E079_Openrouter Vs Requesty - Cuál es mejor
Ep. 79

E079_Openrouter Vs Requesty - Cuál es mejor

Episode description

Episodio de BIMPRAXIS: OpenRouter vs Requesty

En el mundo de la inteligencia artificial, la elección de la infraestructura adecuada es crucial. En este episodio, exploramos la comparativa entre OpenRouter y Requesty, dos conectores de IA que prometen revolucionar la forma en que interactuamos con los modelos de inteligencia artificial. A través de un análisis exhaustivo, descubriremos las ventajas y desventajas de cada opción, desde la simplicidad y velocidad de OpenRouter hasta la seguridad y control de Requesty. ¿Cuál es el mejor enfoque para tu proyecto? Descúbrelo en este episodio de BIMPRAXIS.

Download transcript (.srt)
0:09

Buenas, esto es BIMPRAXIS, el podcast donde el

0:15

BIM se encuentra con la inteligencia artificial.

0:20

Exploramos la ciencia, la tecnología y el futuro

0:23

desde el enfoque de la arquitectura, ingeniería y

0:26

construcción.

0:28

¡Empezamos!

0:36

Muy buenas, bienvenidas, bienvenidos a un nuevo episodio

0:39

de BIMPRAXIS.

0:40

Hoy os traemos OpenRouter frente a Requesti, la

0:43

gran batalla de los conectores de IA en

0:45

2026.

0:46

Y bueno, la verdad es que el material

0:48

que tenemos sobre la mesa hoy es tela.

0:51

O sea, procede de un análisis exhaustivo del

0:53

canal Toby Tiches y pone el foco en

0:56

algo que parece, no sé, puramente técnico, pero

0:59

que lo cambia todo.

1:00

Todo.

1:01

Es que cambia por completo las reglas del

1:03

juego en el desarrollo de software hoy en

1:05

día.

1:06

Exacto.

1:06

Y por eso, la promesa para quienes nos

1:08

escuchan es que, al terminar este análisis a

1:10

fondo, van a tener clarísimo qué infraestructura elegir.

1:14

Da igual si quieren montar un proyecto personal

1:16

el fin de semana.

1:16

O si lideran, yo que sé, una multinacional

1:19

con reglas de datos súper estrictas.

1:21

Eso es.

1:22

Y a ver, para entender bien la magnitud

1:24

de esto, imaginemos el escenario habitual de desarrollo

1:26

hasta cenada.

1:28

Alguien tiene una idea brutal para una app,

1:29

reúne a su equipo y se conectan, pues

1:32

digamos, a un modelo de OpenAI.

1:33

Claro, el camino clásico.

1:35

Sí, sí.

1:35

Pero luego llega el problema masivo.

1:37

Cada dos semanas el ecosistema cambia.

1:39

De repente Anthropic lanza un cloud nuevo que

1:42

es objetivamente mucho mejor para esa app.

1:44

Y claro, ¿eso qué implica?

1:46

Pues implica abrir otra cuenta corporativa, meter otra

1:49

tarjeta de crédito, generar claves nuevas y, lo

1:52

peor de todo, reescribir un montón de código.

1:55

Un cristo, vamos.

1:56

Un cristo importante.

1:58

Porque la forma en la que OpenAI recibe

2:00

los datos no tiene nada que ver con

2:01

cómo lo recibe Google con Gemini o Anthropic.

2:04

Unos usan JSON estructurado, otros separan el System

2:07

Prompt.

2:08

¿Pereza técnica?

2:09

¿La gente se quedaba anclada a un solo

2:11

proveedor?

2:12

Totalmente.

2:13

¿Te pardías los avances del mercado porque daba

2:15

mucha pereza?

2:17

Sí, sí, un clásico.

2:18

Y justo aquí es donde entran a resolver

2:20

el caos plataformas como OpenRouter y Requesty.

2:24

Actúan como una capa de abstracción, ofreciendo una

2:27

interroquerabilidad brutal.

2:29

Quien programa hace una sola integración y ¡boom!,

2:32

acceso a cientos de modelos.

2:33

A ver, vamos a desgranar esto.

2:35

Porque es casi como tener 20 mandos a

2:37

distancia distintos en la mesa del salón.

2:40

Que si el de la tele, el del

2:41

aire acondicionado, el del decodificador… Sí, sí, un

2:44

clásico.

2:45

Y de repente, pues te contamos… Compras un

2:46

mando universal, ¿no?

2:48

Pero, según los apuntes de Toby Tiches, no

2:51

es solo que este mando envíe la señal.

2:53

Es que actúa como un traductor simultáneo en

2:56

tiempo real.

2:57

Exacto.

2:57

Y lo fascinante aquí es precisamente ese matiz

3:01

de la traducción.

3:02

O sea, no es un simple redireccionamiento de

3:05

tráfico, sino que hay un procesamiento de la

3:07

sintaxis.

3:08

Si la aplicación envía una instrucción de temperatura

3:11

para controlar la creatividad, el conector la traduce

3:14

para que Gemini o Yamatress… la entiendan perfectamente.

3:18

Es que es una pasada.

3:20

Elimina por completo la necesidad de leerse la

3:22

documentación de cada maldita IA nueva que sale

3:25

al mercado.

3:26

Tal cual.

3:26

Y claro, una vez entendido que ambas plataformas

3:29

son este traductor mágico, la pregunta es obligada.

3:33

¿En qué se diferencian?

3:35

Pues sí, porque si las dos hacen de

3:36

puente, a priori daría igual cuál elegir, ¿verdad?

3:39

Claro, pero sabemos que no es así ni

3:41

de lejos.

3:42

Ni de lejos.

3:43

Así que vamos a sumergirnos en la primera

3:45

contendiente de esta batalla.

3:46

Que es Open Router.

3:48

Por lo que cuenta el análisis, su filosofía

3:50

es cristalina.

3:51

Es el modelo Buffet Libre.

3:53

Sí, un Buffet Libre con un minimalismo extremo.

3:57

O sea, estamos hablando de acceso masivo a

3:59

más de 400 modelos de IA diferentes.

4:03

400 se dice pronto, ¿eh?

4:05

Es una barbaridad.

4:06

Cubren desde los gigantes comerciales hasta modelos experimentales

4:10

en Hugging Face.

4:11

Pero fíjate que su verdadera identidad no es

4:14

solo el volumen, sino que han eliminado cualquier

4:16

fricción de entrada.

4:18

Ya, o sea que te registras y listo.

4:20

Exacto.

4:21

Te registras, generas tu clave API y en

4:24

dos minutos estás mandando peticiones.

4:26

Cero burocracia, cero configuraciones raras.

4:28

Oye, y hay un detalle en la estructura

4:30

de costes que me ha llamado muchísimo la

4:32

atención.

4:33

Porque rompe un poco con lo que solemos

4:35

ver en el software, ¿no?

4:37

Sí, lo del markup transaccional.

4:39

Eso es.

4:40

Te cobran una comisión del 5 ,5%.

4:42

Pero solo al recargar el saldo con la

4:45

tarjeta.

4:45

Luego, cuando ya tienes el dinero en la

4:47

cuenta, el coste por token, o sea, cada

4:50

palabra generada, es exactamente el mismo que si

4:53

fueras directo al proveedor.

4:54

Claro.

4:55

Te pasan la factura limpia, sin márgenes ocultos

4:58

por el uso continuo.

5:00

Y eso refleja al 100 % su mentalidad.

5:02

No quieren ser tu socio estratégico.

5:04

Quieren ser una tubería, súper rápida y sin

5:07

estorbos.

5:08

Una tubería directa, sí.

5:09

Y por eso gustan tanto a desarrolladores independientes,

5:12

startups.

5:13

Cuando tu objetivo es iterar rápido o probar

5:16

20 modelos en una tarde para ver cuál

5:18

funciona, no quieres capas de software molestando en

5:20

medio.

5:21

Claro.

5:21

Pero, a ver, entonces, ¿qué significa todo esto?

5:24

Si es tan simple y transparente, ¿no corremos

5:27

el riesgo de ir a pelo y sin

5:28

red de seguridad si el proyecto crece?

5:31

Bueno, es que ese es exactamente el punto.

5:34

Porque imagínate que la app se hace viral

5:35

de golpe, o que un banco decide usarla.

5:38

Si van directos, ¿qué pasa con los límites

5:41

de uso o la privacidad?

5:42

Pues pasa que esa falta de red de

5:46

seguridad es una característica de diseño de open

5:49

router, no un fallo.

5:50

O sea, la responsabilidad recae íntegramente en quien

5:53

desarrolla.

5:54

Ostras, claro.

5:55

Te lo tienes que montar tú.

5:57

Exacto.

5:57

Si necesitas limitar peticiones para no arruinarte o

6:00

filtrar contraseñas, tu equipo tiene que programar todo

6:03

eso desde cero en sus propios servidores.

6:05

Ya, y claro, aquí es donde la cosa

6:08

se pone muy interesante.

6:09

Porque a medida que un proyecto escala, la

6:12

velocidad de la red de seguridad se desvanece.

6:12

La red de seguridad pura ya no es

6:13

lo único que importa.

6:14

Entran los de legal, los de finanzas… Y

6:17

te cambian la conversación entera, claro.

6:19

Por completo.

6:20

Ya no se habla de probar modelos, sino

6:23

de mitigar riesgos.

6:24

Y esto nos lleva de lleno al enfoque

6:26

radicalmente opuesto de Requesty.

6:28

O sea, si open router es un coche

6:31

de carrera súper ligero, Requesty sería como contratar

6:34

a un asesor financiero y un guardaespaldas a

6:36

la vez.

6:37

Sí, sí.

6:38

Si conectamos esto con el panorama general, la

6:41

comparación del blindaje… Es buenísima.

6:44

Requesty sacrifica un poco esa ligereza para añadir

6:47

características de grado empresarial.

6:49

Puras y duras.

6:51

Que a nivel de catálogo tampoco andan cojos,

6:53

¿eh?

6:53

Que tienen más de 300 modelos.

6:55

Cierto.

6:56

Es una oferta inmensa.

6:57

Pero su obsesión es el control del flujo

7:00

de datos.

7:01

De hecho, el material de Tobitiches destaca muchísimo

7:04

sus guardias de seguridad integrados.

7:06

Y esto me flipa arquitectónicamente.

7:08

Dicen que son filtros activos.

7:10

A ver, imagínate una app de atención, y

7:12

un usuario despistado pone Hola, mi tarjeta es

7:16

esta, cobradme.

7:17

Un clásico que da terror a cualquier empresa.

7:20

Claro, porque si vas con conexión directa, ese

7:23

número de tarjeta viaja por Internet, entra en

7:26

un servidor de terceros y se queda en

7:28

sus logs.

7:29

Una pesadilla para la protección de datos.

7:31

Totalmente ilegal en muchos contextos, además.

7:34

Pero Requesty intercepta el mensaje.

7:36

La duda que me surge es ¿cómo hacen

7:39

esto en tiempo real sin añadir un lag

7:41

espantoso?

7:41

Porque, si la IA tarda 10 segundos por

7:44

culpa del filtro, el usuario se marcha.

7:46

Bueno, la clave está en el Let's Computing

7:49

y en expresiones regulares muy, muy optimizadas.

7:52

O sea, no mandan el texto a otra

7:54

IA gigantesca para que lo lea, sino que

7:56

usan patrones de reconocimiento ultra rápidos para cazar

8:00

cosas sensibles.

8:01

Ah, vale.

8:02

O sea, buscan la forma de una tarjeta,

8:04

un email, ese tipo de patrones.

8:06

Exacto.

8:06

Al detectar esa información personal identificable, la bloqueen

8:10

o la enmascaran en milisegundos.

8:12

Para empresas sujetas al RGPD en Europa, esto

8:16

te ahorra meses de auditorías.

8:17

Ya lo tienes en la infraestructura.

8:20

Madre mía, es que eso vale oro.

8:21

Y luego está la seguridad operativa, lo de

8:24

los failovers o copias de seguridad automáticas.

8:27

Uy, sí, eso es vital en producción.

8:29

A ver si lo he entendido bien.

8:31

Estás usando GPT -4.

8:33

OpenAI se cae a nivel mundial.

8:34

¿Qué pasa?

8:35

Y Requesty detecta el error 500 y te

8:37

manda la petición a Cloud automáticamente para que

8:40

tu app no muera.

8:41

Eso es.

8:42

¿Te salva la vida?

8:43

Pero espérate, porque aquí veo un problema.

8:46

Si pasas de OpenAI a Cloud en milisegundos,

8:49

la IA cambia de personalidad, ¿no?

8:51

De repente el usuario nota que el tono

8:53

es distinto o el formato cambia.

8:55

¿No es un riesgo enorme?

8:56

Oye, pues es una deducción buenísima.

8:58

Y sí, es un riesgo, especialmente si dependes

9:01

de salidas JSON super estrictas.

9:03

Pero seamos realistas.

9:05

En operaciones a gran escala, entregar una respuesta

9:07

un poco diferente es infinitamente mejor que sacar

9:11

una pantalla de un dispositivo.

9:12

Y no es una idea de error durante

9:12

dos horas.

9:13

Ya, visto así, la pantalla en blanco es

9:16

el mayor de los males.

9:17

Claro.

9:18

Y además, los desarrolladores pueden configurar esos failovers

9:21

para saltar a modelos de la misma familia.

9:23

Por ejemplo, de un modelo grande a uno

9:25

más pequeño del mismo creador para minimizar ese

9:28

choque de personalidad.

9:29

Te garantizan el uptime del 99 ,9%.

9:33

Vale, vale, me convence.

9:34

Pero claro, todo esto suena a magia corporativa.

9:38

Y la magia hay que pagarla.

9:39

Y aquí es donde quiero apretar un poco.

9:41

Venga.

9:42

Vale, dicen que ahorras un 80%, pero de

9:45

entrada te están cobrando un 5 % extra

9:47

por cada uso.

9:48

O sea, un peaje continuo.

9:51

¿Realmente compensa este peaje si no eres una

9:53

megacorporación?

9:54

Pues mira, esta aparente contradicción es lo mejor

9:57

de Requesty.

9:58

Y para entenderlo, hay que saber cómo se

10:01

quema realmente el dinero en la IA generativa.

10:04

Si Requesty fuera solo un tubo pasivo, ese

10:08

5 % extra sería una ruina.

10:10

Claro, estaría esperando perdiendo dinero a expuertas.

10:13

Exacto, pero lo compensan con inteligencia financiera automatizada.

10:18

Concretamente, con dos cosas.

10:20

El enrutamiento inteligente y el almacenamiento en caché

10:23

semántica.

10:24

A ver, pausa aquí.

10:26

Lo de la caché.

10:27

En software normal, si un millón de personas

10:29

piden la misma foto, el servidor la guarda

10:32

y la enseña sin volver a calcularla, ¿no?

10:34

Exacto.

10:35

Sí, una caché de libro.

10:37

Pero en inteligencia artificial se supone que cada

10:40

pregunta es única.

10:42

Si yo digo, ¿cómo devuelvo estos zapatos que

10:44

me aprietan?

10:45

Y otro dice, ¿cuál es la política de

10:47

devoluciones?

10:48

Las frases son súper distintas.

10:51

¿Cómo demonios cacheas algo que no es texto

10:53

idéntico?

10:54

¡Ostras!

10:55

Es que ese es el gran cambio de

10:56

paradigma del que estamos hablando.

10:58

Pasamos de IA generativa a casi, no sé,

11:01

IA reciclada.

11:02

Requesty usa una caché semántica, no de texto

11:05

exacto.

11:06

Vale, ¿y eso cómo se come?

11:08

Pues cogen modelos muy pequeños que convierten la

11:11

pregunta en vectores matemáticos.

11:13

Básicamente extraen la intención.

11:16

Si los vectores de los zapatos que aprietan

11:18

y la política general de devoluciones son idénticos

11:21

en significado, el sistema sabe que la respuesta

11:23

es la misma.

11:24

¡Ostras!

11:25

Claro.

11:25

Así que en lugar de despertar al modele

11:27

principal, que te cuesta pasta por palabra, requesty

11:30

saca la respuesta guardada y te la da

11:32

gratis y al instante.

11:34

¡Guau!

11:34

Visto así, claro, los números cambian por completo.

11:37

Si el 40 % de tus usuarios hacen

11:40

variaciones de las mismas 5 preguntas, casi la

11:43

mitad de tus peticiones te salen a coste

11:45

cero.

11:46

Literalmente.

11:46

Dejas de quemar billetes repitiendo procesos cognitivos que

11:50

la IA ya solucionó ayer por la tarde.

11:53

El sobrecoste del 5 % se amortiza rapidísimo.

11:56

Es alucinante.

11:57

Y mencionabas también el enrutamiento inteligente.

12:00

Sí, ese es el segundo mecanismo.

12:02

Puedes poner reglas de negocio complejas sin tocar

12:05

tu código.

12:05

Imagina que tienes un presupuesto cerrado para un

12:08

modelo superprimium.

12:09

Vale.

12:10

Si llegas al 90 % del presupuesto, a

12:12

mediados de mes, Requesty automáticamente manda las consultas

12:16

fáciles a un modelo de código abierto baratísimo

12:19

y reserva el premium solo para tareas supercomplejas.

12:22

Madre mía, claro.

12:24

Es que cambia la perspectiva.

12:25

Ya no es un peaje.

12:26

Es como tener suprotratado a un departamento entero

12:29

de finanzas y seguridad por una miseria.

12:31

Tal cual.

12:32

¿Te optimizan todos sin que tú tengas que

12:34

hacer nada?

12:34

Pues creo que con este nivel de detalle

12:36

la radiografía está clarísima.

12:39

Tenemos los dos conectores diseccionados.

12:42

Así que, para quien nos esté escuchando y

12:44

mañana tenga que decidir la arquitectura de su

12:47

próximo sistema, ¿cómo resumirías el veredicto definitivo?

12:51

Pues mira, ciñéndonos al análisis.

12:53

Todo se reduce a la tolerancia al riesgo

12:55

frente a la necesidad de control.

12:57

Si lo que priorizas es la simplicidad radical,

13:01

explorar cientos de modelos sin estorbos y construir

13:04

rápido, OpenRouter es tu ganador indiscutible.

13:07

Es el lienzo en blanco perfecto.

13:09

La filosofía del circuito cerrado, no.

13:12

Pura velocidad y cero peso extra.

13:14

Exacto.

13:15

Pero, si el entorno te exige garantías, si

13:18

no te puedes permitir caídas de servidores, si

13:20

tienes obligación legal de bloquear fuga de datos

13:23

y si tu volumen pide automatizar ahorros con

13:26

cachers semánticas, entonces requesties la opción imperativa.

13:30

Lo ideal, como siempre recomiendan, es hacerse cuentas

13:33

de prueba y cacharrear con las dos.

13:35

Me parece una conclusión súper práctica.

13:37

El que quiera el viento en la cara

13:39

probando cosas, tiene una.

13:40

Y el que necesite cruzar un campo de

13:42

minos corporativos sin gastar de más, tiene la

13:45

otra.

13:45

El análisis lo deja súper claro.

13:48

Pero, ¿sabes?

13:49

Esto plantea una pregunta importante.

13:52

Una reflexión de fondo para la audiencia.

13:54

A ver, dispara.

13:55

Hemos visto que cambiar de GPT a Cloud

13:58

o Gemini es ahora tan trivial como enchufar

14:01

un cable USB.

14:02

Y si el acceso es tan intercambiable, nos

14:05

estamos acercando al punto en el que el

14:08

modelo de IA en sí se vuelve un

14:10

producto generalizado.

14:10

O sea, una simple commodity.

14:13

Qué buena pregunta.

14:15

Claro, y si el verdadero valor en el

14:17

futuro no es la IA que uses, sino

14:19

la infraestructura inteligente, el enrutamiento y la seguridad

14:23

que envuelven a esos modelos.

14:25

Uf, es un planteamiento que le da la

14:27

vuelta a todo a la verdad.

14:28

Llevamos años obsesionados con la marca del agua

14:31

que sale por el grifo, debatiendo si esta

14:33

es mejor que la otra, y resulta que

14:35

la verdadera revolución está en las tuberías inteligentes

14:38

que deciden por dónde y a qué precio

14:40

fluye esa agua.

14:41

Menuda idea monumental para dejarla macerando.

14:44

Antes de despedirnos hasta el próximo programa, os

14:47

informamos de que las voces que oyes han

14:48

sido generadas por la IA de Notebook LM

14:51

y que dirigiendo el podcast se encuentra Julio

14:53

Pablo Vázquez, un humano que te envía saludos.

14:56

En caso de error, probablemente sean errores humanos.

14:59

Nos escuchamos.

15:11

Y hasta aquí el episodio de hoy.

15:13

Muchas gracias por tu atención.

15:24

Esto es BIM Praxis.

15:27

Nos escuchamos.

15:28

En el próximo episodio.