E074_Qué es Eden AI y cómo hacer flujos entre diversos modelos LLM

0:09

Buenas, esto es BIMPRAXIS, el podcast donde el

0:15

BIM se encuentra con la inteligencia artificial.

0:20

Exploramos la ciencia, la tecnología y el futuro

0:23

desde el enfoque de la arquitectura, ingeniería y

0:26

construcción.

0:28

¡Empezamos!

0:36

Muy buenas, bienvenidas, bienvenidos a un nuevo episodio

0:40

de BIMPRAXIS.

0:41

Hoy os traemos la muerte del código repetitivo

0:44

al integrar inteligencia artificial.

0:46

Y ya era hora, la verdad.

0:48

Totalmente.

0:49

Pues, a ver, para arrancar, imaginemos el siguiente

0:52

escenario.

0:53

Existe la necesidad de auditar una noticia diplomática

0:56

internacional sobre las relaciones entre Canadá y el

0:59

Reino Unido, para verificar si es falsa.

1:02

Un caso de uso muy típico hoy en

1:04

día.

1:04

Exacto.

1:05

Y el objetivo es conectar el motor de

1:07

reconocimiento visual de Microsoft con la capacidad analítica

1:10

del modelo CloudSonnet de Anthropic.

1:13

Casi nada.

1:13

Claro.

1:14

O sea, lograr que esos dos sistemas… …

1:16

de empresas rivales se comuniquen, procesen la imagen,

1:19

detecten que es una noticia fabricada y devuelvan

1:22

el análisis completo a tu servidor.

1:23

Sí, sí.

1:24

Y la meta, ojo a esto, es hacer

1:27

todo esto en menos de cinco minutos, con

1:30

un coste operativo exacto de 0 ,002 dólares

1:33

y, lo más importante, sin escribir ni una

1:37

sola línea de código de infraestructura.

1:40

Madre mía.

1:41

A ver, hasta hace muy poco, si propones

1:44

esta arquitectura a un equipo de ingeniería… …

1:46

bueno, habría provocado unas cuantas risas en la

1:48

sala.

1:49

Ya te digo.

1:50

Habría provocado risas porque, claro, el coste en

1:52

horas de desarrollo para establecer esa pasarela de

1:55

comunicación habría sido astronómico.

1:57

Total.

1:58

Integrar sistemas heterogéneos siempre ha sido el gran

2:01

cuello de botella, ¿sabes?

2:03

Tradicionalmente, hablar de orquestar múltiples modelos implicaba construir

2:06

un andamiaje técnico masivo.

2:08

Sí, el temido boilerplane.

2:10

Eso es.

2:11

Cada proveedor tiene su propio esquema de autenticación,

2:14

su propio formato para los… … payloads de

2:16

datos, su forma de estructurar los Jasons.

2:19

Mapear todo eso a mano requiere meses de

2:22

trabajo tedioso que no aporta ningún valor directo

2:25

al usuario final.

2:26

Vale, vamos a desgranar esto.

2:27

Hoy exploramos cómo la plataforma Eden AI está

2:31

transformando de raíz todo esto al eliminar ese

2:34

trabajo repetitivo.

2:36

Eso es.

2:36

Nuestra misión en este análisis es comprender cómo,

2:40

a partir del material y las demostraciones presentadas

2:43

por Taja, que es el CEO de la

2:44

compañía, cualquier persona puede combinar decenas de modelos

2:48

de IA, gestionar los costes y generar APIs

2:51

listas para producción sin tocar código base.

2:54

Y para entender por qué esto está ganando

2:56

tanta atracción, hay que observar el estado actual

2:58

del ecosistema de las APIs.

3:00

Claro, que es un caos ahora mismo.

3:01

Exacto.

3:02

En un entorno donde cada semana surge un

3:05

modelo nuevo con más contexto o un coste

3:08

más reducido, pues el peor enemigo de un

3:11

equipo de desarrollo es el vendor lock -in,

3:14

el famoso bloqueo del proveedor.

3:17

Totalmente.

3:18

Estás atado de pies y manos.

3:20

Así es.

3:21

La premisa base de Eden AI es actuar

3:24

como una capa de abstracción universal.

3:26

Ofrecen acceso directo a una variedad inmensa de

3:29

modelos listos para usar, permitiendo seleccionar la mejor

3:33

opción del mercado en cada momento.

3:35

Ajá.

3:36

Y bueno, para quienes buscan soluciones más acotadas,

3:39

también incluyen un constructor de chatbots personalizados que

3:43

ingiere documentos propios.

3:44

Como PDFs, que es un punto de entrada

3:46

excelente.

3:47

O sea, para que nos hagamos una idea,

3:49

la integración tradicional es como si para montar

3:53

un coche tuvieras que fabricar las piezas del

3:55

motor desde cero cada vez.

3:58

Literalmente.

3:58

Y mientras que Eden AI es como tener

4:01

un garaje infinito, donde simplemente encajas el motor

4:05

que mejor te convenga ese día.

4:06

Me gusta mucho esa analogía, sí.

4:08

Pero claro, yo soy un poco escéptica con

4:10

esto.

4:11

¿Qué pasa si ese motor maravilloso falla en

4:14

mi trabajo?

4:16

¿Qué pasa si mi plataforma de salud depende

4:19

de un servicio externo y los servidores de

4:21

ese proveedor sufren una caída?

4:23

Que devuelven un error 500, claro.

4:25

Exacto.

4:25

Si devuelven un error 500, el servicio en

4:28

cascada también se cae.

4:30

¿Cómo aborda esta herramienta el problema de la

4:32

tolerancia a fallos sin obligarnos a programar bucles

4:35

infinitos de reintentos?

4:37

Pues mira, esa es la preocupación arquitectónica número

4:39

uno.

4:40

Lo fascinante aquí es cómo resuelven la resiliencia

4:43

del sistema mediante los llamados proveedores de respaldo,

4:46

o fallback providers.

4:48

Ah, vale.

4:49

O sea, un plan B automatizado.

4:52

Eso es.

4:52

En código puro, interceptar un try -out y

4:55

enrutar la petición hacia otro modelo requiere gestionar

4:58

a sincronía, volver a formatear el payload, manejar

5:02

nuevos errores… Un dolor de cabeza, vamos.

5:05

Un dolor de cabeza que introduce mucha latencia.

5:07

Pero en el ecosistema de Eden AI… Esta

5:10

capa de redundancia se configura a nivel de

5:13

nodo.

5:13

Ya veo.

5:14

Se establece un proveedor principal.

5:16

Digamos, el modelo de Microsoft para la extracción

5:18

de texto.

5:19

Y se asigna a Amazon como respaldo.

5:21

Entiendo.

5:22

Entonces, la plataforma asume el rol de middleware.

5:25

Si el endpoint de Microsoft tarda más de

5:27

la cuenta, Eden AI intercepta ese fallo en

5:30

tiempo real, traduce internamente los parámetros al formato

5:33

de Amazon y ejecuta la llamada, sin que

5:36

la aplicación principal se entere.

5:38

Exactamente.

5:38

Y la latencia añadida a la aplicación es

5:40

la misma.

5:40

La durada por este cambio es de milisegundos.

5:42

Para el cliente final, el sistema simplemente sigue

5:45

funcionando.

5:46

Garantizas una alta disponibilidad empresarial sin mantener bloques

5:50

de código gigantescos dedicados a gestionar desastres.

5:53

¡Qué locura!

5:54

Ya que hemos tocado el tema de estandarizar

5:56

datos, creo que es el momento perfecto para

5:59

cuestionar el cómo.

6:00

A ver… Entiendo la teoría de la tolerancia

6:03

a fallos en el backend.

6:04

Pero el material hace mucho hincapié en que

6:07

toda esta orquestación se realiza visualmente.

6:10

Sí.

6:11

Mediante un constructor de flujos de trabajo.

6:13

Eso es.

6:13

Un lienzo con nodos de arrastrar y soltar.

6:16

Y quienes hemos trabajado con herramientas no -code,

6:19

sabemos que unir cajitas de colores suena muy

6:22

bien.

6:23

Hasta que los esquemas de datos chocan.

6:25

Claro, claro.

6:26

Los mapeos son el terror.

6:28

Exacto.

6:28

¿Cómo resuelve la interfaz visual el mapeo de

6:31

variables entre, por ejemplo, un sistema de reconocimiento

6:34

óptico y un gran modelo de lenguaje?

6:37

Esa es la clave del diseño de la

6:39

plataforma.

6:39

Para ilustrarlo, la demo desgrana ese caso de

6:42

uso de la noticia de la BBC que

6:43

decías antes.

6:44

Sí.

6:44

La arquitectura requiere tres eslabones.

6:47

Primero, el nodo de entrada.

6:48

Aquí defines el esquema de datos que el

6:50

flujo va a recibir.

6:51

En este caso, configuran un archivo de imagen

6:54

y una consulta de texto dinámica.

6:56

Vale, ese sería el punto de ingesta.

6:58

Y de ahí pasamos al procesamiento.

7:01

Correcto.

7:02

Ahí entra el segundo nodo, que es el

7:04

OCR multipágina.

7:05

Configuran a Microsoft como principal y Amazon de

7:08

respaldo.

7:09

El reto aquí no es invocar al OCR,

7:11

sino cómo pasarle la imagen.

7:13

Claro, el formato.

7:14

Pues en la interfaz visual, en lugar de

7:17

escribir código para parsear el archivo, simplemente vinculas

7:20

el campo de entrada del OCR a la

7:22

variable de imagen del primer nodo.

7:24

La plataforma serializa los datos por debajo.

7:27

Vale.

7:27

Aquí es donde la cosa se pone muy

7:29

interesante.

7:30

Porque el texto extraído por ese OCR de

7:33

Microsoft no es el resultado final, ¿verdad?

7:35

No, qué va.

7:36

Es sólo el contexto.

7:37

Es el combustible.

7:39

En el tercer nodo añaden a Cloud Sonnet

7:41

de Anthropic.

7:42

Y el mecanismo para conectar estos dos mundos

7:44

es brillante.

7:45

Sí, es súper ágil.

7:47

En lugar de tener que limpiar el JSON

7:49

de Microsoft, simplemente seleccionas el texto en bruto

7:52

del OCR y lo inyectas dinámicamente en el

7:55

LLM.

7:56

Es como tener a un intérprete simultáneo de

7:58

la ONU integrado en el lienzo.

8:00

Totalmente.

8:01

Microsoft habla en su propio dialecto visual.

8:04

Pero el motor de Eden AI traduce instantáneamente

8:07

ese resultado al formato de texto.

8:11

Esa metáfora del intérprete es muy precisa.

8:14

La plataforma abstrae por completo la transformación de

8:17

datos.

8:17

Tú diseñas la orquestación semántica, es decir, qué

8:21

hace la información, mientras que el motor subyacente

8:23

maneja la sintaxis técnica.

8:25

Qué pasada.

8:26

Y a esto le suman el System Prompt

8:29

y la consulta del usuario, ¿no?

8:31

Exacto.

8:31

Y por eso cuando ejecutan la prueba con

8:34

la captura de la BBC, opera de manera

8:36

súper fluida.

8:37

El OCR extrae los caracteres, los transfiere al

8:40

LLM, el modelo evalúa la consulta y alerta

8:43

sobre la falsedad de la noticia.

8:45

Una colaboración perfecta por 0 ,002 dólares.

8:49

Es que democratiza por completo la experimentación arquitectónica.

8:52

Sin duda.

8:53

Perfiles no tan técnicos pueden visualizar y diseñar

8:56

el flujo exacto de la información sin depender

8:59

de un equipo de ingeniería durante tres semanas.

9:01

Eso es.

9:02

Pero claro, esto me lleva a la pregunta

9:04

inevitable.

9:05

¿El entorno de pruebas?

9:06

Sí.

9:07

El sandbox.

9:07

Siempre funciona de maravilla en las demos.

9:10

Siempre sí.

9:11

La gran barrera suele ser el despliegue.

9:13

Yo monto este lienzo y está muy guay.

9:16

Pero, ¿cómo lo saco de ahí, para integrarlo

9:19

en una base de código real que atienda

9:21

miles de peticiones?

9:23

¿Simplemente conecto esto a mi aplicación y ya

9:26

ejecuta toda la cadena por sí solo?

9:28

Pues sí, porque el puente hacia producción es

9:30

la generación automatizada de APIs.

9:32

¿Te genera la API directamente?

9:34

Sí.

9:34

Una vez que el flujo está testeado, la

9:37

plataforma compila esa lógica y levanta endpoints dedicados

9:40

exclusivamente a ese flujo.

9:42

No exportas código, expones la máquina a través

9:45

de peticiones HTTP estándar.

9:47

Entonces, a ojos de cualquier aplicación externa, el

9:50

flujo entero se convierte en una única caja

9:52

negra a la que llamas a través de

9:54

una API.

9:54

Exactamente.

9:55

Tienen ejemplos listos para integrar en Python con

9:59

Django o FastAPI y en NodeJS para JavaScript.

10:03

El sistema expone dos puntos de conexión principales.

10:06

Vale.

10:07

El primero es un endpoint post para lanzar

10:09

la ejecución.

10:10

Ahí es donde envías el payload inicial, la

10:14

imagen y la pregunta.

10:15

Claro, pero al lanzar ese post, nos enfrentamos

10:19

a la asincronía de la IA.

10:21

Ese es el gran tema.

10:22

Si enviamos un documento de 50 páginas para

10:25

un OCR y luego un LLM, esa operación

10:29

no se va a resolver en 200 milisegundos.

10:31

Para nada.

10:32

Puede tardar segundos o minutos.

10:34

Entonces, si mi aplicación usa un método GET

10:37

estándar para ver si ya está el resultado,

10:40

tengo que implementar una técnica de polling.

10:42

Estar preguntando constantemente al servidor si ha terminado.

10:46

Uf, no.

10:47

El polling constante es una práctica arquitectónica terrible

10:50

para la escalabilidad.

10:52

Ya, saturas el ancho de banda a lo

10:53

tonto.

10:54

Mantienes conexiones abiertas.

10:56

Consumes recursos en cliente y servidor.

10:58

Es un desastre.

11:00

Por eso usan webhooks.

11:01

Ah, vale.

11:03

Lo cual cambia el paradigma por completo.

11:06

Totalmente.

11:07

En la petición post inicial, incluyes la URL

11:10

de un webhook tuyo.

11:11

Y te desentiendes.

11:13

El flujo procesa los nodos a su ritmo.

11:15

Y cuando termina, la plataforma hace una petición

11:19

activa contra ese webhook, entregando los datos.

11:21

¿Te avisan ellos a ti?

11:22

Exacto.

11:23

Madre mía, si conectamos esto con el panorama

11:26

general, el impacto masivo que tiene esto radica

11:29

en la brutal contracción de los ciclos.

11:31

Es brutal, sí.

11:33

Lo que antes te llevaba semanas de escribir

11:35

código de infraestructura, gestionar colas de mensajes, programar

11:39

reintentos, todo ese trabajo oscuro, queda delegado.

11:43

El salto desde un lienzo visual hasta una

11:46

API asíncrona, robusta, ocurre en segundos.

11:49

Es una reasignación de los recursos de ingeniería.

11:52

Los equipos técnicos pueden dejar de mantener conexiones

11:55

y empezar a optimizar el producto.

11:58

Ahora bien, para que este análisis sea riguroso,

12:01

tenemos que hacer un análisis.

12:01

Tenemos que escalar un poco la complejidad.

12:04

Venga.

12:05

Porque hasta ahora, esto es una tubería lineal.

12:07

Entra imagen, va al OCR, luego al LLM

12:10

y sale el resultado.

12:12

Pero las aplicaciones reales no son líneas rectas.

12:15

No, rara vez lo son.

12:17

O sea, esto ya no es solo una

12:18

cadena de montaje básica.

12:19

Es una fábrica inteligente.

12:21

Las cintas transportadoras necesitan reaccionar a los datos,

12:25

ramificarse, tomar decisiones y conectarse con bases de

12:29

datos externas que no tienen nada que ver

12:31

con la IA.

12:31

Si la plataforma visual no permite ramificar, se

12:34

convierte en un juguete.

12:36

Esa es una crítica muy habitual hacia las

12:38

plataformas no -code.

12:39

Y está muy justificada.

12:40

Claro.

12:41

Pero para evitar ese techo de cristal, incorporan

12:44

nodos lógicos y de integración.

12:46

El material detalla el uso de nodos IF,

12:49

declaraciones condicionales… Vale.

12:51

Te permiten inspeccionar el payload en cualquier punto

12:54

y bifurcar el flujo en distintos hilos.

12:57

O sea, ¿enrutamiento dinámico?

12:59

Por ejemplo, imaginemos un sistema de soporte técnico.

13:02

Entra un texto y un modelo rápido lo

13:04

categoriza.

13:05

Si el nodo IF detecta que el ticket

13:08

requiere un análisis legal, enruta la información por

13:11

una rama distinta hacia un modelo más pesado

13:14

y costoso.

13:14

Ese es exactamente el propósito.

13:17

Y también tienen nodos de bucle, los famosos

13:19

loops, para iterar sobre listas de datos como

13:22

correos electrónicos.

13:24

Ajá.

13:24

Y para potenciar aún más esto, incluyen conectores

13:28

externos integrados.

13:29

Mencionan integraciones directas con repositorios, ¿verdad?

13:32

Así es.

13:33

Puedes configurar un nodo que interactúe con Supabase

13:36

para registrar resultados o descargar archivos de Dropbox

13:40

o conectarte con GitHub.

13:41

¡Guau!

13:42

Incluso tienen web scrapers para extraer texto de

13:45

una URL en medio del flujo.

13:47

Vale, entiendo el atractivo.

13:49

Pero cualquiera que haya programado sabe que siempre

13:52

te encuentras con un requerimiento de negocio tan

13:55

específico que ningún nodo prefabricado te sirve.

13:58

Siempre pasa.

13:59

Un algoritmo matemático súper tuyo o limpiar una

14:02

cadena con expresiones regulares muy complejas.

14:05

Cuando llegas a ese muro en una herramienta

14:08

visual, el proyecto se cae.

14:10

¿Hay alguna vía de escape para inyectar lógica

14:13

pura?

14:14

Absolutamente.

14:14

Y es vital.

14:15

Disponen de un nodo de código personalizado.

14:18

Es un entorno seguro donde puedes inyectar código

14:21

JavaScript puro.

14:22

¡Ah, qué bueno!

14:23

En la demo muestran un ejemplo sencillo.

14:26

Una función en JavaScript que recibe un nombre,

14:28

digamos taja, y devuelve un saludo dinámico estructurado.

14:32

Un ejemplo básico, pero demuestra que no es

14:35

una jaula de oro.

14:36

Exacto.

14:37

Es una válvula de escape.

14:38

Si no hay un bloque para tu transformación

14:40

rara de datos, abres el nodo de código,

14:43

programas en JavaScript y ese nodo se integra

14:46

en la cadena visual sin romper la arquitectura.

14:48

Eso es.

14:49

Y si la cosa se pone extrema, recomiendan

14:52

apoyarse en su comunidad de Discord, que es

14:54

un centro neurálgico para resolver dudas.

14:56

Y a ver, esto plantea una pregunta importante

14:59

sobre la evolución de la ingeniería de software.

15:01

¿Te escucho?

15:02

La integración de nodos, condicionales y vías de

15:04

escape de código representa un cambio de paradigma.

15:08

Históricamente, el valor de un desarrollador era dominar

15:10

la sintaxis, gestionar memoria, protocolos HTTP… Sí.

15:14

Pero cuando las plataformas asumen toda esa fricción,

15:17

el talento técnico evoluciona hacia la macroorquestación de

15:20

sistemas.

15:21

O sea, el valor ya no es saber

15:23

programar la pasarela.

15:25

El valor está en el pensamiento sistémico.

15:27

Exactamente.

15:28

Está en poseer la visión para decidir qué

15:31

combinación de modelos, qué lógica de ramificación y

15:34

qué conectores van a resolver el problema de

15:36

negocio de forma más barata y eficiente.

15:38

Es un desplazamiento total hacia el diseño puro

15:41

de la lógica de producto.

15:43

Prototipas, pruebas con modelos reales y despliegas en

15:46

preproducción en la misma tarde.

15:48

Entonces, ¿qué significa todo esto?

15:50

Si recopilamos lo que hemos analizado, resulta evidente

15:53

que EDEN .AI es mucho más que un

15:56

directorio de modelos.

15:57

Mucho más.

15:58

Se posiciona como una capa de infraestructura crítica

16:01

que transforma meses de programación en un diseño

16:06

visual ágil.

16:07

Tolerancia a fallos automática, traducción de formatos, webhooks,

16:11

código personalizado… Eliminan la inmensa fricción entre la

16:16

teoría y el despliegue en producción.

16:18

Es un habilitador tecnológico símbolo.

16:20

Sin precedentes para las empresas, desde luego.

16:22

Y esto nos lleva a una reflexión profunda

16:24

para quienes nos escuchan hoy.

16:26

Hemos visto cómo ahora se pueden estructurar arquitecturas

16:29

complejas y manejar errores de servidor en minutos

16:33

sin infraestructura propia.

16:35

Así es.

16:36

Ante este panorama, cabe plantearse, ¿qué va a

16:39

ocurrir con la barrera de entrada para crear

16:41

software complejo en los próximos cinco años?

16:44

Es una gran pregunta.

16:45

Si la gestión de infraestructura deja de ser

16:47

un requisito, es posible que el próximo gigante

16:50

tecnológico mundial sea construido por alguien brillante que

16:53

simplemente arrastró y soltó los nodos correctos sin

16:56

escribir jamás la infraestructura subyacente de su imperio.

16:59

Uf, es un escenario fascinante sobre el que

17:01

merece la pena meditar, sin duda.

17:03

Totalmente.

17:04

Ha sido un verdadero privilegio explorar la arquitectura

17:07

detrás de este cambio de paradigma hoy.

17:08

Un placer profundizar en estos mecanismos arquitectóricos.

17:12

Sigan analizando y cuestionando los cimientos de la

17:15

tecnología que nos rodea.

17:16

Hasta la próxima.

17:17

Antes de despedirnos hasta el próximo programa, os

17:20

informamos de que las voces que oyes han

17:22

sido generadas por la IA de Notebook LM

17:25

y que dirigiendo el podcast se encuentra Julio

17:27

Pablo Vázquez, un humano que te envía saludos.

17:29

En caso de error, probablemente sean errores humanos.

17:32

¡Nos escuchamos!

17:44

Y hasta aquí el episodio de hoy.

17:47

Muchas gracias por tu atención.

17:58

Esto es BIM Praxis.

18:00

Nos escuchamos en el próximo episodio.

E074_Qué es Eden AI y cómo hacer flujos entre diversos modelos LLM

Episode description

Episodio de BIMPRAXIS: La Integración de Inteligencia Artificial sin Código

Persons