E047_Orquestando_agentes_complejos_con

0:10

Buenas, esto es BIMPRAXIS, el podcast donde el

0:15

BIM se encuentra con la inteligencia artificial.

0:20

Exploramos la ciencia, la tecnología y el futuro

0:23

desde el enfoque de la arquitectura, ingeniería y

0:26

construcción.

0:28

¡Empezamos!

0:37

Vale, vamos a meternos de lleno.

0:39

Hoy tenemos sobre la mesa un conjunto de

0:41

fuentes bastante ecléctico sobre una herramienta llamada LangGraph.

0:45

¡Um!

0:46

Sí, hay un poco de todo.

0:48

Hay de todo.

0:49

Desde guías para principiantes, la documentación oficial, que

0:54

es bastante densa, hasta hilos de debate muy

0:57

intensos en Reddit.

0:58

Ahí es donde está la salsa, claro.

1:01

Totalmente.

1:02

Y la misión es entender por qué algunos

1:04

la describen como algo fundacional, una palabra bastante

1:07

fuerte para construir aplicaciones de inteligencia artificial que

1:10

sean a la vez complejas y fiables.

1:13

Efectivamente.

1:15

Y el reto, yo creo, está en separar

1:17

un poco la promesa de la realidad.

1:19

Las fuentes no solo nos dicen qué es,

1:22

sino que abren un debate muy interesante sobre

1:24

por qué es necesaria.

1:26

Claro.

1:26

O sea, ¿qué problema resuelve que su predecesor,

1:30

Landchain, no podía?

1:32

Y sobre todo, ¿qué opinan los desarrolladores que

1:35

se están quejando con ella en el día

1:36

a día?

1:37

Es que es fascinante ver cómo una pieza

1:39

de software puede generar opiniones tan polarizadas, ¿verdad?

1:42

Muchísimo.

1:43

Pues empecemos por el principio, entonces.

1:45

¿Por qué nace LangGraph?

1:47

Una de las fuentes de un blog llamado

1:49

Q2B Studio dice algo que parece muy simple,

1:52

pero que es la clave de todo.

1:54

A ver.

1:54

Dice que la mayoría de aplicaciones de IA

1:56

no son lineales, no van en línea recta

1:59

del punto A al B.

2:00

¿A qué se refieran con eso exactamente?

2:03

Pues esa es la madre del cordero.

2:05

Su predecesor, Landchain, es fantástico para flujos de

2:08

trabajo que son como una cadena de montaje.

2:10

¿Una secuencia?

2:11

Eso es.

2:12

Coges un dato, se lo pasas a un

2:14

modelo, el resultado se lo pasas a otra

2:16

herramienta, y así sucesivamente.

2:18

Es una secuencia lineal.

2:20

Y es perfecto para un prototipo rápido o

2:23

un chatbot que responde preguntas simples.

2:25

Pero el mundo real no funciona así.

2:27

Para nada.

2:28

Es mucho más caótico.

2:29

Aquí es donde la cosa se pone interesante.

2:31

Las aplicaciones de verdad necesitan poder dudar, tomar

2:35

decisiones, volver sobre sus pasos si algo sale

2:37

mal, autocorregirse.

2:39

Claro.

2:40

La analogía que usan en las fuentes es

2:42

la de un diagrama de flujo, no una

2:44

línea recta.

2:45

Esa es la idea.

2:45

Exacto.

2:47

Piensa en un agente de IA que tiene

2:48

que reservar un viaje.

2:50

Primero busca vuelos.

2:52

Si no hay, no puede simplemente detenerse, ¿no?

2:55

Claro, tiene que probar otras fechas o algo.

2:57

Tiene que probar con otras fechas, si encuentra

2:59

un vuelo, busca uno tal.

3:01

Si el hotel es carísimo, quizás tiene que

3:03

volver atrás y buscar un vuelo a una

3:05

ciudad cercana.

3:06

¿Eso es un grafo?

3:08

Un mapa de decisiones.

3:09

Justo.

3:10

Un mapa de decisiones con bucles, bifurcaciones y

3:14

saltos condicionales.

3:16

LangGraph te da las herramientas para construir ese

3:18

mapa, con sus nodos, que son las acciones,

3:21

y sus aristas, que son las rutas que

3:23

conectan esas acciones.

3:24

Entiendo.

3:25

O sea, no es una tubería, Es una

3:27

red de carreteras y he visto que en

3:30

otra fuente, un curso de Hugging Face, lo

3:32

enmarcan en un concepto que me ha parecido

3:34

muy potente.

3:36

El equilibrio entre el control y la libertad

3:39

del modelo de lenguaje.

3:41

¿Cómo encaja LangGraph en esa balanza?

3:43

Ese punto es crucial.

3:45

A ver, darle total libertad a un LLM

3:48

es como darle las llaves del coche a

3:50

un adolescente muy inteligente pero sin experiencia.

3:53

Buena analogía.

3:53

Puede que llegue al destino, o puede que

3:56

acabe en otra ciudad porque vio un cartel

3:58

que le parece interesante.

3:59

Landchain a veces puede pecar un poco de

4:02

eso.

4:02

De darle demasiada libertad.

4:04

Sí.

4:05

LangGraph, en cambio, se posiciona firmemente en el

4:08

lado del control.

4:09

Te obliga a diseñar ese mapa de carreteras

4:12

de antemano.

4:13

El agente puede elegir qué ruta tomar en

4:15

una bifurcación, pero no puede salirse de las

4:17

carreteras que tú has dibujado.

4:19

Entiendo.

4:20

Es lo que llaman una arquitectura cognitiva controlable.

4:24

Exacto.

4:25

Y eso es fundamental para que una empresa

4:28

se fíe de poner esa IA de cara

4:30

a sus clientes.

4:31

Necesitas esa predictibilidad.

4:34

Vale.

4:35

Eso deja la diferencia conceptual muy clara.

4:37

Pero, en la práctica, si alguien está empezando

4:40

un proyecto, ¿cómo decide?

4:42

La guía de Q2B Studio da algunas pistas,

4:45

pero ¿cuál sería la regla de oro para

4:46

elegir?

4:48

La regla de oro es preguntarse.

4:49

¿Mi agente necesita pensar en varios pasos y

4:53

potencialmente corregir su rumbo?

4:55

Si la respuesta es sí, probablemente necesites LangGraph.

4:58

Vale.

4:59

Para prototipos, chatbots básicos que solo clasifican o

5:03

resumen texto, langchain es más que suficiente y

5:06

mucho más rápido de implementar, ¿verdad?

5:09

Pero si ya necesitas que razone, que maneje

5:11

errores de forma inteligente… Allí es donde langchain

5:14

se queda corto.

5:15

Si necesita llamar a herramientas externas, dependiendo de

5:18

una condición, o recordar el contexto de una

5:21

tarea larga, allí es donde langgraph se vuelve

5:24

indispensable.

5:25

Y ojo, que aquí no se trata de

5:27

que uno sea bueno y el otro malo,

5:29

¿verdad?

5:29

Por lo que entiendo, no compiten entre sí.

5:32

Para nada.

5:33

Más bien, se pasan el relevo.

5:35

LangGraph es la evolución natural cuando la complejidad

5:38

de un proyecto crece.

5:40

Es el siguiente paso lógico.

5:41

O sea que usa componentes de Landchain.

5:44

Claro.

5:45

De hecho, usa muchos de los componentes de

5:47

Landchain.

5:47

Simplemente los organiza de una manera diferente, más

5:50

robusta.

5:51

He visto que en la documentación de IBM

5:53

mencionan algo llamado grafos con estado.

5:56

Suena bastante técnico.

5:57

¿Qué significa exactamente en este contexto y por

6:00

qué es tan importante para LangGraph?

6:01

Es probablemente la característica más importante y la

6:05

que resuelve más dolores de cabeza.

6:07

Con estado significa simplemente que el sistema tiene

6:10

memoria de todo lo que ha pasado en

6:12

cada paso del camino.

6:14

Imagina que cada vez que la gente completa

6:15

una acción, un nodo del grafo, anota en

6:18

un cuaderno digital lo que ha hecho, los

6:21

datos que ha obtenido y el resultado.

6:23

Ese cuaderno es el estado.

6:25

Y se va pasando de un paso a

6:26

otro.

6:27

Se va pasando de nodo a nodo, de

6:29

forma que la gente siempre sabe de dónde

6:30

viene y qué información tiene disponible en ese

6:33

momento.

6:34

Vamos, que es como tener un registro de

6:35

vuelo detallado en todo momento.

6:37

Y supongo que eso es una maravilla para

6:39

depurar errores, ¿no?

6:40

puedes ver exactamente en qué punto se torció

6:42

el plan.

6:43

Exacto, tienes una transparencia total.

6:46

Y esa gestión centralizada del estado es lo

6:48

que evita el caos.

6:49

Hay una cita en uno de los hilos

6:50

de Reddit que lo resume de una forma

6:52

muy directa y brillante.

6:54

A ver, ¿qué dice?

6:55

Un usuario dice, Langchain es una capa de

6:58

abstracción para los clientes de chat de IA.

7:01

Langgraph es para cuando quieres orquestar a estos

7:03

agentes para lograr un resultado.

7:06

Orquestar, me gusta esa palabra.

7:09

Y termina diciendo, básicamente, si necesitas que múltiples

7:12

agentes trabajen juntos, usa LangGraph.

7:14

Y creo que no se puede explicar mejor.

7:17

Esa idea de la orquestación es muy potente.

7:19

Y supongo que para que esa orquesta suene

7:21

bien, no solo necesitan saber qué hacer, sino

7:23

también recordar la partitura.

7:25

Totalmente.

7:27

Eso nos lleva directamente al tema de la

7:28

memoria, que parece ser el otro gran pilar

7:31

de todo esto.

7:31

La capacidad es que el Unchain permita gestionar

7:34

de una forma mucho más estructurada.

7:36

La documentación oficial del Unchain profundiza mucho en

7:39

esto, y es fascinante como lo plantean.

7:41

Sí, lo dividen en dos grandes tipos que

7:44

ayudan a entenderlo, la verdad.

7:45

Por un lado, la memoria a corto plazo,

7:48

la que se usa dentro de una única

7:49

conversación.

7:50

La de aquí y ahora.

7:52

Eso es, la capacidad de recordar lo que

7:54

acabamos de hablar.

7:55

Correcto.

7:56

Esa memoria a corto plazo es parte de

7:58

ese cuaderno digital, de ese estado del que

8:01

hablábamos.

8:02

Es volátil y específica de la tarea actual.

8:05

Vale, pero luego está el verdadero cambio de

8:07

juego.

8:08

La memoria a largo plazo, la que persiste

8:10

entre diferentes conversaciones.

8:13

Es la que permite que una gente te

8:14

reconozca y recuerde tus preferencias de una semana

8:17

para otra.

8:18

Y aquí es donde a mí me voló

8:19

la cabeza, porque usan una analogía con la

8:22

memoria humana para categorizarla.

8:24

Hablan de tres tipos.

8:25

El primero es la memoria semántica.

8:28

La de los hechos.

8:29

Justo, para recordar hechos.

8:31

El ejemplo que dan es, al usuario le

8:33

gusta el lenguaje directo y habla inglés y

8:35

Python.

8:36

Datos puros y duros sobre alguien o algo.

8:38

Sí, esa es la base.

8:40

Luego suben un nivel con la memoria episodica,

8:43

que es para recordar secuencias de acciones o

8:46

conversaciones pasadas.

8:47

Experiencias, por así decirlo.

8:49

Exacto.

8:50

En la práctica, dicen que se usa para

8:52

darle al modelo ejemplos de interacciones exitosas.

8:56

Es como decirle, mira, la última vez que

8:58

pedí un resumen de un informe financiero lo

9:00

hiciste de esta manera y el resultado fue

9:03

perfecto.

9:04

Hazlo así otra vez.

9:06

Es enseñarle con el ejemplo.

9:07

Es aprender de la experiencia, literalmente.

9:10

Y el tercer tipo, que me parece increíble,

9:13

es la memoria procedural.

9:15

No se trata de recordar hechos ni experiencias,

9:17

sino reglas y procedimientos.

9:19

Ahí se pone la cosa muy interesante.

9:21

El ejemplo que ponen es el de un

9:23

agente que puede modificar sus propias instrucciones, su

9:26

system prompt, basándose en el feedback que recibe.

9:30

A este proceso lo llaman reflexión.

9:32

Es un concepto muy avanzado y muy potente.

9:35

Significa que el sistema no es estático.

9:38

Si un agente genera un tuit para una

9:40

campaña de marketing y un humano le dice

9:42

esto es demasiado informal, que pasa mucho, sé

9:44

creativo y divertido, su nueva regla podría ser

9:48

sé creativo y divertido pero mantén un tono

9:51

profesional.

9:52

Es un bucle de automejora real.

9:55

Exactamente.

9:56

Se va puliendo a sí mismo.

9:58

Vale.

9:58

En papel todo esto suena increíble, casi a

10:01

ciencia ficción.

10:02

Un sistema que se autocorrige, que recuerda, que

10:04

sigue un plan.

10:06

Pero, ¿qué pasa cuando los desarrolladores intentan usar

10:08

esto en el mundo real?

10:10

Claro.

10:10

Porque, en los hilos de Reddit que tenemos,

10:13

el panorama no es tan color de rosa

10:14

para todos.

10:15

No, para nada.

10:17

Aquí es donde chocamos con la dura realidad.

10:19

Hay un comentario muy directo en el subreddit

10:22

de Langchain que lo describe como una absoluta

10:25

pesadilla de mantenimiento en producción.

10:28

Uf, palabras mayores.

10:29

Y otro usuario se queja de que probar

10:32

un grafo complejo es un desastre.

10:35

Y hace una comparación que creo que muchos

10:37

desarrolladores entenderán.

10:39

¿Cuál?

10:39

Lo compara con las primeras versiones de TensorFlow,

10:42

el framework de Google.

10:43

Ostras.

10:44

Dice que era tan poco intuitivo y tan

10:46

difícil de depurar que la gente huyó en

10:49

masa a PyTorch.

10:50

Y cualquiera que lidiara con tef.session.trizates en aquella

10:54

época sabe exactamente a qué se refiere.

10:56

Esa sensación de caja negra, de que no

10:59

sabes qué está pasando dentro.

11:00

Es esa sensación de que el framework te

11:02

está combatiendo en lugar de ayudarte.

11:05

La crítica es que LangGraph puede sentirse así,

11:07

a veces.

11:08

Demasiado complejo, demasiadas capas de abstracción.

11:11

Esa crítica sobre la complejidad y el mantenimiento

11:14

aparece varias veces.

11:15

Pero claro, no todo es negativo.

11:17

Hay gente que lo defiende a capa y

11:19

espada.

11:19

Por supuesto.

11:20

Dicen que para flujos de trabajo de agentes

11:22

es de lejos la mejor opción.

11:25

Mencionan a uno de los creadores de LandChain,

11:28

Lance Martin, que confirmó que el bot de

11:30

atención al cliente de su propia empresa está

11:32

construido con LangGraph.

11:34

Sí, y no son los únicos.

11:36

Las fuentes mencionan casos de uso reales en

11:38

empresas grandes.

11:40

Norwegian Cruise Line, por ejemplo, lo usa para

11:42

mejorar la experiencia de reserva de sus clientes.

11:45

También mencionan a Ali, una empresa financiera.

11:48

Eso es, que lo está usando para sus

11:50

agentes.

11:51

Esto nos dice que, a pesar de las

11:52

dificultades, hay quienes están consiguiendo sacarle un valor

11:56

real en entornos de producción muy exigentes.

11:59

Entonces parece que la clave no es si

12:00

la herramienta es buena o mala, sino saber

12:03

cuándo merece la pena la inversión de complejidad.

12:05

Justo.

12:06

He encontrado un comentario en el softreddit de

12:07

IAI Agents que me ha parecido oro pulo.

12:10

Un desarrollador proponía un enfoque muy pragmático para

12:12

decidir cuándo usar LangGraph.

12:14

¿Te suena esta idea de empezar con algo

12:16

simple y solo migrar cuando la cosa se

12:18

complica de verdad?

12:19

Totalmente.

12:20

Es el principio de no uses un martillo

12:22

para matar una mosca.

12:24

Empezar con LangGraph para un bot sencillo es

12:27

una sobreingeniería tremenda.

12:28

Claro.

12:29

Ese consejo refleja una madurez de desarrollo.

12:32

Primero resuelve el problema de la forma más

12:34

simple posible, que a menudo es un simple

12:36

bucle en Python.

12:37

Exacto.

12:37

Y solo cuando ese bucle empieza a llenarse

12:39

de condiciones, de if, else, any dados, cuando

12:42

el diagrama de flujo mental empieza a tener

12:44

demasiadas flechas y fallos, es cuando dices, vale,

12:47

necesito una herramienta que me ayude a gestionar

12:49

este caos.

12:50

Ahí es cuando migras a LangGraph.

12:52

Es un consejo sensacional y basado en la

12:54

experiencia pura.

12:56

Evita comprometerse demasiado pronto con un framework y

12:58

te da la estructura justo cuando la necesitas.

13:01

La regla que propone este usuario es muy

13:03

clara, la verdad.

13:04

Si es un agente que va a tener

13:06

varios pasos y va a ir a producción,

13:08

la claridad y seguridad que te da LangGraph

13:10

valen la pena al esfuerzo inicial.

13:12

Y hablando de seguridad y producción, hay otra

13:15

funcionalidad que destacan varias fuentes, como la de

13:17

IBM, la intervención humana o Human in the

13:20

Loop.

13:21

Ah, eso es fundamental.

13:23

¿Por qué es tan clave para que las

13:24

empresas se atrevan a usar estos sistemas?

13:26

Porque es la red de seguridad.

13:28

Es la capacidad de diseñar tu grafo con

13:30

puntos de control.

13:32

imagina un agente que va a realizar una

13:33

serie de transacciones financieras.

13:35

Algo delicado.

13:36

Muy delicado.

13:37

Puedes programar el grafo para que justo antes

13:39

de ejecutar la transferencia final se detenga y

13:41

espere la aprobación de un supervisor humano.

13:44

Te permite pausar todo el proceso.

13:46

Exacto.

13:47

Permite pausar el flujo, inspeccionar el estado, ese

13:50

cuaderno del que hablábamos, y asegurarse de que

13:52

todo es correcto antes de proceder.

13:54

Es el botón de emergencia.

13:56

Y he leído que incluso permite hacer algo

13:58

que llaman viajar en el tiempo.

14:01

Suena muy espectacular.

14:02

Bueno, es una consecuencia directa de tener el

14:05

estado guardado.

14:06

Si en un punto de control detectas que

14:07

la gente ha tomado una mala decisión dos

14:09

pasos atrás… ¿Puedes volver?

14:11

Puedes literalmente retroceder a ese estado anterior y

14:14

forzarle a tomar un camino diferente.

14:16

Es un nivel de control y depuración que

14:18

es casi imposible de conseguir con un script

14:19

simple.

14:20

Combina lo mejor de los dos mundos.

14:22

Sí, combina la autonomía de la IA con

14:25

la supervisión humana, que ahora mismo es el

14:27

enfoque más robusto y seguro para aplicaciones críticas.

14:31

Entonces, si unimos todas las piezas, ¿qué significa

14:35

todo esto?

14:36

LangGraph no es simplemente una librería de código

14:39

más.

14:40

Parece más bien un cambio de mentalidad.

14:42

Un cambio de paradigma, sí.

14:44

Un cambio en cómo se diseñan y construyan

14:46

los agentes de IA.

14:47

Absolutamente.

14:48

Implica pasar de pensar en secuencias lineales y

14:51

simples a pensar en sistemas cíclicos, con estado,

14:55

donde el control, la memoria y la capacidad

14:57

de observación son los protagonistas.

15:00

¿Representa una madurez en el campo?

15:02

Totalmente.

15:03

Es el reconocimiento de que, para construir sistemas

15:06

fiables, no basta con la brillantez de un

15:08

modelo de lenguaje.

15:10

Se necesita una arquitectura sólida que lo guíe,

15:12

que lo corrija y que le permita aprender

15:14

de sus interacciones.

15:16

Es el andamiaje necesario para pasar de los

15:18

prototipos y las demos espectaculares a sistemas que

15:21

funcionan de verdad en el mundo real, con

15:24

todas sus complicidades e imprevistos.

15:26

Exacto.

15:26

Es un paso fundamental en esa dirección.

15:29

Y todo esto nos deja con una idea

15:31

final para darle vueltas.

15:33

Hemos hablado de la memoria procedural, de esa

15:35

capacidad de un agente para reescribir sus propias

15:38

instrucciones basándose en el feedback.

15:41

Si un sistema puede modificar sus reglas de

15:43

funcionamiento internas para adaptarse y mejorar, dónde queda

15:47

exactamente la línea que separa una herramienta que

15:50

sigue un diagrama de flujo muy sofisticado de

15:52

un sistema que empieza a aprender y adaptarse

15:55

por sí mismo de una forma mucho más

15:57

fundamental.

15:58

Buena pregunta para cerrar.

16:00

Es una línea cada vez más difusa.

16:13

Y hasta aquí el episodio de hoy Muchas

16:16

gracias por tu atención Esto es BIMPRAXIS Nos

16:29

escuchamos en el próximo episodio ¡Suscríbete al canal!

E047_Orquestando_agentes_complejos_con_LangGraph

Episode description

LangGraph: La Evolución de la Inteligencia Artificial

Persons