E080_Crea tu IA corporativa con RAGFlow (OpenSource)
Ep. 80

E080_Crea tu IA corporativa con RAGFlow (OpenSource)

Episode description

Episodio de BIMPRAXIS: La Revolución del Código Abierto en la Creación de Asistentes de Inteligencia Artificial

En este episodio de BIMPRAXIS, se explora la revolución del código abierto para crear asistentes de inteligencia artificial avanzados sin requerir presupuestos astronómicos. Se analiza cómo herramientas como Ragflow permiten transformar información estática en bases de conocimiento dinámicas, y cómo la democratización de la IA avanzada puede cambiar la forma en que las empresas abordan la innovación y la automatización. Se discuten temas como la importancia de la honestidad algorítmica, la trazabilidad y la orquestación de agentes para superar los límites de los modelos de inteligencia artificial tradicionales.

Download transcript (.srt)
0:09

Buenas, esto es BIMPRAXIS, el podcast donde el

0:15

BIM se encuentra con la inteligencia artificial.

0:20

Exploramos la ciencia, la tecnología y el futuro

0:23

desde el enfoque de la arquitectura, ingeniería y

0:26

construcción.

0:28

¡Empezamos!

0:36

Muy buenas, bienvenidas, bienvenidos a un nuevo episodio

0:40

de BIMPRAXIS.

0:41

Hoy os traemos la revolución del código abierto

0:44

para crear tu propio asistente de inteligencia artificial.

0:46

¡Sin volverte loco!

0:48

¡Ragflow!

0:49

Eso es, un análisis a fondo que, la

0:51

verdad, hace muchísima falta hoy en día.

0:54

Totalmente.

0:54

Porque, a ver, resulta muy familiar esa sensación

0:57

de frustración generalizada con las IAS genéricas, ¿verdad?

1:00

Uf, hombre, claro que sí.

1:02

Esa situación recurrente en la oficina donde, no

1:05

sé, alguien le pide a una de estas

1:06

inteligencias artificiales famosísimas que redacte un informe estratégico.

1:11

Sí, o que resuelva una duda hiperespecífica sobre

1:14

un proyecto interno.

1:15

¡Exacto!

1:16

Y la respuesta es, bueno, en fin, una

1:18

colección de generalidades absolutas.

1:20

Una parrafada que no dice nada, vaya.

1:22

Tal cual.

1:23

O sea, suenan estupendamente bien.

1:26

Están redactadas con una prosa envidiable, pero no

1:30

aportan absolutamente nada de valor real al problema

1:34

de esa empresa.

1:35

Cero valor, claro.

1:36

Pero, a ver, si se analiza con frialdad,

1:38

tiene toda la lógica del mundo.

1:39

Ya, no es culpa del modelo en sí.

1:41

Exacto, no lo es.

1:42

Al fin y al cabo, esa IA genérica,

1:44

por muy potente que sea, no tiene acceso

1:46

a los documentos internos de la organización.

1:48

Claro, ¿no se ha leído los manuales?

1:50

Eso es.

1:50

No conoce las intrincadas políticas de la empresa,

1:53

ni los historiales de incidentes de los clientes.

1:55

Hay que matizar que esa IA genérica es

1:57

brillante en su campo, ¿eh?

1:58

Sí, sí, te escribe un poema en cinco

2:00

segundos.

2:01

Hombre, sabe cómo escribir un soneto al estilo

2:03

de Cervantes, desde luego.

2:04

Pero en el contexto del día a día

2:06

corporativo, padece una amnesia total sobre lo que

2:08

realmente importa.

2:09

No tiene ni idea de cuál es el

2:11

protocolo de devoluciones, por ejemplo.

2:13

Ni idea, para nada.

2:15

Exactamente por eso.

2:16

La misión de nuestra exploración de hoy es

2:18

crucial para quien nos escucha.

2:20

Vamos a sumergirnos de lleno.

2:22

Así es.

2:22

Vamos a analizar cómo RackFlow, que además es

2:25

una plataforma de código abierto y completamente gratuita,

2:28

ataca exactamente este cuello de botella.

2:31

Y lo hace operando como un motor Rack,

2:33

¿verdad?

2:33

Exacto.

2:34

Un motor de generación aumentada por recuperación.

2:37

El objetivo de este análisis a fondo es

2:39

destripar cómo esta herramienta consigue algo que, bueno,

2:42

parece magia pura.

2:44

Transforma la información estática.

2:45

Sí.

2:46

Transforma repositorios enteros de documentos, páginas web corporativas

2:50

y esos PDFs infumables que nadie lee.

2:53

Esos de 500 páginas.

2:54

Madre mía.

2:55

Esos mismos.

2:56

Los convierte en una base de conocimientos dinámica,

2:59

viva y perfectamente estructurada para alimentar a chatbots

3:02

interactivos.

3:03

O sea, la democratización definitiva de la IA

3:06

avanzada.

3:07

Eso es.

3:08

Poniéndola al alcance de cualquier entidad sin requerir

3:11

presupuestos astronómicos.

3:13

Bueno, vamos a desgranar esto porque...

3:15

La promesa es enorme.

3:16

Y hay que empezar por el principio.

3:18

Por los cimientos, claro.

3:19

Antes de que esa flamante inteligencia artificial pueda

3:22

ponerse a devorar manuales corporativos y a escupir

3:25

respuestas magistrales, hay un paso previo ineludible.

3:29

Saber dónde va a alojarse.

3:30

Exacto.

3:31

Decidir dónde va a vivir ese celebro digital.

3:34

Porque, tradicionalmente, levantar y mantener este tipo de

3:38

arquitecturas en servidores propios solía ser, bueno, una

3:41

pesadilla.

3:42

Un dolor de cabeza tremendo.

3:43

Era el equivalente tecnológico a intentar construir un

3:46

coche de Fórmula 1 desde cero en el

3:48

garaje de casa.

3:49

Ojo la analogía, que es muy buena.

3:51

Es que es así.

3:51

Se compran las piezas sueltas, se ensamblan y

3:54

se reza fuerte para que el motor no

3:55

explote en la primera curva.

3:57

Y muchas veces explota.

3:58

Totalmente.

3:59

Y a ver, Ragflow, al ser de código

4:01

abierto, permite precisamente esa vía del alojamiento propio,

4:06

lo que se llama self -hosted.

4:07

Para quien quiera aliarse la manta a la

4:10

cabeza y montarlo en su servidor.

4:11

Eso es.

4:12

Pero la realidad es que existe una alternativa

4:15

que altera por completo las reglas del juego.

4:18

Las plataformas en la nube.

4:20

Exacto.

4:21

Plataformas de despliegue gestionado, como por ejemplo el

4:24

Estio.

4:25

Siguiendo con la analogía del coche, recurrir a

4:27

esto sería como, digamos, hacer un renting.

4:30

Un renting integral, sí.

4:31

Claro.

4:32

El vehículo llega impecable y el contrato ya

4:34

incluye los mantenimientos preventivos, el seguro a todo

4:37

riesgo y los cambios de aceite.

4:39

Ojo, porque la analogía del renting es buenísima.

4:42

Pero se queda corta si no miramos el

4:44

coste de oportunidad real para una empresa.

4:46

¿En qué sentido?

4:47

Pues que no se trata solo de la

4:49

comodidad de que te den el coche listo

4:51

para conducir, ¿no?

4:52

Se trata de la eliminación casi total de

4:54

la barrera técnica.

4:56

Esa barrera que frena todo.

4:58

Claro.

4:59

Es que esa barrera bloquea el 90 %

5:01

de los proyectos de innovación hoy en día.

5:04

Históricamente, el gran muro de contención no era

5:07

el precio del software.

5:08

Era el miedo a romper algo, estoy segura.

5:11

Más bien el terror del departamento.

5:12

El terror del departamento de infraestructura.

5:13

Levantar un sistema complejo implica lidiar con dependencias,

5:17

contenedores, actualizaciones constantes.

5:20

Y el pánico absoluto a perder los datos.

5:22

Exacto.

5:23

Pero al utilizar una solución gestionada como el

5:25

Estio, el proceso se vuelve invisible.

5:27

Te quitas ese peso de encima.

5:29

La plataforma subyacente asume el verdadero trabajo sucio.

5:32

Hablamos de la gestión de copias de seguridad

5:35

automatizadas, la monitorización, los parches críticos de seguridad.

5:39

Claro.

5:39

Y desde una perspectiva puramente estratégica, esto es

5:43

oro.

5:43

Permite que los equipos se enfoquen en lo

5:45

que aporta valor, que es el conocimiento en

5:48

sí.

5:48

En vez de pelearse con la terminal de

5:51

comandos.

5:51

Eso es.

5:52

De hecho, el despliegue es tan fluido que

5:54

la principal preocupación pasa a ser puramente de

5:57

arquitectura.

5:58

Quien lidera el proyecto simplemente toma decisiones de

6:01

alto nivel.

6:02

Decisiones como la ubicación de los servidores.

6:05

Exactamente.

6:05

Elegir el proveedor en la nube más adecuado

6:07

o decidir la región geográfica.

6:10

Que a ver, este último detalle no es

6:12

baladero.

6:12

No es baladí, ¿eh?

6:12

En absoluto.

6:13

Hombre, para nada.

6:14

En un entorno corporativo, decidir si los datos

6:17

se alojan en Europa o en Estados Unidos

6:19

lo cambia todo, a nivel de cumplimiento normativo

6:22

y privacidad.

6:23

Totalmente.

6:24

La soberanía de los datos es un tema

6:26

hipercrítico cuando hablamos de subir el know -how

6:29

interno de una empresa a una IA.

6:30

No se puede subir a cualquier sitio.

6:32

Claro que no.

6:33

Y otra decisión fundamental en esa fase es

6:36

el nivel de soporte técnico que respalda la

6:39

infraestructura.

6:39

¿Y una vez definido todo eso?

6:42

Una vez definidas esas variables estratégicas, el despliegue

6:46

se ejecuta en segundo plano.

6:47

Es la magia del código abierto combinado con

6:50

el cloud gestionado.

6:51

En cuestión de minutos lo tienes.

6:54

Literalmente.

6:54

Se pasa de no tener nada a disponer

6:57

de un panel de control completo, con módulos

6:59

de chat, agentes, bases de conocimiento.

7:02

Todo listo para operar de forma privada.

7:05

Vale, o sea, ya tenemos la casa construida,

7:07

el servidor está blindado y tenemos las llaves

7:09

en la mano.

7:10

Ahora toca traer al inquilino.

7:13

Exacto.

7:13

Traer al inquilino inteligente.

7:15

Hay que conectar el modelo de lenguaje, el

7:18

LLM, y proporcionarle una biblioteca en condiciones.

7:22

Eso es.

7:23

Por defecto, Rackflow arranca con un modelo llamado

7:25

Tongji Qiangwen.

7:27

Pero, a ver, la verdadera potencia de una

7:29

arquitectura abierta reside en su flexibilidad.

7:32

Desde luego.

7:33

Obligar a usar un único modelo sería un

7:35

error garrafal.

7:36

La plataforma brilla precisamente porque permite interconectar los

7:40

motores de control.

7:40

Pero, ¿qué pasa con los motores más potentes

7:41

del mercado?

7:42

La interoperabilidad es la palabra clave aquí.

7:44

Aunque este modelo predeterminado tiene su utilidad para

7:46

empezar, la arquitectura permite enchufar modelos de la

7:49

talla de OpenEI.

7:50

O incluso cosas más privadas, ¿no?

7:52

Sí, sí.

7:52

Instancias locales y 100 % privadas, utilizando Oyama

7:56

o las últimas versiones de DeepSeq.

7:58

¿Y es muy complicado conectarlos?

8:00

Qué va.

8:00

La conexión suele requerir únicamente la clave de

8:03

la interfaz, la famosa API key.

8:05

Se pega ahí y Rackflow empieza a comunicarse

8:08

con el modelo al instante.

8:09

Perfecto.

8:10

Entonces, el cerebro ya está conectado y latiendo.

8:13

El siguiente paso lógico es construir esa biblioteca

8:17

de la que hablábamos.

8:18

Crear la base de conocimientos pura y dura.

8:20

Eso es.

8:22

Imaginemos un caso práctico para la audiencia.

8:24

Se crea un espacio de trabajo.

8:26

Se le asigna un logotipo corporativo para que

8:30

quede bonito.

8:30

Se selecciona el idioma.

8:32

Y se establecen los permisos de acceso.

8:34

Muy importante, sí.

8:35

Para determinar qué departamentos pueden consultar qué información.

8:39

Pero, a ver, aquí es donde la curva

8:42

de aprendizaje suele ponerse empinada.

8:45

Ah, ya sé por dónde vas.

8:47

Nos topamos con la jerga pura y dura

8:50

del sector.

8:51

Empezamos a oír hablar de los infames embeddings

8:53

y de los métodos de chunking.

8:56

Sí, la matemática oculta.

8:58

Y a ver, voy a hacer de abogada

8:59

del diablo un momento, ¿vale?

9:01

Adelante.

9:01

Es absolutamente vital entender toda esta matemática de

9:05

vectores, embeddings y chunks.

9:07

Es una pregunta súper lícita.

9:09

Es que suena a una cantidad de terminología

9:12

técnica completamente innecesaria para alguien que, francamente, lo

9:17

único que desea es que un bot responda

9:19

a dudas de un PDF.

9:21

Ya, da la sensación de que hay que

9:22

hacerle el trabajo a la máquina.

9:24

Claro.

9:24

Parece que hay que masticarle la comida a

9:27

la IA para que su cerebro la digiera.

9:29

Y el resultado visual, cuando ves esos chunks,

9:32

parece un caos total.

9:33

Es una excelente objeción, la verdad.

9:35

Pero hay que aclarar que no es sólo

9:37

masticar la comida.

9:37

Es cambiar el idioma en el que está

9:39

escrita la realidad para la máquina.

9:41

A ver, explícame eso.

9:43

Lo fascinante aquí es entender la mecánica oculta.

9:45

Porque sin ella, todo el concepto de rack

9:48

se desmorona.

9:48

Un modelo de embedding no hace otra cosa

9:51

que traducir el texto a coordenadas.

9:53

Coordenadas hiperdimensionales, he leído por ahí.

9:56

Exacto.

9:57

Imaginemos una biblioteca gigantesca.

10:00

Pero en lugar de ordenar los libros alfabéticamente

10:03

por el autor, se ordenan físicamente por el

10:06

sabor o la esencia de sus contenidos.

10:07

Vale, me gusta la idea.

10:10

En esta biblioteca abstracta, un libro sobre manzanas

10:13

se coloca muy cerca de un libro sobre

10:15

peras porque comparten la coordenada de fruta.

10:18

Tiene sentido.

10:19

Pero ambos están a kilómetros de distancia de

10:22

un manual sobre, no sé, bujías de coche.

10:24

Eso es un vector.

10:26

Convierte conceptos abstractos en distancias matemáticas.

10:29

Y así la IA busca más rápido.

10:31

Claro, calcula similitudes a la velocidad de la

10:34

luz.

10:34

Vale.

10:35

La analogía de la biblioteca aclara bastante.

10:37

El tema de los embeddings.

10:39

Pero, ¿qué ocurre con el chunking?

10:41

La fragmentación.

10:42

Sí.

10:42

¿Por qué existe esa necesidad imperiosa de despedazar

10:46

un documento que está perfectamente maquetado y estructurado?

10:50

Porque los modelos de lenguaje, por muy avanzados

10:53

que sean hoy, tienen una ventana de atención

10:55

limitada.

10:56

O sea que se pierden.

10:58

Exacto.

10:58

Si se introduce un manual técnico de 500

11:01

páginas de golpe, la IA pierde el hilo.

11:04

Olvida lo que le dio en la página

11:06

2 al llegar a las 300.

11:07

Como nos pasa a los humanos, vaya.

11:10

Tal cual.

11:11

El chunking soluciona esto troceando el documento en

11:14

fragmentos manejables, con un ligero solapamiento entre ellos

11:18

para no perder el contexto de las frases.

11:21

Ya entiendo.

11:21

¿Y sobre lo que comentaba antes del caos

11:24

visual?

11:24

Es muy pertinente.

11:26

Cuando el sistema procesa el documento y muestra

11:28

esos chunks resultantes en la pantalla, el texto

11:31

aparece deslavazado.

11:33

Lleno de etiquetas y metadatos rarísimos.

11:36

Sí.

11:36

No se ve nada bonito ni es fácilmente

11:39

elegible para un ojo humano.

11:40

Pero hay que asimilar que ese formato fragmentado

11:43

no está diseñado para nosotros.

11:45

Está hecho para la máquina.

11:46

Exacto.

11:47

Es la estructura más eficiente para que la

11:49

máquina indexe y recupere el conocimiento con precisión

11:52

quirúrgica.

11:53

Vale.

11:54

Entonces, ¿quien gestiona esto no tiene que ser

11:56

un experto en álgebra vectorial?

11:58

Para nada.

11:58

La plataforma ya proporciona parámetros por defecto que

12:01

asumen todo este trabajo pesado.

12:03

Menos mal.

12:03

Porque a la hora de alimentar al sistema,

12:05

el enfoque… resulta súper práctico.

12:08

Imaginemos que el equipo de soporte guarda una

12:11

web de preguntas frecuentes en PDF y las

12:13

sube.

12:14

La arrastra al panel y listo.

12:15

Eso es.

12:16

El motor aplica esa magia de los embeddings,

12:18

trocea el texto y lo indexa solo.

12:21

Y de cara a escenarios empresariales, resulta interesantísimo

12:24

ver hacia dónde va esto.

12:25

¿Hacia la automatización total?

12:27

Exacto.

12:28

La sincronización automatizada.

12:30

En lugar de arrastrar archivos manualmente, el sistema

12:32

permite conectar repositorios masivos en la nube, como

12:35

Amazon S3.

12:36

O sea que la base se actualiza sola.

12:38

Literalmente.

12:39

En cuanto alguien sube un documento nuevo al

12:41

servidor interno de la empresa, la IA se

12:44

lo aprende.

12:44

Y esa automatización de la ingesta de datos

12:47

es lo que transforma un simple experimento curioso

12:50

en una herramienta seria, de grado impresarial.

12:53

Totalmente.

12:53

Pero, claro, una vez que ese PDF está

12:56

digerido y convertido en coordenadas matemáticas, surge un

13:00

reto de confianza monumental.

13:02

El gran elefante en la habitación.

13:04

Cómo se audita una caja negra.

13:06

Esa es una pregunta clave.

13:07

Claro, trocear el documento y pasarlo a vectores

13:10

suena super eficiente en teoría, pero el miedo

13:14

siempre es el mismo.

13:15

¿Nos podemos fiar?

13:16

Exacto.

13:17

El miedo en cualquier consejo de administración es,

13:20

¿cómo nos fiamos de que la máquina realmente

13:22

se ha enterado de algo antes de poner

13:24

a este bot a hablar con clientes?

13:26

¿No se puede simplemente cruzar los dedos?

13:28

Desde luego que no.

13:29

Y por eso no se cruzan.

13:31

Se implementan pruebas de recuperación.

13:34

El famoso Retrieval Testing.

13:36

Las pruebas de fuego.

13:38

Eso es.

13:39

Antes de que el modelo formule una frase

13:41

completa, hay que verificar que el motor de

13:43

búsqueda interno funciona.

13:45

Se introducen términos críticos, como tiempos de respuesta.

13:49

Para ver si pesca el dato correcto.

13:51

Para observar exactamente qué fragmentos rescata la base

13:54

de datos de entre sus miles de vectores.

13:56

Pero no basta con encontrar coincidencias sueltas.

13:59

Claro, habrá mucho ruido.

14:00

Muchísimo.

14:01

Aquí entra en juego un concepto vital.

14:03

El modelo de reclasificación.

14:05

O re -rank.

14:07

Un momento.

14:08

Reclasificación.

14:09

Sí, sí.

14:10

Si el sistema ya ha buscado los vectores

14:12

más cercanos en nuestra famosa biblioteca de sabores,

14:16

¿para qué necesita volver a clasificar nada?

14:18

Parece redundante.

14:19

Podría parecerlo, pero es un doble filtro de

14:21

calidad imprescindible, te lo aseguro.

14:24

La primera búsqueda vectorial es muy rápida, pero

14:26

muy amplia.

14:27

O sea, trae de todo un poco.

14:29

Puede rescatar 50 fragmentos que hablan vagamente de

14:32

reembolsos, por ejemplo.

14:33

Pero muchos podrían estar fuera de contexto.

14:36

Vale.

14:36

El modelo de re -rank es un modelo

14:38

más lento y analítico, que toma esos 50

14:41

resultados y los somete a un escrutinio profundo

14:44

contra la pregunta original.

14:46

O sea, ¿hace una criba?

14:47

Descarta el ruido y ordena los tres o

14:49

cuatro fragmentos verdaderamente cruciales.

14:51

Y sólo esa información hiperrefinada es la que

14:54

se le entrega a la IA para redactar

14:56

la respuesta.

14:57

Es brillante.

14:58

Y aquí es donde se pone verdaderamente interesante

15:00

la aplicación práctica.

15:01

Una vez verificado que los engranajes funcionan gracias

15:05

a ese doble filtro, se crea el asistente.

15:07

El chatbot final con el que interactúa el

15:09

usuario.

15:10

Exacto.

15:11

Se define su personalidad, el tono, si tiene

15:15

un avatar… Pero hay una configuración concreta que

15:18

me parece un salvavidas absoluto.

15:19

La respuesta de vacío o empty response.

15:23

Uff, esa función es clave.

15:26

Permite programar con exactitud qué debe articular la

15:29

IA cuando busca en los vectores y descubre

15:31

que no tiene respuesta.

15:32

Algo simple como, no lo sé, preguntaré a

15:35

soporte.

15:36

Hay que detenerse en este punto, porque supone

15:38

un cambio cultural inmenso.

15:40

¿En nuestra relación con la IA?

15:42

Sí.

15:42

El gran problema de la IA generativa actual,

15:44

su talón de Aquiles, son las alucinaciones.

15:48

Esa tendencia casi patológica a inventarse respuestas y

15:51

fechas.

15:51

Con una seguridad pasmosa, además.

15:54

Exacto.

15:54

Cuando se encuentra en un callejón sin salida,

15:56

se lo inventa.

15:58

En el entorno corporativo se penaliza mucho decir,

16:01

no lo sé.

16:01

Pero hablando de algoritmos, la honestidad algorítmica vale

16:05

oro.

16:05

Es infinitamente preferible, claro.

16:07

Es preferible un asistente que admita sus limitaciones

16:10

y detenga el proceso, antes que un bot

16:13

que decida inventarse, no sé, una promoción del

16:16

50 % de descuento.

16:18

Que provoca una crisis de relaciones públicas en

16:21

segundos.

16:21

Tal cual.

16:22

Totalmente de acuerdo.

16:23

Es honestidad por diseño.

16:26

Y esto enlaza con el otro pilar de

16:28

la confianza, para quien nos escucha, la trazabilidad.

16:31

Ah, las citas.

16:32

Exacto.

16:33

Cuando el asistente entra en acción y se

16:35

le hace una pregunta compleja, devuelve una respuesta

16:38

maravillosamente estructurada con sus negritas y viñetas.

16:42

Nada que ver con los chunks feos de

16:44

antes.

16:45

Para nada.

16:46

Pero la joya de la corona aparece al

16:48

final.

16:49

El sistema incluye una cita precisa indicando de

16:52

qué PDF e incluso de qué párrafo exacto

16:55

ha extraído el dato.

16:56

Es vital para auditar.

16:58

Es como tener a un analista junior que…

17:00

No sólo entrega un resumen impecable, sino que…

17:04

Coloca el manual abierto por la página exacta

17:07

de la evidencia.

17:08

Esa es la gran diferencia entre un generador

17:11

de texto al uso y un sistema de

17:13

gestión del conocimiento real.

17:15

Si hay dudas, se revisa la cita.

17:17

La fuente siempre es auditable.

17:19

Transparencia total.

17:20

Y además, la arquitectura permite pivotar sobre la

17:23

marcha.

17:24

Si se percibe que el modelo es demasiado

17:26

lento razonando, se cambia el motor por otro

17:28

más ágil, como un modelo mini.

17:30

Sin reconstruir toda la base de datos.

17:33

¡Qué pasada!

17:34

Todo esto dibuja un ecosistema fantástico y ultraseguro.

17:38

Pero… presenta un límite claro.

17:41

A ver.

17:42

Hasta aquí hemos analizado un cerebro brillante encerrado

17:45

en una habitación llena de archivadores estáticos.

17:48

Pero, ¿qué ocurre cuando la realidad supera esos

17:51

documentos?

17:52

El mundo exterior, claro.

17:54

Las normativas de la empresa pueden ser fijas,

17:56

pero el mundo cambia cada segundo.

17:58

¿Qué pasa si la respuesta depende de conocer

18:01

una noticia publicada hace tres horas?

18:03

O el estado de la bolsa.

18:05

Exacto.

18:05

Datos que simplemente nunca se incluyeron en los

18:08

PDFs de la empresa.

18:09

Ahí es donde la tecnología RAC tradicional choca

18:12

contra un muro.

18:13

Un modelo entrenado hace un año, con PDFs

18:16

de hace un mes, no puede responder a

18:18

una crisis de hoy.

18:19

Lógico.

18:20

Para romper ese aislamiento, se requiere una capa

18:23

superior de autonomía, la orquestación de agentes.

18:25

Esto transforma un sistema pasivo en un investigador

18:29

activo que sale a Internet.

18:30

Y el método para construir estos agentes es

18:32

fascinante.

18:33

Quien espere ver pantallas negras llenas de código

18:35

se llevará una sorpresa masiva.

18:37

Súper accesible.

18:38

La interfaz se basa en nodos visuales.

18:41

Para conceptualizarlo, es muy parecido a plataformas como

18:44

N8N o incluso a jugar con piezas de

18:47

LEGO lógicas.

18:48

Arrastrar y soltar cajitas, básicamente.

18:51

Eso es.

18:51

Permite diseñar flujos complejos arrastrando cajas y conectándolas

18:55

con fuentes.

18:55

Y un detalle brillante es que cada caja

18:58

viene con comentarios didácticos explicando su función.

19:01

Y ojo, que el diseño basado en nodos

19:03

no es un simple lavado de cara estético.

19:05

No.

19:06

Es una abstracción conceptual poderosísima.

19:08

Permite que mentes no técnicas, pero que conocen

19:11

bien el negocio, puedan diseñar la lógica.

19:14

Diseñar sin picar código.

19:15

Exacto.

19:16

Una fente de búsqueda web no es más

19:18

que una secuencia.

19:19

Recibir pregunta, extraer palabras clave, buscar en Internet,

19:24

leer resultados, combinar con datos internos y responder.

19:27

Pero claro, la teoría es preciosa hasta que

19:29

el código choca con la realidad.

19:31

Imaginemos que ensamblamos esas piezas de LEGO para

19:34

preguntar la fecha de nacimiento de Napoleón.

19:36

Un ejemplo clásico.

19:37

Se le da el botón de ejecutar y…

19:39

el sistema colapsa en vivo.

19:43

Lanza un error.

19:44

Pasa en las mejores familias.

19:46

Pero lejos de ser un drama, estos fallos

19:48

resultan ser la mejor clase magistral.

19:51

El fallo no ocurre porque la IA sea

19:53

tonta.

19:54

Suele ser un tema de configuración.

19:56

En ese cirujo específico, el sistema estaba configurado

19:59

para llamar a un modelo de deep -seq

20:01

que no tenía los permisos habilitados en ese

20:03

momento.

20:04

Y la resolución de ese incidente ilustra el

20:07

verdadero cambio de paradigma en el mantenimiento del

20:09

software.

20:10

Es facilísimo de arreglar.

20:12

Hace unos años, solucionar un error de llamadas

20:14

a una API requería bucear entre cientos de

20:17

líneas de código, leer logs crípticos y cruzar

20:19

los dedos.

20:20

Una tortura.

20:21

En este entorno visual, el error se ilumina.

20:24

Se ilumina directamente en las cajitas afectadas, en

20:26

rojo.

20:26

La solución pasa únicamente por identificar esos nodos.

20:30

El de refinar la pregunta y el de

20:32

generar la respuesta, por ejemplo.

20:33

Exacto.

20:34

Abrirlos y, con un menú desplegable, reemplazar el

20:38

motor ausente por uno activo.

20:39

Como la versión mini de GPT -4.

20:42

Y a correr.

20:44

Efectivamente.

20:45

Se aplican los cambios, se vuelve a ejecutar

20:48

y esta vez el flujo es hipnótico.

20:51

Se puede ver cómo la información viaja por

20:54

las flechas, cómo busca la fecha.

20:56

El 15 de agosto, claro.

20:57

Eso es.

20:58

Y cómo entrega la respuesta final añadiendo el

21:01

enlace a Wikipedia como prueba de su investigación

21:03

en tiempo real.

21:04

Esto pantea una cuestión que trasciende la simple

21:07

automatización de tareas.

21:08

Dotar a un modelo de lenguaje de la

21:10

capacidad de orquestar búsquedas web.

21:12

Lo cambia todo.

21:13

Destruye para siempre la barrera del corte de

21:15

conocimiento.

21:16

La IA ya no está limitada por los

21:18

datos con los que fue entrenada en el

21:20

pasado.

21:20

Es la fusión definitiva.

21:22

Totalmente.

21:23

Por un lado, se dispone del conocimiento privado

21:25

de la empresa y, por otro, de la

21:27

inmensidad de datos de Internet.

21:29

Y el puente es un sistema visual para

21:32

que cualquiera construya empleados digitales.

21:34

Se democratiza el rol de ingeniero de automatización,

21:38

desde luego.

21:39

Y para terminar de consolidar todas las piezas

21:41

de este rompecabezas, resulta interesante plantear una reflexión.

21:45

A ver, cuéntanos.

21:47

Una reflexión de cara al futuro a corto

21:49

plazo.

21:49

Hemos diseccionado cómo ecosistemas gratuitos de código abierto

21:53

eliminan la fricción para crear sistemas hipercomplejos.

21:57

Sistemas con memoria y trazabilidad.

22:00

Exacto.

22:01

Y con honestidad algorítmica.

22:02

Si la barrera técnica y financiera ha quedado

22:05

reducida a cenizas, ¿cómo va a cambiar esto

22:08

la arquitectura de los departamentos corporativos?

22:10

Uf, es una gran pregunta.

22:12

¿Cómo evolucionará el estudio académico y la síntesis

22:15

de información masiva en la próxima década?

22:17

Va a ser un salto tremendo.

22:19

Resulta evidente que el límite ya no reside

22:22

en los presupuestos de servidores, ni en la

22:25

complejidad del código.

22:26

La última frontera es nuestra propia imaginación para

22:30

diseñar los flujos de trabajo de la próxima

22:32

era.

22:32

Antes de despedirnos hasta el próximo programa, os

22:36

informamos de que las voces que oyes han

22:38

sido generadas por la IAE de Notebook LM,

22:41

y que dirigiendo el podcast se encuentra Julio

22:44

Pablo Vázquez, un humano que te envía saludos.

22:46

En caso de error, probablemente sean errores humanos.

22:49

¿Nos escuchamos?

22:51

Y hasta aquí el episodio de hoy.

23:04

Muchas gracias por tu atención.

23:15

Esto es BIMpraxis.

23:18

Nos escuchamos en el próximo episodio.