E080_Crea tu IA corporativa con RAGFlow (OpenSource)

0:09

Buenas, esto es BIMPRAXIS, el podcast donde el

0:15

BIM se encuentra con la inteligencia artificial.

0:20

Exploramos la ciencia, la tecnología y el futuro

0:23

desde el enfoque de la arquitectura, ingeniería y

0:26

construcción.

0:28

¡Empezamos!

0:36

Muy buenas, bienvenidas, bienvenidos a un nuevo episodio

0:40

de BIMPRAXIS.

0:41

Hoy os traemos la revolución del código abierto

0:44

para crear tu propio asistente de inteligencia artificial.

0:46

¡Sin volverte loco!

0:48

¡Ragflow!

0:49

Eso es, un análisis a fondo que, la

0:51

verdad, hace muchísima falta hoy en día.

0:54

Totalmente.

0:54

Porque, a ver, resulta muy familiar esa sensación

0:57

de frustración generalizada con las IAS genéricas, ¿verdad?

1:00

Uf, hombre, claro que sí.

1:02

Esa situación recurrente en la oficina donde, no

1:05

sé, alguien le pide a una de estas

1:06

inteligencias artificiales famosísimas que redacte un informe estratégico.

1:11

Sí, o que resuelva una duda hiperespecífica sobre

1:14

un proyecto interno.

1:15

¡Exacto!

1:16

Y la respuesta es, bueno, en fin, una

1:18

colección de generalidades absolutas.

1:20

Una parrafada que no dice nada, vaya.

1:22

Tal cual.

1:23

O sea, suenan estupendamente bien.

1:26

Están redactadas con una prosa envidiable, pero no

1:30

aportan absolutamente nada de valor real al problema

1:34

de esa empresa.

1:35

Cero valor, claro.

1:36

Pero, a ver, si se analiza con frialdad,

1:38

tiene toda la lógica del mundo.

1:39

Ya, no es culpa del modelo en sí.

1:41

Exacto, no lo es.

1:42

Al fin y al cabo, esa IA genérica,

1:44

por muy potente que sea, no tiene acceso

1:46

a los documentos internos de la organización.

1:48

Claro, ¿no se ha leído los manuales?

1:50

Eso es.

1:50

No conoce las intrincadas políticas de la empresa,

1:53

ni los historiales de incidentes de los clientes.

1:55

Hay que matizar que esa IA genérica es

1:57

brillante en su campo, ¿eh?

1:58

Sí, sí, te escribe un poema en cinco

2:00

segundos.

2:01

Hombre, sabe cómo escribir un soneto al estilo

2:03

de Cervantes, desde luego.

2:04

Pero en el contexto del día a día

2:06

corporativo, padece una amnesia total sobre lo que

2:08

realmente importa.

2:09

No tiene ni idea de cuál es el

2:11

protocolo de devoluciones, por ejemplo.

2:13

Ni idea, para nada.

2:15

Exactamente por eso.

2:16

La misión de nuestra exploración de hoy es

2:18

crucial para quien nos escucha.

2:20

Vamos a sumergirnos de lleno.

2:22

Así es.

2:22

Vamos a analizar cómo RackFlow, que además es

2:25

una plataforma de código abierto y completamente gratuita,

2:28

ataca exactamente este cuello de botella.

2:31

Y lo hace operando como un motor Rack,

2:33

¿verdad?

2:33

Exacto.

2:34

Un motor de generación aumentada por recuperación.

2:37

El objetivo de este análisis a fondo es

2:39

destripar cómo esta herramienta consigue algo que, bueno,

2:42

parece magia pura.

2:44

Transforma la información estática.

2:45

Sí.

2:46

Transforma repositorios enteros de documentos, páginas web corporativas

2:50

y esos PDFs infumables que nadie lee.

2:53

Esos de 500 páginas.

2:54

Madre mía.

2:55

Esos mismos.

2:56

Los convierte en una base de conocimientos dinámica,

2:59

viva y perfectamente estructurada para alimentar a chatbots

3:02

interactivos.

3:03

O sea, la democratización definitiva de la IA

3:06

avanzada.

3:07

Eso es.

3:08

Poniéndola al alcance de cualquier entidad sin requerir

3:11

presupuestos astronómicos.

3:13

Bueno, vamos a desgranar esto porque...

3:15

La promesa es enorme.

3:16

Y hay que empezar por el principio.

3:18

Por los cimientos, claro.

3:19

Antes de que esa flamante inteligencia artificial pueda

3:22

ponerse a devorar manuales corporativos y a escupir

3:25

respuestas magistrales, hay un paso previo ineludible.

3:29

Saber dónde va a alojarse.

3:30

Exacto.

3:31

Decidir dónde va a vivir ese celebro digital.

3:34

Porque, tradicionalmente, levantar y mantener este tipo de

3:38

arquitecturas en servidores propios solía ser, bueno, una

3:41

pesadilla.

3:42

Un dolor de cabeza tremendo.

3:43

Era el equivalente tecnológico a intentar construir un

3:46

coche de Fórmula 1 desde cero en el

3:48

garaje de casa.

3:49

Ojo la analogía, que es muy buena.

3:51

Es que es así.

3:51

Se compran las piezas sueltas, se ensamblan y

3:54

se reza fuerte para que el motor no

3:55

explote en la primera curva.

3:57

Y muchas veces explota.

3:58

Totalmente.

3:59

Y a ver, Ragflow, al ser de código

4:01

abierto, permite precisamente esa vía del alojamiento propio,

4:06

lo que se llama self -hosted.

4:07

Para quien quiera aliarse la manta a la

4:10

cabeza y montarlo en su servidor.

4:11

Eso es.

4:12

Pero la realidad es que existe una alternativa

4:15

que altera por completo las reglas del juego.

4:18

Las plataformas en la nube.

4:20

Exacto.

4:21

Plataformas de despliegue gestionado, como por ejemplo el

4:24

Estio.

4:25

Siguiendo con la analogía del coche, recurrir a

4:27

esto sería como, digamos, hacer un renting.

4:30

Un renting integral, sí.

4:31

Claro.

4:32

El vehículo llega impecable y el contrato ya

4:34

incluye los mantenimientos preventivos, el seguro a todo

4:37

riesgo y los cambios de aceite.

4:39

Ojo, porque la analogía del renting es buenísima.

4:42

Pero se queda corta si no miramos el

4:44

coste de oportunidad real para una empresa.

4:46

¿En qué sentido?

4:47

Pues que no se trata solo de la

4:49

comodidad de que te den el coche listo

4:51

para conducir, ¿no?

4:52

Se trata de la eliminación casi total de

4:54

la barrera técnica.

4:56

Esa barrera que frena todo.

4:58

Claro.

4:59

Es que esa barrera bloquea el 90 %

5:01

de los proyectos de innovación hoy en día.

5:04

Históricamente, el gran muro de contención no era

5:07

el precio del software.

5:08

Era el miedo a romper algo, estoy segura.

5:11

Más bien el terror del departamento.

5:12

El terror del departamento de infraestructura.

5:13

Levantar un sistema complejo implica lidiar con dependencias,

5:17

contenedores, actualizaciones constantes.

5:20

Y el pánico absoluto a perder los datos.

5:22

Exacto.

5:23

Pero al utilizar una solución gestionada como el

5:25

Estio, el proceso se vuelve invisible.

5:27

Te quitas ese peso de encima.

5:29

La plataforma subyacente asume el verdadero trabajo sucio.

5:32

Hablamos de la gestión de copias de seguridad

5:35

automatizadas, la monitorización, los parches críticos de seguridad.

5:39

Claro.

5:39

Y desde una perspectiva puramente estratégica, esto es

5:43

oro.

5:43

Permite que los equipos se enfoquen en lo

5:45

que aporta valor, que es el conocimiento en

5:48

sí.

5:48

En vez de pelearse con la terminal de

5:51

comandos.

5:51

Eso es.

5:52

De hecho, el despliegue es tan fluido que

5:54

la principal preocupación pasa a ser puramente de

5:57

arquitectura.

5:58

Quien lidera el proyecto simplemente toma decisiones de

6:01

alto nivel.

6:02

Decisiones como la ubicación de los servidores.

6:05

Exactamente.

6:05

Elegir el proveedor en la nube más adecuado

6:07

o decidir la región geográfica.

6:10

Que a ver, este último detalle no es

6:12

baladero.

6:12

No es baladí, ¿eh?

6:12

En absoluto.

6:13

Hombre, para nada.

6:14

En un entorno corporativo, decidir si los datos

6:17

se alojan en Europa o en Estados Unidos

6:19

lo cambia todo, a nivel de cumplimiento normativo

6:22

y privacidad.

6:23

Totalmente.

6:24

La soberanía de los datos es un tema

6:26

hipercrítico cuando hablamos de subir el know -how

6:29

interno de una empresa a una IA.

6:30

No se puede subir a cualquier sitio.

6:32

Claro que no.

6:33

Y otra decisión fundamental en esa fase es

6:36

el nivel de soporte técnico que respalda la

6:39

infraestructura.

6:39

¿Y una vez definido todo eso?

6:42

Una vez definidas esas variables estratégicas, el despliegue

6:46

se ejecuta en segundo plano.

6:47

Es la magia del código abierto combinado con

6:50

el cloud gestionado.

6:51

En cuestión de minutos lo tienes.

6:54

Literalmente.

6:54

Se pasa de no tener nada a disponer

6:57

de un panel de control completo, con módulos

6:59

de chat, agentes, bases de conocimiento.

7:02

Todo listo para operar de forma privada.

7:05

Vale, o sea, ya tenemos la casa construida,

7:07

el servidor está blindado y tenemos las llaves

7:09

en la mano.

7:10

Ahora toca traer al inquilino.

7:13

Exacto.

7:13

Traer al inquilino inteligente.

7:15

Hay que conectar el modelo de lenguaje, el

7:18

LLM, y proporcionarle una biblioteca en condiciones.

7:22

Eso es.

7:23

Por defecto, Rackflow arranca con un modelo llamado

7:25

Tongji Qiangwen.

7:27

Pero, a ver, la verdadera potencia de una

7:29

arquitectura abierta reside en su flexibilidad.

7:32

Desde luego.

7:33

Obligar a usar un único modelo sería un

7:35

error garrafal.

7:36

La plataforma brilla precisamente porque permite interconectar los

7:40

motores de control.

7:40

Pero, ¿qué pasa con los motores más potentes

7:41

del mercado?

7:42

La interoperabilidad es la palabra clave aquí.

7:44

Aunque este modelo predeterminado tiene su utilidad para

7:46

empezar, la arquitectura permite enchufar modelos de la

7:49

talla de OpenEI.

7:50

O incluso cosas más privadas, ¿no?

7:52

Sí, sí.

7:52

Instancias locales y 100 % privadas, utilizando Oyama

7:56

o las últimas versiones de DeepSeq.

7:58

¿Y es muy complicado conectarlos?

8:00

Qué va.

8:00

La conexión suele requerir únicamente la clave de

8:03

la interfaz, la famosa API key.

8:05

Se pega ahí y Rackflow empieza a comunicarse

8:08

con el modelo al instante.

8:09

Perfecto.

8:10

Entonces, el cerebro ya está conectado y latiendo.

8:13

El siguiente paso lógico es construir esa biblioteca

8:17

de la que hablábamos.

8:18

Crear la base de conocimientos pura y dura.

8:20

Eso es.

8:22

Imaginemos un caso práctico para la audiencia.

8:24

Se crea un espacio de trabajo.

8:26

Se le asigna un logotipo corporativo para que

8:30

quede bonito.

8:30

Se selecciona el idioma.

8:32

Y se establecen los permisos de acceso.

8:34

Muy importante, sí.

8:35

Para determinar qué departamentos pueden consultar qué información.

8:39

Pero, a ver, aquí es donde la curva

8:42

de aprendizaje suele ponerse empinada.

8:45

Ah, ya sé por dónde vas.

8:47

Nos topamos con la jerga pura y dura

8:50

del sector.

8:51

Empezamos a oír hablar de los infames embeddings

8:53

y de los métodos de chunking.

8:56

Sí, la matemática oculta.

8:58

Y a ver, voy a hacer de abogada

8:59

del diablo un momento, ¿vale?

9:01

Adelante.

9:01

Es absolutamente vital entender toda esta matemática de

9:05

vectores, embeddings y chunks.

9:07

Es una pregunta súper lícita.

9:09

Es que suena a una cantidad de terminología

9:12

técnica completamente innecesaria para alguien que, francamente, lo

9:17

único que desea es que un bot responda

9:19

a dudas de un PDF.

9:21

Ya, da la sensación de que hay que

9:22

hacerle el trabajo a la máquina.

9:24

Claro.

9:24

Parece que hay que masticarle la comida a

9:27

la IA para que su cerebro la digiera.

9:29

Y el resultado visual, cuando ves esos chunks,

9:32

parece un caos total.

9:33

Es una excelente objeción, la verdad.

9:35

Pero hay que aclarar que no es sólo

9:37

masticar la comida.

9:37

Es cambiar el idioma en el que está

9:39

escrita la realidad para la máquina.

9:41

A ver, explícame eso.

9:43

Lo fascinante aquí es entender la mecánica oculta.

9:45

Porque sin ella, todo el concepto de rack

9:48

se desmorona.

9:48

Un modelo de embedding no hace otra cosa

9:51

que traducir el texto a coordenadas.

9:53

Coordenadas hiperdimensionales, he leído por ahí.

9:56

Exacto.

9:57

Imaginemos una biblioteca gigantesca.

10:00

Pero en lugar de ordenar los libros alfabéticamente

10:03

por el autor, se ordenan físicamente por el

10:06

sabor o la esencia de sus contenidos.

10:07

Vale, me gusta la idea.

10:10

En esta biblioteca abstracta, un libro sobre manzanas

10:13

se coloca muy cerca de un libro sobre

10:15

peras porque comparten la coordenada de fruta.

10:18

Tiene sentido.

10:19

Pero ambos están a kilómetros de distancia de

10:22

un manual sobre, no sé, bujías de coche.

10:24

Eso es un vector.

10:26

Convierte conceptos abstractos en distancias matemáticas.

10:29

Y así la IA busca más rápido.

10:31

Claro, calcula similitudes a la velocidad de la

10:34

luz.

10:34

Vale.

10:35

La analogía de la biblioteca aclara bastante.

10:37

El tema de los embeddings.

10:39

Pero, ¿qué ocurre con el chunking?

10:41

La fragmentación.

10:42

Sí.

10:42

¿Por qué existe esa necesidad imperiosa de despedazar

10:46

un documento que está perfectamente maquetado y estructurado?

10:50

Porque los modelos de lenguaje, por muy avanzados

10:53

que sean hoy, tienen una ventana de atención

10:55

limitada.

10:56

O sea que se pierden.

10:58

Exacto.

10:58

Si se introduce un manual técnico de 500

11:01

páginas de golpe, la IA pierde el hilo.

11:04

Olvida lo que le dio en la página

11:06

2 al llegar a las 300.

11:07

Como nos pasa a los humanos, vaya.

11:10

Tal cual.

11:11

El chunking soluciona esto troceando el documento en

11:14

fragmentos manejables, con un ligero solapamiento entre ellos

11:18

para no perder el contexto de las frases.

11:21

Ya entiendo.

11:21

¿Y sobre lo que comentaba antes del caos

11:24

visual?

11:24

Es muy pertinente.

11:26

Cuando el sistema procesa el documento y muestra

11:28

esos chunks resultantes en la pantalla, el texto

11:31

aparece deslavazado.

11:33

Lleno de etiquetas y metadatos rarísimos.

11:36

Sí.

11:36

No se ve nada bonito ni es fácilmente

11:39

elegible para un ojo humano.

11:40

Pero hay que asimilar que ese formato fragmentado

11:43

no está diseñado para nosotros.

11:45

Está hecho para la máquina.

11:46

Exacto.

11:47

Es la estructura más eficiente para que la

11:49

máquina indexe y recupere el conocimiento con precisión

11:52

quirúrgica.

11:53

Vale.

11:54

Entonces, ¿quien gestiona esto no tiene que ser

11:56

un experto en álgebra vectorial?

11:58

Para nada.

11:58

La plataforma ya proporciona parámetros por defecto que

12:01

asumen todo este trabajo pesado.

12:03

Menos mal.

12:03

Porque a la hora de alimentar al sistema,

12:05

el enfoque… resulta súper práctico.

12:08

Imaginemos que el equipo de soporte guarda una

12:11

web de preguntas frecuentes en PDF y las

12:13

sube.

12:14

La arrastra al panel y listo.

12:15

Eso es.

12:16

El motor aplica esa magia de los embeddings,

12:18

trocea el texto y lo indexa solo.

12:21

Y de cara a escenarios empresariales, resulta interesantísimo

12:24

ver hacia dónde va esto.

12:25

¿Hacia la automatización total?

12:27

Exacto.

12:28

La sincronización automatizada.

12:30

En lugar de arrastrar archivos manualmente, el sistema

12:32

permite conectar repositorios masivos en la nube, como

12:35

Amazon S3.

12:36

O sea que la base se actualiza sola.

12:38

Literalmente.

12:39

En cuanto alguien sube un documento nuevo al

12:41

servidor interno de la empresa, la IA se

12:44

lo aprende.

12:44

Y esa automatización de la ingesta de datos

12:47

es lo que transforma un simple experimento curioso

12:50

en una herramienta seria, de grado impresarial.

12:53

Totalmente.

12:53

Pero, claro, una vez que ese PDF está

12:56

digerido y convertido en coordenadas matemáticas, surge un

13:00

reto de confianza monumental.

13:02

El gran elefante en la habitación.

13:04

Cómo se audita una caja negra.

13:06

Esa es una pregunta clave.

13:07

Claro, trocear el documento y pasarlo a vectores

13:10

suena super eficiente en teoría, pero el miedo

13:14

siempre es el mismo.

13:15

¿Nos podemos fiar?

13:16

Exacto.

13:17

El miedo en cualquier consejo de administración es,

13:20

¿cómo nos fiamos de que la máquina realmente

13:22

se ha enterado de algo antes de poner

13:24

a este bot a hablar con clientes?

13:26

¿No se puede simplemente cruzar los dedos?

13:28

Desde luego que no.

13:29

Y por eso no se cruzan.

13:31

Se implementan pruebas de recuperación.

13:34

El famoso Retrieval Testing.

13:36

Las pruebas de fuego.

13:38

Eso es.

13:39

Antes de que el modelo formule una frase

13:41

completa, hay que verificar que el motor de

13:43

búsqueda interno funciona.

13:45

Se introducen términos críticos, como tiempos de respuesta.

13:49

Para ver si pesca el dato correcto.

13:51

Para observar exactamente qué fragmentos rescata la base

13:54

de datos de entre sus miles de vectores.

13:56

Pero no basta con encontrar coincidencias sueltas.

13:59

Claro, habrá mucho ruido.

14:00

Muchísimo.

14:01

Aquí entra en juego un concepto vital.

14:03

El modelo de reclasificación.

14:05

O re -rank.

14:07

Un momento.

14:08

Reclasificación.

14:09

Sí, sí.

14:10

Si el sistema ya ha buscado los vectores

14:12

más cercanos en nuestra famosa biblioteca de sabores,

14:16

¿para qué necesita volver a clasificar nada?

14:18

Parece redundante.

14:19

Podría parecerlo, pero es un doble filtro de

14:21

calidad imprescindible, te lo aseguro.

14:24

La primera búsqueda vectorial es muy rápida, pero

14:26

muy amplia.

14:27

O sea, trae de todo un poco.

14:29

Puede rescatar 50 fragmentos que hablan vagamente de

14:32

reembolsos, por ejemplo.

14:33

Pero muchos podrían estar fuera de contexto.

14:36

Vale.

14:36

El modelo de re -rank es un modelo

14:38

más lento y analítico, que toma esos 50

14:41

resultados y los somete a un escrutinio profundo

14:44

contra la pregunta original.

14:46

O sea, ¿hace una criba?

14:47

Descarta el ruido y ordena los tres o

14:49

cuatro fragmentos verdaderamente cruciales.

14:51

Y sólo esa información hiperrefinada es la que

14:54

se le entrega a la IA para redactar

14:56

la respuesta.

14:57

Es brillante.

14:58

Y aquí es donde se pone verdaderamente interesante

15:00

la aplicación práctica.

15:01

Una vez verificado que los engranajes funcionan gracias

15:05

a ese doble filtro, se crea el asistente.

15:07

El chatbot final con el que interactúa el

15:09

usuario.

15:10

Exacto.

15:11

Se define su personalidad, el tono, si tiene

15:15

un avatar… Pero hay una configuración concreta que

15:18

me parece un salvavidas absoluto.

15:19

La respuesta de vacío o empty response.

15:23

Uff, esa función es clave.

15:26

Permite programar con exactitud qué debe articular la

15:29

IA cuando busca en los vectores y descubre

15:31

que no tiene respuesta.

15:32

Algo simple como, no lo sé, preguntaré a

15:35

soporte.

15:36

Hay que detenerse en este punto, porque supone

15:38

un cambio cultural inmenso.

15:40

¿En nuestra relación con la IA?

15:42

Sí.

15:42

El gran problema de la IA generativa actual,

15:44

su talón de Aquiles, son las alucinaciones.

15:48

Esa tendencia casi patológica a inventarse respuestas y

15:51

fechas.

15:51

Con una seguridad pasmosa, además.

15:54

Exacto.

15:54

Cuando se encuentra en un callejón sin salida,

15:56

se lo inventa.

15:58

En el entorno corporativo se penaliza mucho decir,

16:01

no lo sé.

16:01

Pero hablando de algoritmos, la honestidad algorítmica vale

16:05

oro.

16:05

Es infinitamente preferible, claro.

16:07

Es preferible un asistente que admita sus limitaciones

16:10

y detenga el proceso, antes que un bot

16:13

que decida inventarse, no sé, una promoción del

16:16

50 % de descuento.

16:18

Que provoca una crisis de relaciones públicas en

16:21

segundos.

16:21

Tal cual.

16:22

Totalmente de acuerdo.

16:23

Es honestidad por diseño.

16:26

Y esto enlaza con el otro pilar de

16:28

la confianza, para quien nos escucha, la trazabilidad.

16:31

Ah, las citas.

16:32

Exacto.

16:33

Cuando el asistente entra en acción y se

16:35

le hace una pregunta compleja, devuelve una respuesta

16:38

maravillosamente estructurada con sus negritas y viñetas.

16:42

Nada que ver con los chunks feos de

16:44

antes.

16:45

Para nada.

16:46

Pero la joya de la corona aparece al

16:48

final.

16:49

El sistema incluye una cita precisa indicando de

16:52

qué PDF e incluso de qué párrafo exacto

16:55

ha extraído el dato.

16:56

Es vital para auditar.

16:58

Es como tener a un analista junior que…

17:00

No sólo entrega un resumen impecable, sino que…

17:04

Coloca el manual abierto por la página exacta

17:07

de la evidencia.

17:08

Esa es la gran diferencia entre un generador

17:11

de texto al uso y un sistema de

17:13

gestión del conocimiento real.

17:15

Si hay dudas, se revisa la cita.

17:17

La fuente siempre es auditable.

17:19

Transparencia total.

17:20

Y además, la arquitectura permite pivotar sobre la

17:23

marcha.

17:24

Si se percibe que el modelo es demasiado

17:26

lento razonando, se cambia el motor por otro

17:28

más ágil, como un modelo mini.

17:30

Sin reconstruir toda la base de datos.

17:33

¡Qué pasada!

17:34

Todo esto dibuja un ecosistema fantástico y ultraseguro.

17:38

Pero… presenta un límite claro.

17:41

A ver.

17:42

Hasta aquí hemos analizado un cerebro brillante encerrado

17:45

en una habitación llena de archivadores estáticos.

17:48

Pero, ¿qué ocurre cuando la realidad supera esos

17:51

documentos?

17:52

El mundo exterior, claro.

17:54

Las normativas de la empresa pueden ser fijas,

17:56

pero el mundo cambia cada segundo.

17:58

¿Qué pasa si la respuesta depende de conocer

18:01

una noticia publicada hace tres horas?

18:03

O el estado de la bolsa.

18:05

Exacto.

18:05

Datos que simplemente nunca se incluyeron en los

18:08

PDFs de la empresa.

18:09

Ahí es donde la tecnología RAC tradicional choca

18:12

contra un muro.

18:13

Un modelo entrenado hace un año, con PDFs

18:16

de hace un mes, no puede responder a

18:18

una crisis de hoy.

18:19

Lógico.

18:20

Para romper ese aislamiento, se requiere una capa

18:23

superior de autonomía, la orquestación de agentes.

18:25

Esto transforma un sistema pasivo en un investigador

18:29

activo que sale a Internet.

18:30

Y el método para construir estos agentes es

18:32

fascinante.

18:33

Quien espere ver pantallas negras llenas de código

18:35

se llevará una sorpresa masiva.

18:37

Súper accesible.

18:38

La interfaz se basa en nodos visuales.

18:41

Para conceptualizarlo, es muy parecido a plataformas como

18:44

N8N o incluso a jugar con piezas de

18:47

LEGO lógicas.

18:48

Arrastrar y soltar cajitas, básicamente.

18:51

Eso es.

18:51

Permite diseñar flujos complejos arrastrando cajas y conectándolas

18:55

con fuentes.

18:55

Y un detalle brillante es que cada caja

18:58

viene con comentarios didácticos explicando su función.

19:01

Y ojo, que el diseño basado en nodos

19:03

no es un simple lavado de cara estético.

19:05

No.

19:06

Es una abstracción conceptual poderosísima.

19:08

Permite que mentes no técnicas, pero que conocen

19:11

bien el negocio, puedan diseñar la lógica.

19:14

Diseñar sin picar código.

19:15

Exacto.

19:16

Una fente de búsqueda web no es más

19:18

que una secuencia.

19:19

Recibir pregunta, extraer palabras clave, buscar en Internet,

19:24

leer resultados, combinar con datos internos y responder.

19:27

Pero claro, la teoría es preciosa hasta que

19:29

el código choca con la realidad.

19:31

Imaginemos que ensamblamos esas piezas de LEGO para

19:34

preguntar la fecha de nacimiento de Napoleón.

19:36

Un ejemplo clásico.

19:37

Se le da el botón de ejecutar y…

19:39

el sistema colapsa en vivo.

19:43

Lanza un error.

19:44

Pasa en las mejores familias.

19:46

Pero lejos de ser un drama, estos fallos

19:48

resultan ser la mejor clase magistral.

19:51

El fallo no ocurre porque la IA sea

19:53

tonta.

19:54

Suele ser un tema de configuración.

19:56

En ese cirujo específico, el sistema estaba configurado

19:59

para llamar a un modelo de deep -seq

20:01

que no tenía los permisos habilitados en ese

20:03

momento.

20:04

Y la resolución de ese incidente ilustra el

20:07

verdadero cambio de paradigma en el mantenimiento del

20:09

software.

20:10

Es facilísimo de arreglar.

20:12

Hace unos años, solucionar un error de llamadas

20:14

a una API requería bucear entre cientos de

20:17

líneas de código, leer logs crípticos y cruzar

20:19

los dedos.

20:20

Una tortura.

20:21

En este entorno visual, el error se ilumina.

20:24

Se ilumina directamente en las cajitas afectadas, en

20:26

rojo.

20:26

La solución pasa únicamente por identificar esos nodos.

20:30

El de refinar la pregunta y el de

20:32

generar la respuesta, por ejemplo.

20:33

Exacto.

20:34

Abrirlos y, con un menú desplegable, reemplazar el

20:38

motor ausente por uno activo.

20:39

Como la versión mini de GPT -4.

20:42

Y a correr.

20:44

Efectivamente.

20:45

Se aplican los cambios, se vuelve a ejecutar

20:48

y esta vez el flujo es hipnótico.

20:51

Se puede ver cómo la información viaja por

20:54

las flechas, cómo busca la fecha.

20:56

El 15 de agosto, claro.

20:57

Eso es.

20:58

Y cómo entrega la respuesta final añadiendo el

21:01

enlace a Wikipedia como prueba de su investigación

21:03

en tiempo real.

21:04

Esto pantea una cuestión que trasciende la simple

21:07

automatización de tareas.

21:08

Dotar a un modelo de lenguaje de la

21:10

capacidad de orquestar búsquedas web.

21:12

Lo cambia todo.

21:13

Destruye para siempre la barrera del corte de

21:15

conocimiento.

21:16

La IA ya no está limitada por los

21:18

datos con los que fue entrenada en el

21:20

pasado.

21:20

Es la fusión definitiva.

21:22

Totalmente.

21:23

Por un lado, se dispone del conocimiento privado

21:25

de la empresa y, por otro, de la

21:27

inmensidad de datos de Internet.

21:29

Y el puente es un sistema visual para

21:32

que cualquiera construya empleados digitales.

21:34

Se democratiza el rol de ingeniero de automatización,

21:38

desde luego.

21:39

Y para terminar de consolidar todas las piezas

21:41

de este rompecabezas, resulta interesante plantear una reflexión.

21:45

A ver, cuéntanos.

21:47

Una reflexión de cara al futuro a corto

21:49

plazo.

21:49

Hemos diseccionado cómo ecosistemas gratuitos de código abierto

21:53

eliminan la fricción para crear sistemas hipercomplejos.

21:57

Sistemas con memoria y trazabilidad.

22:00

Exacto.

22:01

Y con honestidad algorítmica.

22:02

Si la barrera técnica y financiera ha quedado

22:05

reducida a cenizas, ¿cómo va a cambiar esto

22:08

la arquitectura de los departamentos corporativos?

22:10

Uf, es una gran pregunta.

22:12

¿Cómo evolucionará el estudio académico y la síntesis

22:15

de información masiva en la próxima década?

22:17

Va a ser un salto tremendo.

22:19

Resulta evidente que el límite ya no reside

22:22

en los presupuestos de servidores, ni en la

22:25

complejidad del código.

22:26

La última frontera es nuestra propia imaginación para

22:30

diseñar los flujos de trabajo de la próxima

22:32

era.

22:32

Antes de despedirnos hasta el próximo programa, os

22:36

informamos de que las voces que oyes han

22:38

sido generadas por la IAE de Notebook LM,

22:41

y que dirigiendo el podcast se encuentra Julio

22:44

Pablo Vázquez, un humano que te envía saludos.

22:46

En caso de error, probablemente sean errores humanos.

22:49

¿Nos escuchamos?

22:51

Y hasta aquí el episodio de hoy.

23:04

Muchas gracias por tu atención.

23:15

Esto es BIMpraxis.

23:18

Nos escuchamos en el próximo episodio.

E080_Crea tu IA corporativa con RAGFlow (OpenSource)

Episode description

Episodio de BIMPRAXIS: La Revolución del Código Abierto en la Creación de Asistentes de Inteligencia Artificial

Persons