E031_Los modelos de lenguaje pequeños son el futuro

0:09

Buenas, esto es BIMPRAXIS, el podcast donde el BIM se encuentra con la inteligencia artificial.

0:20

Exploramos la ciencia, la tecnología y el futuro desde el enfoque de la arquitectura, ingeniería y construcción.

0:28

¡Empezamos!

0:37

Hola y bienvenidos. Hoy retomamos nuestra serie especial para BIMPRAXIS, los papers que cambiaron la historia de la IA.

0:43

Y este es el análisis número 17.

0:45

Y creo que el de hoy encaja perfectamente en esa descripción.

0:50

Nos sumergimos en un artículo que, aunque es muy reciente, no se limita a presentar un avance,

0:55

sino que se atreve a desafiar la dirección en la que parece moverse todo el campo.

1:00

Totalmente. Tenemos sobre la mesa un paper de Archive, la gran plataforma de prepublicación científica.

1:06

Y el título ya es todo una declaración de intenciones.

1:09

Small Language Models are the Future of Agentic AI.

1:12

O en español.

1:14

Los modelos de lenguaje pequeños son el futuro de la IA.

1:15

Es un título que te obliga a leerlo dos veces, porque choca frontalmente con la narrativa que llevamos, vamos, años escuchando.

1:25

Claro, la idea de que el progreso en IA es sinónimo de escala.

1:30

Más parámetros, más datos de entrenamiento, modelos cada vez más y más grandes.

1:36

Exacto. Hemos estado inmersos en una especie de carrera armamentística por el tamaño.

1:41

Y de repente llega este equipo liderado por Peter Belzac y dice…

1:45

Un momento. ¿Y si hemos estado mirando en la dirección equivocada?

1:51

¿Y si el futuro no es más grande, sino más astuto y especializado?

1:56

Justo.

1:56

Y es clave entender cómo lo presentan. El propio documento lo califica de declaración de valor.

2:02

No es un simple experimento con una tabla de resultados.

2:05

Es una tesis, un argumento casi filosófico sobre eficiencia y sostenibilidad.

2:11

Publicado en junio de 2025 y revisado en septiembre.

2:14

Así que estamos…

2:15

Estamos analizando el pensamiento más vanguardista.

2:18

Pues vamos a desgranar esa tesis. Por lo que veo, no empiezan atacando directamente.

2:23

De hecho, el resumen reconoce el mérito de los grandes modelos de lenguaje, los LLMS.

2:29

Correcto. No es una refutación. Es una recontextualización.

2:34

Parten de un respeto por lo que se ha conseguido.

2:36

Los LLMS son una maravilla, capaces de una flexibilidad casi humana.

2:40

Pero justo después introducen el concepto que lo cambia todo.

2:43

Los sistemas agénticos.

2:45

Y esta definición es el corazón de su argumento.

2:49

Totalmente.

2:50

¿Y cómo los definen exactamente?

2:51

Porque agente es una de esas palabras que se usan para todo en este sector.

2:56

Pues el paper es muy preciso aquí.

2:58

Los define como aplicaciones donde los modelos de lenguaje realizan un número reducido de tareas especializadas de forma repetitiva y con poca variación.

3:08

O sea, no hablamos de un chat filosófico.

3:10

Para nada. Estamos hablando de la IA que trabaja en segundo plano.

3:14

Entendido. Entonces, ¿no es un tema de la IA que trabaja en segundo plano?

3:15

Entonces, ¿no es un tema de la IA que trabaja en segundo plano?

3:15

Entonces, ¿no es un tema de la IA que trabaja en segundo plano?

3:15

No hablamos de pedirle un chatbot que nos escriba un poema,

3:18

sino de un sistema que, por ejemplo, procesa miles de facturas al día para extraer datos concretos.

3:24

Exactamente esos casos.

3:26

O un agente que monitoriza redes sociales para clasificar menciones de un producto.

3:31

Es la IA como una herramienta industrial, no como un compañero de conversación.

3:36

Y es en ese contexto donde lanzan su idea principal.

3:39

Para estas tareas, los modelos pequeños, los SLMs, son una opción superior.

3:45

Y lo basan en tres pilares.

3:48

Suficientemente potentes, inherentemente más adecuados y, por supuesto, necesariamente más económicos.

3:54

A ver, el tercer punto, el del coste, parece el más obvio.

3:58

Pero los dos primeros son más atrevidos.

4:01

¿De verdad un modelo pequeño es suficientemente potente?

4:05

Esa es la primera gran afirmación que hacen.

4:07

Sostienen que los SLMs ya han cruzado un umbral de calidad

4:11

que les permite ejecutar estas tareas concretas con una eficacia aleatoria.

4:15

Esa es la primera gran afirmación que hacen.

4:16

La complejidad de un modelo gigante, que sabe de física cuántica y de la dinastía Ming,

4:21

es un desperdicio absoluto para leer una factura.

4:24

Suena al viejo dicho de no usar un mazo para cascar una nuez.

4:28

Pero es solo una cuestión de desperdicio.

4:31

Ahí es donde entra el segundo pilar.

4:34

Inherentemente más adecuados.

4:36

Y no es solo que el mazo sea excesivo.

4:39

Es que el mazo puede romper la mesa, la nuez y hasta los dedos.

4:42

Entiendo.

4:43

Un LLM.

4:45

Por su propia naturaleza expansiva, es más propenso a alucinar,

4:49

a inventarse un dato o a salirse del guión.

4:52

Interesante.

4:53

O sea que para una tarea que exige precisión y fiabilidad,

4:57

como extraer datos financieros,

4:59

la creatividad de un LLM se puede convertir en un riesgo.

5:03

Precisamente.

5:04

Un SLM, entrenado específicamente para esa tarea,

5:08

es como un cirujano con un bisturí.

5:10

Su dominio restringido es una ventaja, no una limitación.

5:14

Es más rápido.

5:15

Más predecible y, en última instancia, más seguro.

5:18

Vale.

5:19

Esos dos puntos dibujan un cuadro muy convincente a nivel técnico.

5:23

Pero volvamos al tercer pilar, necesariamente más económicos.

5:28

Porque creo que aquí es donde el argumento pasa de ser

5:30

una discusión académica a una revolución industrial.

5:34

Sin duda.

5:35

Y la escala de la diferencia es difícil de exagerar.

5:39

El coste de entrenar un LLM se cuenta en cientos de millones.

5:42

Pero el verdadero coste oculto,

5:44

está en la operación, en la inferencia.

5:47

Cada vez que le pides que haga algo.

5:48

Exacto.

5:49

Y esos costes pueden sumar millones al MIS para una empresa grande.

5:52

Entonces, si una empresa tiene un agente que procesa un millón de correos al día,

5:57

el coste de usar un LLM gigante para cada uno de esos correos es…

6:02

Astronómico.

6:03

Exacto.

6:04

Con un SLM optimizado, el coste por inferencia se desploma.

6:08

Puede ser cientos o miles de veces más barato.

6:11

Y esto tiene dos consecuencias enormes.

6:12

La primera, imagino,

6:13

es la democratización.

6:15

Desde luego.

6:16

Pequeños y medianas empresas podrían desplegar soluciones de IA que hoy son prohibitivas.

6:22

Y la segunda es el impacto energético.

6:25

La huella de carbono de estos sistemas es un tema cada vez más preocupante.

6:30

Un cambio masivo a SLMs sería un paso gigantesco hacia una IA más sostenible.

6:36

Sin duda.

6:37

Entiendo el argumento.

6:38

Es demoledor para esas tareas repetitivas.

6:41

Pero me queda una duda importante.

6:43

¿Qué es el cambio de LLM?

6:43

¿Qué es el cambio de LLM?

6:43

¿Qué es el cambio de LLM?

6:43

¿Qué es el cambio de LLM?

6:43

¿Qué es el cambio de LLM?

6:43

¿Qué es el cambio de LLM?

6:43

¿Qué es el cambio de LLM?

6:43

Si mi agente está clasificando facturas con un SLM y de repente se topa con una nota

6:49

extraña escrita a mano, ¿se queda bloqueado?

6:52

¿No hemos perdido justo esa flexibilidad que nos vendieron como la gran ventaja de

6:56

los LLMs?

6:57

Esa es la pregunta clave.

7:00

Y la respuesta que da el paper es, en mi opinión, la parte más elegante de toda la

7:04

propuesta.

7:05

¿Y cuál es?

7:06

No abogan por un mundo solo de SLMs.

7:09

Proponen lo que llaman sistemas agénticos heterogéneos.

7:13

¿Heterogéneos?

7:13

¿Heterogéneos?

7:14

O sea, una mezcla.

7:16

¿Quieren decir que un agente no tiene por qué usar un único cerebro?

7:19

Exacto.

7:20

La idea es brillante en su simplicidad.

7:23

Piensa en ello no como un único empleado que lo sabe todo, sino como un equipo de especialistas

7:28

gestionado por un jefe de proyecto.

7:30

Ah, vale.

7:31

Es como un capataz de obra que tiene una caja de herramientas.

7:34

Para el 90% de las tareas, los tornillos de siempre, usa una llave inglesa pequeña

7:40

y eficiente.

7:41

¿Un SLM?

7:43

Eso es.

7:44

Pero si de repente aparece un muro que hay que derribar, en lugar de darle golpecitos

7:49

con la llave, saca el teléfono y llama al martillo pilón, el LLM, solo para esa tarea

7:56

específica.

7:57

Esa analogía es perfecta.

7:59

El agente actúa como ese capataz, o como me gusta llamarlo a mí, un director de orquesta.

8:04

Me gusta.

8:05

La mayor parte del tiempo, la melodía la llevan los violines, los SLMs, que son ágiles.

8:11

Pero cuando la sinfonía lo requiere…

8:13

El director da la entrada a los timbales, el LLM, que interviene con toda su potencia.

8:19

Y luego vuelve al silencio.

8:20

Se trata de usar el recurso adecuado en el momento adecuado.

8:23

Justo.

8:24

Pero esto, que suena genial en teoría, me genera nuevas preguntas.

8:29

Ese director de orquesta, ¿quién es?

8:31

¿Cómo decide qué herramienta usar?

8:34

Porque esa decisión en sí misma parece un problema de IA bastante complejo.

8:38

Absolutamente.

8:39

Y ese es uno de los grandes desafíos técnicos que esta visión,

8:43

implica.

8:44

El sistema necesita un enrutador inteligente, una especie de meta-agente,

8:49

que analiza la tarea y decide si es para un SLM o requiere al LLM.

8:54

Y si se equivoca, el resultado puede ser o un fallo en la tarea o un coste disparado,

8:59

si por error envía miles de tareas simples al LLM.

9:02

La ventaja económica desaparece, claro.

9:05

La implementación de este director es crucial.

9:08

El paper no entra en los detalles, pero reconoce que la orquestación de estos sistemas,

9:13

es el siguiente gran reto.

9:15

La habilidad del futuro quizá no sea tanto el prompt engineering, sino la arquitectura de sistemas.

9:20

La visión es muy convincente, pero parece una auténtica revolución.

9:24

Y las revoluciones siempre encuentran resistencia.

9:27

Me imagino que el paper debe abordar las barreras para que esta idea se adopte, ¿no?

9:31

Sí, sí, lo mencioné explícitamente.

9:33

Y aunque el resumen no las detalla, podemos especular sobre ellas.

9:37

A ver, yo veo una barrera económica obvia.

9:40

Las grandes tecnológicas han invertido miles de millones,

9:43

en la infraestructura para LLMs gigantes.

9:46

¿Cambiar el rumbo de ese transatlántico?

9:48

No es trivial. Esa es la inercia del mercado.

9:51

Y es una fuerza poderosísima.

9:53

Tienen un foso económico construido alrededor de los LLMs.

9:57

¿Qué incentivo real tienen para canibalizar su propio producto estrella?

10:01

Bueno, también se podría argumentar que son las únicas con los recursos

10:04

para construir y ofrecer estos ecosistemas heterogéneos de forma eficaz.

10:08

Podría ser su siguiente gran línea de negocio.

10:11

Y luego está el factor humano.

10:12

¿Qué es el factor humano?

10:12

¿Qué es el factor humano?

10:12

¿Qué es el factor humano?

10:12

¿Qué es el factor humano?

10:12

¿Qué es el factor humano?

10:12

¿Qué es el factor humano?

10:12

¿Qué es el factor humano?

10:12

Si eres desarrollador, te han dicho durante años

10:15

que tienes que usar lo último y lo más grande.

10:17

Hay un factor de prestigio.

10:19

Es más sexy decir que tu app usa el último gran modelo.

10:23

Totalmente. Es una barrera cultural.

10:25

Hay que reeducar a una generación de ingenieros

10:27

que ha crecido con el mantra de más grande es mejor.

10:30

Hay que demostrar que usar un modelo más pequeño no es un paso atrás,

10:34

sino una decisión de ingeniería más inteligente.

10:36

Entonces, tenemos barreras económicas, culturales

10:39

y los desafíos técnicos que mencionamos.

10:41

¿El paper se queda solo en señalar la dirección

10:45

o propone alguna ayuda para empezar el camino?

10:47

Aquí es donde demuestran que su intención es práctica.

10:50

Proponen un Algoritmo General de Conversión de Agente de LLM a SLM.

10:56

Ah, eso es crucial.

10:58

No solo dicen, este es el futuro, sino que añaden,

11:01

y aquí tenéis una receta, una hoja de ruta

11:04

para empezar a convertir vuestros sistemas.

11:07

Eso lo cambia todo.

11:08

Es pasar de la visión a la herramienta.

11:10

¿Qué es el factor humano?

11:11

¿Qué es el factor humano?

11:11

¿Qué es el factor humano?

11:11

¿Qué es el factor humano?

11:11

¿Qué es el factor humano?

11:11

¿Qué es el factor humano?

11:11

¿Qué es el factor humano?

11:11

¿Qué es el factor humano?

11:11

¿Qué es el factor humano?

11:11

Esto conecta con algo que me llamó la atención del resumen,

11:14

su compromiso con el debate público.

11:16

Sí, y es algo bastante inusual y, en mi opinión, muy admirable.

11:20

Se comprometen a publicar toda la correspondencia relacionada con el paper,

11:25

tanto las contribuciones que apoyan su tesis como las críticas,

11:28

en una URL pública.

11:30

Es un gesto de transparencia admirable, casi radical,

11:33

pero, siendo un poco cínico,

11:35

¿podría ser una maniobra para controlar la narrativa?

11:38

Suena un poco idealista.

11:39

Es una lectura posible.

11:41

Pero yo tiendo a verlo de otra forma.

11:44

Creo que refleja que son conscientes de la magnitud de lo que proponen.

11:47

Es una llamada abierta a la comunidad.

11:49

Como un, aquí está nuestra tesis, por favor, atacadla, mejoradla,

11:54

pero tengamos esta conversación en abierto.

11:56

Exacto.

11:57

Porque definirá la economía, la sostenibilidad y la accesibilidad de la IA en la próxima década.

12:02

Visto así, tiene todo el sentido.

12:04

Si juntamos todas las piezas, el panorama que dibuja este paper es fascinante.

12:09

Quizás el futuro de la IA en nuestro diálogo,

12:10

quizás el futuro de la IA en nuestro diálogo,

12:11

no sea un único asistente omnipotente como en las películas.

12:14

Sino más bien una red invisible de pequeños especialistas eficientes.

12:18

Un ejército de agentes silenciosos.

12:21

Exacto.

12:22

Cada uno haciendo una cosa muy bien y de forma muy barata.

12:25

El artículo nos obliga a cambiar la pregunta fundamental.

12:28

Durante años la pregunta ha sido, ¿cómo hacemos los modelos más grandes?

12:32

TIL, ¿cuál es el modelo del tamaño adecuado para esta tarea concreta?

12:37

Es un cambio de paradigma total.

12:39

Pasar de la fuerza bruta a la elegancia.

12:42

De la escala a la eficiencia.

12:44

Y a la sostenibilidad.

12:46

Es una visión de la IA mucho más madura, más pragmática.

12:50

Y con esto, como siempre, dejamos una reflexión final.

12:53

Si esta visión es correcta, si el futuro son estos pequeños agentes,

12:57

pensemos por un momento en nuestras propias rutinas.

13:00

Que tareas repetitivas de nuestro trabajo,

13:03

esas que hacemos casi sin pensar,

13:04

podrían ser las primeras en ser gestionadas por este ejército invisible.

13:08

No por un gran asistente.

13:09

No por un gran asistente al que le damos órdenes.

13:11

Sino por decenas de pequeños optimizadores que, sin que apenas nos demos cuenta,

13:16

van puliendo las fricciones de nuestro día a día.

13:18

Una idea muy potente.

13:19

Mañana volveremos con otro análisis y les aseguro que el paper que tenemos preparado

13:24

es de los que realmente hacen pensar en las fronteras de la inteligencia artificial,

13:29

en la naturaleza misma de la conciencia y la creatividad.

13:33

No se lo pierdan.

13:35

Y hasta aquí el episodio de hoy.

13:47

Muchas gracias por tu atención.

13:49

Esto es BIMPRAXIS.

13:58

Nos escuchamos en el próximo episodio.

E031_Los modelos de lenguaje pequeños son el futuro

Episode description

Persons