E035_Thinking Machines Lab: Crea y entrena tus propios modelos de IA con Tinker

0:09

Buenas, esto es BIMPRAXIS, el podcast donde el BIM se encuentra con la inteligencia artificial.

0:20

Exploramos la ciencia, la tecnología y el futuro desde el enfoque de la arquitectura, ingeniería y construcción.

0:28

¡Empezamos!

0:37

Bueno, acaba de aparecer en escena una nueva empresa de inteligencia artificial que parece sacada de una novela de ciencia ficción.

0:45

Totalmente.

0:46

Se llama Thinking Machines Lab. La funda Mira Murati, la exdirectora de tecnología de OpenEI. Y atención a la cifra.

0:55

Uf, la cifra es de locos.

0:57

Han recaudado 2.000 millones de dólares. 2.000 millones en una ronda semilla.

1:03

Y eso les da una valoración de 12.000 millones. Antes de tener nada.

1:08

Antes de tener un producto público.

1:10

Es una auténtica locura.

1:11

Y fíjate, no estamos hablando de inversores de medio pelo.

1:14

La lista incluye a gigantes como NVIDIA, Andreessen Horowitz, ACIZ, Cisco, AMD.

1:21

Cuando ellos apuestan tan fuerte y tan pronto por algo, no es una simple inversión. Es una declaración de intenciones.

1:28

Es una señal. Una señal muy clara de que ahí se está cociendo algo que podría cambiar las reglas del juego.

1:34

Justo. Totalmente. Pero su comunicación inicial ha sido, bueno, increíblemente críptica.

1:40

Muy misteriosa. Sí.

1:42

Han lanzado una web que es...

1:44

Básicamente una pantalla en blanco y tweets hablando de IA multimodal y de la forma desordenada en que colaboramos.

1:52

Muy abstracto todo.

1:53

Así que hoy vamos a hacer precisamente eso, ¿no?

1:56

Vamos a desentrañar qué es Thinking Machines Lab y sobre todo analizar a fondo su primer producto que acaban de lanzar, llamado Tinker.

2:05

A ver si es un nuevo chatbot, un competidor de OpenAI o...

2:09

O algo radicalmente distinto.

2:11

Esa es la pregunta del Millén.

2:12

Vamos a sumergirnos en los documentos técnicos y en los detalles que han ido saliendo para entender qué hay detrás de esta inversión monumental y de tanto secretismo.

2:21

De acuerdo. Pues vamos a desgranarlo.

2:24

Lo primero que hay que entender sobre Thinking Machines Lab es que su objetivo no es crear otro modelo de lenguaje.

2:30

No. No van por ahí.

2:31

Su misión declarada es mucho más fundamental. Quieren atacar de raíz dos de los mayores desafíos de la IA. La consistencia y el razonamiento.

2:40

Y esto es absolutamente crucial.

2:42

Cuando hablamos de consistencia en IA, a ver, nos referimos a algo que parece muy básico, pero que no lo es.

2:49

¿A qué exactamente?

2:50

A la capacidad de un modelo para dar resultados fiables, predecibles, que no te dé una respuesta brillante un día y una completamente ilógica al día siguiente con una pregunta parecida.

3:00

Claro. Porque de nada sirve tener una IA que sea un genio el lunes y el martes se vuelve un completo idiota.

3:06

Exacto.

3:07

Nadie se subiría a un coche autónomo que funcionase así.

3:10

Justo. Piensa en un sistema de diagnóstico médico.

3:12

En análisis financieros, para tomar decisiones de miles de millones, o en la conducción autónoma.

3:18

Aplicaciones de alto riesgo.

3:20

Efectivamente. No puedes tener un sistema que a veces acierta y a veces improvisa o se vuelve impredecible. La fiabilidad lo es todo. Por eso su misión es tan ambiciosa.

3:31

Quieren que la IA no solo sea creativa, sino también confiable.

3:35

Y para lograrlo han reunido a un equipo que es, literalmente, el Dream Team que hizo posible ChatGPT.

3:42

Ahí quería llegar. No es solo Mira Murati.

3:44

Para nada. Han fichado a gente como John Shulman, cofundador de OpenAI, y una de las mentes clave detrás de las técnicas que hacen que ChatGPT parezca tan, bueno, tan humano.

3:55

Uf, palabras mayores.

3:57

Es que cuando juntas a ese nivel de talento, con esa misión tan clara, y con 2.000 millones de dólares, pues todo el sector de la IA se para a escuchar con mucha atención.

4:06

Bien. Entonces, con esa misión de crear una IA más fiable, lanzan superiores.

4:12

El primer producto, Tinker. Y al principio hubo mucha confusión, ¿no?

4:16

Muchísima.

4:17

La gente esperaba un competidor directo de ChatGPT o de Cloud. Pero resulta que no tiene nada que ver.

4:24

Nada que ver. Tinker no es un producto para el consumidor final. No es una app con la que te pones a hablar.

4:31

Y aquí está la clave para entender la revolución que proponen.

4:34

A ver.

4:35

No se trata de hacer un ChatGPT un poco mejor. Se trata de permitir que un hospital cree un radiólogo de IA

4:42

y a cualquier humano, o que un bufete de abogados entrena a un experto en patentes que no comete errores.

4:47

O sea, es el paso del sabelotodo generalista al genio especialista.

4:51

Exacto. Y eso es un cambio de paradigma total.

4:55

O sea, no nos dan el plato cocinado, sino que nos ofrecen la cocina para que cada uno se prepare su receta.

5:00

Mmm. Esa analogía es perfecta.

5:02

He leído que es como el paso de los ordenadores mainframe de los 70, que solo tenían las grandes instituciones,

5:09

a la llegada de los ordenadores personales que democratizaron.

5:12

Es una analogía buenísima. Pero con un matiz importante.

5:17

Tinker no es una herramienta mágica que crea un modelo de IA a partir de una idea.

5:22

Ah, ¿no es pulsar un botón y ya?

5:23

No. No le dices créame un experto en derecho mercantil y funciona. Requiere conocimientos técnicos.

5:30

Vale.

5:31

Siguiendo con la metáfora, Tinker te proporciona una cocina industrial de última generación.

5:36

Te da la infraestructura, los clústeres de GPUs, la potencia de cálculo…

5:39

Todo lo que es carísimo…

5:42

… y complicadísimo de gestionar.

5:43

Justo. Pero el usuario tiene que traer dos cosas fundamentales. Los ingredientes, que son sus datos…

5:49

Y la receta.

5:50

¿Y la receta? ¿Qué es su código?

5:52

Entiendo. El objetivo, entonces, es que un investigador o un desarrollador pueda centrarse solo en su algoritmo y en la calidad de sus datos.

6:00

Exacto.

6:01

Y se olvide de la pesadilla que es gestionar el hardware la fiabilidad de cientos de GPUs en paralelo. Toda esa orquestación.

6:08

Precisamente. Quieren que el talento se dedique a la ciencia.

6:12

No a ser administrador de sistemas.

6:14

Claro.

6:14

Hablé con una de las primeras investigadoras que lo usó y me contó que llevaba meses atascada intentando configurar un clúster para un experimento.

6:23

Con Tinker, lo tuvo funcionando en una tarde.

6:25

¡Qué bueno!

6:26

Su frase fue, sentí que me habían quitado una mochila llena de piedras de encima y por fin podía volver a hacer ciencia.

6:33

¡Qué pasada! Y lo fascinante es que, a pesar de toda esa complejidad que gestionan por debajo, la interacción parece increíblemente sencilla.

6:41

Sí.

6:41

¿El usuario?

6:42

El usuario escribe un script en Python como si lo ejecutaran su propio ordenador y toda la magia negra ocurre en la nube.

6:50

Así es. Como decíamos, el usuario aporta su receta. Y esta receta tiene tres elementos. Primero, eliges un modelo base.

6:59

Ah, no empiezas de cero.

7:00

No, sería prohibitivamente caro. Escoges un modelo de código abierto potente, como Lama de Meta o Cuen de Alihuabá, y lo usas como punto de partida.

7:10

¿Y lo personalizas?

7:12

Lo personalizas con una técnica muy eficiente llamada Lora, que en lugar de modificar todo el modelo, entrena una especie de adaptador muy pequeño. Es mucho más rápido y barato.

7:23

Vale. Tienes la base. Luego, los ingredientes, que son los datos…

7:27

El componente más importante. El usuario es responsable de sus datos. Y aquí es donde se crea la especialización. Y un detalle muy importante. Garantizan total privacidad.

7:39

¿En qué sentido?

7:40

Los datos de un cliente se usan exclusivamente para entrenar su modelo. Nunca para los de Thinking Machines ni para los de otros clientes.

7:47

Pero ese método de entrenar con datos, por ejemplo, con aprendizaje supervisado, dándole pares de pregunta-respuesta, suena increíblemente laborioso, ¿no?

7:56

Uf, sí.

7:57

¿No hay una forma más inteligente de que la IA aprenda, quizá por su cuenta, sin que tengamos que darle todo masticado?

8:03

Es una pregunta excelente y toca el corazón del asunto.

8:07

El aprendizaje supervisado es muy potente.

8:10

Pero, como dices, muy costoso.

8:12

Claro.

8:13

Por eso, Tinker también soporta plenamente el aprendizaje por refuerzo, el RL. Ahí no le das las respuestas, sino que creas un entorno, una simulación, donde un agente de IA aprende por prueba y error.

8:26

Recibiendo recompensas o castigos.

8:28

Exacto. Además, soporta modelos multimodales. Así que los ingredientes pueden ser texto, pero también imágenes, lo que abre la puerta a entrenar modelos que entiendan radiografías…

8:40

… planos…

8:41

Entendido. Tenemos el modelo base y los datos. Y el tercer componente.

8:46

El código. El script de Python que mencionabas. Es el director de orquesta. Y aquí está la genialidad de su diseño.

8:53

A ver…

8:54

Toda esa complejidad de coordinar cientos de GPUs se controla con un puñado de comandos. Es como decirle a la máquina, toma estos datos y aprende. Ahora actualiza el modelo. Générame un ejemplo para ver cómo vas. Y guarda el progreso.

9:09

O sea…

9:10

Simplifican algo que es increíblemente complejo en cuatro ideas básicas.

9:14

Justo.

9:15

Ah, ahora entiendo mucho mejor su comunicación inicial. Cuando hablaban de la forma desordenada en que colaboramos, no se referían a nosotros, los usuarios.

9:24

No, se referían a la propia comunidad de investigadores de IA.

9:28

Están intentando arreglar el caos y la complejidad que supone construir estos modelos desde cero.

9:34

Exactamente. Su cliente es el investigador, el desarrollador, el científico de datos.

9:40

Y la flexibilidad es total. Si quieres cambiar tu modelo base, de Lama a Cuban.

9:45

No tienes que rehacer todo.

9:46

No, es literalmente cambiar una línea de texto en tu código. Abstraen la complejidad del hardware para potenciar la innovación en el software.

9:54

Vale. Tenemos una herramienta que pone el poder de un gigante tecnológico en manos de equipos mucho más pequeños. Eso suena increíblemente potente.

10:03

Lo es.

10:03

Pero también me hace pensar inmediatamente en las consecuencias. Si cualquiera puede construir una IA súper especializada…

10:09

¿Qué es la IA?

10:09

¿Qué es lo primero que puede salir mal?

10:12

Esa es la otra cara de la moneda, el arma de doble filo. Por un lado, tienes el efecto de la democratización.

10:19

Claro.

10:19

Permite a investigadores universitarios, hospitales o startups pequeñas experimentar con capacidades que hasta ahora estaban reservadas casi en exclusiva para Google, Meta u OpenAI.

10:31

Y eso puede acelerar la investigación en curas para enfermedades, en nuevos materiales…

10:36

Lo que se te ocurra. Pero por otro lado…

10:38

Por otro…

10:39

Por otro, si de repente es mucho más fácil crear modelos de IA muy potentes y personalizados que impide que alguien lo use para fines maliciosos.

10:47

Uf, ese es el tema.

10:49

Imagina un modelo experto en generar desinformación política hiperrealista, en buscar vulnerabilidades de software a gran escala.

10:56

O en crear contenido dañino. Es un riesgo muy real.

11:00

Y ellos son conscientes de esto, supongo. ¿Cómo están gestionando ese riesgo? Porque parece una caja de Pandora.

11:06

Lo son. Por ahora, su solución es muy importante.

11:09

Están revisando personalmente cada solicitud de acceso a la plataforma.

11:14

Una a una.

11:15

Una a una, para asegurarse de que los proyectos tienen fines legítimos. Pero ellos mismos admiten que eso no es escalable a largo plazo.

11:24

Claro. Imposible.

11:25

Han dicho que planean implementar sistemas automatizados en el futuro para detectar y prevenir el mal uso.

11:32

Sinceramente, es un debate muy complejo y todavía abierto en toda la comunidad.

11:37

Suena bien en teoría, pero…

11:39

¿Es realista pensar que pueden controlarlo? Si la herramienta es tan buena, ¿no es inevitable que acaben las manos equivocadas?

11:45

Es el gran dilema de nuestro tiempo.

11:48

La historia de la tecnología está llena de herramientas bien intencionadas usadas para fines terribles.

11:53

Sí, no hay una respuesta fácil. Su enfoque actual es un primer paso, un intento de filtrar los casos más obvios.

12:00

Pero a medida que la tecnología se extienda, la responsabilidad recaerá en una combinación de salvaguardas técnicas, regulación…

12:09

No, imposible.

12:11

Y hay otro punto que me genera dudas. ¿No crea esto una nueva dependencia? Antes dependías de OpenAI para usar su modelo, y ahora dependes de Thinking Machines para construir el tuyo.

12:22

Es una objeción muy inteligente.

12:24

¿Es realmente una democratización o solo un cambio de proveedor?

12:27

Y la han abordado de una forma que creo que es clave. A diferencia de las APIs cerradas, donde solo puedes hablar con el modelo, aquí el modelo final que tú creas con tus datos es tuyo.

12:39

Ah, ¿te lo puedes descargar?

12:40

Te lo puedes descargar. Puedes ejecutarlo en tus propios servidores, en la nube que tú elijas, donde quieras. No estás atado a su plataforma.

12:47

O sea, te dan la fábrica para construir el coche.

12:50

Exacto. Pero una vez construido, el coche es tuyo y te lo llevas. Esa es una diferencia fundamental.

12:56

Eso sí que cambia las cosas. Y para que la gente pueda empezar, han publicado recursos. He visto que mencionan un Tinker Cookbook.

13:04

Sí, es un repositorio en GitHub.

13:09

Es un repositorio de recetas, con ejemplos prácticos de código, para empezar.

13:12

Vale.

13:13

Cubre desde el aprendizaje supervisado más básico hasta configuraciones muy avanzadas de aprendizaje por refuerzo, como RLHF o DPO, que son, bueno, formas de enseñar a la IA a ser más útil y segura usando feedback humano.

13:28

Muy bien. A modo de recapitulación. ¿Queda claro que Thinking Machines Lab no es un competidor directo de ChatGPT?

13:35

Correcto.

13:35

No están construyendo un producto para el gran público.

13:39

Es un proveedor de herramientas de alto nivel. Si la IA es la nueva fiebre del oro, ellos no venden el oro, venden los picos, las palas y la maquinaria pesada para que otros lo encuentren.

13:49

Y Tinker es su primera gran máquina.

13:50

Exacto.

13:51

Y el modelo final que creas es tuyo, lo que resuelve el problema de la dependencia. Puedes llevártelo y usarlo como quieras.

13:58

Exacto. Y yo diría que el verdadero poder de Tinker, su promesa a largo plazo, reside precisamente en esa capacidad de crear expertos de nicho.

14:07

¿Modelos únicos?

14:08

¿Modelos únicos?

14:09

Ultraespecializados.

14:10

Eso es. Modelos que puedan superar con creces a los generalistas en tareas específicas. El futuro podría no ser una única IA que lo hace todo bien, sin un ecosistema de miles de IAs especializadas colaborando entre sí.

14:24

Y eso nos deja con una reflexión final, ¿no? La historia de la tecnología nos enseña que cuando las herramientas de creación se vuelven más accesibles, la innovación explota en direcciones que nadie esperaba.

14:35

Totalmente.

14:36

Totalmente.

14:36

Totalmente.

14:36

Totalmente.

14:36

Totalmente.

14:36

Totalmente.

14:36

Totalmente.

14:36

Totalmente.

14:37

Totalmente.

14:37

Totalmente.

14:37

Totalmente.

14:37

Totalmente.

14:37

Totalmente.

14:37

Totalmente.

14:37

Totalmente.

14:37

Totalmente.

14:37

Totalmente.

14:37

Totalmente.

14:37

Totalmente.

14:37

Totalmente.

14:37

Totalmente.

14:39

Totalmente.

14:40

Totalmente.

14:41

Totalmente.

14:41

Totalmente.

14:41

Totalmente.

14:41

Totalmente.

14:41

Totalmente.

14:41

Totalmente.

14:41

Totalmente.

14:41

Totalmente.

14:41

Totalmente.

14:41

Totalmente.

14:41

Totalmente.

14:41

Totalmente.

14:41

Totalmente.

14:41

Totalmente.

14:41

Totalmente.

14:41

La pregunta es inevitable, ¿qué tipo de asistentes hiperinteligentes para tareas que hoy ni imaginamos podrían surgir?

14:48

Y lo más importante, ¿quiénes serán los que los construyan?

14:52

Ya no solo los gigantes tecnológicos, sino quizás cualquiera con una buena idea, buenos datos y una buena receta.

15:11

Y hasta aquí el episodio de hoy. Muchas gracias por tu atención.

15:17

Esto es BIMPRAXIS.

15:27

Nos escuchamos en el próximo episodio.

E035_Thinking Machines Lab: Crea y entrena tus propios modelos de IA con Tinker

Episode description

Persons