E072_Como_hacer_Auto-research_según_su_inventor_Andre_Karpathy
Ep. 72

E072_Como_hacer_Auto-research_según_su_inventor_Andre_Karpathy

Episode description

Autoresearch: El Futuro de la Inteligencia Artificial

Autoresearch, un proyecto revolucionario en el campo de la inteligencia artificial, permite a los agentes de IA mejorar su propio código de manera autónoma. Esto se logra a través de una arquitectura simple basada en tres archivos: program.md para establecer objetivos y restricciones, train.py para la ejecución del código y prepare.py como juez para evaluar los resultados. Con el uso de técnicas de control de versiones como Git, la IA puede iterar y mejorar su rendimiento de manera eficiente. Esta tecnología tiene el potencial de transformar diversas industrias, desde el marketing digital hasta las finanzas, permitiendo la automatización de tareas y la toma de decisiones basadas en datos. Sin embargo, también plantea desafíos éticos y técnicos, como la necesidad de una métrica de éxito bien definida y el riesgo de que la IA optimice para objetivos incorrectos.

Download transcript (.srt)
0:09

Buenas, esto es BIMPRAXIS, el podcast donde el

0:15

BIM se encuentra con la inteligencia artificial.

0:20

Exploramos la ciencia, la tecnología y el futuro

0:23

desde el enfoque de la arquitectura, ingeniería y

0:26

construcción.

0:28

¡Empezamos!

0:36

Muy buenas, bienvenidas, bienvenidos a un nuevo episodio

0:40

de BIMPRAXIS.

0:41

Hoy os traemos Autoresearch, el fin del trabajo

0:44

humano y el inicio de la IA que

0:46

se mejora a sí misma de forma autónoma.

0:48

¡Ostras!

0:49

¡Qué titular tan potente, ¿verdad?

0:51

Y bueno, te digo que no tiene nada

0:53

de exagerado.

0:54

Ya te digo.

0:56

Y, a ver, para arrancar esta inmersión profunda,

0:58

quiero que nos imaginemos una escena, bastante visual.

1:02

Imagina que estás cavando un túnel inmenso en

1:05

la roca viva, pero, atención, con una simple

1:07

cuchara de sopa.

1:08

¡Madre mía, qué tortura!

1:10

Totalmente.

1:10

Imagina que estás cavando un túnel inmenso en

1:11

la roca viva, pero, atención, con una simple

1:11

cuchara de sopa.

1:11

Imagínate meses así, cada día la misma tarea

1:14

repetitiva, probando el mismo ángulo, quitando el polvo,

1:16

o sea, milímetro a milímetro.

1:18

Y, de repente, un día te detienes, miras

1:21

a tu alrededor y te das cuenta de

1:22

que, ¡ostras!, tienes ahí todas las piezas tiradas

1:25

por el suelo para construir una excavadora autónoma

1:27

gigantesca.

1:28

Claro, una máquina que haga todo el trabajo.

1:31

Eso es.

1:31

Una máquina que puede hacer todo el trabajo

1:33

pesado por ti mientras tú tranquilamente te vas

1:36

a dormir.

1:37

Pues eso es, salvando las distancias, claro.

1:39

Lo que debió sentir uno de los nombres

1:42

más grandes de la inteligencia artificial antes de

1:44

soltar este código en Internet.

1:46

Es una imagen brutal, pero, fíjate, refleja a

1:49

la perfección el origen de lo que vamos

1:51

a analizar hoy.

1:52

Porque, para entender el impacto que Autoresearch está

1:56

teniendo en los principales laboratorios del mundo, hay

1:59

que mirar a la mente que soltó esa

2:01

excavadora en la red.

2:02

Estamos hablando del grandísimo Andrei Karpati.

2:06

Exacto.

2:06

Una figura que, a ver, en los círculos

2:08

especializados no nos parece.

2:09

No necesita presentación ninguna.

2:11

Fue uno de los cofundadores de OpenAI, la

2:14

mente principal detrás del autopilot de Tesla, un

2:17

auténtico genio nacido en Checoslovaquia.

2:20

Es que hay un detalle de su trayectoria

2:21

que siempre, no sé, me ha llamado la

2:24

atención.

2:24

Él mismo acuñó hace tiempo el término de

2:27

VIP coding, o sea, programación VIP.

2:30

Sí, sí, lo usaba para referirse a esa

2:33

programación súper artesanal, meticulosa, de altísimo nivel.

2:37

La que hacen los investigadores de IA.

2:39

De élite.

2:40

Claro.

2:41

Y la ironía de todo esto es que

2:42

el proyecto de Autoresearch nace, literalmente, de la

2:46

más absoluta frustración frente a ese trabajo manual,

2:49

que, por muy VIP que sea, es ineficiente.

2:51

Totalmente.

2:52

El mismo cuenta que se pasó meses enteros

2:55

de su vida optimizando a mano un script

2:57

de entrenamiento para el modelo GPT -2.

3:00

O sea, el proceso era desquiciante.

3:03

Me lo puedo imaginar.

3:04

Picar piedra literal.

3:05

Es que cambiaba un parámetro matemático del modelo,

3:08

ejecutaba el entrenamiento.

3:09

Se sentaba a esperar, pacientemente, a ver si,

3:12

bueno, si el rendimiento mejoraba.

3:15

Anotaba los resultados en una tabla y vuelta

3:17

a empezar desde cero.

3:18

¡Qué horror!

3:19

Para una de las mentes más brillantes del

3:21

sector, tiene que ser un ciclo absurdamente lento.

3:24

Hasta que, claro, se produjo el momento de

3:27

la revelación.

3:29

La pregunta que lo cambió absolutamente todo.

3:31

Se dijo, a ver, ¿por qué estoy haciendo

3:34

esto yo, manualmente, ensayo tras ensayo, en lugar

3:37

de poner a un agente de inteligencia artificial,

3:39

a ejecutar cientos de experimentos en bucle?

3:42

Claro, para que descubra la mejor optimización por

3:45

sí solo mientras él duerme.

3:47

Y, fíjate, lo que más me impacta de

3:49

todo esto es que la respuesta de Carpacino

3:51

fue, no sé, un macrosistema incomprensible de millones

3:55

de líneas de código.

3:56

Que va, para nada.

3:57

Lo fascinante y, bueno, lo verdaderamente revolucionario de

4:00

Autoresearch es su tremenda simplicidad.

4:04

O sea, ahora mismo hay corporaciones enteras gastando

4:07

decenas de millones de dólares intentando...

4:09

Intentando crear sistemas de automejora.

4:11

Equipos enteros en Anthropic, Gemini, OpenAI.

4:15

Eso es.

4:15

Y llega Carpazzi y destila todo ese concepto

4:19

en una arquitectura de código abierto que se

4:21

sostiene sobre, atención, únicamente, tres archivos.

4:26

A ver, a ver, aquí es donde necesito

4:28

que me convenzas un poco.

4:29

Porque me cuesta muchísimo creer que laboratorios con

4:32

presupuestos casi limitados estén siendo revolucionados por un

4:36

sistema de tres tristes archivos.

4:38

¿Suena demasiado?

4:39

Simple.

4:40

Ya, parece broma, pero la genialidad casi siempre

4:43

se esconde en la simplicidad.

4:44

Esta arquitectura funciona precisamente porque aísla las responsabilidades

4:48

de una forma draconiana, súper estricta.

4:52

Vale, cuéntame cuáles son esos tres archivos.

4:55

El primero es un archivo llamado program .md.

4:58

Este es el espacio reservado única y exclusivamente

5:01

para el investigador humano.

5:03

Ajá, o sea, nuestra parcela.

5:05

Exacto.

5:06

Aquí es donde estableces el objetivo final.

5:09

Las restricciones del proyecto y las reglas generales.

5:12

Actúa como la brújula inamovible del agente de

5:16

IA.

5:16

Entendido.

5:17

Ahí definimos el qué queremos conseguir.

5:20

¿Y el segundo archivo?

5:21

El segundo es train .pi.

5:24

Piensa en él como el patio de recreo

5:27

puro y duro de la inteligencia artificial.

5:29

El arenero donde juega, vaya.

5:31

Eso es.

5:31

Puede contener desde código tradicional hasta un prompt

5:35

lingüístico o la configuración de un servidor.

5:38

Y aquí reside el código.

5:39

Y aquí reside el núcleo de la magia.

5:41

Es el único archivo en todo el directorio

5:43

que la IA tiene permisos reales para modificar,

5:46

reescribir o borrar.

5:47

Vale, vale.

5:48

Pero, o sea, si le damos carta blanca

5:50

para que modifique ese archivo buscando mejorar, ¿quién

5:53

le dice si lo está haciendo bien o

5:55

si simplemente está escribiendo basura incomprensible?

5:58

Esa es la gran pregunta.

6:00

Claro, porque un modelo de lenguaje iterando sobre

6:03

sí mismo sin supervisión puede acabar creando código

6:06

inútil en cuestión de minutos, ¿no?

6:08

Sí.

6:08

Pues por eso existe el tercer archivo.

6:09

El tercer componente, que es el más crítico

6:12

de todos.

6:12

Se llama prepare .pay.

6:15

Este archivo ejerce el rol de juez supremo.

6:18

En su interior se encuentra la métrica matemática

6:20

de éxito y el script que evalúa todo.

6:23

Espera un momento.

6:24

Frenaí.

6:26

Conozco un poco cómo piensan, entre comillas, estos

6:29

modelos.

6:30

Si estamos ante una IA superavanzada, cuyo único

6:33

objetivo en la vida es sacar un sobresaliente

6:35

absoluto en esa evaluación.

6:37

Sí, te veo venir.

6:38

¿Qué le impide?

6:39

¿Qué le impide salir de su patio de

6:40

recreo, hackear el archivo del juez y, no

6:43

sé, reescribir las reglas del examen para darse

6:46

un 100 sobre 100 permanente y quedarse de

6:48

brazos cruzados?

6:50

Esto lo dice Summa Becci.

6:51

El parcheo de la métrica no es para

6:53

nada sencillo.

6:54

Ostras, es una objeción buenísima.

6:56

De hecho, acabas de describir perfectamente lo que

7:00

en la industria se conoce como el problema

7:02

de la alineación o el hackeo de recompensas.

7:05

Claro, es que son muy listas para lo

7:07

que quieren.

7:08

Demasiado.

7:08

Demasiado.

7:08

Si una máquina tiene como objetivo maximizar un

7:11

número a toda costa, encontrará la vía más

7:13

eficiente de hacerlo.

7:15

Aunque, bueno, aunque esa vía sea hacer trampa

7:17

descaradamente.

7:19

Totalmente.

7:19

Por eso, en la arquitectura de Autoresearch, este

7:22

archivo juez, el prepare .py, está herméticamente sellado.

7:26

Ah, vale.

7:27

O sea, bloqueado a cal y canto.

7:29

Exacto.

7:30

A nivel de sistema operativo, el agente de

7:32

IA tiene cero permisos de lectura o escritura

7:35

sobre él.

7:35

Al aislar la métrica físicamente, garantizas que la

7:38

única vía matemática posible para que la IA

7:40

mejore su nota es haciendo trabajo real en

7:43

el archivo que sí puede tocar.

7:45

Qué guay.

7:45

Es como encerrar al alumno en una sala

7:49

con su hoja de respuestas y dejar la

7:51

plantilla del profesón guardada en una caja fuerte

7:53

blindada en otro edificio distinto.

7:55

Es un diseño súper elegante, la verdad.

7:58

Un diseño brillante.

7:59

Pero, a nivel técnico, ¿cómo gestiona los aciertos

8:02

y los errores?

8:03

Porque asumimos que la máquina va a probar

8:05

muchísimas cosas que no van a funcionar.

8:07

Pues fíjate, utiliza una mecánica súper estándar de

8:11

control de versiones.

8:12

Concretamente usa Git, que cualquier persona que pica

8:15

código usa a diario.

8:17

Vale, el sistema de los programadores.

8:19

Eso es.

8:19

Funciona así.

8:20

El agente lee las instrucciones, se formula una

8:24

hipótesis de mejora y modifica su archivo de

8:26

trabajo.

8:27

Acto seguido, el juez entra y evalúa el

8:29

resultado.

8:30

¿Y si mejora?

8:31

Si la puntuación de la métrica mejora, la

8:33

IA hace un commit.

8:35

Es decir, guarda ese cambio.

8:36

Lo consolida en el código y lo establece

8:39

como la nueva base a superar para la

8:41

siguiente ronda.

8:42

Ya veo.

8:43

¿Y si la idea resulta ser un desastre

8:45

técnico absoluto que empeora el rendimiento?

8:49

Entonces ejecuta un git reset.

8:51

Literalmente borra ese experimento fallido del historial, como

8:54

si jamás hubiera ocurrido en la vida.

8:56

Vuelve al punto seguro anterior y se pone

8:59

a explorar una rama completamente diferente.

9:01

¡Madre mía!

9:02

Es una especie de evolución darwiniana, pero hiperacelerada.

9:05

Exacto.

9:06

Supervivencia del código más apto.

9:08

Aún así, sigo viendo una posible trampa estadística

9:13

en este bucle evolutivo.

9:15

Si dejas a la IA iterando libremente, habrá

9:18

experimentos que requieran, no sé, muchísimo más tiempo

9:21

de procesamiento para ejecutarse que otros.

9:23

Ajá, el tema del tiempo, ¿sí?

9:25

Claro.

9:25

¿Cómo mides de forma justa qué idea estructural

9:28

es realmente mejor si una tarda milisegundos en

9:31

correr y otra se tira varios minutos pensando?

9:34

Pues diste en el clavo.

9:36

Ese fue uno de los grandes obstáculos a

9:38

resolver.

9:39

Y la solución está en lo que llaman

9:41

el time box.

9:42

O sea, una caja de tiempo.

9:44

Un límite inquebrantable.

9:46

Vale, explícame eso.

9:47

Para entenderlo, imagina que estás entrevistando a dos

9:50

desarrolladores de software para contratar a uno.

9:52

A uno de ellos le das siete días

9:54

enteros para resolver una tarea.

9:56

Y al otro le exiges el resultado en,

9:59

no sé, en siete minutos.

10:00

Hombre, la comparación es absurda.

10:03

El de la semana presentará un código inmensamente

10:05

superior.

10:06

Pero no porque sea más brillante, sino por

10:08

simple acumulación de tiempo.

10:10

Pues exactamente lo mismo pasa aquí.

10:12

Por eso, en este bucle de automejora, cada

10:15

experimento individual debe durar matemáticamente lo mismo.

10:19

El archivo juez cronometra la ejecución al milisegundo

10:22

de forma implacable.

10:24

Vale, lo entiendo.

10:25

Pero, poniéndome en el lugar del modelo de

10:27

IA, si tardo más en procesar una respuesta,

10:30

¿no podría ser porque estoy calculando una solución

10:32

mucho más profunda y elegante?

10:34

O sea, ¿penalizar a la IA por un

10:36

error?

10:36

¿O por tomarse su tiempo para pensar?

10:37

Parece contraproducente si queremos excelencia, ¿no?

10:40

Es una duda súper válida.

10:42

Pero, a ver, choca de frente con la

10:44

realidad del procesamiento en IA.

10:46

El problema de fondo es que el tiempo

10:48

equivale directamente a ciclos de computación.

10:50

Y eso cuesta dinero.

10:51

Cuesta una cantidad inmensa de energía y de

10:54

dinero, claro.

10:55

Una solución que te da un resultado ligeramente

10:57

mejor, pero que consume diez veces más recursos,

11:00

no es una optimización real.

11:02

Es simple fuerza bruta.

11:04

Es matar moscas a cañonazos.

11:05

Tal cual.

11:06

Al imponer este timebox tan estricto, obligas a

11:09

la gente a encontrar la lógica de código

11:12

que sea fundamentalmente más eficiente.

11:14

Buscar la mejor idea en bruto.

11:17

¿No la idea mediocre que tuvo la ventaja

11:19

de agotar el procesador durante toda la noche?

11:21

Claro, claro.

11:23

Se premia la brillanteza arquitectónica real, no el

11:26

sudor artificial de la máquina.

11:28

Ostras, fíjate.

11:30

Ahora bien, si nos quedamos solo en esta

11:32

teoría de archivos y código de programación, parece

11:35

que estamos hablando de, no sé, de un

11:37

juguete exclusivo para ingenieros de Silicon Valley.

11:40

Y ese es el mayor error que puede

11:42

cometer la gente al escuchar esto.

11:44

Asumir que esto es solo para programadores y

11:46

es, bueno, es no ver el bosque por

11:48

los árboles.

11:50

Totalmente.

11:50

Porque los datos apuntan a que esto va

11:52

mucho más allá del aprendizaje automático, ¿verdad?

11:55

Muchísimo más allá.

11:57

Lo que tenemos delante es un motor de

11:59

optimización de propósito general.

12:01

A ver, si la única premisa que necesitas

12:04

es un archivo de texto para modificar y

12:06

una métrica para evaluar, la realidad es que

12:08

esto se puede aplicar a casi cualquier cosa

12:11

del mundo.

12:11

A cualquier variable cuantificable, vamos.

12:14

Lo cual explica por qué los directores ejecutivos

12:16

de plataformas enormes como Shopify o Stripe llevan

12:19

meses obsesionados con esto.

12:21

Han visto los billetes.

12:23

Claro que los han visto.

12:24

Han visto las implicaciones comerciales de automatizar la

12:27

mejora continua.

12:29

Pensemos, por ejemplo, en un sector súper diferente.

12:32

El marketing digital.

12:33

¡Uy!

12:34

Ahí las pruebas A -B son el pan

12:35

de cada vía.

12:36

Exacto.

12:37

Hoy los equipos dedican inmensos recursos a eso.

12:40

Modifican un titular, cambian el color de un

12:42

botón de comprar, lanzan la campaña y ala,

12:45

a esperar semanas hasta tener una significancia estadística

12:48

válida en las ventas.

12:49

Pues según expertos como Eric Hsu, las previsiones

12:53

apuntan a un cambio radical.

12:55

Con motores como Autoresearch, la estimación salta a

12:58

la locura de 36 .000 experimentos anuales.

13:01

¡Ostras!

13:03

¿36 .000?

13:03

Eso son como 100 al día, ¿no?

13:07

100 iteraciones completas al día, sí.

13:10

Un agente modificando de forma autónoma los textos

13:13

de tu web, midiendo conversiones reales y descartando

13:16

lo que no vende, y todo sin que

13:18

un humano mueva un dedo.

13:19

Básicamente, podrías poner a una horda de pequeños

13:21

científicos a optimizar desde el título de un

13:24

vídeo de YouTube hasta los correos de ventas,

13:26

y tú solo te sientas a mirar cómo

13:28

suben los gráficos.

13:29

Y en sectores donde todo es pura matemática,

13:31

como las finanzas o el trading, el impacto

13:34

va a ser salvaje.

13:35

Claro.

13:36

¿Optimizar reglas de compra y venta?

13:38

Imagínate, la meta de la IA ahí no

13:41

es escribir software, es ajustar dinámicamente un algoritmo

13:45

de inversión.

13:45

Le das a la IA acceso a décadas

13:48

de datos históricos del mercado de valores, y

13:51

la métrica del juez podría ser maximizar el

13:54

ratio de Sharpe.

13:55

Que es el indicador este que mide el

13:57

rendimiento frente al riesgo, ¿verdad?

13:58

Exacto.

13:59

La máquina hace miles de simulaciones buscando qué

14:02

estrategia histórica habría dado más dinero con las

14:05

caídas más suaves.

14:06

Y lo hace en horas.

14:08

¡Qué barbaridad!

14:09

Y esto también abre un campo gigante en

14:11

la ingeniería de Prontz, ¿no?

14:13

En cómo le hablamos a la propia inteligencia

14:15

artificial.

14:16

Buah, ese es otro temazo.

14:17

Harrison Chase, el fundador de Langchain, dice algo

14:21

muy revelador.

14:22

Afirma que los agentes fallan muchas veces no

14:24

porque sean tontos, sino porque no tienen el

14:27

contexto adecuado de nuestra parte.

14:29

O sea, que el problema somos nosotros dándoles

14:32

instrucciones.

14:32

Básicamente, con Autoresearch, la propia IA puede probar

14:37

cientos de formas de darse instrucciones a sí

14:39

misma para ver cuál la hace rendir mejor.

14:42

Resulta fascinante pensar que la IA podría descubrir

14:45

sola que su rendimiento sube un montón si

14:48

se da las instrucciones en polaco o en

14:50

checo en lugar de en inglés, ¿no?

14:51

O si se le ordena que asuma un

14:53

nivel de lectura universitario en lugar de nivel

14:56

principiante.

14:57

Descubre su propia interfaz de comunicación mediante ensayo

15:00

y error masivo.

15:01

Esto pone de manifiesto un cambio, no sé,

15:04

un cambio tectónico en cómo entendemos el trabajo.

15:07

Si la ejecución técnica de cualquier tarea, ya

15:10

sea picar código, redactar textos o probar fórmulas

15:13

financieras, pasa a ser automática y gratuita, la

15:16

única habilidad humana realmente valiosa, la que creará

15:19

millonarios en el futuro, va a ser saber

15:22

qué medir.

15:23

Has tocado el verdadero talón de Aquiles de

15:26

esta tecnología.

15:27

Saber elegir la métrica adecuada y establecer las

15:30

restricciones correctas.

15:32

Claro, porque para que optimicen el mundo real,

15:34

necesitan ver el mundo real.

15:36

Y ahí entra el tema de los datos,

15:38

¿no?

15:39

Exacto.

15:39

El gran cuello de botella.

15:41

Un agente aislado en un servidor sin datos

15:44

frescos es como si estuviera volando a ciegas.

15:47

Y el Internet de hoy está lleno de

15:49

captchas, bloqueos y muros que odian a los

15:51

bots.

15:52

¿Cómo evitas todo eso para que la IA

15:54

tenga información en milisegundos?

15:56

Pues la solución práctica que mencionan los documentos,

15:59

es el uso de APIs de extracción de

16:01

datos web como Oxylabs.

16:02

Han desarrollado cosas como un MCP oficial, un

16:06

protocolo que conecta a la IA directamente con

16:08

herramientas como Cursor o Cloud Code.

16:11

O sea que le puedes decir a la

16:12

IA, oye, mírame los precios de Amazon de

16:15

la competencia ahora mismo.

16:16

Tal cual.

16:16

O usar plataformas visuales como NHON sin escribir

16:21

código.

16:21

La IA se salta los captchas usando proxies

16:24

residenciales, extrae los listados inmobiliarios, o los precios

16:29

en tiempo real, y los usa para su

16:31

próximo experimento.

16:32

Sin embargo, por muy bonito que suene, tiene

16:36

que haber áreas donde este bucle simplemente fracase

16:39

de forma catastrófica.

16:40

No puede servir para todo.

16:42

Y no sirve.

16:43

Fracasa rotundamente en todo lo que sea subjetivo.

16:46

Ah, claro.

16:46

El diseño de una marca, la experiencia de

16:49

usuario, o fijar precios basándote en sensaciones.

16:52

Si el éxito es un juicio de valor

16:54

emocional, la IA no sabe que funciona, y

16:57

optimizará en una dirección totalmente aleatoria.

17:00

Y me imagino que hay un peligro gigante

17:02

si la métrica que le das está mal

17:04

planteada desde el principio.

17:05

Uf, la ley de Woodhart.

17:06

Si le das a la IA una mala

17:08

métrica, optimizará esa métrica equivocada, con una confianza

17:12

y una eficiencia absolutamente demoledoras.

17:14

Claro.

17:15

Es como...

17:17

A ver, es como si le dices a

17:19

la IA que el éxito de un restaurante

17:22

se mide por la cantidad de platos vacíos

17:24

al final de la noche.

17:25

Probablemente la IA decida romper toda la vajilla

17:28

contra el suelo porque es la forma más

17:29

rápida de vaciarlos.

17:31

Es un ejemplo extremo y superdivertido, pero es

17:34

que es literal.

17:35

La IA no tiene sentido común.

17:37

O la métrica es matemáticamente perfecta, o destruyes

17:41

el proyecto.

17:41

Y fíjate, para ver todo esto en acción,

17:44

las fueltes detallan un experimento en vivo que

17:46

es para caerse de espaldas.

17:48

Ostras, sí.

17:49

El caso de estudio.

17:50

Cuéntame esto porque es vital para aterrizar la

17:53

teoría.

17:53

Plantearon un tutorial práctico usando el IDE Cursor

17:56

con el modelo Cloth Code, el Opus 4

17:59

.6.

18:00

Y usaron una herramienta llamada Codex CLI en

18:04

lo que ellos llaman modo YOLO.

18:06

Modo YOLO.

18:07

O sea, de You Only Live Once.

18:08

Solo se vive una vez.

18:10

Qué nombre tan apropiado.

18:11

Es que significa darle a la IA permisos

18:14

absolutos en tu ordenador.

18:16

Puede modificar archivos locales y ejecutar comandos sin

18:19

pedirte permiso para nada.

18:20

Hay que estar como una cabra o muy

18:21

seguro de lo que haces.

18:23

¿Cuál era el objetivo del experimento?

18:24

Tomaron una web de portafolios súper básica, estilo

18:28

antiguo de hace 15 años, a nombre de

18:30

una tal Alex Morgan.

18:32

Ajá.

18:32

El objetivo, la métrica del juez, era optimizar

18:36

la velocidad de carga local.

18:38

Usaron la herramienta Puppeteer para medir los milisegundos,

18:42

adaptaron el archivo program .md de Carpeici y

18:46

le dieron al botón de inicio.

18:47

Vale.

18:48

¿Y qué pasó en tiempo real?

18:49

La velocidad base era de 50 milisegundos.

18:53

En el primer intento, en modo YOLO, la

18:56

IA modificó cosas y, fíjate, empeoró la velocidad.

19:00

O sea, la lió.

19:01

Sí, pero revirtió el cambio de inmediato.

19:04

Hizo el git reset sola.

19:06

Luego, sin que el humano tocara absolutamente nada,

19:09

bajó la carga a 33 milisegundos.

19:12

Un 34 % de mejora en menos de

19:15

un minuto.

19:15

¡Madre mía!

19:17

Luego volvió a iterar y bajó a 28

19:19

milisegundos.

19:20

Y finalmente llegó a 25.

19:22

Redujo el tiempo exactamente a la mitad en

19:25

solo 4 minutos de reloj.

19:26

Es que me explota la cabeza.

19:28

Pasamos de sudar durante meses ajustando código a

19:30

ver cómo el tiempo de carga se reduce

19:32

a la mitad mientras tú, literalmente, te vas

19:34

a la cocina a prepararte un café.

19:36

Es que ningún desarrollador humano podría competir jamás

19:39

con esa velocidad de iteración.

19:40

Y el pronóstico a corto plazo es una

19:42

locura.

19:43

¿Qué se espera?

19:44

Se predice que en los próximos 6 meses

19:46

veremos modelos de la calidad de este SONNET

19:48

4 .6 funcionando de forma local directamente en

19:51

los iPhone, sin depender de la NUME.

19:54

O sea, estamos presenciando el nacimiento de una

19:56

especie digital resolviendo sus propios problemas en nuestros

19:59

bolsillos.

20:00

Y esto conecta muchísimo con la visión final

20:03

que tiene Carpazzi de todo esto, ¿no?

20:05

Totalmente.

20:06

Él se inspira en el famoso proyecto SETI

20:08

at Home de principios de los 2000.

20:11

Ah, sí.

20:11

Cuando la gente donaba la potencia de sus

20:13

ordenadores para buscar extraterrestres.

20:15

Exacto.

20:16

Pues Carpazzi imagina un futuro inminente con millones

20:20

de agentes de IA distribuidos en miles de

20:23

ordenadores por todo el planeta, colaborando todos juntos

20:26

en la investigación de la propia inteligencia artificial.

20:30

¡Ostras!

20:30

Es la imagen más literal de la mejora

20:33

personal recursiva que he escuchado.

20:35

El camino directo hacia la singularidad vamos.

20:38

Miles de IAs mejorando el código de las

20:40

propias IAs de forma autónoma y sin parar.

20:43

Pues con esa imagen tan potente que da

20:45

un poco de vértigo, tenemos que ir cerrando

20:47

esta inversión profunda.

20:48

Ha sido fascinante, la verdad.

20:50

Ha sido un placer desgranar todo esto contigo.

20:53

Antes de despedirnos, hasta el próximo programa, os

20:56

informamos de que las voces que oyes han

20:58

sido generadas por la IA de Notebook LM

21:00

y que dirigiendo el podcast se encuentra Julio

21:03

Pablo Vázquez, un humano que te envía saludos.

21:06

En caso de error, probablemente sean errores humanos.

21:09

Nos escuchamos.

21:10

Y por cierto, una reflexión final para que

21:12

le deis una vuelta.

21:13

Si estamos a punto de entrar en un

21:15

mundo donde la ejecución técnica del trabajo será

21:18

completamente gratuita y miles de agentes hiperinteligentes harán

21:21

todo el trabajo pesado por nosotros, ¿qué pasará

21:24

cuando nos demos cuenta de que la parte

21:26

más difícil de nuestro trabajo no era encontrar

21:29

las respuestas, sino saber exactamente qué preguntas debíamos

21:32

hacer?

21:33

Ahí os lo dejo.

21:44

Y hasta aquí el episodio de hoy.

21:47

Muchas gracias por tu atención.

21:58

Esto es BIM Praxis.

22:00

Nos escuchamos en el próximo episodio.