E044_Agent_Zero_automatiza_tareas_y_código

0:09

Buenas, esto es BIMPRAXIS, el podcast donde el

0:15

BIM se encuentra con la inteligencia artificial.

0:20

Exploramos la ciencia, la tecnología y el futuro

0:23

desde el enfoque de la arquitectura, ingeniería y

0:26

construcción.

0:28

¡Empezamos!

0:37

Bienvenida a una nueva entrega de BIMPRAXIS.

0:40

Este es el episodio 44 y seguimos con

0:44

nuestra serie dedicada a herramientas open source gratuitas.

0:48

Hoy vamos a explorar a fondo un superagente

0:52

de IA que está dando muchísimo que hablar,

0:55

Agency Row.

0:56

Sí, y para analizarlo nos hemos sumergido en

0:58

varias fuentes.

0:59

Tenemos la documentación oficial del proyecto, que es

1:02

la base, claro.

1:03

Luego, reseñas de usuarios que lo han puesto

1:05

a prueba de verdad y conversaciones muy, muy

1:08

interesantes en comunidades de desarrollo.

1:10

Exacto.

1:11

El objetivo es entender qué es Agency Row,

1:15

qué lo hace tan diferente de, bueno, de

1:17

otros asistentes de IA y, sobre todo, cómo

1:20

es la experiencia real de instalarlo y usarlo.

1:23

Ver el contraste entre la promesa y la

1:25

realidad, que siempre es lo más jugoso.

1:27

Pues sí, venga, vamos a desgranar esto.

1:29

Para empezar, a ver, lo primero que queda

1:31

claro es que Agency Row no es un

1:34

chatbot tradicional.

1:35

No, para nada.

1:36

La documentación lo define como un No, para

1:40

nada.

1:40

digital, autónomo y en evolución, que opera dentro

1:43

de su propio ordenador virtual, un entorno Docker.

1:46

Exacto.

1:47

Y esto es clave.

1:48

O sea, no es una IA en la

1:49

nube a la que le hablas.

1:51

Está en tu máquina, en un entorno controlado,

1:54

sí, pero con acceso completo a un sistema

1:56

Linux.

1:57

Eso significa que puede escribir código, ejecutarlo, instalar

2:00

software, navegar por la web.

2:02

Por sí mismo.

2:03

Es como darle su propio taller, ¿no?

2:05

En lugar de solo dejarle mirar por la

2:07

ventana.

2:08

Justo.

2:10

Y la filosofía detrás de esto es fascinante.

2:12

El proyecto lo fundó Jan Tomášek en marzo

2:15

de 2024 con una misión muy clara.

2:18

Él quería equilibrar el mundo de la IA,

2:20

dar a todo el mundo la capacidad de

2:22

ejecutar sus propios agentes autónomos.

2:24

Libres de las restricciones de las grandes corporaciones.

2:27

Totalmente.

2:28

Libres de control centralizado.

2:29

Es un proyecto de código abierto por diseño,

2:32

casi como un acto político.

2:34

Entiendo.

2:34

Y en la práctica, ¿qué se puede construir

2:37

con él?

2:38

Pues mira.

2:40

Una página de Github da ejemplos muy concretos,

2:42

desde crear paneles de control en React o

2:44

analizar datos de ventas.

2:46

Vale.

2:47

Hasta redactar artículos técnicos o incluso, y esto

2:50

ya es más serio, administrar sistemas y servidores.

2:53

Aquí es donde la cosa se pone de

2:55

verdad interesante.

2:56

Hay varias características que lo distinguen.

2:59

La primera es lo que una de las

3:01

fuentes llama autonomía sin parangón.

3:04

Dice que puede gestionar procesos complejos de principio

3:07

a fin con una supervisión humana mínima.

3:10

Sí.

3:11

Pero esa autonomía no es mágica, ¿eh?

3:14

Depende muchísimo, y esto es algo que se

3:16

repite sin parar en los foros, de la

3:18

calidad de las instrucciones.

3:19

Un usuario en un foro de Reddit lo

3:21

resumió de una forma que me encantó.

3:23

El prompting lo es todo.

3:25

Claro.

3:25

Unas instrucciones claras y bien definidas son la

3:28

clave.

3:29

Si le das un prompt vago, el resultado

3:32

va a ser, bueno, pues igual de vago.

3:34

Es decir, la autonomía es en la ejecución,

3:37

no en la concepción de la idea.

3:39

Exacto.

3:39

Tú eres el arquitecto, él es el equipo

3:42

de construcción.

3:43

Y hablando de equipo, otra capacidad que mencionan

3:45

es la colaboración multiagente.

3:48

Esto suena a ciencia ficción.

3:50

Pues es una de las cosas más potentes

3:51

que tiene.

3:52

Agent Zero puede, por así decirlo, crear otros

3:55

agentes subordinados.

3:57

¿Cómo?

3:57

Pues divide un proyecto grande en tareas más

3:59

pequeñas y se las asigna a estos nuevos

4:02

agentes, que se ejecutan en paralelo.

4:04

Es como si pudiera montar su propio equipo

4:06

de especialistas digitales para un proyecto.

4:08

Ostras, qué pasada.

4:10

Es como ser el director de orquesta de

4:13

una sinfonía de Illas.

4:15

Tal cual.

4:16

Y no está atado a un único célebro.

4:18

Uno de sus puntos más fuertes es la

4:20

flexibilidad.

4:21

Puedes integrarlo con diferentes modelos de lenguaje grandes,

4:25

los famosos LLMs.

4:27

Vale, como GPT -4, Claude… Sí, puedes usar

4:30

esos, pero… y esto es muy importante para

4:33

su filosofía.

4:34

Puedes ejecutar modelos locales a través de herramientas

4:36

como Oyama.

4:37

¿Y eso para el usuario?

4:39

¿Qué implica exactamente?

4:40

Implica control total.

4:42

Sobre el rendimiento, sobre los costes, sobre la

4:45

privacidad.

4:45

Una reseña muy práctica detalla cómo el autor

4:48

instaló el modelo QN3 para ejecutarlo todo en

4:51

su ordenador.

4:52

Ah, y así te quitas la dependencia de

4:54

las APIs de pago.

4:55

Justo.

4:55

Pero, como advierte otro usuario, y aquí viene

4:58

el pero, esto requiere un hardware potente.

5:01

Claro, me lo imagino.

5:02

Menciona específicamente la necesidad de una buena GPU,

5:05

como una RTX 3060.

5:07

Para que funcione bien.

5:09

No vale cualquier portátil.

5:10

Hablemos de la puesta en marcha.

5:12

Una reseña del portal Apidoc describe la instalación

5:15

como muy sencilla.

5:16

Dice que lleva unos 15 o 20 minutos

5:18

gracias a Docker.

5:19

Los pasos básicos son instalar Docker, descargar la

5:22

imagen y ejecutar el contenedor.

5:24

Sí, el arranque inicial parece directo.

5:27

Docker en eso es una maravilla, te lo

5:29

encapsula todo.

5:30

Ahora bien, las conversaciones de los usuarios revelan

5:33

que la personalización, eso ya es otro cantar.

5:36

Ahí está el lío, ¿no?

5:38

Ahí.

5:39

Algunos comentan que tuvieron que editar archivos de

5:41

configuración, como el initialize .py o el fichero

5:45

.env para poder usar sus modelos locales.

5:47

Y que se encontraron con errores, claro.

5:49

Claro.

5:49

Se reportan errores como el model not found

5:52

o problemas de incompatibilidad con herramientas de visión

5:54

al usar LLM Studio.

5:56

O sea que hay una curva de aprendizaje.

5:58

Hay que ensuciarse las manos.

6:00

Vale, pero una vez lo tienes funcionando, las

6:02

posibilidades parecen enormes.

6:04

La misma reseña que mencionamos lo puso a

6:06

prueba.

6:06

Y es que es un programa de tecnología

6:06

que lleva con tareas muy concretas.

6:08

Por ejemplo, le pidió que comprobara el precio

6:10

del índice SSP 500.

6:13

Algo sencillo, sí, y luego algo más complejo.

6:16

Planificar un viaje de siete días a Tokio.

6:19

Y por lo visto, creó un itinerario súper

6:21

detallado.

6:22

Pero donde de verdad, de verdad brilla es

6:25

en la generación de código.

6:26

Ahí es donde la gente se queda boquiabierta.

6:29

El autor le pidió crear un juego de

6:31

Flappy Bird usando solo HTML y JavaScript.

6:35

Y… Y… Agent Zero generó un juego funcional,

6:39

completamente jugable.

6:41

Anda ya.

6:41

Y no solo eso.

6:42

También creó un juego de guacamole, el de

6:45

golpear al topo y un generador de paletas

6:47

de colores.

6:48

Pero lo más sorprendente es que podía hacer

6:50

estas cosas a la vez.

6:52

Eso es.

6:53

En la interfaz web, el autor tenía un

6:55

chat para codificar el juego y otro para

6:57

planificar el viaje, funcionando simultáneamente.

7:00

Exacto.

7:01

Eso demuestra la capacidad multitarea que permite la

7:04

nueva función de proyectos, que metieron en la

7:06

versión 0 .9 .7.

7:09

Exacto.

7:10

Es un cambio de juego total.

7:12

Bueno, entonces, ¿cuál es el balance final?

7:14

La reseña de Apidoc ofrece una lista de

7:16

aciertos y fallos muy clara.

7:18

Entre los aciertos, la simplicidad de la configuración

7:22

inicial con Docker, que ya hemos dicho.

7:24

La potencia de la multitarea, que es flipante.

7:27

El soporte para modelos locales con Oyama.

7:29

Y la enorme capacidad de personalización, que es

7:32

una pasada.

7:33

Vale.

7:34

Pero vamos a los fallos.

7:36

El primero, se reitera la necesidad de pulir

7:39

los prompts.

7:40

No hay magia.

7:41

Hay que darle buenas instrucciones.

7:43

Luego, lo que ya hemos avanzado.

7:45

Los modelos locales exigen un hardware considerable.

7:49

Mencionan que un portátil con 8 GB de

7:51

RAM se ralentizaba una barbaridad.

7:54

O sea, que no es para todos los

7:55

públicos.

7:56

No.

7:57

Y finalmente, que la documentación...

7:59

La configuración para algunas configuraciones avanzadas podría ser

8:01

más clara.

8:02

Algo típico en estos proyectos que van tan

8:04

rápido.

8:05

Y hay una advertencia crucial en la página

8:07

de GitHub que no podemos pasar por alto

8:09

y que lo ponen bien grande.

8:11

Sí.

8:11

Allen 0 puede ser peligroso.

8:13

Uf, sí.

8:14

Esto es muy, muy serio.

8:16

Hay que recordar que le estás dando la

8:18

capacidad de ejecutar comandos y modificar archivos en

8:21

un sistema operativo.

8:22

Claro.

8:22

Si le das una instrucción mal formulada, te

8:25

la puede liar parda.

8:26

Exacto.

8:27

Por eso es fundamental.

8:29

Repiten mil veces.

8:30

Utilizarlo siempre en un entorno aislado como Docker.

8:33

Para no poner en riesgo tu sistema principal.

8:36

Es la jaula de seguridad.

8:38

No es opcional.

8:39

Para nada.

8:41

Y esto nos lleva a un aspecto que

8:43

define mucho la naturaleza del proyecto.

8:45

Su modelo de sostenibilidad.

8:48

Para financiar el desarrollo sin depender de inversores

8:50

o vender el producto, los creadores lanzaron un

8:53

token cripto, el A0T, en la red base

8:57

de Ethereum.

8:58

Espera, espera.

8:59

¿Significa que hay que comprar criptomonedas para usarlo?

9:02

No, no, no.

9:03

Para nada.

9:03

El framework es totalmente gratuito.

9:05

El token tiene otro propósito.

9:07

A ver.

9:08

El Project Paper insiste mucho en que no

9:11

es una moneda meme.

9:12

Su objetivo es doble.

9:13

Primero, financiar a los desarrolladores, que hasta entonces

9:16

trabajaban de forma voluntaria.

9:18

Vale.

9:18

¿Como un crowdfunding?

9:20

Eso es.

9:20

Y segundo, y esto es muy interesante, establecer

9:24

una gobernanza comunitaria.

9:26

Los que poseen el token pueden votar en

9:29

la red.

9:29

Y también pueden votar en las decisiones sobre

9:30

el futuro del proyecto.

9:31

Ah, o sea que la comunidad dirige el

9:33

rumbo.

9:33

Justo.

9:34

Es un modelo para mantenerlo abierto y fiel

9:37

a su misión.

9:38

Entonces, resumiendo, ¿qué significa todo esto?

9:41

Agent Zero se presenta como un framework de

9:45

IA de código abierto inmensamente potente y versátil.

9:48

Puede en manos de cualquiera la capacidad de

9:50

tener un agente autónomo.

9:52

Sí, pero exige conocimientos técnicos, una curva de

9:55

aprendizaje y, sobre todo, un uso responsable.

9:58

¿Y esto?

9:59

Esto nos lleva a una pregunta importante para

10:00

reflexionar, creo yo.

10:02

Sí.

10:02

La misión de Agent Zero es dar a

10:04

cada persona su propia IA autónoma.

10:07

A medida que estas herramientas se vuelven más

10:10

capaces de actuar de forma independiente… ¿Qué nuevas

10:12

responsabilidades recaen sobre el usuario para garantizar que

10:15

se utilicen de forma ética y segura?

10:18

Exacto.

10:19

Especialmente cuando las únicas barreras son las que

10:21

uno mismo se programa.

10:22

Es una reflexión clave para el futuro que,

10:25

bueno, ya está aquí.

10:26

Totalmente.

10:27

Y con esto… Comenzamos nuestro análisis.

10:30

Detrás de las voces sintéticas que escuchas en

10:32

estos episodios, creadas gracias a la IA de

10:35

Notebook LM, se encuentra un humano, Julio Pablo

10:38

Vázquez, que dirige el cotarro.

10:40

Es decir, elige los temas y el enfoque

10:42

y es al que tienes que pedirle explicaciones

10:44

si detectas algún error.

10:46

Hasta el próximo programa, humano.

10:47

Sonido de cierre suave.

11:00

Y hasta aquí el episodio de hoy.

11:02

Muchas gracias por tu atención.

11:13

Esto es BIMPRAXIS.

11:15

Nos escuchamos en el próximo episodio.

E044_Agent_Zero_automatiza_tareas_y_código_localmente

Episode description

Episodio 44: Agency Row, el superagente de IA

Persons