Buenas, esto es BIMPRAXIS, el podcast donde el
BIM se encuentra con la inteligencia artificial.
Exploramos la ciencia, la tecnología y el futuro
desde el enfoque de la arquitectura, ingeniería y
construcción.
¡Empezamos!
Bienvenida a una nueva entrega de BIMPRAXIS.
Este es el episodio 44 y seguimos con
nuestra serie dedicada a herramientas open source gratuitas.
Hoy vamos a explorar a fondo un superagente
de IA que está dando muchísimo que hablar,
Agency Row.
Sí, y para analizarlo nos hemos sumergido en
varias fuentes.
Tenemos la documentación oficial del proyecto, que es
la base, claro.
Luego, reseñas de usuarios que lo han puesto
a prueba de verdad y conversaciones muy, muy
interesantes en comunidades de desarrollo.
Exacto.
El objetivo es entender qué es Agency Row,
qué lo hace tan diferente de, bueno, de
otros asistentes de IA y, sobre todo, cómo
es la experiencia real de instalarlo y usarlo.
Ver el contraste entre la promesa y la
realidad, que siempre es lo más jugoso.
Pues sí, venga, vamos a desgranar esto.
Para empezar, a ver, lo primero que queda
claro es que Agency Row no es un
chatbot tradicional.
No, para nada.
La documentación lo define como un No, para
nada.
digital, autónomo y en evolución, que opera dentro
de su propio ordenador virtual, un entorno Docker.
Exacto.
Y esto es clave.
O sea, no es una IA en la
nube a la que le hablas.
Está en tu máquina, en un entorno controlado,
sí, pero con acceso completo a un sistema
Linux.
Eso significa que puede escribir código, ejecutarlo, instalar
software, navegar por la web.
Por sí mismo.
Es como darle su propio taller, ¿no?
En lugar de solo dejarle mirar por la
ventana.
Justo.
Y la filosofía detrás de esto es fascinante.
El proyecto lo fundó Jan Tomášek en marzo
de 2024 con una misión muy clara.
Él quería equilibrar el mundo de la IA,
dar a todo el mundo la capacidad de
ejecutar sus propios agentes autónomos.
Libres de las restricciones de las grandes corporaciones.
Totalmente.
Libres de control centralizado.
Es un proyecto de código abierto por diseño,
casi como un acto político.
Entiendo.
Y en la práctica, ¿qué se puede construir
con él?
Pues mira.
Una página de Github da ejemplos muy concretos,
desde crear paneles de control en React o
analizar datos de ventas.
Vale.
Hasta redactar artículos técnicos o incluso, y esto
ya es más serio, administrar sistemas y servidores.
Aquí es donde la cosa se pone de
verdad interesante.
Hay varias características que lo distinguen.
La primera es lo que una de las
fuentes llama autonomía sin parangón.
Dice que puede gestionar procesos complejos de principio
a fin con una supervisión humana mínima.
Sí.
Pero esa autonomía no es mágica, ¿eh?
Depende muchísimo, y esto es algo que se
repite sin parar en los foros, de la
calidad de las instrucciones.
Un usuario en un foro de Reddit lo
resumió de una forma que me encantó.
El prompting lo es todo.
Claro.
Unas instrucciones claras y bien definidas son la
clave.
Si le das un prompt vago, el resultado
va a ser, bueno, pues igual de vago.
Es decir, la autonomía es en la ejecución,
no en la concepción de la idea.
Exacto.
Tú eres el arquitecto, él es el equipo
de construcción.
Y hablando de equipo, otra capacidad que mencionan
es la colaboración multiagente.
Esto suena a ciencia ficción.
Pues es una de las cosas más potentes
que tiene.
Agent Zero puede, por así decirlo, crear otros
agentes subordinados.
¿Cómo?
Pues divide un proyecto grande en tareas más
pequeñas y se las asigna a estos nuevos
agentes, que se ejecutan en paralelo.
Es como si pudiera montar su propio equipo
de especialistas digitales para un proyecto.
Ostras, qué pasada.
Es como ser el director de orquesta de
una sinfonía de Illas.
Tal cual.
Y no está atado a un único célebro.
Uno de sus puntos más fuertes es la
flexibilidad.
Puedes integrarlo con diferentes modelos de lenguaje grandes,
los famosos LLMs.
Vale, como GPT -4, Claude… Sí, puedes usar
esos, pero… y esto es muy importante para
su filosofía.
Puedes ejecutar modelos locales a través de herramientas
como Oyama.
¿Y eso para el usuario?
¿Qué implica exactamente?
Implica control total.
Sobre el rendimiento, sobre los costes, sobre la
privacidad.
Una reseña muy práctica detalla cómo el autor
instaló el modelo QN3 para ejecutarlo todo en
su ordenador.
Ah, y así te quitas la dependencia de
las APIs de pago.
Justo.
Pero, como advierte otro usuario, y aquí viene
el pero, esto requiere un hardware potente.
Claro, me lo imagino.
Menciona específicamente la necesidad de una buena GPU,
como una RTX 3060.
Para que funcione bien.
No vale cualquier portátil.
Hablemos de la puesta en marcha.
Una reseña del portal Apidoc describe la instalación
como muy sencilla.
Dice que lleva unos 15 o 20 minutos
gracias a Docker.
Los pasos básicos son instalar Docker, descargar la
imagen y ejecutar el contenedor.
Sí, el arranque inicial parece directo.
Docker en eso es una maravilla, te lo
encapsula todo.
Ahora bien, las conversaciones de los usuarios revelan
que la personalización, eso ya es otro cantar.
Ahí está el lío, ¿no?
Ahí.
Algunos comentan que tuvieron que editar archivos de
configuración, como el initialize .py o el fichero
.env para poder usar sus modelos locales.
Y que se encontraron con errores, claro.
Claro.
Se reportan errores como el model not found
o problemas de incompatibilidad con herramientas de visión
al usar LLM Studio.
O sea que hay una curva de aprendizaje.
Hay que ensuciarse las manos.
Vale, pero una vez lo tienes funcionando, las
posibilidades parecen enormes.
La misma reseña que mencionamos lo puso a
prueba.
Y es que es un programa de tecnología
que lleva con tareas muy concretas.
Por ejemplo, le pidió que comprobara el precio
del índice SSP 500.
Algo sencillo, sí, y luego algo más complejo.
Planificar un viaje de siete días a Tokio.
Y por lo visto, creó un itinerario súper
detallado.
Pero donde de verdad, de verdad brilla es
en la generación de código.
Ahí es donde la gente se queda boquiabierta.
El autor le pidió crear un juego de
Flappy Bird usando solo HTML y JavaScript.
Y… Y… Agent Zero generó un juego funcional,
completamente jugable.
Anda ya.
Y no solo eso.
También creó un juego de guacamole, el de
golpear al topo y un generador de paletas
de colores.
Pero lo más sorprendente es que podía hacer
estas cosas a la vez.
Eso es.
En la interfaz web, el autor tenía un
chat para codificar el juego y otro para
planificar el viaje, funcionando simultáneamente.
Exacto.
Eso demuestra la capacidad multitarea que permite la
nueva función de proyectos, que metieron en la
versión 0 .9 .7.
Exacto.
Es un cambio de juego total.
Bueno, entonces, ¿cuál es el balance final?
La reseña de Apidoc ofrece una lista de
aciertos y fallos muy clara.
Entre los aciertos, la simplicidad de la configuración
inicial con Docker, que ya hemos dicho.
La potencia de la multitarea, que es flipante.
El soporte para modelos locales con Oyama.
Y la enorme capacidad de personalización, que es
una pasada.
Vale.
Pero vamos a los fallos.
El primero, se reitera la necesidad de pulir
los prompts.
No hay magia.
Hay que darle buenas instrucciones.
Luego, lo que ya hemos avanzado.
Los modelos locales exigen un hardware considerable.
Mencionan que un portátil con 8 GB de
RAM se ralentizaba una barbaridad.
O sea, que no es para todos los
públicos.
No.
Y finalmente, que la documentación...
La configuración para algunas configuraciones avanzadas podría ser
más clara.
Algo típico en estos proyectos que van tan
rápido.
Y hay una advertencia crucial en la página
de GitHub que no podemos pasar por alto
y que lo ponen bien grande.
Sí.
Allen 0 puede ser peligroso.
Uf, sí.
Esto es muy, muy serio.
Hay que recordar que le estás dando la
capacidad de ejecutar comandos y modificar archivos en
un sistema operativo.
Claro.
Si le das una instrucción mal formulada, te
la puede liar parda.
Exacto.
Por eso es fundamental.
Repiten mil veces.
Utilizarlo siempre en un entorno aislado como Docker.
Para no poner en riesgo tu sistema principal.
Es la jaula de seguridad.
No es opcional.
Para nada.
Y esto nos lleva a un aspecto que
define mucho la naturaleza del proyecto.
Su modelo de sostenibilidad.
Para financiar el desarrollo sin depender de inversores
o vender el producto, los creadores lanzaron un
token cripto, el A0T, en la red base
de Ethereum.
Espera, espera.
¿Significa que hay que comprar criptomonedas para usarlo?
No, no, no.
Para nada.
El framework es totalmente gratuito.
El token tiene otro propósito.
A ver.
El Project Paper insiste mucho en que no
es una moneda meme.
Su objetivo es doble.
Primero, financiar a los desarrolladores, que hasta entonces
trabajaban de forma voluntaria.
Vale.
¿Como un crowdfunding?
Eso es.
Y segundo, y esto es muy interesante, establecer
una gobernanza comunitaria.
Los que poseen el token pueden votar en
la red.
Y también pueden votar en las decisiones sobre
el futuro del proyecto.
Ah, o sea que la comunidad dirige el
rumbo.
Justo.
Es un modelo para mantenerlo abierto y fiel
a su misión.
Entonces, resumiendo, ¿qué significa todo esto?
Agent Zero se presenta como un framework de
IA de código abierto inmensamente potente y versátil.
Puede en manos de cualquiera la capacidad de
tener un agente autónomo.
Sí, pero exige conocimientos técnicos, una curva de
aprendizaje y, sobre todo, un uso responsable.
¿Y esto?
Esto nos lleva a una pregunta importante para
reflexionar, creo yo.
Sí.
La misión de Agent Zero es dar a
cada persona su propia IA autónoma.
A medida que estas herramientas se vuelven más
capaces de actuar de forma independiente… ¿Qué nuevas
responsabilidades recaen sobre el usuario para garantizar que
se utilicen de forma ética y segura?
Exacto.
Especialmente cuando las únicas barreras son las que
uno mismo se programa.
Es una reflexión clave para el futuro que,
bueno, ya está aquí.
Totalmente.
Y con esto… Comenzamos nuestro análisis.
Detrás de las voces sintéticas que escuchas en
estos episodios, creadas gracias a la IA de
Notebook LM, se encuentra un humano, Julio Pablo
Vázquez, que dirige el cotarro.
Es decir, elige los temas y el enfoque
y es al que tienes que pedirle explicaciones
si detectas algún error.
Hasta el próximo programa, humano.
Sonido de cierre suave.
Y hasta aquí el episodio de hoy.
Muchas gracias por tu atención.
Esto es BIMPRAXIS.
Nos escuchamos en el próximo episodio.