Buenas, esto es BIMPRAXIS, el podcast donde el
BIM se encuentra con la inteligencia artificial.
Exploramos la ciencia, la tecnología y el futuro
desde el enfoque de la arquitectura, ingeniería y
construcción.
¡Empezamos!
Muy buenas.
Bienvenidas, bienvenidos a un nuevo episodio de BIMPRAXIS.
Hoy os traemos la guía definitiva para transformar
una inteligencia artificial en un sistema autónomo y
personalizado que gestiona tu vida entera.
Y de verdad que no exageramos con lo
de la vida entera.
O sea, es un cambio de paradigma brutal.
Totalmente.
A ver, para ponernos en situación, imaginemos esto.
Horas antes de que suene el despertador por
la mañana, hay un sistema digital en un
servidor que ya se ha tragado todos tus
datos biométricos de la noche.
¿Ah, sí?
¿De fondo, sin hacer ruido?
Exacto.
Y de forma totalmente autónoma, ha evaluado también
cómo funcionaron unas publicaciones en redes sociales del
día anterior.
Ha visto que hay poco compromiso o engagement.
Y te ha reestructurado el calendario diario entero.
O sea, te ha movido a las tareas
pesadas a las horas donde predice que vas
a tener mejor rendimiento físico.
Eso es.
Y todo esto ocurre en silencio, sin que
toques un solo botón.
Todo documentado en archivos de texto.
Hoy, en nuestro análisis a fondo, vamos a
desglosar exactamente cómo se construye esta arquitectura.
Un ecosistema que no es solo un asistente,
es un gestor de información personal.
Es que para entender la magnitud de esto
tenemos que cambiar el chip.
Olvidarnos de cómo usamos la IA ahora mismo.
La mayoría de la gente tiene un enfoque
súper transaccional.
Claro, abres el chat, preguntas y cierras.
Eso es.
Entras en Open Cloud o la que sea,
metes un prompt, sacas el texto y adiós.
Cuando cierras la pestaña, el sistema se reinicia.
Cero memoria.
Es, por diseño, un entorno sin estado.
Y a nivel operativo eso es un cuello
de botella tremendo.
Yo siempre lo comparo con tener a un
colega trabajando contigo que es brillante, el mejor
de su sector, pero que tiene una amnesia
severa.
Sí, sí, sí, como en la película Memento.
Literal.
Cada mañana tienes que sentarle y decirle cuáles
son las reglas, qué lenguaje de programación usamos,
el tono de los correos.
Es agotador.
Y aquí es donde las fuentes de hoy
nos presentan a Hermes.
Hermes, exacto.
Que se basa en un concepto que Andréi
Carpaty bautizó como el WikiLLM.
El WikiLLM.
Me encanta el nombre.
A ver, es que Carpatide en el clavo.
Dice que el próximo salto no es meterle
más parámetros a los modelos, sino darles una
arquitectura de memoria a largo plazo, que sea
persistente.
O sea que no sea reactivo, sino que
el sistema actúe como tu propio archivista.
Eso es.
Antes de que el modelo escupa la primera
palabra de respuesta, un sistema va y lee
un bloque gigante de tu propio archivo histórico,
lo carga en la ventana de contexto y
entonces, y solo entonces, razona.
Pero a ver, alguien te olía a decir,
oye, pues esto es como los sistemas RAG
de toda la vida.
Les subes un PDF gigante a la IA
y ya está.
¿Cuál es la diferencia?
Uf, la diferencia es abismal a nivel técnico.
En un RAG la información es estática.
Si tú lo modificas el PDF, la IA
no aprende nada nuevo.
Pero Echarme S tiene permisos de escritura.
Ostras, claro.
Puede modificar su propia memoria.
Exactamente.
Si la gente ve que siempre le corriges
un cierto tono en los correos, coge, abre
su propio archivo de reglas de forma autónoma,
lo reescribe y se guarda esa nueva regla
para el futuro.
Mutación pura.
Madre mía.
Pero claro, aquí hay un elefante en la
habitación.
Si cada vez que interactúas, la IA tiene
que leerse toda la enciclopedia de tu vida,
eso, a nivel de tokens, tiene que costar
una fortuna, una pasta.
De hecho, los informes documentan que alguien intentó
hacer esto con la API Premium de Cloud
y se dejó 64 dólares en una sola
semana.
64 pavos en una semana.
Eso, para un usuario individual, es insostenible.
Inviable, totalmente.
Por eso la primera regla para no arruinarse
es elegir bien el proveedor.
Y aquí las fuentes recomiendan muchísimo OpenAI Codex
en su versión 5.4.
¿Y eso por qué?
Es más inteligente que los modelos nuevos de
Antrópico o Gemini.
Que va, no es por capacidad de razonamiento,
es por pura supervivencia.
Las plataformas corporativas como Antropic tienen sistemas antitrampas
muy estrictos.
Si ven un flujo constante, programado y automático
de peticiones… Se creen que eres un bot
malicioso y te bloquean la cuenta.
Exacto.
Te banean sin avisar.
Sin embargo, Codex 5.4 se traga este volumen
continuo sin hacer saltar las alormas.
Es súper fiable para la base.
Vale, pero me imagino que no puedes usar
un solo modelo para todo si quieres optimizar
costes.
Ahí le has dado.
El secreto está en plataformas de enrutamiento dinámico,
como Open Router.
Es magia pura.
Es como un director de orquesta.
¿no?
Que decide a quién le manda cada tarea.
Tal cual.
Hermés evalúa lo difícil que es la tarea
que le has pedido.
Si solo es, oye, categoriza esta factura o
ponme esto en negrita, el enrutador lo manda
a un modelo súper barato y rápido.
Como Cloud Sonnet, por ejemplo.
Eso es.
Que tiene un coste marginal ridículo.
Pero si de repente le pides que audite
una arquitectura de código asíncrono o cruce datos
financieros complejos, pues entonces sí, asume el gasto
y lo manda al modelo Opus 47.
Paga por el modelo caro sólo cuando hace
falta la artillería pesada.
Y ojo que en los documentos hablaban de
un truco con Open Router, lo del modelo
Elephant.
Sí, el modelo gratuito.
Es que fíjate, metes 10 dólares de saldo
en la cuenta, un depósito mínimo, y la
plataforma te desbloquea mil peticiones diarias gratis para
ese modelo en concreto.
Una locura de ahorro.
Vale, tenemos el software y la factura controlados.
Pero esto tiene que estar encendido 24 horas.
Si lo tengo en mi portátil y bajo
la tapa, se cae todo.
Se desploma el ecosistema, sí.
Puedes intentar usar o llama en local con
modelos ligeros como QN 3.5, que por cierto
va bien, pero otros como Gamma 3B fracasaron
porque no soportan llamadas a herramientas.
Ya, pero sigues dependiendo de tener el ordenador
encendido todo el día.
Claro, la solución real es un VPS, un
servidor privado virtual en la nube.
Y aquí es donde la gente suele salir
corriendo.
Total, en cuanto les dices línea de comandos,
Linux o conexiones SSH, la mitad de la
audiencia desconecta.
Da vértigo.
Y es normal, ¿eh?
Pero los documentos muestran una herramienta brutal llamada
Open Router Spawn.
Esto te abstrae de todo ese follón técnico.
O sea, ¿no tienes que tocar código en
la terminal?
Nada.
Spawn se conecta a un proveedor como DigitalOcean,
instala la imagen, pone las variables y te
levanta los servicios.
Todo casi con un clic.
Por unos 18 dólares al mes tienes un
droplet con dos CPUs y dos gigas de
RAM.
Más que suficiente para mantener el cerebro despierto
todo el tiempo.
Vale, cambiando de tercio.
Ya tenemos la máquina funcionando en la nube.
Pero, ¿cómo interactuamos con ella?
¿Porque no vas a entrar al servidor cada
vez?
Ni de broma.
Las pruebas confirman que Telegram es la mejor
interfaz, sin duda.
Usas Botfather, creas un bot con tu identificador
y listo, lo tienes en el móvil.
Y hablaban de crear diferentes chats temáticos dentro
de Telegram, ¿verdad?
Sí, súper importante.
Tienes un chat para redes sociales, otro para
programación, otro para charlar.
Así evitas la contaminación cruzada en el contexto
del modelo.
Claro, no mezclas un análisis de métricas con
la receta de la cena.
Pero a mí lo que me fascina es
cómo se le da personalidad a esto a
través de los archivos Markdown.
Los famosos .md.
Es que la clave de toda la configuración
lógica está en un panel web local, y
sobre todo en esos tres archivos, user, souls
y agents.
A ver, es que esto es, literalmente, como
hacerte una ficha de personaje en un juego
de rol.
Totalmente.
A ver cómo lo enfocas tú.
Pues mira, el archivo user.md es el trasfondo,
el lore de tu personaje.
Que vives en Madrid, que tienes un perro,
tu estado civil.
Es el contexto pasivo.
Luego, souls.md es el carisma, el tono, la
empatía.
El alma de la gente.
Exacto.
Y agents.mdd son las habilidades de combate.
Las reglas súper estrictas de sintaxis o código
que la IA no puede saltarse jamás.
Y fíjate que esta separación, que suena a
broma de rol, a nivel de redes neuronales
es un escudo anti alucinaciones bestial.
¿Por qué?
Si al final la IA se lee los
tres archivos igual.
Sí, pero al estar en bloques separados, obligas
al mecanismo de atención del modelo a ponderarlos
de forma independiente.
Si tú metes un prompt kilométrico tradicional donde
mezclas el tono divertido con las reglas de
código estricto, se lía así.
Los pesos estadísticos se contaminan y la IA
te pone variables de código con nombres graciosos
o se salta tabulaciones porque está en modo
creativo.
Claro.
Separando los archivos, le puedes decir en souls.md
que actúe modo hype, súper motivado o incluso
como un pirata.
Y te dará los buenos días súper eufórico.
Pero cuando genere código basado en agents.md, será
impecable.
Sintaxis pura sin que la creatividad le afecte
lo más mínimo.
Vale, me parece brillante.
Pero ahora viene para mí la parte más
ciencia ficción de todo esto.
Hemos hablado de pedirle cosas, pero ¿este sistema
es proactivo?
Da el salto, sí.
Pasa de estar esperando órdenes a iniciar la
conversación.
Y lo hace con lo que los arquitectos
llaman heartbeats.
Latidos.
Esto viene de la filosofía de OpenCloud y
el comando aquel famoso de sorpréndeme, ¿no?
Exactamente.
Básicamente son cronjobs, tareas programadas a nivel de
servidor.
Tú le dices, oye, despiértate cada día a
las 8 de la mañana y mira a
ver si hay algo interesante.
Y aquí el caso de la salud es
alucinante.
Por favor, repasa ese caso porque yo cuando
lo leía estaba alucinada.
Fíjate, conectan una aplicación para volcar los datos
cerrados de Apple Health en el directorio local
del servidor.
La IA se despierta, ve esos datos en
bruto sobre el sueño y dice, vale, esto
es ilegible para un humano.
Y en vez de simplemente resumir, ¿qué hace?
Pues escribe un script en Python por sí
misma.
Crea una herramienta para limpiar el ruido de
los datos, calcular medias y aislar los días
malos.
Y descubre que el usuario durmió una media
de siete horas y media, pero hubo un
día crítico de cinco horas.
¡Ostras!
Pero lo fuerte es que no borre el
script.
Se da cuenta de que es útil, lo
guarda como una habilidad permanente y a la
mañana siguiente… A la mañana siguiente, el latido
salta de nuevo.
Pero la IA ya no gasta tiempo ni
tokens en pensar cómo procesar.
Ejecute el script guardado y te manda el
informe por Telegram directamente.
Te dice, oye, has dormido fatal hoy.
Ojo con el rendimiento.
A ver, yo aquí tengo que hacer de
abogada del diablo.
Un sistema que te vigila el sueño y
te manda notificaciones médicas no solicitadas.
Suena un poco a distopía de Silicon Valley.
Suena intrusivo total.
Es verdad, sobre todo si pensamos en las
apps comerciales de hoy en día, que solo
quieren tu atención para venderte cosas.
Claro, la economía de la atención.
Pero aquí radica la diferencia brutal.
Este ecosistema lo alojas tú.
Tú controlas los cronjobs.
Los datos biométricos jamás salen de tu servidor
privado.
No te están vendiendo nada.
Solo transforman un dato pasivo en inteligencia accionable
para ti.
Vale, visto así, al ser local y privado,
la cosa cambia.
Y hablaban de otro caso de uso, saltándose
restricciones en redes sociales, ¿no?
Con threads.
Buah, ese es un ejemplo técnico espectacular de
cómo evitan los muros corporativos.
Ya sabes que las APIs oficiales de Meta
son súper restrictivas.
Sí, te cierran el grifo rápido si intentas
automatizar cosas.
Pues Erms usa una extensión llamada getcookies.ext.
Básicamente se exportan las credenciales de sesión encriptadas
de tu propio navegador al servidor.
O sea, que la IA finge ser tú
entrando desde tu ordenador.
Exacto.
Se salta las barreras de autenticación como si
fuera un humano legítimo navegando.
Se metió en decenas de hilos, sacó el
texto, las réplicas, las interacciones y sacó conclusiones.
Y conclusiones útiles, porque descubrió que cuando hablaban
del propio agente ERMS o de hardware productivo,
las métricas se disparaban.
Hizo una auditoría de redes sociales completa y
gratis, sin que nadie moviera un dedo.
Es que es muy fuerte.
Pero claro, para que todo esto converja, llegamos
al concepto del CIO definitivo que mencionaban las
fuentes.
El director de orquesta.
Porque, claro, ERMS no puede hacerlo todo solo
sin saturarse.
Necesita delegar.
Es como conectar la consola de Google Cloud
para que lea el correo y el calendario.
La IA ve que el jueves tienes una
cita médica presencial de 5 a 6, lee
un correo de un cliente urgente y te
reorganiza el día.
Y ahí es donde entra la arquitectura multiagente.
Es que ya no hablamos de un cerebro
único y monolítico.
es una empresa.
Literal.
Herms es el CEO, atiende el teléfono en
Telegram, toma las decisiones rápidas, pero si le
dices, oye, hazme una investigación profunda sobre el
mercado inmobiliario en Valencia.
Herms dice, vale, esto me va a llevar
horas, pues se lo delega a un subordinado,
a OpenCloth.
Le da las instrucciones y OpenCloth se tira
cinco horas navegando en segundo plano, mientras Herms
sigue libre para contestarte por Telegram.
Y cuando el subordinado termina, le pasa el
informe limpio al jefe.
Pero, a ver, técnicamente, para que no se
pise en la memoria a estos dos agentes,
¿cómo lo hacen?
Esa es la magia de los archivos Markdown
y de usar un servidor NAS.
Todos los agentes leen y escriben en la
misma carpeta física del servidor.
¿Es la misma fuente de verdad para todos?
Eso es.
Al usar Markdown, que es texto plano y
súper ligero, tanto las máquinas como nosotros podemos
leerlo sin problemas.
No hay formatos propietarios cerrados.
¿Y para visualizar todo este enjambre de datos
sin volverte loco, usas Obsidian?
Obsidian es la guinda del pastel.
Conectas Obsidian a esa carpeta del NAS y
te renderiza todos esos miles de archivos de
texto en un mapa visual, con nodos conectados.
¿Ves literalmente tu segundo cerebro digital latiendo en
directo?
Nodos que se actualizan solos mientras hablas con
el bot.
Es una maravilla técnica.
Rompe por completo la barrera entre la máquina
y la mente humana.
Pero claro, llegar a este nivel de monitorización
invisible plantea un dilema, tela de profundo.
Ya te digo, porque al final estás montando
una infraestructura que se traga tus correos, sabe
cómo duermes, lee tus finanzas, entiende cómo hablas
a lo largo de los meses.
Ya no es un asistente, es un espejo
absoluto de tu vida.
Un espejo estadístico perfecto.
La máquina empieza a haber correlaciones que a
ti se te escapan totalmente.
Es que, imagínate, si esta red persistente pilla
patrones ocultos entre tu nivel de cansancio físico
y las malas decisiones que tomas en el
trabajo o lo que compras.
La pregunta es inevitable, ¿no?
Llegará un punto en el que este ecosistema
entienda tus sesgos, tus malos hábitos y tus
bajones de productividad mucho mejor de lo que
te conoces tú mismo.
Es que yo creo que sí, la tecnología
ya está aquí, las APIs lo permiten, el
código funciona… El límite ya no es técnico,
es puramente psicológico.
¿Estamos preparados para cederle la auditoría de nuestra
vida a las matemáticas de un algoritmo?
Uf, construir un observador silencioso que termina conociendo
tus defectos mejor que tu propio cerebro, que
siempre se intenta engañar y justificar a sí
mismo, es fascinante a nivel de ingeniería.
Pero pone los pelos de punta a nivel
de privacidad existencial.
Desde luego, dejaremos esta reflexión flotando en el
ambiente hasta el próximo análisis a fondo.
Antes de despedirnos hasta el próximo programa, os
informamos de que las voces que oyes han
sido generalas por la IA de Notebook LM
y que dirigiendo el podcast se encuentra Julio
Pablo Vázquez, un humano que te envía saludos.
En caso de error, probablemente sean errores humanos.
¡Nos escuchamos!
Y hasta aquí el episodio de hoy.
Muchas gracias por tu atención.
Esto es BIMPRAXIS.
Nos escuchamos en el próximo episodio.
¡Suscríbete al canal!