E014_La arquitectura Transformer que arrancó la revolución de la IA

¿Te has preguntado cómo la IA pasó de tropezar con frases simples a escribir ensayos complejos y generar vídeo? 🤖 Antes de 2017, las máquinas leían “por una rendija”, palabra por palabra, olvidando a menudo el principio de la frase al llegar al final. Todo cambió con el paper legendario “Attention Is All You Need”. En este episodio, destripamos la arquitectura Transformer, el verdadero motor que impulsa a gigantes actuales como GPT-4, Claude y Sora. 🚀 Descubre cómo el mecanismo de Self-Attention 🧠 dotó a las máquinas de una “memoria fotográfica”, permitiéndoles procesar todo el contexto de golpe y paralelizar el aprendizaje masivo. Pero la tecnología no se detiene y los Transformers no son perfectos. 🛑 Analizamos su talón de Aquiles: un coste computacional que se dispara y un consumo energético voraz. ⚡ ¿Qué viene después? Miramos hacia el horizonte (2025-2026) para presentarte a los sucesores que buscan romper estas barreras: desde las arquitecturas Mamba 🐍 y modelos híbridos como Jamba, hasta la visión de JEPA propuesta por Yann LeCun. Si quieres entender la ingeniería detrás del hype y saber hacia dónde evoluciona la próxima generación de IA, dale al play ▶️ y acompáñanos en este viaje técnico y fascinante.

E014_La arquitectura Transformer que arrancó la revolución de la IA

Episode description

Persons