El experto Yann LeCun, galardonado con un Premio Turing y pionero del reconocimiento de imágenes, sostiene que los modelos de lenguaje actuales han alcanzado un límite insuperable porque carecen de una comprensión verdadera de la realidad física. A través de su nueva iniciativa, propone sustituir la arquitectura de los chats convencionales por sistemas denominados JEPA, los cuales aprenden mediante la observación de videos y representaciones abstractas. Estos modelos de mundo permiten que la inteligencia artificial comprenda conceptos básicos como la gravedad o la permanencia de objetos, habilidades que un niño adquiere de forma natural pero que el texto no puede transmitir. La propuesta enfatiza la investigación abierta y el desarrollo de capacidades de planificación interna en lugar de la simple predicción de palabras. En última instancia, el autor argumenta que la verdadera inteligencia general solo se logrará cuando las máquinas puedan simular y predecir consecuencias dentro del entorno físico real.