La carrera por la inteligencia artificial suma un nuevo capítulo.
Tras el éxito de los grandes modelos de lenguaje (LLM), ahora las compañías tecnológicas más poderosas del mundo avanzan hacia los grandes modelos de mundo (LWM), sistemas capaces de recrear entornos físicos y predecir interacciones en la vida real.
Mientras los LLM como ChatGPT se entrenan con lenguaje, los LWM buscan algo más ambicioso: aprender del mundo físico. Google, Meta, Nvidia y Amazon ya trabajan en esta dirección, desarrollando plataformas que permitirían a los robots, vehículos autónomos o incluso videojuegos generar entornos dinámicos y realistas.
Según especialistas, estos modelos combinan datos de audio, video, imágenes y sensores espaciales como LiDAR, logrando una comprensión espacio-temporal mucho más cercana a la experiencia humana.
Robots que anticipan y aprenden
El potencial de los LWM es enorme. Un robot entrenado con esta tecnología podría calcular la presión adecuada para sostener un vaso sin romperlo, o anticipar movimientos en su entorno antes de ensayar cientos de veces. Para la industria, esto significa acelerar el desarrollo de algoritmos y reducir el ensayo-error.
En el campo automotriz, vehículos autónomos como los de Tesla o Waymo podrían prever peligros antes de que sus cámaras los detecten, por ejemplo, frenando al intuir que un niño podría aparecer detrás de una pelota.
Empresas y millones en juego
La apuesta no es menor. La investigadora Fei-Fei Li, considerada la “madrina de la IA”, logró financiamiento por 230 millones de dólares para World Labs, mientras que Skild AI recibió más de 400 millones con apoyo de Nvidia, Amazon y Samsung.
Nvidia, por su parte, lanzó su plataforma Cosmos, orientada al desarrollo de modelos de mundo para robots y vehículos autónomos. Meta y Google también presentaron sus propios avances en esta línea, reforzando la competencia global.
Desafíos y riesgos en el horizonte
Aunque prometedora, la tecnología enfrenta grandes obstáculos. La recopilación masiva de datos plantea dilemas de privacidad y sesgo, y al igual que los modelos de lenguaje, los LWM también pueden “alucinar” o generar resultados poco fiables.
Según El País el desafío está en equilibrar la innovación con la responsabilidad. Tal como advierten expertos, el desarrollo debe incluir transparencia en los algoritmos y mecanismos que midan la incertidumbre de cada predicción.
El futuro de la inteligencia artificial parece dirigirse a un nuevo nivel: recrear el mundo físico. Si logra superar sus riesgos, los LWM podrían convertirse en el cerebro de las máquinas, transformando desde la robótica hasta la conducción autónoma.