El equipo de Google Deepmind ha anunciado su nuevo modelo de IA para generar mundos interactivos. A finales del año pasado Nos sorprendió lo que Genie podía hacer 2 Y la nueva versión es un salto importante, uno que para Google es un avance en la creación de la Inteligencia artificial general o AGIlo que puede igualar las habilidades del mejor humano.
Genio 3. Es el nuevo Modelo mundial o Modelo mundial de DeepMind. Permite crear mundos interactivos para los cuales podemos explorar, todo desde un Inmediato de texto. El modelo anterior era muy limitado y solo se pudo usar durante unos segundos, pero con Genie 3 Deepmind promete que se puede explorar durante «varios minutos». Además, la resolución ha mejorado a 720p a 24 fps. El modelo se basa en Genie 2 y veo 3.
Tiene memoria. Es la mejora más importante del nuevo modelo. El mundo se genera a través de IA a medida que lo exploramos, pero si nos damos la vuelta y miramos algo que ya habíamos visto, sigue siendo el mismo. También podemos cambiar algo, como pintar en una pared, y eso se mantiene cuando lo dejamos todo el tiempo. Esto no sucedió en versiones anteriores y sus creadores dicen que no lo programaron explícitamente para hacerlo. Como se explica en un artículo en TechCrunchGenie 3 puede recordar lo que ya ha generado para entrenar a sí mismo, de esta manera aprende cómo funciona el mundo y su físico.
Interactivo. También enfatiza que los eventos se pueden agregar con Indicaciones Además en su artículo, DeepMind pone varios ejemplos interactivos, como un prado en el que podemos elegir si aparecerán un tractor, un oso, un caballo o globos de aire caliente. Lo llaman «eventos mundiales rápidos» y también le permiten cambiar aspectos como el clima.
¿Por qué es importante?. Los modelos mundiales son útiles en diferentes escenarios, como la creación de escenarios para juegos de tiempo real, en educación o en la capacitación de agentes de IA. Google lo señala en su blog como un paso clave para llegar al AGI, esa inteligencia artificial superior que Tantas empresas están tratando de obtener lo antes posible. Estos mundos se pueden usar como un campo de entrenamiento para otras IA, que también incluyen robots, casos en los que simular escenarios reales es un desafío.
En la presentación, el equipo de DeepMind explicó cómo pusieron a un agente en una etapa que simuló un almacén y le pidió que se acercara a ciertos elementos, como un cubo de basura verde. En todas las pruebas que logró, según el equipo de DeepMind «el hecho de que (el agente) puede lograr esto se debe a que Genie 3 sigue siendo coherente».
La competencia. La competencia IA más grande, al menos a nivel de productos para el usuario final, la vemos en los chatbots y, en menor medida, en los generadores de video o audio. Los modelos mundiales son menos populares entre el público y no hay una gran competencia. Nvidia presentó cosmos al comienzo del año Y hay algunas empresas como Laboratorios mundiales Ofrecen propuestas similares. Nos gustaría terminar este texto con un enlace para que pueda probarlo, pero Genie 3 solo está disponible en beta para un grupo muy limitado de académicos.
Imagen | Profundo
En | Algunos investigadores crearon una empresa donde todos los empleados eran agentes de IA. No hicieron una cuarta parte del trabajo