Muévase sobre GenAI. Google dice prepararse para GenWorld

Google DeepMind anuncio El lunes 6 de enero creó un nuevo equipo para trabajar en modelos generativos “masivos” que “simularían el mundo”. Estos modelos representan la siguiente etapa de avance en las capacidades de inteligencia artificial (IA) para la toma de decisiones, la planificación Y creatividad.

Los modelos mundiales son marcos computacionales que ayudan a los sistemas de inteligencia artificial a comprender y simular el mundo real o virtual. Son esenciales para parte enseñar a los sistemas de inteligencia artificial a navegar en un entorno y tener aplicaciones generalizadas en robótica, juegos y sistemas autónomos.

Por ejemplo, los vehículos autónomos utilizan estos modelos globales para simular el tráfico y las condiciones de las carreteras. También pueden entrenar robots de IA generales en diferentes entornos. Un problema común es la falta de entornos de formación ricos, diversos y seguros para según cabe suponer IA encarnada.

La oferta de trabajo de DeepMind publicada el lunes decía que escalar los modelos de IA también era importante para la evolución de la tecnología.

“Creemos que ampliar la formación previa en vídeo y datos multimodales está en el camino crítico hacia la inteligencia artificial general. Los modelos mundiales impulsarán muchas áreas, como el razonamiento visual y la simulación, la planificación de agentes incorporados y el entretenimiento interactivo en tiempo real”, afirma la publicación de trabajo. PYMNTS se comunicó con Google pero aún no ha recibido respuesta.

Tim Brooksquien dejó OpenAI en octubre para unirse a Google DeepMind, liderará el equipo. En OpenAI, Brooks codirigió el desarrollo de Sora, su modelo de generación de vídeo que se volvió viral tras su presentación debido a su sofisticación.

De acuerdo a trabajo anuncios para el equipoLos nuevos empleados “colaborarán y aprovecharán” el trabajo de los equipos Gemini, el gran modelo multimodal insignia de Google, Veo (modelo de generación de video) y Genie (modelo global).

El enfoque de Google DeepMind en modelos globales se produce como dijo la startup de inteligencia artificial World Labs cuando salió de la clandestinidad en septiembre pasado. La startup desarrolla grandes modelos globales. Dirigido por el pionero de la IA de Stanford fei fei liLa startup está financiada por el pionero de la IA y premio Nobel Geoffrey Hinton, el director ejecutivo de Salesforce, Marc Benioff, el cofundador de LinkedIn, Reid Hoffman, el ex presidente de Google, Eric Schmidt, así como Andreessen Horowitz, NEA, NVentures y otros.

Google DeepMind ya ha desarrollado varios modelos globales, incluidos Genie y Genie 2. Genie 2 puede transformar texto y imagen en mundos 3D que reaccionan en función de las acciones de un usuario en ese entorno. (Genie solo creó mundos 2D).

Genie 2 es un potente modelo de IA que aprende de un gran conjunto de datos de vídeo y utiliza un proceso que comprime fotogramas de vídeo en representaciones más simples y significativas a través de un codificador automático. Estos fotogramas comprimidos luego se analizan mediante un modelo transformador que predice el progreso del vídeo, paso a paso, utilizando un método similar a cómo funcionan los modelos de generación de texto como ChatGPT.

Genie 2, entrenado en un conjunto de datos de video a gran escala, puede mostrar interacciones de objetos, animaciones de personajes complejas y física (como efectos de gravedad y salpicaduras de agua). Y modelar el comportamiento de otros agentes. El mundo que crea puede durar hasta un minuto, la mayoría de las veces entre 10 y 20 segundos.

El mayor enfoque de Google DeepMind en los modelos globales perfeccionará aún más las capacidades de sus sistemas de inteligencia artificial mientras compite con OpenAI, Meta y Microsoft. Y Amazon al servicio de las empresas.

La última innovación se suma a su ya rica cartera de innovaciones, una de las cuales condujo recientemente a El Premio Nobel asiente para el director ejecutivo Demis Hassabis Y Juan M. Saltador: AlphaFold2. Es un modelo de IA que previsto la naturaleza de todas las proteínas conocidas, resolviendo así un desafío bioquímico de 50 años.

En un artículo publicado en octubre, los investigadores de Google DeepMind dicho Entrenaron un gran modelo de lenguaje llamado Máquina Habermas para que actuara como mediador de inteligencia artificial y ayudara a pequeños grupos británicos a encontrar puntos en común en temas controvertidos como el Brexit o la inmigración. Para ello, redactó una “declaración de grupo” que reflejaba sus puntos de vista compartidos.