Ad image

Google publie Project Genie, une application web qui génère des mondes interactifs en 3D

Service Com'
Lu il y a 4 minutes


Google DeepMind ouvre enfin l’accès à Genie 3, son modèle d’IA capable de créer et d’explorer des mondes interactifs générés à la volée. Une nouvelle étape dans la course aux world models, ces systèmes d’IA générative à la croisée du jeu vidéo, de la simulation et de la création immersive.

Les world models sont la prochaine grande frontière que les laboratoires d’IA cherchent à conquérir. Google, qui a publié en août dernier Genie 3‚un générateur de mondes virtuels capable de simuler des environnements navigables en temps réel pendant plusieurs minutes, le tout en haute résolution, accélère aujourd’hui sur le sujet en rendant l’expérience accessible au public. Il prend la forme de “Project Genie”, une application web interactive qui reste à l’état de prototype.

Disponible dès à présent auprès des abonnés majeurs à Google AI Ultra aux États-Unis, ce prototype de recherche permet de créer, explorer et remixer leurs propres mondes interactifs. L’application utilise une combinaison de plusieurs modèles : Genie 3, Nano Banana Pro et Gemini.

Des mondes interactifs en 3D

L’expérience repose sur trois fonctionnalités : proposer un “croquis du monde”, un mode “exploration” et la possibilité de réinventer ces mondes, notamment à l’aide du modèle Nano Banana Pro. L’idée est de laisser l’utilisateur être le plus créatif possible : ce dernier peut utiliser des prompts et des images générées ou importées pour créer un l’environnement.

L'utilisateur peut modifier l'environnement au fur et à mesure que ce dernier est généré grâce à la combinaison de modèles Google.Google
L’utilisateur peut modifier l’environnement au fur et à mesure que ce dernier est généré grâce à la combinaison de modèles Google. L’utilisateur peut modifier l’environnement au fur et à mesure que ce dernier est généré grâce à la combinaison de modèles Google.

Il peut créer un personnage, un monde, et déplacer ensuite ce personnage à pied, à cheval, dans les airs… Le point de vue de l’utilisateur peut aussi changer selon les envies, par exemple à la première ou à la troisième personne, et l’environnement dans lequel avance le personnage est généré au fil de cette exploration en fonction des actions réalisées.

Des limites inhérentes au prototype

Bien évidemment, il ne s’agit là que d’un prototype, comme le souligne Google, avec les limites qu’il comporte. Ainsi, les mondes générés peuvent ne pas être totalement réalistes ou ne pas toujours respecter fidèlement les commandes, les images ou la physique du monde réel. Les personnages peuvent parfois être moins contrôlables ou présenter une latence plus élevée. Enfin, les générations sont limitées à 60 secondes.

Par ailleurs, les mondes générés trahissent parfois les données d’entraînement du modèle, avec notamment des mondes qui ressemblent fortement à Fortnite ou à d’autres jeux vidéo. Il est beaucoup plus facile de reproduire l’environnement de jeux existants, d’autant plus si on en trouve beaucoup de vidéos sur Internet, que de créer quelque chose de toutes pièces.



Source link

Share This Article
Laisser un commentaire