Ad image

Google sort Nano Banana Pro, son nouveau modèle de génération d’images basé sur Gemini 3

Service Com'
Lu il y a 6 minutes


Gemini 3 Pro n’arrive pas seul. Il est accompagné d’un nouveau modèle de génération et retouche d’images : Nano Banana Pro. Meilleure gestion du texte dans les images, meilleure constance entre les images générées et leurs modèles, plus de contrôles sur le format des images et leur traitement (couleur, luminosité, mise au point)… C’est un grand pas en avant pour ce modèle qui était déjà considéré comme le meilleur du marché. Cerise sur le gâteau : la traçabilité des images est assurée depuis l’application Gemini.

Rien n’arrête plus Google. 48 heures après le lancement en fanfare de Gemini 3 Proc’est au tour du modèle de génération d’images Nano Banane d’avoir droit à sa nouvelle version, avec Nano Banana Pro (dont le nom formel est Gemini 3 Pro Image). Nano Banana Pro s’appuie sur les capacités de raisonnement de Gemini 3 Pro pour générer de meilleurs visuels qui correspondent mieux aux requêtes des utilisateurs.

Nano Banana Pro - Infographie

Il peut par exemple produire des infographies à partir d’une recette de cuisine, en utilisant à la fois du contenu fourni par l’utilisateur et des éléments disponibles sur le web. Il peut aussi intégrer des informations récentes comme la météo du jour ou les derniers résultats sportifs.

Une meilleure gestion du texte Et plus de fidélité avec les images sources

Un travail important a été effectué pour rendre la génération de texte dans une image encore plus précis et qualitatif. Il permet de contrôler avec précision la police de caractère utilisée et même de faire de la calligraphie ou de changer les textures appliquées au texte. Et il est évidemment capable de produire différentes versions de l’image dans plusieurs langues différentes grâce à ses capacités de traduction automatique.

Nano Banana Pro - Texte

Autre point d’amélioration : la constance des éléments générés d’une image à l’autre. Jusqu’à 14 images peuvent être importées pour être intégrées dans un nouveau visuel  (voir image d’en-tête), et le modèle peut conserver la ressemblance de 5 personnes à la fois sur une série d’images. Cela s’applique même à la génération de structures en 3D à partir de plans, par exemple pour simuler une pièce d’ingénierie ou un bâtiment.

Gemini 3 Pro Image / Nano Banane Pro

Google décline aussi les innovations présentée en mai avec Veo 3 et Flow en matière de contrôle sur les angles de vue et divers éléments spécifiques d’une image : mise au point, bokeh, gestion des couleurs, luminosité de la scène, etc. Le tout avec une plus grande variété de formats d’affichage et dans des résolutions allant jusqu’à 4K.

Disponible dans l’application Gemini, dans les produits Google et sur Vertex AI

Nano Banana Pro est disponible dès à présent dans le monde entier depuis l’application Gemini en sélectionnant le mode “Thinking”. Les utilisateurs gratuits ont un quota strict qui limite leur utilisation avant de repasser à Nano Banana standard, tandis que les abonnés Google AI Pro et Ultra ont des quotas beaucoup plus généreux. Nano Banana Pro est également disponible dans le moteur de recherche pour les abonnés (via AI Mode), mais uniquement aux Etats-Unis. Même chose pour NotebookLM.

Pour les professionnels, ce nouveau modèle est disponible par défaut dans Google Ads et est intégré dans les applications Slides et Vids de Google Workspace. Il arrivera prochainement dans Gemini Enterprise, mais est d’ores et déjà accessible depuis l’API Gemini ainsi que dans Vertex AI sur Google Cloud. Les développeurs pourront par ailleurs faire appel à lui dans Google AI Studio et Antigravity. Et bien sûr il est présent dans Flow pour les abonnés Google AI Ultra.

Il est aussi disponible dès maintenant dans Adobe Firefly (module texte vers image et Firefly Boards) et Photoshop (pour le remplissage génératif). Adobe souligne que de nombreuses images ont été générées avec Nano Banana dans ses applications depuis son intégration il y a deux mois.

Une traçabilité intégrée par défaut à toutes les images et vérifiable depuis l’application Gemini

Clou du spectacle, SynthID est désormais pleinement opérationnel et accessible au grand public. Ce dispositif de traçabilité des images générées par intelligence artificielle est accessible depuis l’application Gemini. Toutes les images provenant des modèles de Google sont marquées numériquement (de façon invisible à l’œil nu), ce qui permet à tout un chacun d’en vérifier la provenance. Une ressource essentielle pour limiter les risques de désinformation.

ID de synthèse Google

SynthID n’est pour le moment disponible que pour les images statiques, mais Google indique qu’il sera prochainement étendu aux vidéos et aux fichiers audio. Google a également choisi de maintenir un marquage visible dans les images générées par les utilisateurs de ses produits, sauf pour les abonnés à Google AI Ultra.



Source link

Share This Article
Laisser un commentaire