Le premier jour de la conférence annuelle d’AWS dédiée aux développeurs n’aura pas fait défaut aux années précédentes : un nombre incalculable d’annonces avec un focus sur l’IA et l’agentique. Retour sur les derniers modèles du géant du cloud et le renforcement de son service Bedrock.
Amazon Web Services vit un “momentum” avec Bedrock. Son service qui permet aux entreprises d’accéder, de personnaliser et de déployer des modèles d’IA générative via une API sécurisée, sans avoir à gérer l’infrastructure ni entraîner les modèles elles-mêmes, se renforce. Ils sont plus de 50 clients à avoir dépassé les 1000 milliards de tokens traités dans Bedrock à date.
À l’occasion de sa conférence annuelle re:Invent, qui se déroule du 1er au 5 décembre à Las Vegas, le géant du cloud annonce une expansion complète de son portefeuille Nova avec quatre nouveaux modèles, un service novateur d’“open training” pour aider les entreprises à créer leurs propres variantes personnalisées ainsi qu’un service dédié à la création d’agents IA hautement fiables.
Quatre modèles pour adresser tous les besoins
Vantant le nombre sans cesse croissant d’entreprises qui utilisent les modèles Nova, “des dizaines de milliers”, selon les mots du patron d’AWS, Matt Garman, la firme lance donc la deuxième salve de modèles, un an après la sortie de la première génération de ses modèles Foundation Nova. Cette famille est la promesse d’un équilibre entre “vitesse, coût et intelligence dans plusieurs domaines de l’IA”.

Le premier de cette série, baptisé Nova 2 Lite, est un modèle de raisonnement rapide et économique pour les charges de travail quotidiennes, capable de traiter à la fois du texte, des images et des vidéos pour générer du texte. Les clients peuvent ajuster la dose de “réflexion” étape par étape que le modèle effectue avant de répondre, afin de trouver le bon équilibre entre connaissance, rapidité et coût. Idéal pour les chatbots de service client, le traitement de documents et l’automatisation des processus métier, Nova 2 Lite offre des performances égales ou supérieures par rapport à Claude Haiku 4.5, GPT-5 Mini, et Gemini Flash 2.5.
Deuxième de la famille : Nova 2 Pro. Ce dernier est plutôt construit pour “les charges de travail très complexes”, capable de traiter l’audio en plus des autres modalités citées pour Nova 2 Lite. Il s’avère utile dans les tâches d’agentic coding, la planification à long terme et la résolution de problèmes sophistiqués. Nova 2 Pro se mesure à Claude Sonnet 4.5, GPT-5.1, Gemini 2.5 Pro, et même Gemini 3 Pro Preview (récemment publié) sur un certain nombre de benchmarks.
À noter que les deux modèles Nova 2 Lite et Nova 2 Pro intègrent des capacités natives de recherche web et d’exécution de code, ce qui leur permet de s’appuyer sur des informations actualisées plutôt que sur les seules données d’entraînement.
En retard sur l’IA conversationnelle, AWS cherche à se rattraper
AWS avance sur l’IA conversationnelle avec son tout dernier modèle Nova 2 Sonic. Ce modèle speech-to-speech propose un support multilingue avec des voix expressives, une précision accrue et une fenêtre de contexte d’un million de tokens, tout en assurant un basculement fluide entre voix et texte.
Le modèle gère les tâches de manière asynchrone, afin que les utilisateurs puissent poursuivre des conversations naturelles — même en changeant de sujet — pendant que des actions comme la réservation de vols s’exécutent en arrière-plan.
Nova 2 Sonic s’intègre parfaitement à Amazon Connect, aux fournisseurs de téléphonie (Vonage, Twilio, AudioCodes) et aux frameworks d’IA conversationnelle (LiveKit, Pipecat), ce qui en fait un modèle idéal pour les services clients, assistants IA et expériences vocales interactives. AWS promet des performances prix et qualité inégalées par rapport aux modèles gpt-realtime d’OpenAI et de Gemini 2.5 Flash disponibles via leurs API temps réel.
Un modèle capable de générer texte et images
Enfin et surtout, Nova 2 Omni : ce modèle de raisonnement et de génération multimodale est capable de traiter des entrées texte, image, vidéo et audio, tout en générant du texte et des images. Il gère jusqu’à 750 000 mots, des heures d’audio, des vidéos longues et des documents de centaines de pages, promet AWS.
Par exemple, les équipes marketing peuvent analyser des détails produits dans tous les formats pour générer instantanément des campagnes incluant titres, textes, posts pour les réseaux sociaux et visuels en un seul workflow.
Quid des usages ? Ce sont les clients qui en parlent le mieux
Ils sont des milliers à utiliser les modèles Nova. Mais qui sont-ils vraiment ? Cisco, Siemens, Sumo Logic et Trellix utilisent d’ores et déjà les modèles Nova 2 pour des applications allant de la détection de menaces agentiques à la compréhension vidéo et aux assistants vocaux IA, glisse Matt Garman lors de la keynote dédiée.
Ces quatre modèles remplacent donc Nova Micro (texte uniquement, ultra-rapide, très économique), Nova Lite (multimodal : texte, images, vidéos), Nova Pro (multimodal avec un bon rapport performance/coût) et Nova Premier, version haut de gamme axée sur le raisonnement complexe, arrivé plus tard, au premier trimestre 2025.
Les modèles de Mistral AI débarquent sur Bedrock
Bedrock grossit à vue d’œil et cela ne semble pas prêt de s’arrêter. Alors que la start-up française a annoncé ce jour la sortie de sa nouvelle famille de modèles Mistral 3“les meilleurs modèles open source du marché” selon ses propres mots, AWS a, semble-t-il, réussi à avoir la priorité en tant que distributeur !

Les développeurs peuvent donc accéder dès à présent à Mistral Large 3 et Ministral 3 (3B, 8B, 14B) sur Bedrock. Pour le Français, c’est l’assurance de voir grimper en flèche l’adoption de ses modèles à peine arrivés sur le marché.
Un service de personnalisation de modèles signé AWS
Revenons-en aux annonces de l’hyperscaler. Qui a dit que la personnalisation faisait l’effet d’une montagne à franchir ? Avec Nova Forge, AWS promet de simplifier la création et personnalisation de modèles d’IA avec l’intégration des connaissances propriétaires dans ses modèles. Ces variantes optimisées de Nova sont appelées “Novellas”.
Les clients ont un accès aux checkpoints pré-entraînés, en cours d’entraînement et post-entraînement des modèles Nova, afin de mélanger leurs données avec les data sets sélectionnés par Amazon à chaque étape. Pour l’heure, les clients peuvent commencer à créer leurs Novellas avec Nova 2 Lite, l’intégration du service à Nova 2 Pro et Nova 2 Omni étant prévu prochainement pour tous.
Si l’offre Nova Forge ne révolutionne pas totalement le concept de personnalisation des LLM, elle se démarque dans le sens où elle s’adresse bien aux entreprises, contrairement aux offres concurrentes proposées par OpenAI, Google ou Microsoft. Des bêta testeurs comme Booking.com, Nomura Research Institute, Reddit et Sony s’emploient déjà à créer leurs propres modèles avec Nova Forge. Chris Slowe, CTO de Reddit, déclare ainsi : “Nous remplaçons plusieurs modèles différents par une solution unique, plus précise, qui rend la modération plus efficace”.
AWS assure en outre le même niveau de sécurité, de scalabilité et de confidentialité des données que tous les autres modèles Bedrock.
Créer des agents à partir des modèles Nova 2
Un ultime service AWS présenté en parallèle des derniers modèles ouvre la grande porte de l’agentique. Baptisé Nova Act, il doit aider les entreprises à créer et gérer des agents IA capables d’agir dans des navigateurs web.
Développé à partir d’un modèle Nova 2 Lite personnalisé, Nova Act “offre la voie la plus rapide et la plus simple pour créer et gérer des flottes d’agents”, promet AWS. Nova Act atteint 90% de fiabilité sur les workflows des premiers clients et surpasse les modèles concurrents sur les benchmarks pertinents, ajoute le géant du cloud. Avec ce service, la promesse est simple : “Prototyper un agent en quelques minutes grâce à un environnement no code utilisant des prompts en langage naturel, affiner cet agent Nova Act dans des IDE familiers comme VS Code, puis le déployer sur AWS”.


