Ad image

Nvidia sort de nouveaux modèles Nemotron 3 pour stimuler le développement et l’adoption d’agents IA open source

Service Com'
Lu il y a 4 minutes


Bien que les hyperscalers s’arrogent la majeure partie de ses nouveaux GPU à chaque annonce, Nvidia tente de faire florir un écosystème de l’IA générative riche et ouvert. Ses nouveaux modèles Nemotron 3 s’inscrivent dans cette stratégie.

Nvidia ne veut pas se contenter de servir quelques clients gargantuesques comme Amazon, Microsoft ou OpenAI. Il veut voir fleurir des centres de calcul partout dans le monde, et c’est pourquoi il soutient vigoureusement l’écosystème open source… et les iniatives souveraines. Car dans tous les cas, ces solutions tourneront sur ses technologies.

Le lancement de la famille de modèles Nemotron 3 ce 15 décembre s’inscrit dans ce contexte. Il s’agit de modèles ouverts – comme toujours avec Nvidia – répartis en trois tailles comme c’est désormais de coutume. Ils ont été conçus pour servir à la création de systèmes multi-agents, et utilisent une architecture par mixture of experts (MoE) hybride, ce qui leur permet d’être plus légers que des modèles denses à performances égales.

  • Némotron 3 Nano dispose de 30 milliards de paramètres dont 3 milliards sont actifs. Il est recommandé pour des tâches simples comme résumer des contenus ou aller chercher des informations dans une base de connaissance.
  • Némotron 3 Super est un modèle de raisonnement pour les applications multi-agents qui demandent une faible latence. Il est doté de 100 milliards de paramètres dont 10 milliards sont actifs.
  • Némotron 3 Ultra cumule 500 milliards de paramètres dont 50 milliards sont actifs, et est réservé aux applications les plus complexes.

Seule la version Nano est disponible à date

Nvidia met en avant les performances de Nemotron 3 Nano, avec des benchmarks fournis par Artificial Analysis. Il est à la fois “moins gourmand en matière d’inférence et plus précis dans ses réponse que des modèles de taille équivalente”, d’après l’entreprise. On note néanmoins l’absence de certains modèles récents, comme Ministral 3.

Repères Nemotron 3
Repères Nemotron 3

Si l’accent est mis sur Nano, c’est qu’il est le seul disponible sur Visage câlin à ce jour. Les variantes Super et Ultra ne seront publiées qu’au cours du premier semestre 2026. Autant dire une éternité pour le secteur de l’IA générative, ou chaque semaine voit de nouveaux modèles sortir.

Nvidia précise que Nemotron 3 Nano peut produire quatre fois plus de tokens que son précédent modèle (Nemotron 2 Nano) à inférence égale, et qu’il nécessite 60% de tokens en moins pour les tâches de raisonnement. Il dispose par ailleurs d’une fenêtre contextuelle d’un million de tokens.

Nvidia publie aussi les données d’entraînement

Fait rare, Nvidia ne se contente pas de publier les poids de ses modèles mais aussi leurs données d’entraînement (représentant 3000 milliards de tokens), plus des bibliothèques d’apprentissage par renforcement (NeMo Gym et NeMo RL) pour aider les développeurs à créer leurs propres agents IA spécialisés. Enfin, NeMo Evaluator est un outil permettant de valider la sécurité et performance des modèles ainsi créés. Tout est disponible sur GitHub et Hugging Face.

Comme nous l’avons rappelé en introduction, la stratégie de Nvidia découle du fait qu’une pluralité de “petits” clients est préférable à une poignée de mastodontes, qui cherchent par ailleurs à s’affranchir de se fournisseur coûteux. Il cite parmi les “early adopters” de ses modèles Accenture, Cadence, CrowdStrike, Cursor, Deloitte, EY, Oracle Cloud Infrastructure, Palantir, Perplexity, ServiceNow, Siemens et Zoom.



Source link

Share This Article
Laisser un commentaire