
“L’IA ne peut se développer de manière responsable sans évaluations tierces transparentes et continues”. C’est avec cette conviction forte que LMArena compte proposer des outils d’évaluation toujours plus fiables à ses utilisateurs. Retour sur une montée en puissance de ce qui n’était, il y a deux ans encore, qu’un projet développé par des chercheurs de l’Université de Californie à Berkeley.
C’est une étape majeure dans le parcours de LMArena. L’entreprise, réputée pour sa plateforme d’évaluation de modèles d’intelligence artificielle rapidement devenue une référence, boucle aujourd’hui un nouveau tour de table avec 150 millions de dollars récoltés.
Derrière ce financement, se trouvent Felicis et UC Investments (Université de Californie), rejoints par Andreessen Horowitz, The House Fund, LDVP, Kleiner Perkins, Lightspeed Venture Partners et Laude Ventures.
Il s’agit du second financement bouclé en moins de douze mois puisqu’en mai dernier, LMArena avait procédé à un tour de seed de 100 millions de dollars. Avec ce nouveau financement, la start-up voit sa valorisation post-levée de fonds grimper à 1,7 milliard de dollars, soit près du triple de sa valorisation initiale en mai 2025.
Une croissance propulsée par la guerre des modèles d’IA
L’équipe de LMArena affirme avoir “connu une croissance bien plus rapide que ce que nous avions imaginé”. Historiquement centrée sur l’idée d’apporter aux utilisateurs des outils pour comparer directement différents modèles de langage à grande échelle, la plateforme a rapidement gagné en popularité avec aujourd’hui plus d’un million de visiteurs mensuels (une multiplication par 25 explique LMArena).
En cause : la montée en puissance de la guerre que se mènent les principaux acteurs du marché, à savoir Anthropic, Cohere, DeepSeek, Google, Meta, Microsoft et OpenAI. Ces derniers font d’ailleurs partie du Top de son classement des meilleurs modèles Frontier : Gemini-3-pro, gpt-5.2-search, Veo-3.1 ou Claude-opus-4.5 font notamment partie des modèles qui se sont distingués cette année, en fonction de leur performance en conditions réelles d’utilisation.
Les retours de dizaines de millions d’utilisateurs exploités
Offrant désormais des classements basés sur les préférences des utilisateurs, LMArena influence ainsi directement les perceptions de la qualité des modèles dans l’industrie de l’IA. En quelques mois seulement, la communauté d’utilisateurs présents sur le site a ainsi contribué de plusieurs manières.
50 millions de votes couvrant le texte, la vision, le développement web, la recherche, la vidéo et l’image ont été recensés, pour plus de 400 nouvelles évaluations de modèles, incluant des modèles open source et propriétaires.
Anastasios Angelopoulos, cofondateur et CEO de LMArena est clairvoyant à ce sujet : “Pour mesurer l’utilité réelle de l’IA, il faut la mettre entre les mains de vrais utilisateurs. C’est précisément ce que fait LMArena, en exploitant les retours de dizaines de millions de consommateurs et de professionnels pour définir les normes de référence du secteur de l’IA”.
Une réputation en jeu
Pourtant, tout n’a pas toujours été rose pour LMArena. La plateforme, proche des géants technologiques, a, en mai dernier, été pointée du doigt pour son manque d’indépendance. L’étude “Leaderboard Illusion” signée par des chercheurs de Cohere Labs met en lumière certains biais systémiques. Une publication qui a, à l’époque, fortement déplu aux dirigeants de la plateforme qui ont décidé de revenir sur ce qu’ils considéraient alors comme des “affirmations erronées”.
Hasard du calendrier – ou non – cette étude est parue à peine un mois après l’annonce par la plateforme d’évaluation de modèles d’IA de devenir une entreprise indépendante nommée LMArenaopérant sous la raison sociale Arena Intelligence.
Pourquoi lever des fonds maintenant
Quelques mois plus tard donc, l’affaire s’est tassée, et LMArena revient sur le besoin critique d’évaluations rigoureuses et reproductibles, à l’heure où les laboratoires d’IA des grandes entreprises technologiques se tiennent tête. Quels modèles sont les plus performants ? Quels sont ceux adaptés à tel ou tel usage ? Autant de questions auxquelles LMArena tâche de répondre.
Son premier produit d’évaluation, lancé en septembre, a été bien accueilli avec des retours pour plusieurs points : des indicateurs de performance en conditions réelles, des données diversifiées, récentes et de niveau expert, une approche scientifique rigoureuse pour comprendre le jugement humain, des environnements de test alignés sur les usages réels de l’IA.
“Cette dynamique s’est traduite par une forte croissance du chiffre d’affaires”, assure LMArena. Son chiffre d’affaires annuel a en effet dépassé les 30 millions de dollars en décembre, moins de quatre mois après la commercialisation de son premier produit. Et c’est justement dans ce contexte que l’entreprise a choisi de lever des fonds “afin d’accélérer encore, développer de nouvelles fonctionnalités et améliorer l’expérience produit pour l’ensemble de nos utilisateurs”.


