Ce qu’il faut retenir :
- Xiaomi a lancé MiMo-V2-Pro, un modèle IA de plus de 1 000 milliards de paramètres conçu pour piloter des agents autonomes.
- Le modèle approche les performances de Claude Opus 4.6 sur les benchmarks agentiques, pour un coût six à sept fois inférieur.
- L’équipe MiMo, dirigée par l’ex-chercheuse de DeepSeek Luo Fuli, avait testé le modèle anonymement sous le nom de code “Hunter Alpha”.
Xiaomi ne fabrique plus seulement des smartphones et des voitures électriques. Le géant chinois a dévoilé le 18 mars MiMo-V2-Pro, un modèle de fondation propriétaire taillé pour les tâches agentiques, c’est-à-dire capables d’exécuter des actions complexes de bout en bout sans intervention humaine. Avec plus de 1 000 milliards de paramètres totaux et un prix d’accès API six à sept fois inférieur à ceux d’OpenAI ou d’Anthropic, Xiaomi frappe fort sur le marché de l’IA.
Hunter Alpha : l'embuscade qui a trompé toute l’industrie
Avant même son annonce officielle, MiMo-V2-Pro avait déjà fait parler de lui. Le 11 mars, un modèle anonyme baptisé “Hunter Alpha” est apparu sur OpenRouter, la plus grande plateforme d’agrégation d’API pour modèles d’IA. Sans aucune attribution, le modèle a rapidement grimpé en tête des classements d’utilisation et dépassé 1 000 milliards de tokens traités en quelques jours.
L’industrie entière a cru à un test secret de DeepSeek V4. La confusion était d’autant plus compréhensible que l’équipe MiMo est dirigée par Luo Fuli, ancienne chercheuse clé de DeepSeek et contributrice au développement de DeepSeek-V2. Recrutée par Xiaomi fin 2025, cette prodige de l’IA, née en 1995 et diplômée de l’université de Pékin, avait été débauchée par le PDG Lei Jun pour des dizaines de millions de yuans selon la presse chinoise.
“J’appelle ça une embuscade silencieuse, non pas parce que c’était planifié, mais parce que le passage du chat à l’agent s’est produit si vite que même nous avions du mal à y croire”, a écrit Luo Fuli sur X après la révélation.
Des benchmarks qui tutoient les meilleurs modèles mondiaux
MiMo-V2-Pro repose sur une architecture Mixture-of-Experts (MoE) avec plus de 1 000 milliards de paramètres totaux, dont 42 milliards actifs par requête. Le modèle hérite du mécanisme d’attention hybride de son prédécesseur MiMo-V2-Flash, avec un ratio porté de 5:1 à 7:1, et dispose d’une fenêtre de contexte de 1 million de tokens.
Sur le benchmark ClawEval, qui évalue les capacités agentiques dans des environnements réels, MiMo-V2-Pro obtient un score de 61,5 points. Ce résultat dépasse nettement GPT-5.2 (50,0) et se rapproche de Claude Opus 4.6 (66,3). En génération de code, le modèle surpasse Claude 4.6 Sonnet selon les tests internes de Xiaomi. Sur l’Artificial Analysis Intelligence Index, un indice composite couvrant raisonnement, mathématiques et programmation, MiMo-V2-Pro se classe 8e mondial et 2e parmi les modèles chinois, avec un score de 49.
Le modèle se distingue aussi par son efficacité : pour l’ensemble des tests de l’Intelligence Index, il n’a consommé que 77 millions de tokens en sortie, nettement moins que GLM-5 (109 millions) ou Kimi K2.5 (89 millions).
Une stratégie de prix pour conquérir les développeurs
Fidèle à la philosophie de Xiaomi, MiMo-V2-Pro mise sur l’accessibilité tarifaire. L’accès API est proposé à 1 dollar par million de tokens en entrée et 3 dollars par million de tokens en sortie. Cette grille est environ six à sept fois inférieure à celle des solutions comparables chez OpenAI ou Anthropic, un écart qui rappelle la stratégie ayant fait le succès de DeepSeek R1 début 2025.
Pour accélérer l’adoption, Xiaomi propose une semaine d’accès API gratuit à l’échelle mondiale. Le modèle est compatible avec cinq frameworks majeurs de développement d’agents IA : OpenClaw, OpenCode, KiloCode, Blackbox et Cline. OpenClaw, en particulier, gagne rapidement du terrain dans la communauté open source comme framework généraliste pour agents autonomes, et MiMo-V2-Pro en constitue le moteur de référence.
Le modèle est aussi intégré à l’écosystème logiciel de Xiaomi : MiMo Chat pour le grand public, MiMo Claw comme agent autonome, et les outils de productivité Kingsoft WPS Office pour le traitement de documents.
Ce qu’il faut surveiller
MiMo-V2-Pro ne gère pour l’instant que du texte : pas d’entrée image ni multimodale, un point faible notable face aux modèles “omni” de la concurrence. Xiaomi a cependant annoncé un modèle séparé, MiMo-V2-Omni, dédié à la perception multimodale.
La question clé sera de mesurer les performances réelles du modèle à grande échelle, au-delà des benchmarks. L’absence de poids ouverts (contrairement à MiMo-V2-Flash, publié sous licence MIT) pourrait aussi freiner l’adoption dans les entreprises exigeant des audits de sécurité approfondis. L’éventuelle publication d’une version open source, évoquée par Luo Fuli, sera un signal décisif pour l’écosystème.
Cet article vous a plu ? Recevez les prochains par email
Rejoignez +40 000 abonnés. L'essentiel du marché crypto dans votre boîte mail, tous les 2 jours.