Ce qu’il faut retenir :
- DeepSeek a rendu permanente la réduction de 75 % sur son modèle phare V4 Pro, désormais facturé 0,435 $ par million de tokens en entrée et 0,87 $ en sortie.
- C’est 34 fois moins cher que GPT-5.5 en sortie et 29 fois moins que Claude Opus 4.7, remettant en cause le modèle économique à marges élevées des laboratoires occidentaux.
- Les deux modèles DeepSeek supportent nativement les formats API d’OpenAI et d’Anthropic, réduisant le coût de migration à un simple changement d’URL.
DeepSeek vient de transformer une promotion temporaire en déclaration de guerre tarifaire permanente. Le 23 mai, la start-up chinoise a annoncé que la réduction de 75 % sur son modèle V4 Pro, initialement prévue pour expirer le 31 mai, devenait définitive. Le prix de l’intelligence artificielle vient de subir un choc structurel.
L’écart de prix est vertigineux
Les chiffres parlent d’eux-mêmes. Le V4 Pro coûte désormais 0,435 $ par million de tokens en entrée et 0,87 $ en sortie. En comparaison, GPT-5.5 d’OpenAI facture 5 $ en entrée et 30 $ en sortie. Claude Opus 4.7 d’Anthropic se situe à 5 $ en entrée et 25 $ en sortie. Le V4 Flash, version allégée, descend à 0,14 $ et 0,28 $, soit jusqu’à 99 % moins cher que GPT-5.5.
L’avantage n’est pas qu’un artifice de prix. L’architecture de DeepSeek, fondée sur le Mixture-of-Experts (MoE), l’attention latente multi-tête (MLA) et des innovations propriétaires, réduit drastiquement les besoins en cache et en calcul. Le coût réel par tâche, pas seulement par token, est structurellement plus bas.
Les deux modèles offrent une fenêtre de contexte d’un million de tokens et jusqu’à 384 000 tokens en sortie, les rendant compétitifs sur les charges de travail agentiques qui consomment des budgets tokens massifs.
Migration quasi instantanée
Le détail qui fait mal aux concurrents : les modèles V4 supportent nativement les formats API d’OpenAI et d’Anthropic. Un développeur peut migrer en changeant simplement une URL de base et une clé API. La friction de migration est essentiellement nulle.
Pour une large part des applications réelles (support client, génération de contenu, extraction de données, la plupart des tâches de coding), un modèle “suffisamment bon” à un trentième du prix constitue une proposition de valeur difficile à ignorer.
Un problème existentiel pour les IPO d’OpenAI et Anthropic
La dimension stratégique dépasse la simple guerre des prix. OpenAI et Anthropic préparent tous deux des introductions en bourse, portées par le récit que l’IA est un business à marges élevées comparable au SaaS. DeepSeek argue, données à l’appui, que l’IA est en réalité une infrastructure commoditisée.
Pour les charges de travail agentiques, qui consomment des ordres de grandeur plus de tokens que les chatbots simples, la différence de coût devient existentielle. Une entreprise faisant tourner des agents IA à grande échelle sur GPT-5.5 pourrait réduire ses coûts de 97 % en basculant sur V4 Flash.
OpenAI, Google et Anthropic ont déjà réduit leurs prix tout au long de 2025 pour retenir leurs clients entreprise. La baisse permanente de DeepSeek accélère brutalement cette compression.
La question de la confiance
L’objection la plus fréquente reste la confiance : les entreprises occidentales confieront-elles leurs données à un modèle d’origine chinoise ? Le point est légitime, mais nuancé. DeepSeek est open-weights : les entreprises peuvent le télécharger et l’héberger elles-mêmes pour garantir la confidentialité. L’auto-hébergement réduit l’avantage de coût, mais des fournisseurs tiers en Europe, exploitant l’hydroélectricité scandinave par exemple, pourraient combler cet écart.
La vraie question pour les entreprises n’est pas de savoir si elles peuvent utiliser DeepSeek, mais si elles peuvent se permettre de ne pas l’évaluer quand un concurrent l’utilise à un coût d’inférence 30 fois inférieur.
Ce qu’il faut surveiller
La réponse tarifaire d’OpenAI et d’Anthropic dans les prochaines semaines sera le premier test. Si les laboratoires occidentaux s’alignent, leurs marges s’effondrent et le narratif d’IPO à haute marge vacille.
S’ils maintiennent leurs prix, ils risquent de perdre les développeurs et les entreprises les plus sensibles aux coûts. DeepSeek, de son côté, joue un jeu plus long : construire un écosystème hardware IA chinois complet (NAND, LPDDR, ASIC) en exploitant l’avantage de coût logiciel comme levier stratégique. L’ère de l’IA à prix premium touche peut-être à sa fin.
Cet article vous a plu ? Recevez les prochains par email
Rejoignez +40 000 abonnés. L'essentiel du marché crypto dans votre boîte mail, tous les 2 jours.