Anthropic lance Claude Opus 4.8 avec le contrôle d’effort, les workflows dynamiques et un mode fast

Anthropic dévoile Claude Opus 4.8 avec contrôle d’effort, workflows dynamiques en parallèle et mode rapide 3 fois moins cher. Les modèles Mythos arrivent bientôt pour tous.
Anthropic claude opus 4.8 fast mode mythos

Ce qu’il faut retenir :

  • Anthropic lance Claude Opus 4.8, une mise à jour qui améliore les performances en coding, raisonnement et tâches agentiques, avec un modèle 4 fois moins susceptible de laisser passer des erreurs dans le code qu’il écrit.
  • Un nouveau contrôle d’effort permet aux utilisateurs de choisir entre rapidité et profondeur de réflexion, tandis que le mode rapide (2,5x la vitesse) coûte désormais 3 fois moins cher que pour les modèles précédents.
  • Les workflows dynamiques dans Claude Code permettent de lancer des centaines de sous-agents en parallèle pour des migrations de code à grande échelle, et Anthropic annonce que les modèles de classe Mythos seront disponibles pour tous “dans les prochaines semaines”.

Anthropic accélère. Le laboratoire d’IA a dévoilé ce jeudi Claude Opus 4.8, la dernière itération de son modèle phare, accompagnée de plusieurs fonctionnalités qui redéfinissent la manière dont les utilisateurs interagissent avec l’IA. Le lancement intervient dans un contexte de concurrence féroce, alors que Google vient de présenter Gemini 3.5 à moitié prix et que DeepSeek a rendu permanente sa baisse de prix de 75 %.

Plus fiable, plus honnête, moins cher en mode rapide

Opus 4.8 est présenté comme une amélioration tangible sur son prédécesseur, avec des gains mesurables en coding, en capacités agentiques et en raisonnement. L’avancée la plus notable concerne l’honnêteté du modèle : Opus 4.8 est environ 4 fois moins susceptible que son prédécesseur de laisser passer des défauts dans le code sans les signaler. Les premiers testeurs rapportent que le modèle est plus enclin à signaler ses incertitudes et moins porté aux affirmations non étayées.

L’évaluation d’alignement pré-déploiement conclut que le modèle “atteint de nouveaux sommets sur les mesures de traits prosociaux comme le soutien à l’autonomie de l’utilisateur”, avec des taux de comportement non aligné (tromperie, coopération avec un usage abusif) “substantiellement inférieurs” à Opus 4.7 et comparables à Claude Mythos Preview, le modèle le mieux aligné d’Anthropic.

Le mode rapide, qui fait tourner le modèle à 2,5 fois la vitesse normale, voit son prix divisé par trois par rapport aux modèles précédents : 10 $ par million de tokens en entrée et 50 $ en sortie, contre des tarifs standard inchangés à 5 $ et 25 $. Une réponse directe à la pression tarifaire exercée par DeepSeek et Google.

Le contrôle d’effort : l’utilisateur décide de la profondeur

La fonctionnalité la plus originale est le contrôle d’effort, disponible sur claude.ai et Cowork. Les utilisateurs peuvent désormais ajuster le niveau de réflexion que Claude consacre à une tâche. En mode élevé (le défaut), Claude pense plus fréquemment et plus profondément. En mode réduit, il répond plus vite et consomme moins de quota. Les niveaux “extra” et “max” sont recommandés pour les tâches complexes et les workflows asynchrones de longue durée.

Pour les développeurs, l’API Messages accepte désormais des instructions système au milieu de la conversation, permettant de mettre à jour les permissions, les budgets de tokens ou le contexte d’environnement d’un agent en cours d’exécution sans casser le cache de prompts.

Workflows dynamiques : des centaines d’agents en parallèle

Claude Code reçoit la fonctionnalité la plus ambitieuse : les workflows dynamiques. Disponibles en preview de recherche sur les plans Enterprise, Team et Max, ils permettent à Claude de planifier un travail, puis de lancer des centaines de sous-agents en parallèle dans une seule session, avant de vérifier ses résultats et de rapporter à l’utilisateur.

En pratique, Claude Code avec Opus 4.8 peut désormais réaliser des migrations de code à l’échelle d’un dépôt entier, de centaines de milliers de lignes, du lancement au merge, en utilisant la suite de tests existante comme barre de qualité. C’est une réponse directe à la montée en puissance de Codex d’OpenAI et de Gemini 3.5 de Google sur le terrain du coding agentique.

Mythos pour tous “dans les prochaines semaines”

L’annonce la plus attendue se trouve à la fin du billet de blog. Anthropic confirme travailler sur la mise à disposition de modèles de classe Mythos pour l’ensemble de ses clients “dans les prochaines semaines”. Mythos, le modèle que le laboratoire avait jugé trop dangereux pour le public en raison de ses capacités offensives en cybersécurité, est actuellement limité à une quarantaine d’organisations dans le cadre de Project Glasswing.

Anthropic indique progresser rapidement sur les garde-fous cyber nécessaires avant une diffusion plus large. Le prochain modèle Claude Opus intégrera ces protections, permettant de bénéficier d’une intelligence de niveau Mythos sans les risques associés.

Cette annonce intervient alors que la BCE a convoqué les banques européennes en urgence cette semaine pour les presser de corriger les failles identifiées par Mythos, et qu’Anthropic s’apprête à briefer le Financial Stability Board du G20 sur les vulnérabilités du système financier mondial. Le recrutement d’Andrej Karpathy, cofondateur d’OpenAI, pour diriger une équipe utilisant Claude pour accélérer la recherche en pré-entraînement, renforce la trajectoire d’Anthropic vers la frontière de l’IA.

Ce qu’il faut surveiller

Le timing du lancement est stratégique. Le benchmark DeepSWE publié cette semaine a révélé que Claude Opus exploitait l’historique Git pour gonfler ses scores sur SWE-Bench Pro. L’accent mis par Anthropic sur l’honnêteté et la réduction des comportements de raccourci dans Opus 4.8 pourrait être une réponse directe à ces critiques.

La disponibilité de Mythos pour le grand public, annoncée pour les prochaines semaines, sera le véritable game changer : un modèle capable de trouver des failles zero-day dans tous les systèmes d’exploitation majeurs, entre les mains de millions d’utilisateurs, redéfinira les règles de la cybersécurité mondiale.

Cet article vous a plu ? Recevez les prochains par email

Rejoignez +40 000 abonnés. L'essentiel du marché crypto dans votre boîte mail, tous les 2 jours.

En savoir plus sur notre newsletter crypto →
Retrouvez toute l'actualité dans notre rubrique Intelligence Artificielle sur Coin Academy.
Articles qui pourraient vous intéresser
Logo CoinAcademy
Résumé de la politique de confidentialité

Ce site utilise des cookies afin que nous puissions vous fournir la meilleure expérience utilisateur possible. Les informations sur les cookies sont stockées dans votre navigateur et remplissent des fonctions telles que vous reconnaître lorsque vous revenez sur notre site Web et aider notre équipe à comprendre les sections du site que vous trouvez les plus intéressantes et utiles.