Anthropic a sorti Claude Sonnet 5 le 30 juin 2026, un modèle intermédiaire qui flirte avec les performances d’Opus 4.8 tout en divisant la facture par deux. La promesse est claire : de l’IA agentique accessible, avec un curseur d’effort réglable pour doser puissance et coût.
Sonnet 5 remplace Sonnet 4.6, et ce n’est pas un simple bump
Sonnet 4.6 datait de février 2026. En quatre mois, Anthropic a réussi à en faire un modèle «le plus agentique jamais conçu» dans la gamme Sonnet. Concrètement, Sonnet 5 planifie ses tâches, manipule des outils comme un navigateur ou un terminal, et mène des missions complexes de façon autonome. Un niveau d’autonomie qui nécessitait jusqu’ici des modèles bien plus lourds et onéreux, type Opus.
Le modèle est activé par défaut sur les forfaits Gratuit et Pro de Claude. Pas de chichi : vous ouvrez Claude, vous l’avez. Pour les développeurs, l’API expose l’identifiant claude-sonnet-5 et le modèle est disponible dans Claude Code.
Le curseur d’effort : une première dans la gamme Sonnet
Cinq niveaux sont proposés : faible, moyen, élevé, très élevé (xhigh) et maximal. Plus l’effort grimpe, plus le modèle réfléchit longtemps, explore d’outils et affine sa réponse. Évidemment, la facture suit. Mais même à effort faible ou moyen, Sonnet 5 surclasse déjà largement Sonnet 4.6 pour un coût très inférieur.
Sur le benchmark de codage agentique SWE-bench Pro, Sonnet 5 atteint 63,2 %, contre 58,1 % pour Sonnet 4.6 et 69,2 % pour Opus 4.8. Sur les tâches de travail de connaissance (GDPval-AA v2), il devance même légèrement son grand frère Opus. C’est la première fois qu’un modèle Sonnet bat Opus sur un benchmark de ce type.
La moitié du prix d’Opus, un argument massif
Le tarif d’introduction, valable jusqu’au 31 août 2026, est fixé à 2 dollars par million de tokens en entrée et 10 dollars en sortie. Ensuite, la grille passe à 3 et 15 dollars. En face, Opus 4.8 facture 5 dollars en entrée et 25 dollars en sortie. Pour une entreprise qui fait tourner des pipelines d’inférence en continu, l’écart est considérable.
Un développeur de Zapier, cité par Anthropic, raconte avoir confié à Sonnet 5 une tâche en deux étapes menée intégralement à son terme sans intervention humaine. Le genre de témoignage qui fait le tour des Slacks tech en une matinée.
Sécurité et alignement : du mieux, mais pas encore Opus
Côté comportement, Sonnet 5 affiche moins d’hallucinations et une meilleure résistance aux tentatives d’injection de prompt que Sonnet 4.6. Le score de comportements indésirables passe de 2,89 à 2,53 (plus le score est bas, mieux le modèle se comporte). Il n’a produit aucun exploit de cybersécurité fonctionnel lors des tests internes.
En revanche, il reste en retrait par rapport à Opus 4.8 (score de 2,10) sur les évaluations d’alignement les plus poussées. Anthropic est clair : Sonnet 5 n’est pas un modèle de sécurité, c’est un modèle de productivité. Si votre use case exige le niveau d’alignement maximal, Opus reste la référence.
Concrètement, ça change quoi pour un développeur ?
Jusqu’ici, confier une tâche complexe à un modèle impliquait de choisir entre rapidité et profondeur. Les modèles légers comme Haiku expédiaient le travail sans le comprendre, les modèles lourds comme Opus comprenaient tout mais coûtaient une fortune. Sonnet 5 introduit un entre-deux inédit : un modèle qui réfléchit assez pour être autonome, mais dont le ticket d’entrée reste acceptable pour des usages quotidiens.
Dans Claude Code, le gain est immédiat. L’assistant peut naviguer dans un codebase, exécuter des commandes, itérer sur un correctif et valider le résultat, le tout en une seule session. Un développeur de Zapier cité par Anthropic raconte avoir confié au modèle une tâche en deux étapes menée intégralement à son terme sans intervention humaine.
Autre changement notable : les cinq niveaux d’effort ne sont pas un gadget marketing. Sur une tâche de refactoring simple, le mode faible suffit et coûte quelques centimes. Sur une migration de base de données ou un audit de sécurité, le mode maximal déploie une capacité de raisonnement proche d’Opus, facturée en conséquence. Cette granularité permet aux équipes d’optimiser leur budget au plus près du besoin réel, là où les modèles précédents imposaient un tarif unique quelle que soit la complexité de la tâche.
Un signal fort dans la guerre des prix de l’IA
Ce lancement intervient dans un contexte de flambée des coûts de l’IA. OpenAI verrouille l’accès à GPT-5.6 derrière une approbation gouvernementale américaine, Google muscle Gemini, et les prix de la RAM s’envolent. Anthropic choisit la voie inverse : baisser le ticket d’entrée tout en montant en gamme sur l’autonomie des modèles.
Le message est limpide : l’IA agentique n’est plus un luxe réservé aux grands comptes. Pour les équipes tech qui veulent automatiser des workflows sans exploser leur budget API, Sonnet 5 pourrait bien devenir le choix par défaut. Et avec un tarif promo qui court jusqu’à fin août, la fenêtre pour tester est ouverte.
