Claude Opus 4.7 : ce qui change pour ton stack

Q: Faut-il utiliser l'effort `xhigh` pour le coding agentique ?

Anthropic recommande `xhigh` comme point de départ pour les usages de coding et agentiques, et au minimum `high` pour les tâches exigeantes en intelligence. Les niveaux plus bas produisent moins d'appels d'outils et des sorties plus courtes. Montez l'effort si l'agent s'arrête trop tôt ou saute des étapes.

Q: Peut-on encore utiliser le thinking étendu avec un budget de tokens fixe ?

Non. Le thinking étendu avec `budget_tokens` est supprimé sur Opus 4.7 et renvoie une erreur 400. Adaptive thinking est le seul mode de thinking disponible. Pour contrôler les coûts sur une boucle agentique, utilisez le nouveau `task_budget` (header beta `task-budgets-2026-03-13` requis).

Transparence : Cet article inclut un lien de guest pass Claude Code depuis notre compte. Anthropic nous a donné 3 passes à partager. Chaque pass offre à un ami une semaine gratuite de Claude Code et Cowork. On ne touche pas de commission. On partage parce qu’on utilise Claude Code tous les jours.

Claude Opus 4.7 est sorti aujourd’hui. Voici ce qu’Anthropic a vraiment changé, quels breaking changes vont silencieusement dégrader la sortie de vos intégrations, et où 4.7 s’insère dans notre stack d’agents IA.

Cet article suppose que vous utilisez déjà Claude via l’API ou Claude Code. Sinon, sautez à la section “Faut-il migrer ?” en bas.

Ce qu’Anthropic a vraiment livré aujourd’hui

Claude Opus 4.7 succède à Opus 4.6. Même tarif (5 $ en entrée, 25 $ en sortie par million de tokens). Même fenêtre de contexte d’1M tokens, confirmée au tarif API standard, sans premium long-contexte. Nouveau tokenizer, nouvelle stack vision, nouvelle API de task budget, et trois breaking changes qui vont vous mordre si vous sautez les release notes.

Model ID : claude-opus-4-7. Disponible aujourd’hui sur Claude.ai, l’API Anthropic, AWS Bedrock, Google Cloud Vertex AI et Microsoft Foundry.

Les fonctionnalités phares d’après l’annonce officielle d’Anthropic :

Vision haute résolution. Images jusqu’à 2576 px (3,75 MP). C’est un bond de 3x depuis l’ancien plafond de 1568 px / 1,15 MP. Les coordonnées pixel correspondent 1:1 à celles du modèle : vos agents de computer-use n’ont plus à faire de calcul de scale.
Nouveau niveau d’effort xhigh. Un cran au-dessus de high, pour le coding et les boucles agentiques. Messages API uniquement.
Task budgets (bêta). Un budget de tokens indicatif sur l’ensemble d’une boucle agentique. Le modèle voit le décompte en cours et s’auto-régule.
Adaptive thinking uniquement. Le thinking étendu avec budget_tokens fixe n’existe plus. Adaptive thinking est désormais le seul mode de raisonnement, et il est désactivé par défaut.

Anthropic indique dans ses release notes qu’adaptive thinking bat de façon fiable l’ancien thinking étendu sur leurs évaluations internes. Ça colle avec leur philosophie plus large autour de l’adaptive thinking : laisser le modèle décider du raisonnement qu’une étape mérite, plutôt que d’allouer un budget fixe à l’avance.

Les benchmarks qui comptent

Les vrais bonds d’Opus 4.7 sont dans le coding agentique et la vision. CursorBench passe de 58 % à 70 %. L’acuité visuelle sur les tâches de computer-use saute de 54,5 % à 98,5 %. Rakuten-SWE-Bench montre 3x plus de tâches de production résolues. Sur le travail agentique long-horizon et la lecture d’écran, 4.7 n’est pas dans la même catégorie de poids que 4.6.

Benchmark	Opus 4.6	Opus 4.7	Ce qu’il mesure
CursorBench	58 %	70 %	Tâches réelles de coding dans un IDE
Acuité visuelle (computer-use)	54,5 %	98,5 %	Lecture de pixels dans des screenshots
Rakuten-SWE-Bench	1x	3x	Résolution de tâches en production
Recall CodeRabbit	baseline	+10 %	Couverture de code review
Harvey BigLaw Bench	n/a	90,9 %	Raisonnement juridique (effort élevé)

Les chiffres de CursorBench et de computer-use sont ceux qui nous ont fait changer d’avis. Nos agents passent la journée à lire des dashboards, parser des logs, lancer des linters via capture d’écran. Un bond de 44 points sur l’acuité visuelle, ce n’est pas une marge d’erreur.

Ce qui change peu : le chat pur, le Q&A mono-tour, tout ce qui demande juste au modèle de produire un paragraphe à partir d’un prompt clair. Si c’est tout votre workload, vous pouvez rester sur 4.6 encore un cycle sans rien remarquer.

Les breaking changes qui vont vous blesser en silence

Trois changements API vont casser vos intégrations si vous ne les gérez pas. Aucun ne produit une erreur évidente. Tous dégradent la qualité de sortie si vous les ratez.

Les budgets de thinking étendu sont morts

# Avant (Opus 4.6) : fonctionne
thinking = {"type": "enabled", "budget_tokens": 32000}

# Après (Opus 4.7) : erreur 400
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}

Si vous comptiez sur les budgets de thinking fixes pour prévoir vos coûts, il faut un autre levier. Ce levier, c’est task_budget, qui est indicatif (pas un hard cap) et nécessite le header bêta task-budgets-2026-03-13. max_tokens reste le plafond dur par requête.

Les paramètres de sampling renvoient des erreurs 400

temperature, top_p, top_k : tous rejetés sur Opus 4.7. Si vous mettiez temperature=0 pour du “déterminisme” (qui n’a jamais été du vrai déterminisme), retirez-le. Pilotez le comportement par le prompt.

Le contenu de thinking est omis par défaut

Les blocs de thinking sont toujours streamés, mais leur champ thinking est vide sauf si vous l’opt-in :

thinking = {
    "type": "adaptive",
    "display": "summarized",  # défaut : "omitted"
}

C’est le mode d’échec silencieux qui va casser tout produit qui stream le raisonnement à l’utilisateur. L’UI affiche maintenant une longue pause avant le début de la sortie, ce qui peut se lire comme une API tombée. Si votre UX stream le thinking aux utilisateurs finaux, faites l’opt-in avec display: 'summarized' avant de changer le model ID.

Le changement de tokenizer dont personne ne parle

Le nouveau tokenizer consomme 1,0 à 1,35x plus de tokens par prompt. Jusqu’à 35 % en plus sur des entrées identiques. Même portefeuille, plus d’octets.

Anthropic présente ça comme un gain net : l’efficacité des tokens sur les évaluations de coding s’est améliorée malgré une consommation plus élevée par message. On les croit pour le coding. Pour les workloads de chat où vous payez chaque token, que le modèle l’ait bien “utilisé” ou non, c’est une hausse de coût de 10 à 35 % au même prix unitaire.

Si vous avez des agents structurés avec beaucoup d’appels d’outils, augmentez vos max_tokens et vos triggers de compaction de 20 à 25 % avant de basculer le model ID. Anthropic le signale explicitement dans son guide de migration : les triggers calibrés pour les compteurs de 4.6 vont se déclencher plus tôt sur 4.7.

Comment on prévoit d’utiliser Claude Opus 4.7 chez Hayka Pacha

On gère une flotte d’agents IA sur plus de 400 sites. Le job : monitorer, maintenir, pousser les changements, répondre aux alertes. Voici notre plan de migration pour 4.7.

Agents de maintenance site : à migrer. L’effort xhigh sur Claude Code semble valoir la latence supplémentaire quand un agent doit lire une stacktrace, vérifier l’historique git et écrire un patch. On recalibrera nos taux de complétion de tâches une fois le rollout fait.

Pour notre pipeline d’automation de contenu : on reste sur 4.6 pour l’instant. C’est un workload de chat étroit. Pas de boucle agentique, pas de vision, pas de tâche long-horizon. 4.7 coûterait pareil au token mais brûlerait environ 10 à 35 % de tokens en plus par appel à cause du nouveau tokenizer. Pas rentable aujourd’hui.

Le workflow /ultrareview : à ajouter. Anthropic a livré une commande de code review dédiée dans Claude Code. On va la brancher sur notre hook pre-merge cette semaine. On en reparle quand on aura assez de cycles de review pour la comparer à notre agent de review actuel.

Envie d’essayer Opus 4.7 dans Claude Code sans payer une place ? On a un guest pass Claude Code à donner. Il offre à un ami une semaine gratuite de Claude Code et Cowork. Trois passes au total. Premier arrivé, premier servi.

Les changements de comportement que vous sentirez dans vos prompts

Ceux-là ne produisent pas d’erreurs. Ils changent simplement ce que vous recevez. Tous sont documentés dans le guide de migration d’Anthropic.

Suivi d’instruction plus littéral. Le modèle ne généralise plus silencieusement. Si vous écrivez “corrige le bug dans auth.ts” et attendez qu’il touche aussi auth.test.ts, dites-le.
La longueur de réponse s’adapte à la complexité. Plus de verbosité par défaut. Les tâches courtes reçoivent des réponses courtes.
Moins d’appels d’outils à bas effort. 4.7 raisonne plus avant d’appeler. Montez effort si vous voulez plus d’appels.
Moins de sous-agents par défaut. Si votre workflow comptait sur un fan-out agressif, prompez-le explicitement.
Ton plus direct, moins d’emoji. Moins de chaleur, moins de validation. Si votre UX reposait sur le ton plus amical d’Opus 4.6, vos utilisateurs vont le sentir.

Si vos prompts contiennent du scaffolding de self-check du type “relis la mise en page de la slide avant de répondre”, le guide de migration d’Anthropic recommande explicitement de le retirer sur 4.7 : le modèle gère désormais cette vérification en interne. Même logique pour les prompts qui comptaient sur la généralisation silencieuse entre fichiers similaires. 4.7 est plus littéral : soyez explicite sur chaque fichier que vous voulez toucher.

Migrer vite : le chemin officiel

Anthropic livre une skill Claude API officielle qui applique automatiquement les breaking changes à votre codebase. Depuis Claude Code, lancez :

/claude-api migrate this project to claude-opus-4-7

La skill gère le swap du model ID, retire temperature/top_p/top_k, convertit thinking: {type: "enabled", budget_tokens: N} en thinking: {type: "adaptive"}, nettoie les headers bêta désormais en GA (effort-2025-11-24, interleaved-thinking-2025-05-14), et recommande un point de départ pour l’effort.

D’après la documentation officielle de la skill, la migration produit une checklist d’items à valider à la main : prompts de contrôle de longueur, tests d’intégration, recalibrage des coûts et des rate limits. Ce sont exactement les items qu’on prévoirait de valider sur n’importe quelle migration de modèle.

Si vous n’utilisez pas Claude Code, la skill est open source sur GitHub et installable partout où les Agent Skills fonctionnent.

Faut-il migrer ?

Migrez aujourd’hui si vous faites :

Du coding ou du code review agentique (le delta CursorBench paie à lui seul le travail de migration)
Des workflows de computer-use ou lourds en screenshots (98,5 % contre 54,5 %, ce n’est pas subtil)
Des boucles d’agents long-horizon avec mémoire
Tout ce qui lit des graphes, des schémas ou des images techniques

Restez sur 4.6 pour l’instant si vous faites :

Du chat pur sans vision ni tool use
De l’inférence haut volume sensible au coût où 10 à 35 % de surcoût de tokens compte vraiment
Des produits à budget latence serré qui ne peuvent pas absorber la nouvelle latence du thinking par défaut

Dans tous les cas, lisez le guide de migration avant de changer le model ID. Les défauts silencieux (thinking omis, moins d’appels d’outils, moins de sous-agents) changeront le comportement de votre produit même si rien n’erreur.

Ce qu’on surveille ensuite

La vraie histoire avec 4.7, c’est le coding agentique et le computer-use. Pas le chat. C’est exactement là où l’IA devient économiquement intéressante, et c’est là que notre stack vit. Prochain article : ce qui se passe quand notre flotte d’agents (400+ sites sur Kubernetes, gérés en GitOps) bascule sur 4.7 partout. Le plan : mesurer la complétion de tâches, les interventions humaines, et le coût par tâche en tokens contre nos baselines Opus 4.6.

Si vous buildez sur Claude et voulez échanger, ou si vous voulez qu’on vous aide à migrer une stack d’agents en production, contactez-nous. Un ami veut essayer Claude Code ? Prenez un de nos guest passes. Trois disponibles, premier arrivé premier servi. Dans les deux cas, lisez les release notes complètes avant de le livrer à vos utilisateurs.

Sources

Anthropic, annonce Claude Opus 4.7
Docs API Anthropic, Nouveautés de Claude Opus 4.7
Docs API Anthropic, Migration vers Claude Opus 4.7
Docs API Anthropic, Claude API skill
À lire : comment on a construit cette landing page en 24h avec Astro et l’IA

FAQ

Claude Opus 4.7 est-il rétrocompatible avec les appels API d'Opus 4.6 ?

Non. Opus 4.7 introduit trois breaking changes : les budgets de thinking étendu renvoient des erreurs 400 (seul adaptive thinking fonctionne), les paramètres de sampling comme temperature et top_p sont rejetés, et le contenu de thinking est omis des réponses par défaut. Mettez à jour votre client avant de changer le model ID.

Combien coûte Opus 4.7 par rapport à Opus 4.6 ?

Le prix au token est identique (5 $ en entrée, 25 $ en sortie par million). Mais le nouveau tokenizer consomme 1,0 à 1,35x plus de tokens sur le même prompt. Attendez-vous à 10 à 35 % de coût réel en plus sur les workloads non retravaillés. Les évaluations de code ressortent mieux.

Faut-il utiliser l'effort `xhigh` pour le coding agentique ?

Anthropic recommande xhigh comme point de départ pour les usages de coding et agentiques, et au minimum high pour les tâches exigeantes en intelligence. Les niveaux plus bas produisent moins d'appels d'outils et des sorties plus courtes. Montez l'effort si l'agent s'arrête trop tôt ou saute des étapes.

Quelle est la fenêtre de contexte d'Opus 4.7 ?

1M de tokens au tarif API standard, sans premium long-contexte. La sortie maximale est de 128k tokens. L'adaptive thinking est disponible mais désactivé par défaut : il faut donc passer thinking: {type: 'adaptive'} explicitement pour activer le raisonnement.

Peut-on encore utiliser le thinking étendu avec un budget de tokens fixe ?

Non. Le thinking étendu avec budget_tokens est supprimé sur Opus 4.7 et renvoie une erreur 400. Adaptive thinking est le seul mode de thinking disponible. Pour contrôler les coûts sur une boucle agentique, utilisez le nouveau task_budget (header beta task-budgets-2026-03-13 requis).