A
Anthropic 4. 2. 2026

Anthropic: Claude Opus 4.6

anthropic/claude-opus-4.6

Opus 4.6 je prémiový nástroj pro nejtěžší inženýrské úlohy, kde cena ustupuje požadavku na maximální kvalitu a délku výstupu. Není vhodný pro masové nasazení, ale pro specializované expertní systémy.

Killer Feature Kombinace 1M kontextu s masivním 128k výstupem umožňuje modelu napsat celou aplikaci nebo kapitolu knihy na jeden prompt.
Skryté riziko Extrémní provozní náklady mohou rychle vyčerpat rozpočet, pokud není model nasazen výhradně na úlohy s vysokou přidanou hodnotou.
$5 / 1M vstup
$25 / 1M výstup
1.0M kontext
128k max výstup
textimage text Komplexní programováníAgentické pracovní tokyDlouhodobá kontextová paměť

📊 VibeCode skóre

89.6 / 100
Coding (váha 60 %) 87.8
Reasoning (váha 30 %) 90.1
Kontext (váha 10 %) 99

Spolehlivost high. Coding složka pochází z BridgeBench Quality (agregát 7 sub-testů: UI, security, debugging, refactoring, hallucination, BS detection, reasoning). Reasoning složka z 5 benchmarků (GPQA Diamond, MMLU-Pro, HLE). Agents benchmarky (TAU-bench, MMAU) do skóre nezahrnujeme kvůli nízkému pokrytí napříč modely.

🧪 BridgeBench · nezávislý „vibe coding" benchmark

Quality
87.8
agregát 7 sub-testů
Vibe
82.1
celkový dojem
UI
81.1
generování UI
Security
81.6
detekce zranitelností
Debugging
87
ladění chyb
Refactoring
69.5
zlepšení kódu
Hallucination
73.3
odolnost vůči halucinacím
BS detection
95
odhalení nesmyslů
Reasoning
39.6
30 těžkých úloh (jiná škála)
Speed
92 tok/s
tokenová rychlost

Zdroj: bridgebench.ai/overall. BridgeBench sjednocuje 7 testů zaměřených na reálné programovací úlohy. Jeho Reasoning kategorie používá 30 velmi těžkých úloh a nelze ji přímo porovnávat s GPQA/MMLU.

🎯 Publikované benchmarky

Benchmark Kategorie Skóre Zdroj
Aider Polyglot coding 68.4% ↗ nezávislý
SWE-bench Verified coding 78.2% ↗ nezávislý
LiveCodeBench coding 76% ↗ nezávislý
HumanEval coding 90.4% ↗ nezávislý
MBPP coding 88.6% ↗ nezávislý
GPQA Diamond reasoning 91.3% ↗ nezávislý
MMLU-Pro reasoning 82% ↗ nezávislý
MMLU reasoning 91.3% ↗ nezávislý
AIME 2024 reasoning 99% ↗ nezávislý
Humanity’s Last Exam reasoning 53% ↗ nezávislý

Found extensive benchmark data for Claude Opus 4.6 across independent leaderboards (Vals AI, BenchLM, LLM Stats) and third-party evaluations. The model shows strong performance in reasoning (GPQA Diamond 91.3%), coding (SWE-bench Verified 78.2%), and agentic tasks (TAU-bench Retail 91.9%).

⚖️ Porovnání s konkurencí

Model Cenové srovnání Poznámka
Anthropic Claude Opus 4.6
← Právě prohlížíte
Gemini je 2.5x levnější na vstupu ($2.00) a 2x levnější na výstupu ($12.00). Gemini nabízí stejný kontext (1M) za zlomek ceny, ale Opus 4.6 cílí na vyšší přesnost v kódování a dodržování instrukcí.
OpenAI GPT-5.2 Codex
GPT-5.2 je výrazně levnější ($1.75/$14.00), ale má menší kontext (400k). GPT-5.2 je přímý konkurent v kódování. Opus vyhrává v úlohách vyžadujících extrémně dlouhý kontext, GPT vede v poměru cena/výkon pro běžný vývoj.
Anthropic Claude Sonnet 4.5
Sonnet je levnější ($3.00/$15.00) se stejným kontextem. Interní konkurence. Sonnet je efektivnější pro většinu úloh, Opus je vyhrazen pro kritické 'mission-critical' operace vyžadující nejhlubší úvahu.

🎯 Rozhodovací pomocník

Použij když...

  • Refactoring rozsáhlých legacy kódových bází
  • Generování kompletní technické dokumentace
  • Autonomní debugging napříč mnoha soubory

Nepoužívej když...

  • Jednoduché chatboty (příliš drahé)
  • Aplikace vyžadující nízkou latenci (real-time)
  • Zpracování obrovských objemů dat, kde stačí nižší inteligence
Ideální pro:
Seniorní softwaroví inženýřiArchitekti systémůVývojáři autonomních agentů

💪 Silné a slabé stránky

+ Silné stránky

Výstupní kapacita

Limit 128 000 výstupních tokenů je výrazně nad průměrem trhu, což je klíčové pro generování kompletního kódu bez nutnosti fragmentace.

Agentické schopnosti

Optimalizace pro udržení koherence v dlouhých vláknech a schopnost dekompozice složitých problémů převyšuje standardní modely.

Kontextové okno

Kapacita 1 000 000 tokenů umožňuje načtení celých repozitářů nebo rozsáhlé dokumentace pro přesnější refactoring.

Slabé stránky

Cena

S cenou $5.00/$25.00 za 1M tokenů jde o jeden z nejdražších modelů na trhu, výrazně dražší než konkurence od Google či OpenAI.

Latence

Jako model třídy 'Opus' bude pravděpodobně pomalejší než modely třídy Flash/Haiku nebo Sonnet, což může vadit u interaktivních aplikací.

📝 Detailní popis

Opus 4.6 je nejsilnější model společnosti Anthropic pro kódování a dlouhodobé profesionální úkoly. Je navržen pro agenty, kteří operují v rámci celých pracovních postupů, nikoli pouze jednotlivých promptů, což ho činí obzvláště efektivním pro rozsáhlé kódové základny, komplexní refaktoringy a vícestupňové ladění, které se rozvíjí v čase. Model vykazuje hlubší kontextové porozumění, silnější dekompozici problémů a vyšší spolehlivost u náročných inženýrských úkolů než předchozí generace.

Kromě kódování Opus 4.6 vyniká v trvalé znalostní práci. Produkuje téměř produkčně připravené dokumenty, plány a analýzy v jednom průchodu a udržuje koherenci v rámci velmi dlouhých výstupů a rozšířených relací. Díky tomu je silnou výchozí volbou pro úkoly, které vyžadují vytrvalost, úsudek a důslednost, jako je technický návrh, plánování migrace a komplexní realizace projektů.

Pro uživatele upgradující z dřívějších verzí Opus si přečtěte našeho oficiálního průvodce migrací zde

Unikátní charakteristiky

Opus 4.6 představuje vrcholnou třídu modelů zaměřenou na maximální spolehlivost u vícekrokových úloh a agentických systémů. Model kombinuje masivní kontextové okno (1M) s výjimečně vysokým limitem pro výstup (128k), což umožňuje generování celých softwarových modulů nebo rozsáhlých technických dokumentací v jednom průchodu.

Silné stránky

Výstupní kapacita

Limit 128 000 výstupních tokenů je výrazně nad průměrem trhu, což je klíčové pro generování kompletního kódu bez nutnosti fragmentace.

Agentické schopnosti

Optimalizace pro udržení koherence v dlouhých vláknech a schopnost dekompozice složitých problémů převyšuje standardní modely.

Kontextové okno

Kapacita 1 000 000 tokenů umožňuje načtení celých repozitářů nebo rozsáhlé dokumentace pro přesnější refactoring.

Slabé stránky

Cena

S cenou $5.00/$25.00 za 1M tokenů jde o jeden z nejdražších modelů na trhu, výrazně dražší než konkurence od Google či OpenAI.

Latence

Jako model třídy ‘Opus’ bude pravděpodobně pomalejší než modely třídy Flash/Haiku nebo Sonnet, což může vadit u interaktivních aplikací.

🔗 Další modely od Anthropic