O
Openai 17. 3. 2026

OpenAI: GPT-5.4 Nano

openai/gpt-5.4-nano

GPT-5.4 Nano je vynikající volbou pro 'hrubou práci' v AI potrubích, kde vítězí cena a rychlost nad genialitou. Je ideální jako levný klasifikátor předávající složité úkoly větším modelům.

Killer Feature Kombinace extrémně nízké latence s plnou multimodální podporou (obrázky/soubory) za cenu $0.20/1M.
Skryté riziko Cena výstupu ($1.25) je výrazně vyšší než u konkurence (Grok/Mistral), což může prodražit aplikace generující dlouhé texty.
$0.2 / 1M vstup
$1.25 / 1M výstup
400k kontext
128k max výstup
fileimagetext text Nízká latenceEfektivita nákladůKlasifikace a extrakce dat

📊 VibeCode skóre

58.7 / 100
Coding (váha 60 %) 58.9
Reasoning (váha 30 %) 49.1
Kontext (váha 10 %) 85.9

Spolehlivost high. Coding složka pochází z BridgeBench Quality (agregát 7 sub-testů: UI, security, debugging, refactoring, hallucination, BS detection, reasoning). Reasoning složka z 4 benchmarků (GPQA Diamond, MMLU-Pro, HLE). Agents benchmarky (TAU-bench, MMAU) do skóre nezahrnujeme kvůli nízkému pokrytí napříč modely.

🧪 BridgeBench · nezávislý „vibe coding" benchmark

Quality
58.9
agregát 7 sub-testů
Vibe
62.3
celkový dojem
UI
65.3
generování UI
Security
80
detekce zranitelností
Debugging
81.2
ladění chyb
Refactoring
56.9
zlepšení kódu
Hallucination
69.6
odolnost vůči halucinacím
Reasoning
34.8
30 těžkých úloh (jiná škála)
Speed
228 tok/s
tokenová rychlost

Zdroj: bridgebench.ai/overall. BridgeBench sjednocuje 7 testů zaměřených na reálné programovací úlohy. Jeho Reasoning kategorie používá 30 velmi těžkých úloh a nelze ji přímo porovnávat s GPQA/MMLU.

🎯 Publikované benchmarky

Benchmark Kategorie Skóre Zdroj
Aider Polyglot coding 9.8% ↗ nezávislý
GPQA Diamond reasoning 82.8% ↗ provider
MMLU-Pro reasoning 35.61% ↗ nezávislý
MMLU reasoning 80.1% ↗ nezávislý
Humanity’s Last Exam reasoning 3.81% ↗ nezávislý

Found official OpenAI benchmarks from the March 2026 launch announcement, as well as independent evaluations from LayerLens and OpenRouter (Artificial Analysis). Scores for SWE-bench Pro and AIME 2025/2026 are available, but specific requested variants like SWE-bench Verified and AIME 2024 are not yet published for this exact model.

⚖️ Porovnání s konkurencí

Model Cenové srovnání Poznámka
Openai GPT-5.4 Nano
← Právě prohlížíte
Stejná cena vstupu ($0.20), ale 2.5x levnější výstup ($0.50 vs $1.25) Grok 4.1 Fast nabízí 5x větší kontext (2M) a levnější generování, což z něj činí silného soupeře pro čistě textové úlohy, ačkoliv GPT-5.4 Nano může mít výhodu v ekosystému OpenAI.
Mírně dražší vstup ($0.25) i výstup ($1.50) Gemini nabízí více než dvojnásobný kontext (1M+), ale je mírně dražší. Souboj se odehrává primárně v rychlosti a kvalitě multimodálního zpracování.
MistralAI Mistral Small 2603
Levnější vstup ($0.15) i výstup ($0.60) Mistral je cenově výhodnější pro čistě textové operace, ale má menší kontext (262k vs 400k) a pravděpodobně slabší integraci nástrojů než GPT-5.4.

🎯 Rozhodovací pomocník

Použij když...

  • Klasifikace e-mailů a ticketů v reálném čase
  • Extrakce strukturovaných dat z obrázků a faktur
  • Řízení pod-agentů (sub-agents) pro jednoduché úkoly

Nepoužívej když...

  • Složité logické dedukce a matematika
  • Analýza extrémně dlouhých dokumentů (>400k tokenů)
  • Kreativní psaní vyžadující vysokou nuanci
Ideální pro:
Vývojáři vysokoobjemových aplikacíTvůrci agentních systémůFirmy zpracovávající dokumenty

💪 Silné a slabé stránky

+ Silné stránky

Cenová dostupnost

S cenou $0.20 za 1M vstupních tokenů patří k nejdostupnějším modelům na trhu, což umožňuje masivní škálování automatizovaných procesů.

Multimodální schopnosti

Na rozdíl od mnoha 'nano' modelů konkurence podporuje nativně vstupy textu, obrázků i souborů, což je klíčové pro extrakci dat z dokumentů.

Výstupní kapacita

Limit 128,000 výstupních tokenů je pro tuto třídu modelů nadstandardní a umožňuje generování rozsáhlých reportů nebo kódu v jednom průchodu.

Slabé stránky

Kontextové okno

Kapacita 400,000 tokenů je sice slušná, ale zaostává za přímou konkurencí (Grok 4.1 Fast má 2M, Gemini Flash Lite 1M), což limituje práci s velkými korpusy dat.

Komplexní uvažování

Model je explicitně optimalizován pro rychlost, nikoliv pro hlubokou logiku; u složitých matematických nebo logických úloh bude vykazovat vyšší chybovost než verze Mini nebo Pro.

📝 Detailní popis

GPT-5.4 nano je nejodlehčenější a nákladově nejefektivnější varianta rodiny GPT-5.4, optimalizovaná pro úlohy kritické na rychlost a s vysokým objemem dat. Podporuje textové a obrazové vstupy a je navržena pro případy použití s nízkou latencí, jako je klasifikace, extrakce dat, hodnocení a spouštění sub-agentů.

Model upřednostňuje odezvu a efektivitu před hlubokým usuzováním, což jej činí ideálním pro pipeline, které vyžadují rychlé a spolehlivé výstupy ve velkém měřítku. GPT-5.4 nano se dobře hodí pro úlohy na pozadí, systémy v reálném čase a distribuované architektury agentů, kde je minimalizace nákladů a latence zásadní.

Unikátní charakteristiky

GPT-5.4 Nano představuje nejlehčí variantu v rodině GPT-5.4, navrženou specificky pro vysokoobjemové operace, kde je kritická rychlost a cena. Model obětuje hloubku uvažování (deep reasoning) ve prospěch okamžité odezvy a schopnosti zpracovávat multimodální vstupy v reálném čase.

Silné stránky

Cenová dostupnost

S cenou $0.20 za 1M vstupních tokenů patří k nejdostupnějším modelům na trhu, což umožňuje masivní škálování automatizovaných procesů.

Multimodální schopnosti

Na rozdíl od mnoha ‘nano’ modelů konkurence podporuje nativně vstupy textu, obrázků i souborů, což je klíčové pro extrakci dat z dokumentů.

Výstupní kapacita

Limit 128,000 výstupních tokenů je pro tuto třídu modelů nadstandardní a umožňuje generování rozsáhlých reportů nebo kódu v jednom průchodu.

Slabé stránky

Kontextové okno

Kapacita 400,000 tokenů je sice slušná, ale zaostává za přímou konkurencí (Grok 4.1 Fast má 2M, Gemini Flash Lite 1M), což limituje práci s velkými korpusy dat.

Komplexní uvažování

Model je explicitně optimalizován pro rychlost, nikoliv pro hlubokou logiku; u složitých matematických nebo logických úloh bude vykazovat vyšší chybovost než verze Mini nebo Pro.

🔗 Další modely od Openai