Google na konferenci I/O 2026 vydal Gemini 3.5 Flash a přestavěl svou agentní platformu na Antigravity 2.0. Chybělo Gemini 3.5 Pro. Sundar Pichai oznámil, že vlajková loď přijde “až příští měsíc”. V publiku to vyvolalo slyšitelné zklamání. Pro vývojářskou komunitu, která čekala odpověď na měsíc starý Claude Opus 4.7 a GPT-5.5 (23. dubna), je to signál. Google ve frontier kategorii nestíhá tempo. Jak to tedy je?
Místo Pro verze Google sází na změny. Model rodiny Flash je poprvé v historii dostatečně dobrý, aby porazil předchozí Pro generaci v klíčových testech. Antigravity 2.0 přestala být IDE a stala se agent-first orchestrační platformou. To je dnes modernější a mocnější.. Managed Agents v Gemini API dovolují spustit izolované Linux prostředí pro agenta jedním voláním. Jde o jiný směr než Anthropic Claude Code nebo OpenAI Codex - Google buduje plnou platformu pro paralelní agenty, ne nástroj pro jednoho. Otázka je, jestli tato sázka vyjde, když (zatím?) nemá k dispozici nejvyšší inteligenci pro orchestraci.
Co Gemini 3.5 Flash je
Flash je nyní výchozí model v Gemini App a AI Mode v Search globálně. Pro vývojáře dostupný přes Antigravity, Gemini API, Google AI Studio, Android Studio, Vertex AI a Gemini Enterprise.
| Parametr | Hodnota |
|---|---|
| Kontextové okno | 1 048 576 tokenů (1M) |
| Maximum výstupu | 65 536 tokenů |
| Modality | text, obraz, audio, video, PDF (vstup), text (výstup) |
| Reasoning | Dynamic thinking implicitně, úrovně minimal/low/medium/high |
| Knowledge cutoff | leden 2026 |
| Cena (vstup / výstup) | $1,50 / $9,00 za milion tokenů |
| Cached input | $0,15 za milion tokenů |
| Blended (3:1) | $3,38 za milion tokenů |
Cenově je Flash zhruba o 40 % levnější než Gemini 3.1 Pro ($2,00 / $12,00). Proti konkurenci je v mezitřídě - levnější než Claude Sonnet 4.6 ($3 / $15), výrazně levnější než Claude Opus 4.7 ($5 / $25) a GPT-5.5 ($5 / $30). Ale dražší než DeepSeek V4-Flash ($0,14 / $0,28) nebo MiMo V2.5 ($0,40 / $2,00). To není špatně: americká technologie za cenu, kdy si neospravedlníte tak snadno tu čínskou…
Klíčové body na cenotvorbě: 3,5 Flash je 4× rychlejší v output tokenech než konkurenční frontier modely podle interních měření Google. Nezávislé Artificial Analysis to potvrzuje - 284 tokenů za sekundu proti mediánu 63 t/s u modelů srovnatelné cenové třídy. To je hezký rychlostní rozdíl.
Benchmarkový obraz: kde Flash skutečně vede
Před hodnocením modelu stojí za to projít celou matici dostupných benchmarků. Různé zdroje měří různé věci a obraz Flash je rozporuplnější, než data z tiskové zprávy Google decentně naznačují i tím, co za čísla vynechávají.
| Benchmark | Skóre Flash | Pozice | Co měří |
|---|---|---|---|
| Arena Code Frontend | 1507 ELO | #9 | HTML/React od reálných uživatelů (blind pairwise) |
| Arena Text | – | #9 | Obecné textové úlohy (blind pairwise) |
| APEX-Agents-AA | 47 % Pass@1 | #1 | Long-horizon agentní úlohy (banking, consulting, právo) |
| Terminal-Bench 2.1 (Google) | 76,2 % | – | Agentní coding workflow |
| MCP Atlas (Google) | 83,6 % | – | Tool use pro agenty |
| AA Intelligence Index | 55 | nad medián 36 | Composite intelligence |
| AA Coding Index | 45 | střed pole | Composite coding |
| AA Terminal-Bench Hard | 41 % | střed pole | Hardcore terminal úlohy |
| CursorBench 3.1 | 49,8 % | #10 ze 14 | Multi-file úlohy v Cursor IDE |
| Humanity’s Last Exam | 40,2 % | pod 3.1 Pro | Deep reasoning |
| ARC-AGI-2 | 72,1 % | pod 3.1 Pro | Abstract reasoning |
| MRCR v2 (128k) | 77,3 % | pod 3.1 Pro | Long-context retrieval |
Vzorec je jasný. Flash dominuje ve frontend kódu, dlouhodobých agentních workflow a rychlosti. Zaostává v deep reasoning, hardcore multi-file IDE coding a dlouhém kontextu nad 128K. Je to tedy specialista, ne univerzál.
Arena Code Frontend je nezávislé odnocení reálných uživatelů, kteří staví aplikace v HTML a React. 9. místo z velkého poolu modelů je silný výsledek - a oproti předchozí generaci Gemini 3 Flash je to skok o 70 ELO bodů. To znamená, že kvalita frontend kódu, který Flash generuje, je sama o sobě výrazně lepší, nejen rychlejší.
APEX-Agents-AA si zaslouží zvláštní pozornost, protože je to konkrétní typ úlohy, kde Flash vede mezi nejlepšími modely. Benchmark testuje 452 úloh v investment bankingu, management consultingu a corporate law - long-horizon multi-step úlohy, které profesionálovi zaberou v průměru 1,8 hodiny. Flash dosáhl 47 % Pass@1, GPT-5.5 xhigh 38 %, Claude Opus 4.6 max 33 %, dokonce vlastní Gemini 3.1 Pro Preview jen 32 %. Když slabší varianta poráží silnější od téhož vendora o 15 bodů, neměří benchmark obecnou inteligenci, ale specifickou vhodnost pro daný workflow. Mercor (autor benchmarku) ukázal stejný vzorec už u Gemini 3 Flash v lednu 2026 - Flash architektura má systematickou výhodu v dlouhých multi-tool workflow s tvrdým limitem kroků.
Naopak CursorBench 3.1 ukazuje slabinu. Ve vícesouborových úlohách z reálných Cursor sessions Flash dosáhl jen 49,8 %, 10. místo ze 14. Cursorův vlastní model Composer 2.5 (odvozenina z čínského KIMI) dosáhl 63,2 % za třetinu ceny Flash. Pro vývojáře v Cursor ekosystému to znamená, že Flash není konkurenceschopný proti tamní výchozí volbě.
Co Flash znamená pro agenty a kódování
Klíčové strategické rozhodnutí Googlu: rychlost je důležitější než marginální zlepšení kvality. Pro paralelní agentní workflow, kde běží 5, 10 nebo 100 subagentů současně, latence modelu se násobí. Pokud Flash dokáže Terminal-Bench 76,2 % za čtvrtinu času, je to praktičtější než pomalejší model s 78 %. Drobná procentní zlepšení versus značné časové úspory jdou naproti dnešnímu trendu lepšího zadávání instrukcí, promptů do modelu. Když lépe definujete úlohu, budete ji mít s Flash rychleji a efektivněji.
Ukázky Antigravity 2.0 na I/O ukázaly konkrétní úlohy: dva agenti (builder + player) v sebezlepšujícíse smyčce vytvoří hratelnou hru, subagenti syntetizují AlphaZero paper a nakódují plně hratelnou implementaci za 6 hodin, migrace zabordelené legacy codebase na Next.js bez ručního zásahu, multi-step workflow pro přejmenování a kategorizaci nestrukturovaných aktiv.
Tulsee Doshi, jedna z ředitelek Google, popsala v rozhovoru pro TechCrunch budoucí architekturu: “3.5 Pro se stane vaším orchestrátorem a plánovačem, který pak může využít Flash jako různé subagenty.” Tedy Pro = mozek, Flash = ruce. Hierarchický agent design, který vyžaduje oba modely. To koresponduje s APEX-Agents výsledky - Flash je optimalizovaný pro dílčí kroky v dlouhém workflow. Drobný problém: nové Pro zatím nemáme a oproti starému je Flash lepší.
Kritické poznámky k Flash jsou ale reálné. Artificial Analysis naměřilo, že 3.5 Flash spotřebovává 73 milionů tokenů na evaluaci Intelligence Indexu, zatímco medián této třídy je 36M. Dvojnásobně ukecanější (verbosity). Katalogová cena $1,50 / $9 je nízká, ale čistá cena na úlohu může být blízko Sonnet 4.6. Druhý problém: čas do prvního tokenu je 17,75 sekundy, šestkrát pomalejší než medián 2,72s. Pro krátké chat interakce frustrující. Pro dlouhé agentní úlohy to ovšem nevadí.
Antigravity 2.0: posun z IDE na agentní platformu
Antigravity 1.0 (listopad 2025) byl VS Code fork s integrovanou AI - tedy IDE s asistentem. Antigravity 2.0 je něco úplně jiného: samostatná desktopová aplikace zaměřená na orchestraci agentů, ne na editaci kódu.

Centrem je multi-agent orchestrace - paralelní práce na více úlohách současně, definovatelné subagent workflows, scheduled tasks běžící na pozadí, nativní voice command support. Tight integrace s AI Studio, Firebase, Android a Google Cloud. Antigravity 2.0 connects natively to GCP billing accounts s SLA-backed agent execution a private VPC support pro enterprise.
Pro vývojáře je důležitý Antigravity CLI v Go - rychlejší a responsivnější náhrada starého Gemini CLI, který je nyní oficiálně zavrženo. Plus Antigravity SDK pro budování vlastních agentů na Google infrastruktuře.

Pro API uživatele je zásadní novinka Managed Agents v Gemini API. Jedno volání API spustí agenta, který resí, používá nástroje a vykonává kód v izolovaném Linux prostředí. Trvale izolované prostředí (každá interakce vytvoří prostředí, které lze obnovit), multi-turn sessions se zachováním všech souborů a stavu, vlastní definice agentů přes markdown soubory. Pohání to Gemini 3.5 Flash + Antigravity agent harness. Tohle přímo konkuruje OpenAI Codex API a Anthropic Claude Code, ale s odlišnou strukturou - plně řízený runtime pro agenty bez nutnosti vlastní infrastruktury.
Google také zavedl AI Ultra plan za $100 měsíčně s 5× vyššími limity v Antigravity proti AI Pro plánu. Současně snížil cenu top-tier Ultra plánu z $250 na $200. Plus mobilní aplikace AI Studio pro Android s exportem do Antigravity jedním kliknutím.
Kritická poznámka: Rozdělení Antigravity na dva produkty bez dostatečné komunikace, to mi dává zabrat. Mnoha uživatelům po auto-updatu zmizel editor, file tree, terminal a WSL/SSH připojení. Reakce v komunitě byla panická. Kdo chce klasický IDE workflow, musí nainstalovat zvlášť “Antigravity IDE”. To je špatný start, který stojí za zmínku.
Zpoždění Pro modelu je silný signál
Pichai prohlásil před publikem I/O: “Vím, že se nemůžete dočkat. Dejte nám měsíc, abychom vám to dodali.” Odezvu v publiku to nemělo pozitivní…
Důvod zpoždění není oficiálně zveřejněn, ale DNYUZ přišel s pravděpodobnou interpretací: Google zdržuje Pro, aby ho ještě vylepšil pro AI coding úlohy. Antigravity 2.0 s 3.5 Flash bude od dnešního dne generovat masivní množství anonymizovaných dat o tom, jak vývojáři skutečně pracují s agenty. Tato data poslouží jako trénovací materiál pro reinforcement learning na 3.5 Pro.
Je to elegantní strategie, ale má rub: Google ve frontier kategorii zaostává v tempu. Anthropic vydal Opus 4.7 16. dubna, OpenAI GPT-5.5 23. dubna, DeepSeek V4 24. dubna, Kimi K2.6 20. dubna. Google na své největší developerské konferenci roku nemohl ukázat top model. Pro Google Cloud sales týmy a partnery v enterprise je to nepříjemná pozice - Anthropic a OpenAI mají alespoň měsíc náskoku v reálném nasazení frontier kapacit.
Z technického pohledu má strategie smysl. Z tržního ne tolik, komunita vývojářů je z toho rozmrzelá.
Google také ohlásil Gemini Spark - personální AI agent využívající 3.5 Flash, který běží 24/7 a má “pomáhat s digitálním životem”. Beta startuje příští týden v USA pro AI Ultra subscribery. Strategicky je to přímá konkurence pro Microsoft Copilot a OpenAI Operator.
Pro koho a kdy
Gemini 3.5 Flash má smysl, pokud:
- Generujete frontend kód (HTML/React) - Arena potvrzuje top 10 kvalitu
- Děláte long-horizon agentní workflow s mnoha tool calls (APEX-Agents)
- Pracujete v Antigravity 2.0 nebo Managed Agents API
- Potřebujete multimodální zpracování v jednom modelu
- Cena je faktor (3× levnější než Opus 4.7 na blended ceně)
- Děláte úlohy v Terminal-Bench nebo MCP Atlas kategorii
Flash nedává smysl, pokud:
- Potřebujete deep reasoning (počkat na 3.5 Pro v červnu nebo Opus 4.7)
- Pracujete v Cursor IDE - Composer 2.5 je dramaticky lepší a 4× levnější
- Pracujete s hard long-context retrieval nad 128K (3.1 Pro je lepší)
- Latence kritická pro krátké chat interakce (TTFT 17s je vysoký)
- Nepotřebujete agentní funkcionalitu - DeepSeek V4-Flash je 35× levnější
Co počkat:
- Gemini 3.5 Pro v červnu 2026 (orchestrator pro Flash subagenty)
- Stabilizace Antigravity 2.0 po split chaosu
- První produkční zkušenosti s Managed Agents API
Závěr
Gemini 3.5 Flash je specialista, ne univerzál. Dominuje ve frontend kódu (Arena #9), dlouhých agentních workflow (APEX-Agents #1) a rychlosti (284 t/s, 4× nad mediánem). Zaostává v deep reasoning, hard long-context retrieval a multi-file IDE coding v Cursor stylu. Strukturálně mění tržní logiku - Google poprvé umístil frontier inteligenci do Flash rodiny a posunul cenovou hladinu trhu.
Antigravity 2.0 je významnější signál než model sám. Google se přerodil z IDE poskytovatele na plnou agentní orchestration platformu. To je sázka na dlouhodobý směr, kde Anthropic i OpenAI musí reagovat. Managed Agents v Gemini API jsou skutečná novinka, kterou ostatní nemají.
Zpoždění modelu Pro ale ukazuje, že Google ve frontier kategorii zaostává v tempu. Strategická interpretace (sběr dat z Antigravity pro vylepšení Pro) je rozumná, ale nezakrývá fakt, že na I/O 2026 chyběl. Pro vibecoding.cz publikum dnešní zpráva zní: vyzkoušejte 3.5 Flash v Antigravity, hlavně pokud děláte frontend nebo paralelní agentní úlohy. Pro deep reasoning a Cursor workflow má konkurence stále navrch.