Gemini 3.5 Flash a Antigravity 2.0: Google sází na agenty, ale Pro neukázal

Google na konferenci I/O 2026 vydal Gemini 3.5 Flash a přestavěl svou agentní platformu na Antigravity 2.0. Chybělo Gemini 3.5 Pro. Sundar Pichai oznámil, že vlajková loď přijde “až příští měsíc”. V publiku to vyvolalo slyšitelné zklamání. Pro vývojářskou komunitu, která čekala odpověď na měsíc starý Claude Opus 4.7 a GPT-5.5 (23. dubna), je to signál. Google ve frontier kategorii nestíhá tempo. Jak to tedy je?

Místo Pro verze Google sází na změny. Model rodiny Flash je poprvé v historii dostatečně dobrý, aby porazil předchozí Pro generaci v klíčových testech. Antigravity 2.0 přestala být IDE a stala se agent-first orchestrační platformou. To je dnes modernější a mocnější.. Managed Agents v Gemini API dovolují spustit izolované Linux prostředí pro agenta jedním voláním. Jde o jiný směr než Anthropic Claude Code nebo OpenAI Codex - Google buduje plnou platformu pro paralelní agenty, ne nástroj pro jednoho. Otázka je, jestli tato sázka vyjde, když (zatím?) nemá k dispozici nejvyšší inteligenci pro orchestraci.

Co Gemini 3.5 Flash je

Flash je nyní výchozí model v Gemini App a AI Mode v Search globálně. Pro vývojáře dostupný přes Antigravity, Gemini API, Google AI Studio, Android Studio, Vertex AI a Gemini Enterprise.

Parametr	Hodnota
Kontextové okno	1 048 576 tokenů (1M)
Maximum výstupu	65 536 tokenů
Modality	text, obraz, audio, video, PDF (vstup), text (výstup)
Reasoning	Dynamic thinking implicitně, úrovně minimal/low/medium/high
Knowledge cutoff	leden 2026
Cena (vstup / výstup)	$1,50 / $9,00 za milion tokenů
Cached input	$0,15 za milion tokenů
Blended (3:1)	$3,38 za milion tokenů

Cenově je Flash zhruba o 40 % levnější než Gemini 3.1 Pro ($2,00 / $12,00). Proti konkurenci je v mezitřídě - levnější než Claude Sonnet 4.6 ($3 / $15), výrazně levnější než Claude Opus 4.7 ($5 / $25) a GPT-5.5 ($5 / $30). Ale dražší než DeepSeek V4-Flash ($0,14 / $0,28) nebo MiMo V2.5 ($0,40 / $2,00). To není špatně: americká technologie za cenu, kdy si neospravedlníte tak snadno tu čínskou…

Klíčové body na cenotvorbě: 3,5 Flash je 4× rychlejší v output tokenech než konkurenční frontier modely podle interních měření Google. Nezávislé Artificial Analysis to potvrzuje - 284 tokenů za sekundu proti mediánu 63 t/s u modelů srovnatelné cenové třídy. To je hezký rychlostní rozdíl.

Benchmarkový obraz: kde Flash skutečně vede

Před hodnocením modelu stojí za to projít celou matici dostupných benchmarků. Různé zdroje měří různé věci a obraz Flash je rozporuplnější, než data z tiskové zprávy Google decentně naznačují i tím, co za čísla vynechávají.

Benchmark	Skóre Flash	Pozice	Co měří
Arena Code Frontend	1507 ELO	#9	HTML/React od reálných uživatelů (blind pairwise)
Arena Text	–	#9	Obecné textové úlohy (blind pairwise)
APEX-Agents-AA	47 % Pass@1	#1	Long-horizon agentní úlohy (banking, consulting, právo)
Terminal-Bench 2.1 (Google)	76,2 %	–	Agentní coding workflow
MCP Atlas (Google)	83,6 %	–	Tool use pro agenty
AA Intelligence Index	55	nad medián 36	Composite intelligence
AA Coding Index	45	střed pole	Composite coding
AA Terminal-Bench Hard	41 %	střed pole	Hardcore terminal úlohy
CursorBench 3.1	49,8 %	#10 ze 14	Multi-file úlohy v Cursor IDE
Humanity’s Last Exam	40,2 %	pod 3.1 Pro	Deep reasoning
ARC-AGI-2	72,1 %	pod 3.1 Pro	Abstract reasoning
MRCR v2 (128k)	77,3 %	pod 3.1 Pro	Long-context retrieval

Vzorec je jasný. Flash dominuje ve frontend kódu, dlouhodobých agentních workflow a rychlosti. Zaostává v deep reasoning, hardcore multi-file IDE coding a dlouhém kontextu nad 128K. Je to tedy specialista, ne univerzál.

Arena Code Frontend je nezávislé odnocení reálných uživatelů, kteří staví aplikace v HTML a React. 9. místo z velkého poolu modelů je silný výsledek - a oproti předchozí generaci Gemini 3 Flash je to skok o 70 ELO bodů. To znamená, že kvalita frontend kódu, který Flash generuje, je sama o sobě výrazně lepší, nejen rychlejší.

APEX-Agents-AA si zaslouží zvláštní pozornost, protože je to konkrétní typ úlohy, kde Flash vede mezi nejlepšími modely. Benchmark testuje 452 úloh v investment bankingu, management consultingu a corporate law - long-horizon multi-step úlohy, které profesionálovi zaberou v průměru 1,8 hodiny. Flash dosáhl 47 % Pass@1, GPT-5.5 xhigh 38 %, Claude Opus 4.6 max 33 %, dokonce vlastní Gemini 3.1 Pro Preview jen 32 %. Když slabší varianta poráží silnější od téhož vendora o 15 bodů, neměří benchmark obecnou inteligenci, ale specifickou vhodnost pro daný workflow. Mercor (autor benchmarku) ukázal stejný vzorec už u Gemini 3 Flash v lednu 2026 - Flash architektura má systematickou výhodu v dlouhých multi-tool workflow s tvrdým limitem kroků.

Naopak CursorBench 3.1 ukazuje slabinu. Ve vícesouborových úlohách z reálných Cursor sessions Flash dosáhl jen 49,8 %, 10. místo ze 14. Cursorův vlastní model Composer 2.5 (odvozenina z čínského KIMI) dosáhl 63,2 % za třetinu ceny Flash. Pro vývojáře v Cursor ekosystému to znamená, že Flash není konkurenceschopný proti tamní výchozí volbě.

Co Flash znamená pro agenty a kódování

Klíčové strategické rozhodnutí Googlu: rychlost je důležitější než marginální zlepšení kvality. Pro paralelní agentní workflow, kde běží 5, 10 nebo 100 subagentů současně, latence modelu se násobí. Pokud Flash dokáže Terminal-Bench 76,2 % za čtvrtinu času, je to praktičtější než pomalejší model s 78 %. Drobná procentní zlepšení versus značné časové úspory jdou naproti dnešnímu trendu lepšího zadávání instrukcí, promptů do modelu. Když lépe definujete úlohu, budete ji mít s Flash rychleji a efektivněji.

Ukázky Antigravity 2.0 na I/O ukázaly konkrétní úlohy: dva agenti (builder + player) v sebezlepšujícíse smyčce vytvoří hratelnou hru, subagenti syntetizují AlphaZero paper a nakódují plně hratelnou implementaci za 6 hodin, migrace zabordelené legacy codebase na Next.js bez ručního zásahu, multi-step workflow pro přejmenování a kategorizaci nestrukturovaných aktiv.

Tulsee Doshi, jedna z ředitelek Google, popsala v rozhovoru pro TechCrunch budoucí architekturu: “3.5 Pro se stane vaším orchestrátorem a plánovačem, který pak může využít Flash jako různé subagenty.” Tedy Pro = mozek, Flash = ruce. Hierarchický agent design, který vyžaduje oba modely. To koresponduje s APEX-Agents výsledky - Flash je optimalizovaný pro dílčí kroky v dlouhém workflow. Drobný problém: nové Pro zatím nemáme a oproti starému je Flash lepší.

Kritické poznámky k Flash jsou ale reálné. Artificial Analysis naměřilo, že 3.5 Flash spotřebovává 73 milionů tokenů na evaluaci Intelligence Indexu, zatímco medián této třídy je 36M. Dvojnásobně ukecanější (verbosity). Katalogová cena $1,50 / $9 je nízká, ale čistá cena na úlohu může být blízko Sonnet 4.6. Druhý problém: čas do prvního tokenu je 17,75 sekundy, šestkrát pomalejší než medián 2,72s. Pro krátké chat interakce frustrující. Pro dlouhé agentní úlohy to ovšem nevadí.

Antigravity 2.0: posun z IDE na agentní platformu

Antigravity 1.0 (listopad 2025) byl VS Code fork s integrovanou AI - tedy IDE s asistentem. Antigravity 2.0 je něco úplně jiného: samostatná desktopová aplikace zaměřená na orchestraci agentů, ne na editaci kódu.

Centrem je multi-agent orchestrace - paralelní práce na více úlohách současně, definovatelné subagent workflows, scheduled tasks běžící na pozadí, nativní voice command support. Tight integrace s AI Studio, Firebase, Android a Google Cloud. Antigravity 2.0 connects natively to GCP billing accounts s SLA-backed agent execution a private VPC support pro enterprise.

Pro vývojáře je důležitý Antigravity CLI v Go - rychlejší a responsivnější náhrada starého Gemini CLI, který je nyní oficiálně zavrženo. Plus Antigravity SDK pro budování vlastních agentů na Google infrastruktuře.

Pro API uživatele je zásadní novinka Managed Agents v Gemini API. Jedno volání API spustí agenta, který resí, používá nástroje a vykonává kód v izolovaném Linux prostředí. Trvale izolované prostředí (každá interakce vytvoří prostředí, které lze obnovit), multi-turn sessions se zachováním všech souborů a stavu, vlastní definice agentů přes markdown soubory. Pohání to Gemini 3.5 Flash + Antigravity agent harness. Tohle přímo konkuruje OpenAI Codex API a Anthropic Claude Code, ale s odlišnou strukturou - plně řízený runtime pro agenty bez nutnosti vlastní infrastruktury.

Google také zavedl AI Ultra plan za $100 měsíčně s 5× vyššími limity v Antigravity proti AI Pro plánu. Současně snížil cenu top-tier Ultra plánu z $250 na $200. Plus mobilní aplikace AI Studio pro Android s exportem do Antigravity jedním kliknutím.

Kritická poznámka: Rozdělení Antigravity na dva produkty bez dostatečné komunikace, to mi dává zabrat. Mnoha uživatelům po auto-updatu zmizel editor, file tree, terminal a WSL/SSH připojení. Reakce v komunitě byla panická. Kdo chce klasický IDE workflow, musí nainstalovat zvlášť “Antigravity IDE”. To je špatný start, který stojí za zmínku.

Zpoždění Pro modelu je silný signál

Pichai prohlásil před publikem I/O: “Vím, že se nemůžete dočkat. Dejte nám měsíc, abychom vám to dodali.” Odezvu v publiku to nemělo pozitivní…

Důvod zpoždění není oficiálně zveřejněn, ale DNYUZ přišel s pravděpodobnou interpretací: Google zdržuje Pro, aby ho ještě vylepšil pro AI coding úlohy. Antigravity 2.0 s 3.5 Flash bude od dnešního dne generovat masivní množství anonymizovaných dat o tom, jak vývojáři skutečně pracují s agenty. Tato data poslouží jako trénovací materiál pro reinforcement learning na 3.5 Pro.

Je to elegantní strategie, ale má rub: Google ve frontier kategorii zaostává v tempu. Anthropic vydal Opus 4.7 16. dubna, OpenAI GPT-5.5 23. dubna, DeepSeek V4 24. dubna, Kimi K2.6 20. dubna. Google na své největší developerské konferenci roku nemohl ukázat top model. Pro Google Cloud sales týmy a partnery v enterprise je to nepříjemná pozice - Anthropic a OpenAI mají alespoň měsíc náskoku v reálném nasazení frontier kapacit.

Z technického pohledu má strategie smysl. Z tržního ne tolik, komunita vývojářů je z toho rozmrzelá.

Google také ohlásil Gemini Spark - personální AI agent využívající 3.5 Flash, který běží 24/7 a má “pomáhat s digitálním životem”. Beta startuje příští týden v USA pro AI Ultra subscribery. Strategicky je to přímá konkurence pro Microsoft Copilot a OpenAI Operator.

Pro koho a kdy

Gemini 3.5 Flash má smysl, pokud:

Generujete frontend kód (HTML/React) - Arena potvrzuje top 10 kvalitu
Děláte long-horizon agentní workflow s mnoha tool calls (APEX-Agents)
Pracujete v Antigravity 2.0 nebo Managed Agents API
Potřebujete multimodální zpracování v jednom modelu
Cena je faktor (3× levnější než Opus 4.7 na blended ceně)
Děláte úlohy v Terminal-Bench nebo MCP Atlas kategorii

Flash nedává smysl, pokud:

Potřebujete deep reasoning (počkat na 3.5 Pro v červnu nebo Opus 4.7)
Pracujete v Cursor IDE - Composer 2.5 je dramaticky lepší a 4× levnější
Pracujete s hard long-context retrieval nad 128K (3.1 Pro je lepší)
Latence kritická pro krátké chat interakce (TTFT 17s je vysoký)
Nepotřebujete agentní funkcionalitu - DeepSeek V4-Flash je 35× levnější

Co počkat:

Gemini 3.5 Pro v červnu 2026 (orchestrator pro Flash subagenty)
Stabilizace Antigravity 2.0 po split chaosu
První produkční zkušenosti s Managed Agents API

Závěr

Gemini 3.5 Flash je specialista, ne univerzál. Dominuje ve frontend kódu (Arena #9), dlouhých agentních workflow (APEX-Agents #1) a rychlosti (284 t/s, 4× nad mediánem). Zaostává v deep reasoning, hard long-context retrieval a multi-file IDE coding v Cursor stylu. Strukturálně mění tržní logiku - Google poprvé umístil frontier inteligenci do Flash rodiny a posunul cenovou hladinu trhu.

Antigravity 2.0 je významnější signál než model sám. Google se přerodil z IDE poskytovatele na plnou agentní orchestration platformu. To je sázka na dlouhodobý směr, kde Anthropic i OpenAI musí reagovat. Managed Agents v Gemini API jsou skutečná novinka, kterou ostatní nemají.

Zpoždění modelu Pro ale ukazuje, že Google ve frontier kategorii zaostává v tempu. Strategická interpretace (sběr dat z Antigravity pro vylepšení Pro) je rozumná, ale nezakrývá fakt, že na I/O 2026 chyběl. Pro vibecoding.cz publikum dnešní zpráva zní: vyzkoušejte 3.5 Flash v Antigravity, hlavně pokud děláte frontend nebo paralelní agentní úlohy. Pro deep reasoning a Cursor workflow má konkurence stále navrch.