G
Google 2. 4. 2026
84 skóre

Google: Gemma 4 31B

google/gemma-4-31b-it

Gemma 4 31B je vysoce efektivní open-weights model, který poskytuje vynikající poměr ceny a výkonu pro multimodální úlohy a zpracování dlouhých dokumentů.

Killer Feature Kombinace masivního 131K výstupního okna a nativního zpracování videa za extrémně nízkou cenu.
Skryté riziko Lokální nasazení s využitím plného 256K kontextového okna bude vyžadovat enterprise-grade GPU infrastrukturu kvůli husté architektuře modelu.
$0.14 / 1M vstup
$0.4 / 1M výstup
262k kontext
131k max výstup
Dobrý hodnocení
imagetextvideo text ProgramováníReasoningAnalýza dokumentůMultimodalita

📊 Benchmarky

💻 Programování
85
Výborný
🧠 Reasoning
82
Dobrý
📏 Kontextové okno
88
Výborný
👁️ Multimodalita
86
Výborný
💰 Cena/Výkon
92
Výborný
Celkové skóre 84/100

⚖️ Porovnání s konkurencí

Model Cenové srovnání Poznámka
Google Gemma 4 31B
← Právě prohlížíte
Mistral AI Mistral Small 2603
Téměř identická cena ($0.15/$0.60 vs $0.14/$0.40 u Gemmy). Oba modely mají srovnatelné kontextové okno (262K). Gemma má výhodu v nativní podpoře videa a obrazu a výrazně větším maximálním výstupu, zatímco Mistral se může soustředit na čistě textovou efektivitu.
DeepSeek DeepSeek V3.2
DeepSeek má téměř 2x dražší vstup ($0.26), ale podobnou cenu výstupu ($0.38). DeepSeek je silným konkurentem v programování a matematice, ale Gemma nabízí větší kontextové okno (262K vs 164K) a širší multimodální schopnosti včetně zpracování videa.
Grok je mírně dražší na vstupu ($0.20) i výstupu ($0.50). Grok nabízí masivní kontextové okno 2 miliony tokenů, což je téměř 8x více než Gemma. Gemma však kontruje otevřenou licencí Apache 2.0 a konfigurovatelným režimem uvažování.

🎯 Rozhodovací pomocník

Použij když...

  • Analýza dlouhých video záznamů a extrakce dat
  • Generování a refaktoring rozsáhlých kódových bází
  • Zpracování rozsáhlých multijazyčných dokumentů

Nepoužívej když...

  • Úlohy vyžadující generování multimédií na výstupu
  • Běh na koncových zařízeních s velmi omezenou pamětí (edge devices)
Ideální pro:
Vývojáři aplikacíVýzkumníci v oblasti AIEnterprise sféra hledající open-weights řešení

💪 Silné a slabé stránky

+ Silné stránky

Multimodalita

Nativní podpora obrazu a videa na vstupu umožňuje komplexní analýzu multimediálních dat bez nutnosti externích modulů.

Kapacita výstupu

Maximální délka výstupu 131 072 tokenů je výjimečně vysoká a umožňuje generování rozsáhlých kódových bází nebo celých knih v jednom běhu.

Licencování

Apache 2.0 licence umožňuje široké komerční nasazení a modifikace bez striktních omezení.

Cenová efektivita

S cenou $0.14 za milion vstupních tokenů nabízí velmi atraktivní poměr ceny a výkonu pro multimodální úlohy.

Slabé stránky

Hardwarové nároky

Hustá architektura s 30.7 miliardami parametrů vyžaduje pro lokální inferenci s plným 256K kontextem značnou kapacitu VRAM ve srovnání s MoE alternativami.

Omezení výstupu

Model podporuje pouze textový výstup, neumožňuje přímé generování obrázků nebo videa.

📝 Detailní popis

Gemma 4 31B Instruct je hustý multimodální model od Google DeepMind o velikosti 30,7 miliard parametrů, který podporuje textový a obrazový vstup s textovým výstupem. Nabízí kontextové okno o velikosti 256 tisíc tokenů, konfigurovatelný režim myšlení/usuzování, nativní volání funkcí a multijazyčnou podporu ve více než 140 jazycích. Je silný v úlohách kódování, usuzování a porozumění dokumentům. Licence Apache 2.0.

Unikátní charakteristiky

Gemma 4 31B je otevřený model střední velikosti, který integruje nativní podporu pro zpracování obrazu a videa s textovým výstupem. Vyniká rozsáhlým kontextovým oknem 256K tokenů a konfigurovatelným režimem uvažování (thinking mode), což je v kategorii open-weights modelů této velikosti nadstandardní.

Silné stránky

Multimodalita

Nativní podpora obrazu a videa na vstupu umožňuje komplexní analýzu multimediálních dat bez nutnosti externích modulů.

Kapacita výstupu

Maximální délka výstupu 131 072 tokenů je výjimečně vysoká a umožňuje generování rozsáhlých kódových bází nebo celých knih v jednom běhu.

Licencování

Apache 2.0 licence umožňuje široké komerční nasazení a modifikace bez striktních omezení.

Cenová efektivita

S cenou $0.14 za milion vstupních tokenů nabízí velmi atraktivní poměr ceny a výkonu pro multimodální úlohy.

Slabé stránky

Hardwarové nároky

Hustá architektura s 30.7 miliardami parametrů vyžaduje pro lokální inferenci s plným 256K kontextem značnou kapacitu VRAM ve srovnání s MoE alternativami.

Omezení výstupu

Model podporuje pouze textový výstup, neumožňuje přímé generování obrázků nebo videa.

🔗 Další modely od Google