Gemma 4 31B Instruct je hustý multimodální model od Google DeepMind o velikosti 30,7 miliard parametrů, který podporuje textový a obrazový vstup s textovým výstupem. Nabízí kontextové okno o velikosti 256 tisíc tokenů, konfigurovatelný režim myšlení/usuzování, nativní volání funkcí a multijazyčnou podporu ve více než 140 jazycích. Je silný v úlohách kódování, usuzování a porozumění dokumentům. Licence Apache 2.0.
Unikátní charakteristiky
Gemma 4 31B je otevřený model střední velikosti, který integruje nativní podporu pro zpracování obrazu a videa s textovým výstupem. Vyniká rozsáhlým kontextovým oknem 256K tokenů a konfigurovatelným režimem uvažování (thinking mode), což je v kategorii open-weights modelů této velikosti nadstandardní.
Silné stránky
Multimodalita
Nativní podpora obrazu a videa na vstupu umožňuje komplexní analýzu multimediálních dat bez nutnosti externích modulů.
Kapacita výstupu
Maximální délka výstupu 131 072 tokenů je výjimečně vysoká a umožňuje generování rozsáhlých kódových bází nebo celých knih v jednom běhu.
Licencování
Apache 2.0 licence umožňuje široké komerční nasazení a modifikace bez striktních omezení.
Cenová efektivita
S cenou $0.14 za milion vstupních tokenů nabízí velmi atraktivní poměr ceny a výkonu pro multimodální úlohy.
Slabé stránky
Hardwarové nároky
Hustá architektura s 30.7 miliardami parametrů vyžaduje pro lokální inferenci s plným 256K kontextem značnou kapacitu VRAM ve srovnání s MoE alternativami.
Omezení výstupu
Model podporuje pouze textový výstup, neumožňuje přímé generování obrázků nebo videa.