Společnost Google vydala pro své modely Gemma 4 takzvané MTP (Multi-Token Prediction) draftery, které využívají techniku spekulativního dekódování. Tato inovace umožňuje zrychlit generování odpovědí (inferenci) až 3krát bez snížení kvality výstupu. Pro vývojáře to znamená výrazně nižší latenci a citelně lepší odezvu aplikací běžících lokálně i na zařízeních s omezeným výkonem. 👉
Gemma 4
2 zpráv o Gemma 4 5. 5. 17:34
2. 4. 16:56
Společnost Google představila Gemma 4, svou dosud nejschopnější rodinu otevřených AI modelů, postavenou na technologii Gemini 3. Tyto modely jsou navrženy pro pokročilé uvažování a agentní úlohy, přičemž nabízejí špičkový výkon při efektivním využití hardwaru. Gemma 4 je k dispozici v různých velikostech pro nasazení od mobilních zařízení po výkonné servery a je vydána pod komerčně přívětivou licencí Apache 2.0. 👉