N
Nex-Agi 8. 6. 2026

Nex AGI: Nex-N2-Pro (free)

nex-agi/nex-n2-pro:free

Nex-N2-Pro je vysoce efektivní model pro vývojáře budující autonomní agenty, který poskytuje nadstandardní výstupní okno a masivní MoE architekturu bez poplatků za API.

Killer Feature Kapacita výstupního okna 262 144 tokenů umožňuje generování rozsáhlých textových a kódových struktur v jediném průchodu.
Skryté riziko Skrytá latence způsobená složitým směrováním v 397B MoE architektuře může zpomalit interaktivní aplikace citlivé na odezvu.
$0 / 1M vstup
$0 / 1M výstup
262k kontext
262k max výstup
textimage text Agentní systémyZpracování dlouhého kontextuMultimodální analýza

📊 Orientační hodnocení

🤖 Agenti
88
Výborný
📏 Kontextové okno
95
Výborný
💰 Cena/Výkon
100
Výborný
👁️ Multimodalita
80
Dobrý

Uvedená čísla jsou odhad LLM analyzátoru na základě popisu modelu, nikoli měřené benchmarky. Pro tento model jsme zatím nenašli dostatek publikovaných benchmarků k výpočtu VibeCode skóre.

⚖️ Porovnání s konkurencí

Model Cenové srovnání Poznámka
Nex-Agi Nex-N2-Pro (free)
← Právě prohlížíte
Google gemma-4-26b-a4b-it:free
Stejná cena (oba modely jsou zdarma) Gemma nabízí hustou (dense) architekturu s 26B parametry, což poskytuje stabilnější latenci. Nex-N2-Pro má však výhodu v celkové kapacitě parametrů (397B) a schopnosti generovat výrazně delší výstupy.
MistralAI mistral-small-2603
Nex-N2-Pro je zdarma, Mistral stojí $0.15/$0.60 za 1M tokenů Oba modely disponují vstupním kontextem 262k tokenů. Nex-N2-Pro nabízí větší výstupní kapacitu a multimodální schopnosti bez poplatků, zatímco Mistral se soustředí na vysokou rychlost a efektivitu v čistě textových úlohách.
Nex-N2-Pro je zdarma, DeepSeek stojí $0.10/$0.20 za 1M tokenů DeepSeek nabízí 4x větší vstupní kontext (1M tokenů) a velmi nízkou cenu. Nex-N2-Pro mu konkuruje nulovou cenou a specializací na dlouhé výstupy pro agentní nasazení.

🎯 Rozhodovací pomocník

Použij když...

  • Generování rozsáhlých kódových bází
  • Analýza dlouhých multimodálních dokumentů
  • Asynchronní autonomní agentní systémy

Nepoužívej když...

  • Úlohy vyžadující extrémně nízkou latenci (real-time chat)
  • Běh na koncových zařízeních (edge computing)
Ideální pro:
Vývojáři AI agentůVýzkumníci v oblasti LLMStartupy s omezeným rozpočtem na API

💪 Silné a slabé stránky

+ Silné stránky

Kapacita výstupu

Podporuje generování až 262 144 tokenů na jeden výstup, což je technický parametr vhodný pro komplexní agentní úlohy a generování celých projektů.

Nákladová efektivita

Model je poskytován s nulovými poplatky za vstupní i výstupní tokeny, přičemž využívá robustní 397B MoE architekturu.

Multimodalita

Nativní podpora zpracování obrazu a textu rozšiřuje možnosti využití v automatizovaných systémech pro analýzu vizuálních dat.

Slabé stránky

Infrastrukturní nároky

Přestože je aktivních pouze 17B parametrů, celková velikost 397B vyžaduje masivní paměťovou infrastrukturu pro případný self-hosting nebo lokální běh.

Latence prvního tokenu

Vzhledem k celkové velikosti modelu a nutnosti směrování (routing) u MoE architektury může být latence při generování prvního tokenu (TTFT) vyšší ve srovnání s menšími hustými modely.

📝 Detailní popis

Nex-N2-Pro is an agentic mixture-of-experts model from Nex AGI, with 17B active parameters out of 397B total. Built on the Qwen3.5 architecture, it accepts text and image input and produces…

Unikátní charakteristiky

Nex-N2-Pro je rozsáhlý MoE model s 397 miliardami parametrů, z nichž je pouze 17 miliard aktivních při inferenci, což optimalizuje výpočetní náročnost. Technicky se odlišuje především symetrickým kontextovým oknem, které umožňuje nejen přijmout, ale i vygenerovat až 262 144 tokenů v jednom průchodu.

Silné stránky

Kapacita výstupu

Podporuje generování až 262 144 tokenů na jeden výstup, což je technický parametr vhodný pro komplexní agentní úlohy a generování celých projektů.

Nákladová efektivita

Model je poskytován s nulovými poplatky za vstupní i výstupní tokeny, přičemž využívá robustní 397B MoE architekturu.

Multimodalita

Nativní podpora zpracování obrazu a textu rozšiřuje možnosti využití v automatizovaných systémech pro analýzu vizuálních dat.

Slabé stránky

Infrastrukturní nároky

Přestože je aktivních pouze 17B parametrů, celková velikost 397B vyžaduje masivní paměťovou infrastrukturu pro případný self-hosting nebo lokální běh.

Latence prvního tokenu

Vzhledem k celkové velikosti modelu a nutnosti směrování (routing) u MoE architektury může být latence při generování prvního tokenu (TTFT) vyšší ve srovnání s menšími hustými modely.