M
Minimax 18. 3. 2026

MiniMax: MiniMax M2.7

minimax/minimax-m2.7

Specializovaný model pro scénáře vyžadující masivní generování textu a autonomní rozhodování, který nabízí skvělý poměr ceny a výkonu, pokud nepotřebujete vizuální vstupy.

Killer Feature Obrovský limit 131k výstupních tokenů, který umožňuje modelu napsat celou knihu nebo modul kódu na jeden prompt.
Skryté riziko Absence multimodálních vstupů může být kritickou překážkou pro agenty, kteří potřebují 'vidět' GUI aplikací.
$0.3 / 1M vstup
$1.2 / 1M výstup
205k kontext
131k max výstup
text text Autonomní agentiProduktivitaGenerování dokumentů

📊 VibeCode skóre

48 / 100
Coding (váha 60 %) 31.4
Reasoning (váha 30 %) 71.8
Kontext (váha 10 %) 76.3

Spolehlivost medium. Coding složka pochází z BridgeBench Quality (agregát 7 sub-testů: UI, security, debugging, refactoring, hallucination, BS detection, reasoning). Reasoning složka z 3 benchmarků (GPQA Diamond, MMLU-Pro, HLE). Agents benchmarky (TAU-bench, MMAU) do skóre nezahrnujeme kvůli nízkému pokrytí napříč modely.

🧪 BridgeBench · nezávislý „vibe coding" benchmark

Quality
31.4
agregát 7 sub-testů
Vibe
30.1
celkový dojem
UI
62.3
generování UI
Security
9.1
detekce zranitelností
Debugging
67.7
ladění chyb
Refactoring
49
zlepšení kódu
Hallucination
66.8
odolnost vůči halucinacím
BS detection
47
odhalení nesmyslů
Reasoning
37.5
30 těžkých úloh (jiná škála)
Speed
68 tok/s
tokenová rychlost

Zdroj: bridgebench.ai/overall. BridgeBench sjednocuje 7 testů zaměřených na reálné programovací úlohy. Jeho Reasoning kategorie používá 30 velmi těžkých úloh a nelze ji přímo porovnávat s GPQA/MMLU.

🎯 Publikované benchmarky

Benchmark Kategorie Skóre Zdroj
SWE-bench Verified coding 78% ↗ nezávislý
LiveCodeBench coding 79.93% ↗ nezávislý
GPQA Diamond reasoning 87.4% ↗ nezávislý
MMLU-Pro reasoning 80.43% ↗ nezávislý
Humanity’s Last Exam reasoning 28.1% ↗ nezávislý

Found independent benchmark scores for MiniMax M2.7 across Vals AI, Artificial Analysis, OpenRouter, and tech blogs. The model scores 78.0% on SWE-bench Verified, 79.93% on LiveCodeBench, 87.4% on GPQA Diamond, and 80.43% on MMLU Pro. Agentic benchmarks like TAU-bench retail/airline and MMAU were not publicly available for this specific version.

⚖️ Porovnání s konkurencí

Model Cenové srovnání Poznámka
Minimax MiniMax M2.7
← Právě prohlížíte
DeepSeek DeepSeek V3.2
Podobný vstup ($0.26 vs $0.30), ale 3x levnější výstup ($0.38 vs $1.20) DeepSeek nabízí lepší poměr cena/výkon pro obecné úlohy, ale MiniMax má výrazně vyšší limit pro generování textu (output tokens).
Mírně levnější ($0.25/$1.50), srovnatelná cenová hladina Gemini nabízí 5x větší kontextové okno (1M) a multimodalitu, což z něj činí univerzálnější volbu pro analýzu velkých dat.
MistralAI Devstral 2512
Dražší vstup ($0.40) i výstup ($2.00) Oba modely cílí na vývojáře a kódování. MiniMax je ekonomičtější volbou s lepšími deklarovanými výsledky v autonomních úlohách.

🎯 Rozhodovací pomocník

Použij když...

  • Generování celých projektových dokumentací
  • Autonomní debugging v terminálu
  • Komplexní finanční modelování

Nepoužívej když...

  • Analýzu videa nebo obrázků
  • Zpracování extrémně velkých kontextů (>200k tokenů)
Ideální pro:
Vývojáři autonomních agentůFinanční analyticiTvůrci dlouhého obsahu

💪 Silné a slabé stránky

+ Silné stránky

Výstupní kapacita

Max output 131 072 tokenů umožňuje generování celých reportů nebo rozsáhlých kódových bází v jednom průchodu, což překonává většinu konkurence.

Agentní schopnosti

Vysoké skóre v SWE-Pro (56,2 %) a Terminal Bench 2 (57,0 %) naznačuje silnou schopnost pracovat s nástroji a terminálem.

Cena

S cenou $0.30 za 1M vstupních tokenů je vysoce konkurenceschopný pro náročné RAG aplikace.

Slabé stránky

Kontextové okno

Kapacita 204 800 tokenů je v prosinci 2025 podprůměrná (konkurence běžně nabízí 1M+).

Multimodalita

Omezení pouze na text-to-text (chybí zpracování obrazu) limituje využití v moderních multimodálních agentních systémech.

📝 Detailní popis

MiniMax-M2.7 je velký jazykový model nové generace navržený pro autonomní produktivitu v reálném světě a neustálé zlepšování. M2.7, vytvořený pro aktivní účast na vlastní evoluci, integruje pokročilé agentní schopnosti prostřednictvím multi-agentní spolupráce, což mu umožňuje plánovat, provádět a vylepšovat komplexní úkoly v dynamických prostředích.

M2.7, trénovaný pro výkon na úrovni produkce, zvládá pracovní postupy, jako je živé ladění, analýza základní příčiny, finanční modelování a kompletní generování dokumentů v aplikacích Word, Excel a PowerPoint. Dosahuje silných výsledků v benchmarkách, včetně 56,2 % na SWE-Pro a 57,0 % na Terminal Bench 2, a zároveň dosahuje 1495 ELO na GDPval-AA, čímž nastavuje nový standard pro multi-agentní systémy fungující v reálných digitálních pracovních postupech.

Unikátní charakteristiky

MiniMax M2.7 se specializuje na agentní pracovní postupy a autonomní vykonávání úkolů s důrazem na extrémně dlouhý výstupní limit (131k tokenů). Model je navržen pro ‘self-evolution’ a komplexní operace v reálném světě, jako je ladění kódu nebo finanční modelování, spíše než jen pro prostou konverzaci.

Silné stránky

Výstupní kapacita

Max output 131 072 tokenů umožňuje generování celých reportů nebo rozsáhlých kódových bází v jednom průchodu, což překonává většinu konkurence.

Agentní schopnosti

Vysoké skóre v SWE-Pro (56,2 %) a Terminal Bench 2 (57,0 %) naznačuje silnou schopnost pracovat s nástroji a terminálem.

Cena

S cenou $0.30 za 1M vstupních tokenů je vysoce konkurenceschopný pro náročné RAG aplikace.

Slabé stránky

Kontextové okno

Kapacita 204 800 tokenů je v prosinci 2025 podprůměrná (konkurence běžně nabízí 1M+).

Multimodalita

Omezení pouze na text-to-text (chybí zpracování obrazu) limituje využití v moderních multimodálních agentních systémech.

🔗 Další modely od Minimax