Item: Perceptron: Perceptron Mk1
Author: Patrick Zandl

Perceptron: Perceptron Mk1

perceptron/perceptron-mk1

Perceptron Mk1 je vysoce specializovaný model pro vizuální a prostorové uvažování, který je ideální pro analýzu krátkých videí a obrazů, avšak jeho malé kontextové okno jej diskvalifikuje pro rozsáhlejší úlohy.

✦

Killer Feature Pokročilé ztělesněné uvažování (embodied reasoning) nad video vstupy za velmi nízkou cenu vstupních tokenů.

⚠

Skryté riziko Extrémně malé kontextové okno (32k) může vést k oříznutí dat při pokusu o analýzu i středně dlouhých videí s vysokým snímkováním.

$0.15 / 1M vstup

$1.5 / 1M výstup

33k kontext

8k max výstup

textimagevideo text Analýza videaZtělesněné uvažování (embodied reasoning)

📊 Orientační hodnocení

👁️ Multimodalita

Výborný

🧠 Reasoning

Dobrý

💰 Cena/Výkon

Dobrý

💻 Programování

Průměrný

📏 Kontextové okno

Slabý

Uvedená čísla jsou odhad LLM analyzátoru na základě popisu modelu, nikoli měřené benchmarky. Pro tento model jsme zatím nenašli dostatek publikovaných benchmarků k výpočtu VibeCode skóre.

⚖️ Porovnání s konkurencí

Model	Cenové srovnání	Poznámka
Perceptron Perceptron Mk1	← Právě prohlížíte	—
Google gemini-3.1-flash-lite	Mírně dražší vstup ($0.25 vs $0.15), stejná cena výstupu ($1.50).	Gemini nabízí masivní kontextové okno (1M tokenů) a silnou nativní multimodalitu, což z něj dělá lepší volbu pro analýzu dlouhých videí, na která Perceptron Mk1 nestačí kapacitou.
DeepSeek deepseek-v4-flash	Podobná cena vstupu ($0.14 vs $0.15), výrazně levnější výstup ($0.28 vs $1.50).	DeepSeek nabízí mnohem větší kontext (1M) a lepší celkovou cenu pro generování textu, avšak Perceptron může mít navrch ve specifických úlohách prostorového uvažování nad videem.
MistralAI mistral-small-2603	Stejná cena vstupu ($0.15), více než 2x levnější výstup ($0.60 vs $1.50).	Mistral má větší kontext (262k) a je nákladově efektivnější pro textové úlohy, ale pravděpodobně nedosahuje kvalit Perceptronu v nativním zpracování videa a ztělesněném uvažování.

🎯 Rozhodovací pomocník

✓

Použij když...

Extrakce informací z krátkých videoklipů
Prostorové uvažování nad statickými snímky
Analýza fyzikálních interakcí ve scéně

✗

Nepoužívej když...

Analýza dlouhých videí (nad limit 32k tokenů)
Generování rozsáhlých textových dokumentů
Běžné konverzační úlohy a zpracování velkých textových databází

Ideální pro:

Výzkumníci v oblasti robotikyAnalytici video obsahuVývojáři počítačového vidění

💪 Silné a slabé stránky

+ Silné stránky

Multimodalita

Nativní podpora zpracování obrazu a videa pro komplexní vizuální dotazy a prostorové uvažování.

Cena vstupu

Velmi nízká cena za vstupní tokeny ($0.15/1M) umožňuje nákladově efektivní zpracování vizuálních dat, pokud se vejdou do kontextu.

− Slabé stránky

Kontextové okno

Kapacita 32 768 tokenů je v porovnání se současným standardem (1M+ tokenů) výrazně omezující, zejména pro analýzu delších videí.

Cena výstupu

Asymetrický cenový model, kde je výstup 10x dražší než vstup ($1.50/1M), prodražuje generování dlouhých textových analýz.

📝 Detailní popis

Perceptron Mk1 (Mark One) je nejkvalitnější model vidění a jazyka od Perceptronu pro video a ztělesněné usuzování. Přijímá obrazové a video vstupy spárované s dotazy v přirozeném jazyce a vytváří podrobné vizuální porozumění…

Unikátní charakteristiky

Perceptron Mk1 je specializovaný vizuálně-jazykový model navržený primárně pro hluboké porozumění videu a ztělesněné uvažování. Vyniká schopností zpracovávat komplexní vizuální vstupy, avšak zaostává ve velikosti kontextového okna, které je omezeno na pouhých 32 tisíc tokenů.

Silné stránky

Multimodalita

Nativní podpora zpracování obrazu a videa pro komplexní vizuální dotazy a prostorové uvažování.

Cena vstupu

Velmi nízká cena za vstupní tokeny ($0.15/1M) umožňuje nákladově efektivní zpracování vizuálních dat, pokud se vejdou do kontextu.

Slabé stránky

Kontextové okno

Kapacita 32 768 tokenů je v porovnání se současným standardem (1M+ tokenů) výrazně omezující, zejména pro analýzu delších videí.

Cena výstupu

Asymetrický cenový model, kde je výstup 10x dražší než vstup ($1.50/1M), prodražuje generování dlouhých textových analýz.