Modely a strategie zpracování
Při každém přepisu si volíte strategii (kde se zpracování provede) a model (jaký AI engine přepis vytvoří). Správná volba zásadně ovlivní přesnost, rychlost a soukromí vašich dat.
Dostupné modely závisí na konfiguraci administrátora
Tato stránka popisuje všechny modely, které Inkscriptio podporuje. Na vašem serveru jsou aktivní pouze ty, které povolil administrátor — ostatní se v nabídce nezobrazí.
Aktuálně aktivní modely: lokálně WhisperX a Qwen3-ASR. Pro sumarizaci lokálně Qwen3:8B, cloudově Claude Haiku (cloud sumarizace momentálně vypnuta).
Strategie: Local vs. Cloud
| Local | Cloud | |
|---|---|---|
| Kde se zpracovává | Na vašem serveru | U externího poskytovatele (OpenAI, Google, …) |
| Soukromí dat | Data neopustí server | Data odcházejí třetí straně |
| Rychlost | Závisí na hardware | Obvykle rychlé |
| Náklady | Bez poplatků za zpracování | Platba za minutu/token |
| Dostupnost | Vždy, i offline | Vyžaduje připojení a API klíč |
Doporučení
Pro citlivé nahrávky (interní schůzky, osobní data) vždy volte Local. Cloud použijte pro nárazové velké objemy nebo pokud lokální hardware nestačí.
Secure mode
Secure mode lze nastavit samostatně pro přepis a pro sumarizaci. Pokud je zapnutý Secure mode pro přepis (administrátorem nebo ve vašem profilu), Cloud strategie přepisu je skryta. Secure mode pro sumarizaci nezávisle omezuje cloudové poskytovatele shrnutí.
Lokální modely
Whisper (faster-whisper)
Nejuniverzálnější volba. Podporuje přes 90 jazyků.
| Model | Rychlost | Přesnost | Vhodné pro |
|---|---|---|---|
| Tiny / Base | ⚡⚡⚡ Velmi rychlý | ★★☆ | Rychlý náhled, kvalitní nahrávky |
| Small / Medium | ⚡⚡ Rychlý | ★★★ | Standardní použití |
| Large-v3 | ⚡ Pomalejší | ★★★★ | Nejlepší přesnost, složité podmínky |
| Turbo | ⚡⚡ Rychlý | ★★★★ | Dobrý kompromis rychlost/přesnost |
WhisperX
WhisperX je vylepšená verze Whisper s přesným zarovnáním na úrovni slov a automatickou identifikací mluvčích (diarizace).
- Ideální pro: nahrávky s více mluvčími (schůzky, rozhovory, panely)
- Výstup: každý segment je označen, kdo mluví (SPEAKER_00, SPEAKER_01, …)
- Rychlost: přibližně 1/10 délky nahrávky
- Podporuje live přepis: Ano
Qwen3-ASR
Model od Alibaba, výborný pro češtinu a 52 dalších jazyků.
- Rychlý, srovnatelný s WhisperX (přibližně 1/10 délky nahrávky)
- Časy segmentů jsou odhadované (ne z analýzy zvuku)
- Podporuje live přepis: Ne
NVIDIA Parakeet TDT 0.6B
Specializovaný model pro 25 evropských jazyků včetně češtiny s přesnými časovými razítky na úrovni slov.
- Vynikající volba pro české nahrávky
- Zvládá soubory až 3 hodiny v jednom průchodu
- Podporuje live přepis: Ne
Cloudové modely
Cloudové modely jsou dostupné pouze pokud má administrátor nastaveny API klíče příslušných služeb.
Podmínky použití dat
Při použití cloudových modelů jsou vaše nahrávky odesílány externímu poskytovateli. Před použitím zkontrolujte jejich podmínky — zejména zda data využívají pro trénování modelů. Viz Bezpečnost a soukromí.
| Model | Poskytovatel | Silné stránky |
|---|---|---|
| OpenAI Whisper v3 | OpenAI | Univerzální, vysoká přesnost |
| Google Chirp 3 | Google Cloud | Nahrávky až 8 hodin bez rozdělení |
| ElevenLabs Scribe v2 | ElevenLabs | Vestavěná diarizace až 32 mluvčích |
| Deepgram Nova-3 | Deepgram | Dávkové soubory i živé nahrávání, vestavěná diarizace |
Identifikace mluvčích (Diarizace)
Automatické rozlišení, kdo mluví, podporují tyto modely:
- WhisperX — lokální, velmi přesné
- ElevenLabs Scribe v2 — cloudový, až 32 mluvčích
- Deepgram Nova-3 — cloudový, dávkové i live nahrávání
Ostatní modely přepis vytvoří bez označení mluvčích.
Zpracování dlouhých nahrávek
Pro soubory delší než 15 minut aplikace automaticky nahrávku rozdělí na překrývající se části, každou zpracuje zvlášť a výsledky inteligentně sloučí. Tento proces probíhá zcela automaticky — nemusíte nic nastavovat. U velmi dlouhých nahrávek (2+ hodiny) může zpracování trvat desítky minut.
Live přepis
Pouze modely označené jako Live capable jsou dostupné při živém nahrávání. Jde o modely na bázi faster-whisper (Tiny až Large-v3, Turbo, WhisperX) a Deepgram Nova-3. Modely Qwen3-ASR a Parakeet live přepis nepodporují.