O projektu
Tři studenti s nadšením dělat něco nového. Něco, co tu ještě nebylo. Snad jako každého nás unesla schopnost zahraničních nástrojů komplexně opravovat chyby v angličtině, a tak nás napadlo se o něco podobného pokusit i pro naši mateřštinu.
Více než rok vývoje
Po více než roce vývoje tak představujeme výsledek našeho úsilí. Ještě nejsme v cíli, i s omezenými zdroji jsme ale došli daleko dál, než kterýkoliv jiný dostupný nástroj. A naše cesta tady rozhodně nekončí. Nejlepší způsob, jak nám pomoct vytvořit ještě lepší korekthor, je pořídit si předplatné. Vyjde vás to na méně než jedno kafe měsíčně za nejpokročilejší automatickou opravu češtiny!
Neuronové sítě
Po vzoru úspěšných zahraničních nástrojů jsme místo algoritmického přístupu sáhli po neuronových sítích. Korekthor tak narozdíl od kteréhokoliv jiného dostupného systému dokáže opravit i chyby závislé na kontextu.
Co všechno korekthor opraví?
Níže najdete výčet chyb, které se korekthor snaží opravovat. Různé chyby označuje korekthor s různou úspěšností.
Chyby hledané neuronovými sítěmi
- Chybějící/přebývající čárka
- Velká písmena u slov, kde záleží na jejich kontextu
- I/Y/A na konci slov
- Rozdíl mezi slovy jakýkoliv a kterýkoliv
- Chybné tvary zájmena jenž
- Rozdíl mezi J a N na začátku zájmena (ji/ni, jíž/níž apod.)
- Rozdíl mezi jsi a si
- Rozdíl mezi kromě a mimo
- Chybné tvary zájmen který a jaký
- Rozdíl mezi mě a mně
- Chybějící/přebytečná mezera za jednotkou (např. 10%/10 %)
- Chybná délka předložky (s/se, z/ze apod.)
- Rozdíl mezi S a Z na začátku slova
- Rozdíl mezi s sebou a sebou
- Oprava překlepů, které vytvoří platné slovo ze slovníku
Chyby hledané algoritmicky
- Rozdíl mezi spojovníkem a pomlčkou
- Oprava anglických uvozovek ("x") na české („x“)
- Chybná pozice interpunkce na konci citace („x,“/„x“,)
- Změna třech teček na výpustku
- Oprava překlepů, které nevytvoří platné slovo ze slovníku
- Odstranění symbolu ,-
- Nahrazení běžných mezer za nedělitelné mezery
- Velká písmena u slov, kde nezáleží na jejich kontextu
- Odstanění násobných interpunkcí a mezer