Open source | Mozilla

Mozilla Common Voice pro rozpoznávání řeči bude dostupný i v Česku. Zapojte se do sběru potřebných dat

V létě minulého roku spustila Mozilla sběr dat pro Common Voice, open-source projekt s cílem vybudovat otevřenou platformu pro rozpoznávání řeči. Primárně jej zprovoznila v angličtině s příslibem postupného přibývání dalších jazyků. Nyní se díky tuzemské komunitě dostalo i na češtinu a na webu voice.mozilla.cz se kdokoliv může zapojit do první fáze projektu – sběru dostatečného množství vět pro pozdější převod.

Common Voice funguje na jednoduchém principu, kdy uživatelé předčítají vzorové věty. Čím víc vzorků, tím spolehlivější bude následný převod na text. Pro českou verzi je však třeba nejprve sesbírat alespoň dva tisíce zmíněných vzorových vět. Ty mohou uživatelé odesílat primárně ze zdrojů publikovaných pod svobodnou licencí CC0. Těmi mohou být třeba knihy, na která se již nevztahují autorská práva. V rámci nástroje pro Cherry picking jsou potom vybrány věty vhodné pro Common Voice.

Snímek obrazovky 2018-02-26 v 14.42.50.png
Stačí zkopírovat kus textu z volného díla a nástroj sám vybere vhodné věty pro Common Voice

Až dojde k sesbírání dostatečného množství těchto vět, bude spuštěna druhá fáze projektu – sběr nahrávek, kde budou uživatelé ony věty předčítat.

Váš názor Další článek: Největší rival SpaceX pracuje na vlastní opakovaně použitelné raketě

Témata článku: , , , , , , , , , , , , , , , , , , , , , , , ,