Strojové učení | Neuronová síť | DeepMind

Neuronová síť Googlu sledovala BBC tak dlouho, dokud se nenaučila odezírat z úst. Nejlépe ze všech

Neuronová síť Googlu sledovala BBC tak dlouho, dokud se nenaučila odezírat z úst. Nejlépe ze všech

Vědci z Oxfordu se před pár týdny pochlubili technologií LipNet, která dokáže odezírat z úst a to zhruba s 93,4% úspěšností na připraveném vzorku. Jejich program se nejprve pomocí obrazové analýzy naučil, jak se deformují lidská ústa při vyslovování jednotlivých slov, a pak už jen stačilo vytvořit model.

V Oxfordu mají rty asi opravdu rádi, naprosto identickému výzkumu se tu totiž věnovaly hned dva týmy. Ten druhý se s výsledky pochlubil o něco později, ovšem zmínku si rozhodně zaslouží, jednalo se totiž o projekt sponzorovaný laboratoří Google DeepMind pro vývoj umělé inteligence.

Klepněte pro větší obrázek
Strojové učení pracovalo podobně jako fotoaparát, který detekuje lidskou tvář. V tomto případě stroj hledal na snímcích ústa a pomocí přepisu mluveného slova se učil, jakým slovům odpovídají jednotlivé deformace úst.

Druhý tým k učení použil neuronovou síť z Londýna, která dostala za úkol sledovat jeden televizní pořad BBC za druhým a učit se. Po zhlédnutí tisíců hodin otevírání a zavírání úst vytvořila model, který nyní dokáže odezírat z úst s úspěšností 46,8 %.

46,8 % sice není 93,4 %, ale pozor! První tým dosáhl tak ohromné úspěšnosti jen na pečlivě připraveném vzorku, zatímco neuronová síť Googlu (DeepMindu) dokáže s poloviční úspěšností odezírat prakticky z jakéhokoliv obrazového vstupu.

46,8% úspěšnost je skvělá, když totiž z videí BBC odezíral lidský profesionál, dosáhl pouze 12,4 %.

Ačkoliv by podobná technologie mohla v reálném životě pomoci třeba lidem s poruchou sluchu – zvláště v kombinaci s převodem hlasu na text, nabízí se pochopitelně i kontroverznější použití. Představte si třeba orwellovský svět, ve kterém by podobná technologie jednou dokonale rozpoznala, o čem si lidé povídají třeba na náměstí, protože je zpovzdálí snímá běžná bezpečnostní kamera, jejíž obraz v dohledovém centru neustále analyzuje nějaká podobná neuronová síť budoucnosti.

Úvodní fotografie: Sergio Fabara Muñoz, CC-BY-SA

Diskuze (8) Další článek: Podívejte se na unikátní hudební videoklip natočený pouze za 4,2 sekundy

Témata článku: Technologie, Google, Věda, Výzkum, Strojové učení, Neuronová síť, DeepMind, Román, Zavírání, Flickr.com, Úvodní fotografie, Dok, Google DeepMind, Druhý tým, Nen, Oxford, BBC, Televizní pořad, Mluvené slovo, Deformace, Levné fotoaparáty na Mall.cz


Určitě si přečtěte

Google Coral: Raspberry Pi s čipem, který zpracuje 4 biliony operací za sekundu

Google Coral: Raspberry Pi s čipem, který zpracuje 4 biliony operací za sekundu

** Je to velké jako Raspberry Pi ** Ale je to až o několik řádů rychlejší ** Dorazil nám exotický Google Coral s akcelerátorem Edge TPU

Jakub Čížek | 18

Šmírování kamerami Googlu: Koukněte, co šíleného se objevilo na Street View

Šmírování kamerami Googlu: Koukněte, co šíleného se objevilo na Street View

Google stále fotí celý svět do své služby Street View. A novodobou zábavou je hledat v mapách Googlu vtipné záběry. Podívejte se na výběr nejlepších!

redakce | 6

Starý smartphone nemusí skončit v koši. 10 způsobů, jak ho ještě můžete využít

Starý smartphone nemusí skončit v koši. 10 způsobů, jak ho ještě můžete využít

** Co dělat s vysloužilým chytrým telefonem? Neházejte ho do koše! ** Našli jsme pro vás deset možností, jak ho prakticky využít ** I stará zařízení tak mohou být užitečná

Karel Kilián | 47