Neuronová síť Googlu sledovala BBC tak dlouho, dokud se nenaučila odezírat z úst. Nejlépe ze všech

Neuronová síť Googlu sledovala BBC tak dlouho, dokud se nenaučila odezírat z úst. Nejlépe ze všech

Vědci z Oxfordu se před pár týdny pochlubili technologií LipNet, která dokáže odezírat z úst a to zhruba s 93,4% úspěšností na připraveném vzorku. Jejich program se nejprve pomocí obrazové analýzy naučil, jak se deformují lidská ústa při vyslovování jednotlivých slov, a pak už jen stačilo vytvořit model.

V Oxfordu mají rty asi opravdu rádi, naprosto identickému výzkumu se tu totiž věnovaly hned dva týmy. Ten druhý se s výsledky pochlubil o něco později, ovšem zmínku si rozhodně zaslouží, jednalo se totiž o projekt sponzorovaný laboratoří Google DeepMind pro vývoj umělé inteligence.

Klepněte pro větší obrázek
Strojové učení pracovalo podobně jako fotoaparát, který detekuje lidskou tvář. V tomto případě stroj hledal na snímcích ústa a pomocí přepisu mluveného slova se učil, jakým slovům odpovídají jednotlivé deformace úst.

Druhý tým k učení použil neuronovou síť z Londýna, která dostala za úkol sledovat jeden televizní pořad BBC za druhým a učit se. Po zhlédnutí tisíců hodin otevírání a zavírání úst vytvořila model, který nyní dokáže odezírat z úst s úspěšností 46,8 %.

46,8 % sice není 93,4 %, ale pozor! První tým dosáhl tak ohromné úspěšnosti jen na pečlivě připraveném vzorku, zatímco neuronová síť Googlu (DeepMindu) dokáže s poloviční úspěšností odezírat prakticky z jakéhokoliv obrazového vstupu.

46,8% úspěšnost je skvělá, když totiž z videí BBC odezíral lidský profesionál, dosáhl pouze 12,4 %.

Ačkoliv by podobná technologie mohla v reálném životě pomoci třeba lidem s poruchou sluchu – zvláště v kombinaci s převodem hlasu na text, nabízí se pochopitelně i kontroverznější použití. Představte si třeba orwellovský svět, ve kterém by podobná technologie jednou dokonale rozpoznala, o čem si lidé povídají třeba na náměstí, protože je zpovzdálí snímá běžná bezpečnostní kamera, jejíž obraz v dohledovém centru neustále analyzuje nějaká podobná neuronová síť budoucnosti.

Úvodní fotografie: Sergio Fabara Muñoz, CC-BY-SA

Témata článku: Google, Technologie, Věda, Strojové učení, Neuronová síť, Výzkum, DeepMind, Flickr.com, Oxford, BBC, Mluvené slovo, Dok

8 komentářů

Nejnovější komentáře

  • Ředitel ČTÚ 25. 11. 2016 11:40:29
    Jetli se říká, že tajný vojenský výzkum je 10 let před tím co známe obecně...
  • salpo1992 25. 11. 2016 11:31:53
    Ted uz jen zabudovat to do verejnych kamer, a mame po soukromi :)
  • StormBorec 25. 11. 2016 11:29:37
    Fascinující, podobně jako rozpoznávání obličejů ... Těžko říct, jestli...
Určitě si přečtěte

Právě vychází nový Computer: trápí vás slabý signál Wi-Fi?

Právě vychází nový Computer: trápí vás slabý signál Wi-Fi?

** MESH Wi-Fi sítě jsou skvělé, ale drahé. Známe levnější řešení ** Otestovali jsme NVMe a SATA SSD ** Příjemně nás překvapily batohy do 2 000 Kč

Dnes | Časopis Computer

A je to tady: Legendární Flash Player končí. Z webu definitivně zmizí v roce 2020

A je to tady: Legendární Flash Player končí. Z webu definitivně zmizí v roce 2020

** Web už nebude, co býval ** Adobe oznámilo ukončení vývoje jedné z internetových legend ** Flash Player definitivně utichne do konce roku 2020

Včera | Čížek Jakub | 9