Strojové učení | Neuronová síť | DeepMind

Neuronová síť Googlu sledovala BBC tak dlouho, dokud se nenaučila odezírat z úst. Nejlépe ze všech

Neuronová síť Googlu sledovala BBC tak dlouho, dokud se nenaučila odezírat z úst. Nejlépe ze všech

Vědci z Oxfordu se před pár týdny pochlubili technologií LipNet, která dokáže odezírat z úst a to zhruba s 93,4% úspěšností na připraveném vzorku. Jejich program se nejprve pomocí obrazové analýzy naučil, jak se deformují lidská ústa při vyslovování jednotlivých slov, a pak už jen stačilo vytvořit model.

V Oxfordu mají rty asi opravdu rádi, naprosto identickému výzkumu se tu totiž věnovaly hned dva týmy. Ten druhý se s výsledky pochlubil o něco později, ovšem zmínku si rozhodně zaslouží, jednalo se totiž o projekt sponzorovaný laboratoří Google DeepMind pro vývoj umělé inteligence.

Klepněte pro větší obrázek
Strojové učení pracovalo podobně jako fotoaparát, který detekuje lidskou tvář. V tomto případě stroj hledal na snímcích ústa a pomocí přepisu mluveného slova se učil, jakým slovům odpovídají jednotlivé deformace úst.

Druhý tým k učení použil neuronovou síť z Londýna, která dostala za úkol sledovat jeden televizní pořad BBC za druhým a učit se. Po zhlédnutí tisíců hodin otevírání a zavírání úst vytvořila model, který nyní dokáže odezírat z úst s úspěšností 46,8 %.

46,8 % sice není 93,4 %, ale pozor! První tým dosáhl tak ohromné úspěšnosti jen na pečlivě připraveném vzorku, zatímco neuronová síť Googlu (DeepMindu) dokáže s poloviční úspěšností odezírat prakticky z jakéhokoliv obrazového vstupu.

46,8% úspěšnost je skvělá, když totiž z videí BBC odezíral lidský profesionál, dosáhl pouze 12,4 %.

Ačkoliv by podobná technologie mohla v reálném životě pomoci třeba lidem s poruchou sluchu – zvláště v kombinaci s převodem hlasu na text, nabízí se pochopitelně i kontroverznější použití. Představte si třeba orwellovský svět, ve kterém by podobná technologie jednou dokonale rozpoznala, o čem si lidé povídají třeba na náměstí, protože je zpovzdálí snímá běžná bezpečnostní kamera, jejíž obraz v dohledovém centru neustále analyzuje nějaká podobná neuronová síť budoucnosti.

Úvodní fotografie: Sergio Fabara Muñoz, CC-BY-SA

Diskuze (8) Další článek: Podívejte se na unikátní hudební videoklip natočený pouze za 4,2 sekundy

Témata článku: Technologie, Věda, Google, Výzkum, síť, Strojové učení, Neuronová síť, DeepMind, Nen, Oxford, Flickr.com, Google DeepMind, Televizní pořad, Román, Mluvené slovo, Úvodní fotografie, Deformace, BBC, Zavírání, Druhý tým, Dok, Levné fotoaparáty na Mall.cz


Určitě si přečtěte

Pozor, na Česko v těchto dnech útočí falešné Tesco, Penny Market a Lidl

Pozor, na Česko v těchto dnech útočí falešné Tesco, Penny Market a Lidl

** Máme tu další českou phishingovou vlnu ** Podle průzkumů máme stále problém s kybernetickou gramotností ** Nebezpečím jsou děti, které opouštějí rodiče

Jakub Čížek | 37

Šmírování kamerami Googlu: Koukněte, co šíleného se objevilo na Street View

Šmírování kamerami Googlu: Koukněte, co šíleného se objevilo na Street View

Google stále fotí celý svět do své služby Street View. A novodobou zábavou je hledat v mapách Googlu vtipné záběry. Podívejte se na výběr nejlepších!

redakce | 7

13 praktických tipů a triků pro Mapy.cz, které možná neznáte

13 praktických tipů a triků pro Mapy.cz, které možná neznáte

** Mapy.cz neslouží jen k zobrazení podkladů a plánování tras ** Nabízejí celou řadu dalších praktických funkcí a možností ** Vybrali jsme třináct tipů a triků, o kterých možná nevíte

Karel Kilián | 36

Nejlepší příslušenství k počítači. Tipy na osvědčené klávesnice, tiskárny, routery…

Nejlepší příslušenství k počítači. Tipy na osvědčené klávesnice, tiskárny, routery…

** Tipy na klávesnice, myši, routery, tiskárny, sluchátka a další věci k počítačům ** Poradíme, s jakými produkty neuděláte chybu ** Vybíráme jak příslušenství na běžnou práci, tak na hraní her

David Polesný | 22