Věda | Umělá inteligence | Výzkum

Umělá inteligence se učí řeč jako dítě, které pozoruje okolí

  • Vědci vytvořili nový systém učení řeči pro umělou inteligenci
  • Systém je podobný tomu lidskému, stejně jako se učí děti
  • Nová technika odhaluje i fungování lidského mozku
Umělá inteligence se učí řeč jako dítě, které pozoruje okolí

Vědci z MIT představili nové řešení pro učení umělé inteligence, která je určená pro zpracování a chápání lidské řeči. Oproti jednodušším strojovým přístupům se ale inspirovali u člověka a používají tak „biologický“ přístup, který je více zaměřen na pozorování okolí.

Než se člověk naučí řeč, což zahrnuje jak jednotlivá slova, tak i větnou skladbu a kontext, trvá to několik let. Alespoň pokud se začíná z ničeho (narozené dítě). Tento přístup byl zvolen i u nového sémantického parseru, který se učí vše od začátku a musí sám zjistit, co jaká slova vlastně znamenají a v jakém kontextu.

Vytrvalé pozorování

Podobně jako děti, které během let postupně vidí obrovské množství obrazu spojeného se zvukem, se i testovaná umělá inteligence musí poprat s tím, že vidí pouze video, které je navíc doplněno o titulky.

Jakmile tak různé osoby na videu něco říkají, dělají nebo vnímají (přes 400 testovacích videí), umělá inteligence tuto kombinaci zpracuje a zároveň tak uloží i kontext se slovy v titulcích. Programátoři nic dalšího dopředu umělou inteligenci nenaučili.

Oproti jiným systémům učení tak dochází k naprosto minimálnímu zásahu do učení a korekci, což je srovnatelné právě s dítětem, které většinu času pouze pozoruje a poslouchá, aniž by ho okolní lidé nějak speciálně učili. Výsledkem bylo, že „sentence tracker“ posléze dokázal na videu rozpoznat například událost „žena, která zvedá jablko“ a další podobné akce.

Klepněte pro větší obrázek
Ukázka různých snímků a jejich analýzy umělou inteligencí

Díky tomu se umělá inteligence dokáže podobně jako dítě naučit různé nuance jazyka daného okolí, takže dle dostupných materiálů v podobě videa se může měnit i řeč a styl mluvy.

Čus kámo

Systém je velmi dobrou ukázkou nejen pro učení jazyka od samotného začátku, ale i přizpůsobení v jiném okolí. Jako typický příklad si lze představit to, že budoucí roboti a umělé inteligence se budou vyskytovat na různých místech, v různých rodinách a podobně.

Aby jejich pozice na daném místě nebo v rodině byla co nejpřirozenější, musí se naučit trochu jiný styl jazyka, jeho použití a vnímání kontextu dle nových pravidel. S tím souvisí i nový systém obvyklého vyjadřování při pozdravení a dalších činnostech, v pokročilejších stádiích třeba i vtipech a interakci s jednotlivými lidmi zvlášť. Právě přizpůsobitelnost dle pozorování videa (obrazu) je klíčovou technologií nového systému učení řeči.

Porozumění učení řeči

Nový systém také poodkrývá roušku toho, jak v lidském mozku probíhá učení řeči už v raném věku. V případě člověka ale pochopitelně nejde jen o pasivní video s titulky, ale o neustálý interaktivní přísun informací jak z očí, tak i z uší, který je doplněn i spoustou komplexního dodatečného vnímání například emocí a dalších jemných variací, které jsou pro kontext rovněž důležité.

Je jasné, že budoucí systémy budou s těmito dodatečnými informacemi počítat a budou se tak učit i tyto jemné informace, které jsou důležité při komunikaci mezi lidmi. V další fázi chtějí vědci systém posunout směrem k větší interaktivitě a zase tak o něco přiblížit systém k tomu, jak funguje dětský mozek v reálném světě.

Originální materiál k výzkumu naleznete zde (PDF)

Diskuze (5) Další článek: Samořídicí auta vjedou už i do hlavního města USA. Ford tam získal povolení k testování

Témata článku: Věda, Umělá inteligence, Výzkum, PDF, Dobrá ukázka, Pokročilé stádium, Dodatečná informace, Pozdrav, Nová technika, Nové pravidlo, Kontext, Nový systém, Minimální zásah, Nové řešení, Raný věk, Typický příklad, Inteligence, Okolí, Dostupný materiál, Reálný svět, Klíčová technologie, Lidský mozek, Budoucí systém, Řeč, Lidská řeč


Určitě si přečtěte

Porno insider: Jak virtuální realita vstupuje do filmů pro dospělé

Porno insider: Jak virtuální realita vstupuje do filmů pro dospělé

** Pornografie údajně představuje třetinu internetové obsahu a je technologický tahounem ** Do erotického obsahu postupně zasahuje i virtuální realita ** Kromě vizuálního vjemu se pracuje také na virtuálním uspokojení toho hmatového

Jan Dudek | 32

Zbavujeme se Googlu: vybíráme nejlepší alternativy, které nahradí jeho služby

Zbavujeme se Googlu: vybíráme nejlepší alternativy, které nahradí jeho služby

** Google nabízí spoustu služeb, ale většina z nich má i dobré alternativy ** Pokud z nějakého důvodu nechcete používat služby Googlu, nemusíte ** Připravili jsme přehled služeb, kterými lze ty od Googlu nahradit

Karel Javůrek, David Polesný | 90

Levný televizor místo drahého 4K HDR monitoru? Na co si musíte dát pozor

Levný televizor místo drahého 4K HDR monitoru? Na co si musíte dát pozor

** 43", 4K, 60 Hz a HDR k tomu za deset tisíc ** Televizor takových parametrů stojí téměř polovinu, co monitor ** Využití televize jako monitoru přináší řadu kompromisů, ale jde to

Tomáš Holčík | 63