Umělá inteligence v posledních letech zaznamenala obrovský růst, přičemž za to vděčí zejména tzv. hlubokým neuronovým sítím, které v současnosti dosahují nejlepších výsledků při rozpoznávání řeči, obrazu a dalších klasifikačních úlohách v porovnání s ostatními metodami.
Jedním z největších současných problémů jsou však studijní data. Algoritmy neuronových sítí jich pro strojové učení vyžadují enormní množství, což se z lidského úhlu pohledu jeví jako docela neefektivní.
Jen si to představte. Chcete svého potomka naučit chytat míč, a tak na něj hodíte milionkrát tenisák a budete doufat, že se naučí chytat sám od sebe. To zní děsivě, viďte? Nehledě na to, že by podobná metoda hraničila i s týráním dětí. A přesně tak dnes postupujeme v případě trénování standardních konvolučních sítí. Prostě na ně „hodíme“ balík dat a ony se učí.
Trénink neuronových sítí se ne vždy povede (viz zde):
|
|
|
„a young boy is holding a baseball bat."
|
„a horse is standing in the middle of a road."
|
„a woman holding a teddy bear in front of a mirror."
|
„mladý chlapec drží baseballovou pálku“
|
„kůň stojí uprostřed cesty“
|
„žena drží plyšového medvídka před zrcadlem“
|
Učící se kapsle
K největším ikonám A.I. posledních let patří sedmdesátiletý vědec z Googlu Geoffrey Hinton. Před pár dny společně se svým týmem publikoval dvě studie popisující tzv. kapslové sítě (1 a 2). Hintonovy kapslové sítě se svou přesností vyrovnaly současným nejlepším technikám, jak software naučit rozeznávat ručně psané číslice, a obstály i v testu rozpoznávání objektů z různých úhlů s poloviční chybou oproti konkurenci.
Nová metoda používá malé skupiny neuronů, které se kolektivně nazývají kapsle. Ty jsou organizované do vrstev tak, aby identifikovaly objekty ve videu nebo obrázcích. Když několik kapslí v jedné vrstvě dojde ke stejnému výsledku, aktivují kapsli na vyšší úrovni, a to se opakuje do té doby, než se daná síť finálně rozhodne, co přesně vidí. Každá z kapslí může být navrhnuta tak, aby detekovala specifickou vlastnost z obrázku i v takovém měřítku, že dokáže tuto vlastnost rozeznat v různých scénářích, například z více úhlů.
Ve vědeckých studiích se kapslové sítě používají v současnosti jenom pro identifikaci ručně psaných znaků a identifikaci objektů. Zatím není známo, jestli se dají použít pro všechny oblasti, ve kterých se v současné době používají hloubkové neuronové sítě. Zároveň je ze studií patrné, že nová metoda je oproti té staré mírně pomalejší.
Je otázkou, zdali tento systém nahradí ty současné. Můžeme očekávat, že komunita okolo strojového učení bude implementovat technologii kapslí do svých systémů a časem tak přijdeme na to, jestli je tento systém efektivní pouze pro počítačové vidění, anebo i pro jiné oblasti. Každopádně pokud jste se doposud obávali, že strojové učení narazilo na softwarové limity a dále je jen v rukou rychlejšího hardware, tohle je výrazný argument, že tomu tak ne vždy musí být.