IQ testy umělé inteligence

Pro měření intelektu člověka byly vynalezeny IQ testy. Jak ale uchopit inteligenci strojů? Výzkumníci se pokoušejí zjistit, jaké úrovně inteligence AI skutečně dosáhla - a kdy překoná tu lidskou.

V roce 1979 vstoupilo na scénu šachového sportu zázračné dítě ze Sovětského svazu. Tehdy šestnáctiletý Garri Kasparov zvítězil na mezinárodním šachovém turnaji v jugoslávské Banja Luce. Až o 18 let později, v roce 1997, byl Kasparov znovu poražen na významném turnaji. Tentokrát však nikoli člověkem, ale šachovým programem Deep Blue od společnosti IBM.

Šachy byly dlouho považovány za exkluzivní záležitost pro lidský rozum. Ještě rok před zápasem Kasparov tvrdil, že ho šachový program nikdy nedokáže porazit. Po vítězství Deep Blue si odborníci pospíšili význam šachu relativizovat - vítězství bylo na jedné straně považováno za „milník výzkumu“, na druhé straně označováno jako „slepá ulička“, protože přemýšlení šachového počítače je založeno na hrubé výpočetní síle a nemá co do činění se skutečnou umělou inteligencí.

Stroje však už dávno dobyly mnohé pevnosti, v nichž předtím dominovala lidská inteligence. Co například jazykové hádanky nebo jemné narážky? Umělá inteligence Watson od IBM jim rozumí lépe než nejlepší hráči světa. Nebo oblast rozpoznání objektů? Software od Microsoftu MRSA 2015 byl v soutěži Large Scale Visual Recognition Challenge s podílem chyb kolem pěti procent spolehlivější než lidské pokusné osoby. Dešifrování písma či porozumění mluvenému slovu? Umělé neuronové sítě to umí již dlouho lépe než lidská inteligence. Jiným příkladem může být software z univerzity v Cambridge, který dokáže na základě lajků na Facebooku odhadnout znaky osobnosti lépe než životní partner.

Opravdu odborní idioti?

Ačkoli AI dosáhla nesporných úspěchů, stále nemůže být řeči o skutečné inteligenci. Podle Davida Gelerntera z Yaleovy univerzity jsou stroje vybavené umělou inteligencí jenom „fachidioti“, kteří zvládají pouze jediný úkol. Mohou být tedy stroje doopravdy inteligentní? Praotec všech testů inteligence pro stroje pochází od průkopníka informatiky Alana Turinga. Ten již v roce 1950 navrhl „imitační hru“, při níž se člověk může zmýlit v tom, jestli jeho partner v chatu je bot nebo jiný člověk. Nedá-li se při této hře rozlišit člověk od stroje, může být stroj podle Turinga skutečně považován za inteligentní.

V roce 2014, kdy uplynulo 60 let od smrti zmíněného matematika, podrobila Univerzita v Readingu pět superpočítačů Turingovu testu. Stroje absolvovaly sérii psaných rozhovorů o délce pěti minut. Počítače, které byly ve více než 30 procentech případů považovány za člověka, podle definice v testu obstály. Superpočítač Eugene z Ruska přitom dosáhl kvóty 33 procent.

Mnozí experti však tento test kritizovali a poukazovali na to, že nebyl provedený správně a testovací čas pěti minut byl příliš krátký. Ve vzduchu stále visí otázka - je inteligence skutečně tím, co počítače neumějí? Ve kterých testech by stroje musely obstát, abychom jim mohli skutečnou inteligenci přisoudit?

Nové inteligenční benchmarky

Podle psychologa Garyho Marcuse z Univerzity v New Yorku je Turingův test jenom začátek a nyní je čas na novou generaci zkoušek. Jedním z benchmarků je AI Science Challenge, test vytvořený Allenovým institutem pro umělou inteligenci. Testovací otázky jsou tvořeny sbírkou úkolů ze standardizovaných školních prací amerických žáků osmé třídy. Umělá inteligence musí dokázat z textů vytáhnout jednoduché závěry. Testovací otázka by mohla znít: „Podle předpovědi počasí máme v noci očekávat teploty pod bodem mrazu. Co máme dělat, aby se rostliny chránily před zmrznutím?“ Hodnotí se pak podíl smysluplných odpovědí.

Podobnou zkoušku je možné provádět i s obrazy, jak ukázal test Visual Question Answering Challenge (VQA) amerických univerzit ve Virginii a Georgii. Databanka sestává z více než 260 tisíc scén, u nichž má AI zodpovědět otázky, jako např. „Jakou barvu má tričko, které nosí kluk na skateboardu?“. V roce 2016 vyhrál tuto soutěž tým z Berkeley se systémem, který využívá dvě neuronové sítě - první, která se snaží porozumět otázce, a druhou, která příslušnou scénu analyzuje.

Člověk u těchto nových benchmarků přesto nad stroji vítězí. V případě VQA se umělá inteligence nacházela se 66 procenty pod výkonností lidí (ti dosáhli na 90 procent), u AI Science Challgenge se žáci osmé třídy blížili k úspěšnosti 100 procent a nejlepší umělá inteligence zvládala jenom kolem 60 procent.

Velmistr v Asteroids

Stále však zůstává otázkou, jestli tyto testy měří skutečně vše, co vytváří lidskou inteligenci. Mnozí o tom mají pochybnosti, jak dokládají na příkladu staré hry z roku 1979. V té době se dostala na trh konzolová hra Asteroids, vyvinutá pro společnost Atari. Úkolem hráčů bylo ovládat trojúhelníkovou loď a ničit ohrožující asteroidy prolétávající kolem. Hra si brzy našla vášnivé přívržence a se 70 tisíci prodanými exempláři se stala jedním z největších úspěchů herního průmyslu v historii.

Málokdo však ví, že podobně jako u šachu existuje i u této hry někdo na způsob velmistra. V roce 1982 dosáhl tehdy 15letý Scott Safran z New Jersey po 60hodinách hraní neuvěřitelného skóre 41 336 440 bodů. Teprve v roce 2014 dosáhl 43letý zámečník John McAllister o 2 300 bodů víc. Je přitom pozoruhodné, že v jednoduchých hrách pro Atari, jako je např. Video Pinball nebo Up and Down, již počítače dosáhly nadlidských výkonů. Proč se jim to ale nezdařilo v případě Asteroids?

Odpověď leží v komplexnosti scén a interakcí. Hráči se musí ve zlomcích vteřin rozhodnout, který asteroid letí do blízkosti trojúhelníkové rakety, jestli je lepší se mu vyhnout, odstřelit ho, nebo nechat proletět. Umělá inteligence je takovými úkoly přetížena.

Podobně je tomu i u vizuálních scén - představme si třeba fotografii parku v šeru, v popředí několik dětí hraje fotbal, další lidé pořádají piknik a v pozadí stojí Eiffelova věž. Člověk takovou scénu rychle rozpozná: „Jde o park v Paříži, pravděpodobně bude večer, protože ráno se nedělají pikniky.“ Navzdory veškerým pokrokům při rozpoznávání objektů zde umělá inteligence ztroskotává, stejně jako kdykoli předtím.

Robot staví stan

Ještě víc se projeví rozdíl mezi člověkem a strojem, když umělá inteligence dostane tělo a musí vypočítat jeho chování a pohyby. Tuto slabinu dobře demonstruje soutěž RoboCup, kde od roku 1997 zápasí týmy složené z robotů o to, jak se přiblížit schopnostem profesionálních fotbalistů. Roboti samozřejmě nemohou držet krok ani s velmi špatným lidským hráčem fotbalu. Při hře je nutná schopnost přijímat smyslová data z očí, uší a těla a pak je převést do správných reakcí - a přitom se umět učit z chyb (blíže o RoboCupu viz box nahoře).

Je zřejmé, že vést inteligentní dialog, učit se z obrazů nebo filmů nebo hrát fotbal je možné jedině v případě, dokáže-li umělá inteligence propojit svět logiky a smyslů. Jak by tedy měl takový test vypadat? Výzkumník Charles Ortiz z firmy Nuance, která se zabývá řečovými systémy, k tomu navrhl podivuhodně jednoduchý test: robot sám dostal za úkol postavit stan nebo kus nábytku od firmy IKEA. Může se to zdát zcela banální, ale dnes jde stále ještě o utopii.

***

Fotbaloví dřeváci

V soutěži RoboCup každoročně soupeří týmy z celého světa v robotickém fotbalu. V roce 2017 zvítězil robot NimbRo-OP2 z univerzity v Bonnu. Ve finále humanoidních robotů se střetl se strojem Sweaty z vysoké školy v Offenburgu. Oba humanoidní stroje pomalu přešlapovaly kolem míče a nesměle do něj poťukávaly. Sweaty přitom občas spadl, což NimbRo využil ke střílení branek. A výsledné skóre? Jedenáct k nule pro tým NimbRo. V robotickém fotbalu se stále ještě názorně projevuje, jak stroje co do pohybové inteligence zaostávají za člověkem.

Foto popis| Zatímco v šachu je superpočítač schopen porazit velmistra, umělá inteligence v jednoduché hře Asteroids z roku 1979 naprosto ztroskotává.
Foto popis| Garri Kasparov se přepočítal, když tvrdil, že ho superpočítač nedokáže porazit. V roce 1997 se to podařilo stroji DeepBlue společnosti IBM.
Foto popis| Superpočítač IBM Watson je schopen porozumět jednoduchým hádankám.

O autorovi| MICHAL ČERNÝ, michalcerny.media@seznam.cz

Předplatné

Digitální chip

Earchiv