Datum zveřejnění: 
20. 8. 2018

Inteligenci počítačů už měřit dovedeme, ale vždy jen v úzké oblasti. Vznikne někdy stroj všestranně nadaný, s vlastními smysly a tělem?

Před šachovým zápasem mezi Garrim Kasparovem a počítačem Deep Blue v roce 1997 ruský velmistr sebejistě tvrdil, že ho počítač nikdy nedokáže porazit. "Garri ten stroj úplně rozmetá," nechal se slyšet také velmistr Yasser Seirawan. Jenže Kasparov se dostal ve druhé partii do úzkých a musel vzdát. Zdrcený porážkou pak v dalším střetnutí zahrál pod své možnosti a dopustil se série chyb. Triumf stroje nad lidským intelektem se stal světovou senzací.
Právě ve druhé partii předvedl Deep Blue výkon, o němž málokdo věřil, že by ho vůbec byl nějaký počítač schopen. V průběhu hry dokonce odmítl tah, který by vedl k zisku, ve prospěch jiného, čistě pozičního manévru.
Stroje již dobyly mnohé pevnosti, kde dříve kralovala lidská inteligence. Superpočítač IBM Watson si počátkem dekády vedl v televizní vědomostní soutěži lépe než nejlepší hráči světa a rozuměl při tom i různým ironickým narážkám moderátora, což je podle mnohých na jeho inteligenci to nejcennější. Jiné systémy excelují v rozpoznávání objektů, například na snímku z ulice dokážou rozlišit člověka na motocyklu, jeho přilbu nebo projíždějící automobil. V roce 2015 v tom jistý software od Microsoftu dokonce dosáhl vyšší spolehlivosti než lidé. Na základě lajků na Facebooku umí software Univerzity v Cambridgi odhadnout charakteristiky osobnosti lépe než životní partner.
Jak inteligentní jsou ale stroje doopravdy? Pro hrubý odhad intelektu člověka byly vynalezeny IQ testy, pro počítače je zde Turingův test, k němuž se ještě dostaneme. Potřebujeme však i další indikátory. V jakých testech by superpočítače musely obstát, abychom jim mohli přisoudit skutečnou inteligenci?

Tajemství čínského pokoje Jako jedna ze zkoušek se nabízejí jednoduché počítačové hry. Již v roce 1979 byly na trh uvedeny Asteroids, kde hráč pohyboval po obrazovce trojúhelníkovitou kosmickou lodí, vyhýbal se prolétajícím asteroidům a ničil je. Když se podařilo asteroid zasáhnout, rozpadl se na několik menších, což loď dále ohrožovalo. Se 70 tisíci prodanými exempláři se Asteroids staly jedním z největších úspěchů v historii počítačových her.
Jen málokdo přitom ví, že i tato hra má své velmistry. V roce 1982 dosáhl tehdy patnáctiletý Scott Safran po 60 hodinách hraní neuvěřitelného skóre přes 41 milionů bodů. Teprve v roce 2014 se třiačtyřicetiletému zámečníkovi Johnu McAllisterovi podařilo rekord překonat o 2300 bodů. A počítače? V jiných jednoduchých hrách pro staré konzole firmy Atari už člověka zastínily, v případě Asteroids se jim to ale nepodařilo. Jednou z příčin je složitost herních situací a vztahů a neexistence jasně dané strategie.
Podle experta na umělou inteligenci Viliama Lisého z ČVUT spočívá hlavní problém s podobnými úkoly v tom, že se dosud nepodařilo vyvinout dostatečně všestranný systém, který by uměl řešit mnoho různorodých problémů. "Určitě bychom dokázali vyvinout aplikaci speciálně vyladěnou pro Asteroids, která by se na této hře postupně učila a člověka by časem překonala. Už by si ale neporadila s jakoukoli jinou hrou," vysvětluje Lisý.
Současnou situaci lze přiblížit na takzvaném paradoxu čínského pokoje, který v roce 1980 popsal filozof John Searle. Představme si uzavřenou místnost s knihovnou naplněnou velkým množstvím čínských textů. Do takového pokoje umístíme člověka, který čínštinu vůbec neovládá, ale disponuje znalostí, jak v knihovně najít dostatek relevantních informací a prostým opsáním textu vytvořit smysluplnou odpověď. Tazatel zvnějšku se pak může domnívat, že dotazovaný čínsky umí.
"Paradox čínského pokoje vystihuje to, jak funguje naše současná umělá inteligence," říká Viliam Lisý. "Ona disponuje gigantickými knihovnami informací a instrukcí, díky nimž dokáže na určitý vstup mechanicky odpovědět určitým výstupem. Hlubší pochopení jí ale schází." Takové umělé inteligenci se někdy říká "slabá" – na rozdíl od té zatím neexistující všestranné, tedy "silné".

V noci má mrznout. Jak ochráníš rostliny?
Kdo chce měřit schopnosti počítačů, musí si nevyhnutelně položit otázku, co je vlastně inteligence u člověka. Vědci se dosud nedokázali shodnout. Podle psychologa Michala Černouška (žil v letech 1945–2005) jsou například klasické IQ testy hrubým zjednodušením, protože se snaží veškerou složitost duševních schopností vyjádřit jediným číslem. "Hodnota IQ tak vypovídá pouze o úspěšnosti v řešení IQ testů," říkal Černoušek na univerzitních přednáškách z úvodu do psychologie. Americký psycholog Robert Sternberg zase připomíná, že géniové jsou zpravidla jednostranně nadaní a za svůj extrémní talent platí v jiných oblastech. Například u Napoleona se již v dětství ukázala jeho schopnost bleskově se orientovat ve spletitých otázkách a dříve než ostatní dospět ke správnému řešení složitého matematického příkladu, na druhou stranu se velmi špatně učil cizím jazykům.
V současné psychologii tak probíhá spor o to, zda u člověka je, či není možné najít "G-faktor", který by byl korelací všech jednotlivých duševních schopností. Pak by hodnota IQ přece jen mohla o něčem vypovídat, aspoň pokud by se v ní G-faktor nějak odrazil.
Za spolehlivé měřítko schopností umělé inteligence se dlouho považovalo čistě analytické uvažování, například schopnost porazit lidského protivníka ve hře go. Podobně jako v psychologii to však nestačí. Počítačový velmistr v go už existuje, spolehlivě drtí nejlepší lidské hráče, nic jiného však opět neumí. Je tedy jasné, že potřebujeme nějaký lepší test, který by uměl odhalit, co umělá inteligence zvládne a zda se vyznačuje aspoň zárodkem všestrannosti.
Nejslavnější a nejstarší je zmíněný Turingův test. Projde jím stroj, který komunikuje s člověkem tak dobře, že onen člověk nepozná, že jeho partnerem není jiná lidská bytost. O tom, zda se to už nějakému počítači povedlo, se vedou spory. V roce 2014, kdy od úmrtí britského počítačového vědce Alana Turinga uplynulo 60 let, podrobila Univerzita v Readingu testu pět superpočítačů. Absolvovaly sérii písemných rozhovorů o délce pěti minut a měly během nich s lidmi konverzovat na úrovni třináctiletého chlapce. Kritéria splnil superpočítač Eugene z Ruska, kritici ale namítali, že během pouhých pěti minut testu se slabé stránky stroje možná jen nestihly projevit. Navíc by podle nich měl test vycházet ze schopností dospělých, nikoli dospívajících. Turingův test má každopádně hluboký smysl, protože během konverzace je možné počítač dostat do nepředvídatelných situací.
Méně známý, novější druh zkoušky nabízí takzvaný Stanford Question Answering Dataset (SQuAD), který prověřuje, nakolik stroje rozumějí textům. Jeho databanka sestává z více než 50 tisíc krátkých článků z Wikipedie a ze 100 tisíc dotazů k těmto textům – například pochopení článku o meteorologii a srážkách může zjišťovat otázka: "Co způsobuje, že déšť padá směrem k zemi?" (Správnou odpovědí je "gravitace".) Systém zkoumá nejenom schopnost počítače dávat srozumitelné odpovědi, ale také odmítnout otázky, které se na základě poskytnutého textu zodpovědět nedají. Od června 2018 vede žebříček úspěšných absolventů testu neuronová síť Kangwonské národní univerzity v Jižní Koreji, jež odpovídala správně z 68 procent. Mnohem výkonnější lidský mozek dosáhl 86 procent.
Dalším "zkoušejícím" je Allen AI Science Challenge. Otázky, které tento test strojům klade, pocházejí z učebnic pro americké žáky osmé třídy, přičemž zkoušený tentokrát musí být schopen odvodit z předloženého textu jednoduché závěry. Třeba odpovědět smysluplně na otázku: "Podle předpovědi počasí má teplota v noci klesnout pod bod mrazu. Co můžeš udělat pro to, abys rostliny ochránil před zmrznutím?"
Zkouška zvaná Visual Question Answering Challenge (VQA) amerických technických univerzit ve Virginii a Georgii ukázala, že podobný test je možné provést také ve vizuální oblasti. Databáze sestává z více než 260 tisíc scén, jež mají prověřit schopnost umělé inteligence orientovat se v tom, co se odehrává před jejíma "očima". Testovaný systém tak odpovídá na dotazy typu "jakou barvu má tričko, které nosí kluk na skateboardu?" V roce 2016 zvítězil tým z Kalifornské univerzity v Berkeley. Využil dvě neuronové sítě – jednu, která se snažila porozumět otázkám, a druhou, jež příslušnou scénu analyzovala. V praktickém životě se mohou podobné schopnosti umělé inteligence uplatnit třeba v pomoci nevidomým, systém jim například popíše, co je vidět na obrázku z webu.
Lidé v těchto zkouškách zatím nad stroji vítězí; v případě vizuálního testu VQA odpovídala umělá inteligence správně z 66 procent, člověk dosáhl devadesátiprocentní úspěšnosti. V testu Allen AI Science Challenge byli žáci osmé třídy obvykle stoprocentně úspěšní, zatímco ta nejlepší umělá inteligence zaostávala s 60 procenty.

Robote, postav stan

Zatímco se slabá umělá inteligence pokouší v konkrétních úkolech vyrovnat člověku, vědci přemýšlejí, jak vytvořit tu silnou. Jednou ze zatím neprošlapaných cest je dát umělému mozku tělo a nechat ho, aby se sám učil podobně jako malé dítě. Naprogramovaný svět logiky by se pak propojil se světem smyslových vjemů, v nichž by se počítač sám učil hledat vzorce a pravidla. Mohl by si pak poradit i v situaci, kdy je konfrontován s problémem úplně novým, pro jehož řešení vůbec nebyl vytvořen. Podobné experimenty už probíhají, jsou však v začátcích (více v rámečku Pavouk, nebo had?).
Pokud tímto způsobem dokonalejší umělá inteligence skutečně vznikne, bude potřebovat nové testy, jež by prověřily její schopnosti. Výzkumník Charles Ortiz z firmy Nuance, která se zabývá řečovými systémy, v roce 2015 navrhl, aby se testovaný robot musel samostatně naučit postavit stan nebo sestavit kus nábytku. Zdá se to jako směšně jednoduchý úkol, pro umělou inteligenci jde však stále ještě o utopii.
I proto se podle Viliama Lisého z ČVUT pravděpodobně hned tak nepodaří vyvinout stroj, jehož všestranná inteligence by se stala výzvou, a možná i hrozbou pro lidstvo. "Mnohem více se bojím zneužití slabé umělé inteligence, tedy že například nějaký diktátor získá možnost analyzovat všechny telefonáty či e-maily a podsouvat občanovi obsah tak, aby si udělal ten,správný‘ názor. To je s onou úzce specializovanou umělou inteligencí, kterou máme už dnes k dispozici, dobře uskutečnitelné," uzavírá Lisý.

Pavouk, nebo had?

V roce 2012 představil profesor Cornellovy univerzity Hod Lipson robota v podobě jakési "krabice" se čtyřma nohama, z nichž každou ovládaly dva servomechanismy. Robot neměl žádné informace o tom, jak vypadá, a jeho úkolem bylo naučit se chodit. "Představte si, že sedíte v krabici bez oken a máte před sebou osm knoflíků, o nichž víte, že jsou nějak spojeny s jakýmisi motory. Když jimi kroutíte, cítíte, že krabice se s vámi různě naklání, nevíte ale, jak to celé funguje," vysvětloval profesor. Robot zkrátka netušil, jestli je had, pavouk, kolik má nohou, kde má klouby a podobně. Postupně si však vytvořil reprezentaci svého těla a přišel s vlastní podivnou verzí chůze. Tyto experimenty, které někdy probíhají bez skutečného těla, jen v podobě počítačových simulací, jsou ovšem i dnes stále v začátcích. "Lidská buňka je pozoruhodná soustava propojených částí, má podobný počet součástek jako moderní tryskáč – a všechny tyto díly vzešly z dlouhodobé, vnořené interakce s přirozeným světem," uvedl v magazínu Aeon britský počítačový vědec Ben Medlock. Během evoluce se buňky spojily do robustních, samostatných agentů, mnohobuněčných organismů schopných řešit obrovské množství různorodých problémů. Zda se podaří tento proces někdy napodobit v laboratoři, není zatím jasné.       

Autor: 
MICHAL ČERNÝ
Zdroj: 
Respekt