Civilizace5. 3. 201612 minut

První stroj vybavený intuicí porazil světového šampiona ve hře go

Výhra je považována za podobně historický moment, jako když Garri Kasparov podlehl v roce 1997 programu firmy IBM

V historické bitvě mezi člověkem a umělou inteligencí počítač těsně porazil světového šampiona ve hře go. Jihokorejský světový šampion Lee Se-dol byl poražen programem AlphaGo v první ze série pěti partií. Během turnaje v Soulu se soutěží o milion dolarů, další čtyři partie mají následovat během měsíce. Po třech a půl hodinách hry, kterou vysílaly v přímém přenosu televize z Jižní Koreje, Číny a Japonska, se Se-dol rozhodl vzdát partii, když uznal, že už porážku neodvrátí.

Již loni v říjnu program přemohl evropského šampiona v go. Nynější výhra je považována za podobně historický moment, jako když šachový velmistr Garri Kasparov podlehl v roce 1997 programu firmy IBM. Prastará hra má totiž nevyčíslitelně více herních variant než šachy, umělá inteligence tudíž musela poprvé prokázat, že má intuici. U příležitosti tohoto technologického milníku odemykáme text z nového čísla, který vývoj AlphaGo podrobně popisuje.

Mohlo by vás zaujmout:

Stroj se stává orákulem; jeho verdiktům musíme věřit.

↓ INZERCE

Je původem z Číny, o několik tisíciletí let starší než šachy. A také neporovnatelně složitější; počet možných kombinací v go je dokonce vyšší než počet atomů v kosmu. V roce 1997 počítač poprvé porazil světového velmistra v šachu, ale vypadalo to, že v go stroj nad člověkem nezvítězí buď nikdy, nebo po mnoha desítkách let dalšího vývoje.

Aktuální číslo RespektuText, který výjimečně zpřístupňujeme všem čtenářům, je součástí aktuálního Respektu 10/2016. Kromě tohoto článku v něm najdete například tato témata:
• Vídeň je nejpříjemnější město k životu. Zjistili jsme proč
• Rozhovor s ministryní školství Kateřinou Valachovou
• Hieronymus Bosch: Reportáž z výstavy století
• Česko znovu uvažuje o vězeních pro děti
• Pirátská strana si získává uznání a míří vzhůru

Koncem ledna však britská firma DeepMind, jedna z nedávných akvizic Googlu, oznámila, že její počítačový systém zvítězil nad nejlepším evropským hráčem go, Francouzem čínského původu Fan Huiem, a brzy vyzve i světového velmistra. Prestižní vědecký časopis Nature označil šampiona za přelom v umělé inteligenci, první stroj, který se umí řídit instinktem. Firma přitom považuje svůj výtvor za pouhý začátek: do 15 let chce vytvořit „křemíkového vědce“ – systém, který by mohl figurovat třeba mezi autory odborného článku právě v Nature.

Jako novorozenec

Termín „umělý mozek“ se poprvé objevil v roce 1946. O tři roky později jej zpopularizoval britský tisk, když tak nazval jeden z prvních počítačů, který se právě rozběhl na Manchesterské univerzitě. Vzletné označení pro monstrum, jež k fungování potřebovalo místnost o rozměrech menšího obývacího pokoje a příkon, který by dnes rozzářil stadion, rozzlobilo tamního profesora neurochirurgie, sira Geoffreyho Jeffersona: „Dokud stroj nesloží sonet či nezkomponuje koncert na základě svých emocí a pocitů, nikoli jen náhodným nakupením symbolů, a dokud si nebude vědom, že tak učinil, nevyrovná se lidskému mozku. Žádný stroj necítí radost z úspěchu, smutek, když se mu taví elektronky, potěšení z lichotek, zlost ze svých chyb,“ prohlásil při přebírání ocenění pro význačné chirurgy.

V té době se zdálo, že myšlenky do stroje vetkne složitá matematika zapsaná v chytrém programu. I na emoce mohlo podle tehdejších představ dojít, pokud by se podařilo najít dostatečně složité výpočetní algoritmy, které by popsaly radost či žal. Zároveň se však brzy začaly rozvíjet jiné přístupy, bez nichž by – jak dnes víme – skutečně chytrý software nikdy nevznikl. Svět kolem nás je příliš složitý na to, aby šel popsat pomocí předem pevně daného programu. Ukázalo se, že logické uvažování nestačí, člověk i počítač potřebují víc: schopnost učit se, nabývat těžko definovatelné zkušenosti. Získávat něco jako instinkt, jemuž se někdy říká „přemýšlení bez přemýšlení“.

Už od padesátých let se proto vyvíjejí umělé neuronové sítě, výsledek snah napodobit způsob, jakým pracuje lidský mozek. Umělá neuronová síť není nic, co by existovalo fyzicky, je to „jen“ softwarový model, ale když se síť za pomoci člověka učí, mění se v ní intenzita signálů, které putují spoji mezi jednotlivými „nervovými buňkami“. Budují se nová, silnější spojení a vzniká tak nová dovednost – podobně jako když se novorozenec „učí vidět“, chápat a interpretovat obraz zprostředkovaný zrakem, nebo když si lékař léta vytváří schopnost odhadnout diagnózu.

Novou krev pak vnesly v minulé dekádě do výzkumu počítačové hry. Potřebovaly dobrou grafiku, a vyžádaly si proto vznik moderních grafických karet; ty přitom obsahují spoustu jader, výpočetních jednotek, které velmi dobře zastanou roli jednotlivých „nervových buněk“ v neuronové síti. Kombinace velkého počtu těchto jader umožnila vznik takzvaných hlubokých sítí o mnoha vrstvách, z nichž každá může plnit trochu odlišné úkoly. Otevřela se nová cesta, díky níž začaly počítače mnohem lépe zvládat úkoly vyžadující dlouhé a složité učení.

Krásný, tedy chytrý tah

Jedním z nich je právě hra go, v níž se střetávají černé a bílé kameny dvou soupeřů, snaží se obklíčit protivníka a získat pro sebe co největší území. Na herním poli tvořeném průsečíky 19 x 19 linií se během utkání rodí složité obrazce, které zkušený fanoušek hry může vnímat jako krásné, protože slibují vítězství, nebo „škaredé“, neboť naznačují prohru. „Člověk je velmi vizuálně zaměřený tvor. Hráč o spoustě tahů ví, že jsou dobré, ale nezná důvod – tuší jen, že vzniká hezký tvar,“ vysvětluje Josef Moudřík, doktorand Matematicko-fyzikální fakulty UK a odborník na strojové učení, mezi jehož záliby patří právě go. „Profesionál nemusí v partiích proti méně zdatným soupeřům téměř vůbec propočítávat různé možnosti, prostě vidí, jak má hrát.“

Bez této intuice nelze v go dosáhnout špičkové úrovně – počet možných tahů i herních variant je příliš velký na to, aby se následující kroky daly tak dobře propočítat jako v šachu. Deep Blue, systém, který v roce 1997 porazil šachového velmistra Kasparova, se přesně řídil programem, nemusel se nic učit, a k vítězství mu to stačilo. V go klasická umělá inteligence selhává, proto ještě nedávno i nejlepší program uspěl pouze proti amatérům. Pak ale přišel AlphaGo, který nejenže porazil zmíněného evropského šampiona v pěti partiích z pěti odehraných, ale zvítězil také ve 499 z 500 utkání proti jiným počítačovým programům.

Představa dvou umělých mozků, které se ohromující rychlostí střetávají ve hře, jež je kvůli nárokům na intuici blízká lidskému, nikoli strojovému vnímání světa, může být poněkud mrazivá. Systémy založené na strojovém učení jsou navíc něco jako černé skříňky: nelze jednoduše zjistit, proč se rozhodly právě pro tento tah, a nikoli jiný. Prostě se naučily, že to nejspíš bude fungovat – instinkt je nejpřesnější slovo. „Stroj se stává orákulem; jeho verdiktům musíme věřit,“ píše Nature.

AlphaGo si vytvářel intuici jednak tím, že mu tvůrci ukázali tisíce profesionálních partií. Analyzoval 30 milionů tahů a zkoumal, nakolik vedly k vítězství či prohře. Kromě toho sehrál miliony partií sám se sebou, dohrával určitá rozestavení kamenů a zjišťoval, kdo zvítězí. Takto získaný instinkt nyní při každé partii kombinuje s metodami klasické umělé inteligence (více v rámečku). „AlphaGo hraje podobně jako člověk. Kdyby mi neřekli, kdo je můj soupeř, myslel bych si, že je to trochu zvláštní, ale velmi silný lidský hráč,“ prohlásil poražený šampion Fan Hui, původně čínský profesionál v go, který se odstěhoval do Evropy.

Chápat, co je kočka

Vlastní program pro go vyvíjí také Facebook, ale rivalovi od Googlu se jeho systém zatím nevyrovná. Soupeření obou internetových obrů na tomto zvláštním poli svědčí o tom, že zkušenosti z vývoje neuronových sítí pro go, hru, která vyžaduje vizuální intuici, se mohou ve virtuálním prostoru velmi hodit.

„Vznikají třeba aplikace, které rozpoznají, co je na fotografiích,“ vysvětluje odborník na umělou inteligenci Roman Neruda, proč firmy soupeří v tak exotické sféře. „Ukazujete neuronové síti snímky a říkáte jí – tohle je kočka, muž, had. Ona ve skutečnosti nic nevidí, dostane jen informaci o pixelech, obrazových bodech, a učí se extrahovat, co s ní má zvíře či člověk společného,“ říká Neruda, který kromě MFF UK působí v Ústavu informatiky AV ČR.

Stroj se stává orákulem; jeho verdiktům musíme věřit.

Po čase neuronová síť pochopí, v čem spočívá „esence kočkovitosti“, a nevadí jí, když je zvíře natočené z různých stran či jinak barevné. „Někdy se zmýlí, řekne, že leopard je kočka, pes je kočka. Ale to jsou hezké chyby, mají jistou sémantickou logiku,“ líčí Neruda, podle nějž se nejpokročilejší sítě už hodí pro složitá zadání typu: „Najdi mi na webu fotografii afrického domorodce s kopím stojícího před chýší v pralese.“

Vyhledávání podle klíčových slov se tak brzy rozšíří o vyhledávání ve fotografiích, kterých je na webu nepřeberné množství. Tím to ale zdaleka nekončí. Díky své rychlosti počítačový systém zvládne v reálném čase také anotaci videa, třeba obrazu z kamery v jedoucím autě – označí chodce, dopravní značku, obrubník, kaluž. Význam pro řízení aut bez zásahu lidské ruky je tu očividný.

Další oblastí, kde se mohou neuronové sítě uplatnit, je porozumění psanému či mluvenému slovu, kdy počítač do jisté míry skutečně pochopí, o čem je řeč a jaké emoce sdělení nese. Systémy typu asistentky v chytrém telefonu by se tak mohly stát mnohem inteligentnějšími a užitečnějšími. V medicíně mohou neuronové sítě – díky schopnosti nacházet souvislosti v nepřehledném terénu informací – určovat diagnózy rychleji a spolehlivěji než lidští lékaři. To všechno jsou důvody, proč firmy jako Google nebo Facebook vysávají odborníky na neuronové sítě z kateder a výzkumných ústavů a zaměstnávají je ve svých laboratořích.

Proti velmistrovi

Přes všechny úspěchy však slova sira Geoffreyho z roku 1949 zůstávají v platnosti i dnes: současná umělá inteligence necítí žal a nedokáže být člověku tak všestrannou partnerkou jako třeba operační systém „s duší ženy“ ve filmu Ona (Her). Neumí o mnoho víc než to, pro co byla stvořena. „Náš systém se může naučit šachy, ale nebude v nich lepší než počítač Deep Blue,“ řekl časopisu Wired v lednu Demis Hassabis, šéf a spoluzakladatel firmy, která vytvořila AlphaGo. Podobně se systém určený pro rozpoznávání tváří nenaučí strojovému překladu či řízení aut.

Do 20 let chce však Hassabis, jenž se v rámci impéria Googlu těší naprosté tvůrčí svobodě, vyvinout skutečně všestrannou umělou inteligenci, která by se v nejrůznějších situacích rozhodovala podobně jako člověk. Namísto toho, aby ji lidský operátor trénoval pro jeden určitý úkol, dokázala by se sama učit nejrůznějším dovednostem. Neuměla by ještě skládat sonety podle nálady, neměla by vědomí, přesto by byla určitým způsobem kreativní. Dovedla by například navrhnout novou teorii, kterou by bylo možné otestovat v laboratoři. Firma DeepMind nasadila na vytváření všestranné umělé inteligence 100 vědců ze 40 zemí.

Pro nejbližší dny je však cíl týmu kolem Hassabise o něco skromnější. Mezi 9. a 15. březnem se v jihokorejské metropoli Soulu odehraje série pěti zápasů mezi AlphaGo a světovým šampionem Leem Se-dolem – a Hassabis věří, že velmistr bude poražen. Se-dol je opatrnější: „Jsem přesvědčen, že dokážu zvítězit. Aspoň protentokrát.“

Velmistr Lee Se-dol

Jak přemýšlí umělý hráč go

Systém AlphaGo využívá několik strategií: zaprvé předem naprogramované výpočty z oboru klasické umělé inteligence, kdy analyzuje budoucí tahy své i soupeře a hledá nejvýhodnější strategii. Metoda zvaná stromové vyhledávání Monte Carlo se v go používá od roku 2006; umožnila vytvořit program, který se vyrovnal nejsilnějším amatérským hráčům.

Posun na profesionální úroveň přišel, až když se připojily hluboké neuronové sítě schopné učení. Díky jejich „instinktu“ lze „strom“ možných budoucích tahů značně zúžit a zjednodušit tak výpočty na únosnou mez – například po prvním tahu soupeře má hráč 360 možností, kam položit svůj kámen, ale chytrá síť ví, že smysl má přemýšlet jen o deseti z nich.

I tak lze ovšem propočítat jen určité množství tahů dopředu, proto má síť v zásobě další trik: díky tomu, že v minulosti odehrála řadu partií sama se sebou, pozná, které herní pozice na konci „stromových“ výpočtů mohou vést k výhře a které nikoli. Umí tedy mezi mnoha větvemi košatého stromu příštích tahů vybrat nejvýhodnější možnost.

Jak funguje neuronová síť

Živá nervová buňka, neuron, se skládá z výběžků zvaných dendrity, které sbírají signály z jiných neuronů v okolí, dále vlastního „těla“, kde se tyto vstupní signály zhruba sčítají, a vyústění zvaného axon, které vyšle signál, pokud je součet vstupních signálů dostatečně silný. Umělé neuronové sítě lze vytvářet v laboratoři, pro praktické aplikace však vznikají pouze softwarové modely, jež tuto složitou biologickou architekturu volně napodobují v klasickém počítači. Umělý neuron je tak matematická funkce, která „sbírá signály z okolí“ a za určitých podmínek je předává dál. Spojováním neuronů vznikají sítě schopné učit se – posilovat ta spojení, jež vedou ke správnému výsledku. Operátor například může síti (spojené s body pro vnímání obrazu) ukazovat různá písmena A tak dlouho, až se síť naučí toto písmeno bezpečně rozpoznat.

Pokud jste v článku našli chybu, napište nám prosím na [email protected].