Denní menu2. 2. 20174 minuty

Další meta umělé inteligence: roboti se naučili blafovat a vyhrávají i v pokeru

V souboji lidského mozku s umělou inteligencí zdolali roboti další metu. V americkém Pittsburghu skončil duel Brains vs AI, ve kterém se čtyři profesionální hráči pokeru utkali s novým softwarem Libratus. A stalo se to, k čemu se schylovalo hned od začátku – lidé prohráli na celé čáře.

Během 20 dnů sehráli s počítačem 120 tisíc partií a dohromady přišli o 1,76 milionu dolarů. Nešlo sice o opravdové peníze, ale o čest. Zatímco v šachách nebo v go už počítače dokázaly proti nejlepším hráčům vyhrát, v pokeru zatím odolávali. S tím je po konec.

Fanoušci pokeru a vědci bádající na poli umělé inteligence považují turnaj za velký průlom. Poker je totiž tzv. hra s neúplnými informacemi, kdy nestačí jen spočítat, co máte před sebou na stole. Do úvahy je potřeba vzít i to, co druhá strana skrývá a jak se zachová. Jinými slovy je třeba umět blafovat, což je umění, které dosud od počítačů nikdo příliš neočekával.

↓ INZERCE

Pokud si jej osvojí, pak se jednoho dne může stát, že za vás (nebo proti vám) nastoupí v každodenních životních situacích třeba jako vyjednavači při koupi ojetého auta nebo bytu. Blafovací robot by se mohl hodit i jako poradce v politice nebo při sjednávání obchodních kontraktů.

V turnaji hrál každý ze čtyř hráčů sám za sebe, počítač s nimi bojoval simultánně jeden na jednoho 11 hodin denně. Hrál se klasický Texas Hold'em, kdy každý z hráčů dostane na začátku do ruky dvě karty a kombinuje je s pěti kartami, které se postupně odkrývají na stole. Cílem je poskládat ze sedmi karet co nejlepší ruku. Hráči hráli s počítačem přímo na monitoru, bez opravdových karet.

Pravidla byla předem domluvena tak, aby se eliminoval faktor štěstí. Stejné karty, s kterými hrál jednou počítač, pak proti němu dostal v jiné hře jiný ze čtyř hráčů. Existoval i limit na sázku all-in. Všichni čtyři hráči skončili na konci v mínusu, v průměru v každé hře prohráli 14,72 dolaru.

„Neříkali jsme počítači, jak hrát. Jen jsme mu vysvětlili pravidla a nechali ho, ať se to naučí sám,“ řekl k turnaji jeden z tvůrců softwaru Noam Brown z týmu profesora Thomase Sandholma z americké Carnegie Mellon University. Stejný tým už zkoušel štěstí proti živým lidem předloni a tehdy jejich program neuspěl. I proto byly předem vypsány sázky proti programu v kurzu 1:4, což se ovšem ukázalo jako velký přehmat.

"Libratus byl mnohem lepší, než jsme čekali. Je to trochu frustrující," přiznal jeden z kvarteta poražených Jason Les, který prohrál 880 tisíc virtuálních dolarů, tedy nejvíc ze všech. Všichni hráči v rozhovorech upozorňovali na to, že právě blafování bylo to, co šlo počítači nebývale dobře. Příklad? V jedné hře dostal Jason Les na začátek dvě desítky, srdcovou a károvou. Na stůl přišly čtyřka, devítka a král, z toho dvoje kříže. Libratus už měl dvě křížové karty v ruce, a tak oba přihodili – Les na svoje desítky a počítač v naději, že na stůl ještě nějaké kříže přijdou (pak by měl fleš – pět karet stejné barvy). Čtvrtá karta na stole byla pětka, která se nehodila ani jednomu, takže oba zahlásili "check“ (zůstali na svém) a počkali si na poslední kartu. Přišla královna, která se opět nikomu nehodila, ale Libratus zablafoval, agresívně přihodil a Jason Les svoje karty položil, i když v tu chvíli vyhrával.

Po chvíli se hra otočila a karty, které měl předtím počítač, dostal do ruky další z hráčů Dong Kyu. Jenže k sázce na fleš se vůbec nedostal. Libratus hodně přihodil už na svoje dvě desítky a Kyu kříže zahodil. Komentátoři vysvětlovali úspěšnost počítače v tomto případě tím, že neváhá hodně riskovat, i když v banku právě není moc peněz, což je u lidí trochu proti psychice – a že právě toto byla jedna z věcí, kterou počítač vypozoroval a upravil podle ní svoji strategii.