Pozadí astronaut Brázda
Pozadí astronaut Brázda
Často hledáte, jak…

Denní menu, Společnost

Další meta umělé inteligence: roboti se naučili blafovat a vyhrávají i v pokeru

Professionální hráč Jason Les hraje poker proti programu Libratus • Autor: ČTK
Professionální hráč Jason Les hraje poker proti programu Libratus • Autor: ČTK

V souboji lidského mozku s umělou inteligencí zdolali roboti další metu. V americkém Pittsburghu skončil duel Brains vs AI, ve kterém se čtyři profesionální hráči pokeru utkali s novým softwarem Libratus. A stalo se to, k čemu se schylovalo hned od začátku – lidé prohráli na celé čáře.

Během 20 dnů sehráli s počítačem 120 tisíc partií a dohromady přišli o 1,76 milionu dolarů. Nešlo sice o opravdové peníze, ale o čest. Zatímco v šachách nebo v go už počítače dokázaly proti nejlepším hráčům vyhrát, v pokeru zatím odolávali. S tím je po konec.

Fanoušci pokeru a vědci bádající na poli umělé inteligence považují turnaj za velký průlom. Poker je totiž tzv. hra s neúplnými informacemi, kdy nestačí jen spočítat, co máte před sebou na stole. Do úvahy je potřeba vzít i to, co druhá strana skrývá a jak se zachová. Jinými slovy je třeba umět blafovat, což je umění, které dosud od počítačů nikdo příliš neočekával.

Pokud si jej osvojí, pak se jednoho dne může stát, že za vás (nebo proti vám) nastoupí v každodenních životních situacích třeba jako vyjednavači při koupi ojetého auta nebo bytu. Blafovací robot by se mohl hodit i jako poradce v politice nebo při sjednávání obchodních kontraktů.

V turnaji hrál každý ze čtyř hráčů sám za sebe, počítač s nimi bojoval simultánně jeden na jednoho 11 hodin denně. Hrál se klasický Texas Hold'em, kdy každý z hráčů dostane na začátku do ruky dvě karty a kombinuje je s pěti kartami, které se postupně odkrývají na stole. Cílem je poskládat ze sedmi karet co nejlepší ruku. Hráči hráli s počítačem přímo na monitoru, bez opravdových karet.

Pravidla byla předem domluvena tak, aby se eliminoval faktor štěstí. Stejné karty, s kterými hrál jednou počítač, pak proti němu dostal v jiné hře jiný ze čtyř hráčů. Existoval i limit na sázku all-in.  Všichni čtyři hráči skončili na konci v mínusu, v průměru v každé hře prohráli 14,72 dolaru.

„Neříkali jsme počítači, jak hrát. Jen jsme mu vysvětlili pravidla a nechali ho, ať se to naučí sám,“ řekl k turnaji jeden z tvůrců softwaru Noam Brown z týmu profesora Thomase Sandholma z americké Carnegie Mellon University. Stejný tým už zkoušel štěstí proti živým lidem předloni a tehdy jejich program neuspěl. I proto byly předem vypsány sázky proti programu v kurzu 1:4, což se ovšem ukázalo jako velký přehmat.

"Libratus byl mnohem lepší, než jsme čekali. Je to trochu frustrující," přiznal jeden z kvarteta poražených Jason Les, který prohrál 880 tisíc virtuálních dolarů, tedy nejvíc ze všech. Všichni hráči v rozhovorech upozorňovali na to, že právě blafování bylo to, co šlo počítači nebývale dobře. Příklad? V jedné hře dostal Jason Les na začátek dvě desítky, srdcovou a károvou. Na stůl přišly čtyřka, devítka a král, z toho dvoje kříže. Libratus už měl dvě křížové karty v ruce, a tak oba přihodili – Les na svoje desítky a počítač v naději, že na stůl ještě nějaké kříže přijdou (pak by měl fleš – pět karet stejné barvy). Čtvrtá karta na stole byla pětka, která se nehodila ani jednomu, takže oba zahlásili "check“ (zůstali na svém) a počkali si na poslední kartu. Přišla královna, která se opět nikomu nehodila, ale Libratus zablafoval, agresívně přihodil a Jason Les svoje karty položil, i když v tu chvíli vyhrával.

Po chvíli se hra otočila a karty, které měl předtím počítač, dostal do ruky další z hráčů Dong Kyu. Jenže k sázce na fleš se vůbec nedostal. Libratus hodně přihodil už na svoje dvě desítky a Kyu kříže zahodil. Komentátoři vysvětlovali úspěšnost počítače v tomto případě tím, že neváhá hodně riskovat, i když v banku právě není moc peněz, což je u lidí trochu proti psychice – a že právě toto byla jedna z věcí, kterou počítač vypozoroval a upravil podle ní svoji strategii.

Pokud jste v článku našli chybu, napište nám prosím na [email protected].