Datum zveřejnění: 
7. 6. 2017

Umělá inteligence poprvé porazila pokerové profesionály! Na úspěšném algoritmu se podíleli odborníci z "Matfyzu" a ČVUT

Umělá inteligence už dokázala porazit hráče v dámě, šachu nebo japonské hře go. Poker se od nich liší především tím, že jde o hru s neúplnou informací – hráči během ní nemají všichni stejný pohled na hru, protože nedisponují stejnými informacemi. Tým výzkumníků z Univerzity Karlovy, Českého vysokého učení technického Praze a Albertské univerzity v Kanadě vyvinul počítačový program DeepStack. Během prosince 2016 se DeepStack utkal se skupinou třiceti profesionálních hráčů pokeru. A porazil je s obrovskou převahou!

Jak se učí počítač

Doposud převládal přístup, kdy musel program předem uvažovat o celé hře najednou. DeepStack je převratný v tom, že vypočítává strategii vhodnou pro konkrétní herní situaci teprve ve chvíli, kdy ona situace nastane. Umožnil mu to i rozvoj strojového učení pomocí hlubokých neuronových sítí.

DeepStack využívá neuronovou síť k vyhodnocování jednotlivých situací, které během hry nastanou. Pracuje přitom i s jistou formou "intuice", kterou si stejně jako lidský hráč zlepšuje s počtem odehraných partií.

Zápasení s počítačem

Pokerové klání probíhalo na internetu. Každý z třiceti profesionálních hráčů pocházejících ze 17 různých zemí světa měl měsíc na to, aby se připojil a s programem odehrál 3 000 partií dvouhráčové verze populárního Texas hold’em pokeru. Na tři nejlepší čekala slušná finanční odměna, takže měli dobrou motivaci vyhrát. Požadovaný počet partií dohrálo 11 hráčů. Každého z nich DeepStack porazil i individuálně. V pokerových kláních byl přitom rychlejší než jeho lidští protihráči – na jedno rozhodnutí mu stačily v průměru tři sekundy.

Uplatnění v praxi

DeepStack byl předveden na pokeru, ale aplikovat se dá mnohem šířeji. Protože jeho algoritmus spadá do oblasti teorie her, dá se aplikovat na problémy z běžného života, které se tváří jako hra. "Když se podíváte na černé pasažéry a revizory v metru, je to také taková hra. Černí pasažéři se snaží revizorům vyhýbat a revizoři se je na oplátku snaží nachytat, když zrovna nemají lístek," vysvětluje Viliam Lisý z Fakulty elektrotechnické ČVUT. Obdobně se dá algoritmus aplikovat třeba na "hry" mezi hackery a správci sítí nebo mezi správci chráněných parků a pytláky.

Turnaj v přímém přenosu

S podobnými algoritmy přicházíme do styku každý den. "Ať už si v mobilu hledáte MHD nebo si pouštíte videa na YouTube, který vám navrhuje, jaká videa by se vám mohla líbit, někde pod pokličkou těchto aplikací fungují podobné algoritmy, jako využívá DeepStack," doplňuje Martin Schmid z Matematicko-fyzikální fakulty UK. Pokud byste chtěli vidět v akci přímo DeepStack, výzkumníci plánují během pár týdnů sdílet jeho zápasy proti profesionálům přes herní streamovací platformu Twitch.

 

 

Autor: 
Šárka Flídrová
Zdroj: 
abicko.cz