Heads-up: Člověk proti počítači. Je lidský mozek stále nejlepším procesorem pro NL Hold'em?
Od 11. ledna usedne v pittsburghském Rivesr's Casinu v rámci akce “Brains Vs. Artificial Intelligence: Upping the Ante” ke stolů čtveřice profesionálů Jason Les, Dong Kim, Daniel McAulay a Jimmy Chou, kteří odehrají v průběhu 20 dní celkem 120.000 hand heads-upu proti neživému protihráči. Budou soupeřit o podíly z $200.000.
Vyvolenou umělou inteligencí, která bude jejich soupeřem, je program nazvaný Libratus, jenž bude v letos nasazen poté, co v předloňském roce program Claudico prohrál ve třech ze čtyř heads-upů. Hráči odehráli celkem 80.000 hand, což profesoři univerzity nebrali za dostatečný vzorek. Odvolávali se především na pokerovou varianci, malý odehraný vzorek a statisticky relativně těsné vítězství, když se ve všech hrách protočilo přes 170 milionů a Claudico celkem prohrál jen 732K.
Robot Libratus vyvinutý dvojící Sandholm a Brown zvítězil v únoru 2016 v obou vyhlášených kategoriích v rámci robotické soutěž v No Limit Texas Hold'em a kvarteto profesionálů tak bude znovu čelit opravdu tomu nejlepšímu z nejlepších. Bude to tentokrát stačit?
Doug Polk proi Claudicu v květnu 2015
Zvolení profesionálové budou spárování a proti počítači budou hrát duplicitní zápasy. Tzn. jeden z dvojice odehraje své zápasy a druhý bude počítači čelit v obráceném gardu při stejném rozdání. Hráči při tom budou v izolovaných místnostech. Díky navýšení počtu hracích dní a také počtu stolů (každý z hráčů bude hrát současně na dvou stolech) se zvýší i celkový počet her a tím bude samotný pokus zajímavý i ze statistického hlediska, doufejme i pro vědce z Carnegie Mellon. Hrát se bude každý den odpoledne. River's Poker room bude otevřen také divákům.
"Už od prvních dní výzkumu AI (umělé inteligence) bylo vždy silným měřítkem pokroku soupeření s lidskými hráči v nejrůznějších hrách.," řekl Tuomas Sandholm, profesor počítačových věd na Carnegie Mellon, který pokerového bota společně se svým studentem Noamem Brownem vytvořil.
"Už v roce 1997 dokázal počítačový program porazit nejúspěšnějšího šachového hráče, v roce 2009 zvítězil robot v Jeopardy! a v Go kraloval v minulém roce. Poker je na rozdíl od těchto her v mnohém složitější, především díky nutnosti rozhodovat se na základě neúplných informací a také díky situacím, ve kterých může čelit bluffování a jiným trikům."
Výsledek tak s jistotou nelze předem předvídat.
Program Libratus byl vyvinut nezávisle na předchozím modelu Claudico zcela od nuly s využitím algoritmu pro výpočet strategií pro hry s neúplnými informacemi. Při hře bude používat k výpočtu výherní strategie superpočítač z Pittsburgh Supercomputing Center. Hráči se tak mají rozhodně na co těšit a nečeká je lehký úkol.
Vylepšením jsou i rozumnější implementace mnoha podivných tahů na zmatení soupeřů jako je limpování a nové technologie k určení Nashova equilibria. Bot by měl být nově schopen rychleji najít handy a postupy, které v určitých situacích nejsou slibné a tyto nadále ignorovat.
Libratus je slovo pocházející z latiny znamenající vyvážený a silný. Tvůrci ho vybrali nejen díky začlenění nových technologií, ale také jako poctu absolventovi Carnegie Mellon a držiteli Nobelovy ceny Johnu Nashovi.
Prosazení umělé inteligence v hrách s neúplnými informacemi by mohlo mít další využití například v ekonomice, počítačové bezpečnosti či medicíně.
"Rozšíření umělé inteligence do reálného světa, kde často máte neúplné informace, neznáte podrobnosti a vaši soupeři často mění svou strategii, je zásadně těžší, než využití u her s kompletní informací," řekl Nick Nystrom, ředitel výzkumu na Pittsburgh Supercomputing centrum.
Související články:
- Brains vs AI: Umělá inteligence neměla šanci. Lidské mozky zvítězily na plné čáře
- Po první polovině výzvy je téměř rozhodnuto. Počítačový soupeř je hluboko v mínusu
- Brains vs. AI $100K Challenge: Po prvním dni prohrává umělá inteligence $148.000
- Porazí člověk umělou inteligenci? Doug Polk vyzve počítačový program Claudico
