Mokslininkai atskleidė dirbtinio intelekto, laimėjusio $2 mln iš pokerio čempionų, veikimo principą  (1)

Dirbtinio intelekto (DI) sistemos Libratus, šių metų pradžioje iš profesionalių pokerio lošėjų laimėjusios beveik $2 mln, kūrėjai pirmą kartą atskleidė jos veikimo principą. Straipsnis publikuojamas Science.


Prisijunk prie technologijos.lt komandos!

Laisvas grafikas, uždarbis, daug įdomių veiklų. Patirtis nebūtina, reikia tik entuziazmo.

Sudomino? Užpildyk šią anketą!

DI algoritmai gan seniai išmoko laimėti prieš žmones žaidimuose, kur visa informacija atvira (pavyzdžiui, šachmatais ar go). Tačiau iki pat dabar įsivaizduota, kad žaidimuose, kur nėra žinoma visa informacija – tarkime, kaip pokeryje – mašinai žmogų įveikti praktiškai neįmanoma. Pokerio žaidėjai gali blefuoti, priversdami priešininką patikėti, kad turima kombinacija yra stipri, ir informacijos apie žaidėją šaltinis gali būti vien mimika, gestai ir kitos menkai pastebimos elgesio detalės; manyta, kad tinkamai atsižvelgti, įvertinti šiuos faktorius ir laimėti žaidimą DI nesugebėtų. Libratus pergalė tapo pirmuoju tokiu įvykiu, kai pralaimėjo geriausi pasaulyje pokerio žaidėjai.

Mokslininkų sukurtas algoritmas susideda iš trijų dalių. Kiekvieno dalinimo pradžioje Libratus pokerį vertino kaip abstraktų žaidimą, ir atsižvelgdama į turimas kortas, kurdavo bendrą strategiją: pirmųjų žingsnių strategija buvo gan detali, o baigiamasis žaidimo etapas – kol kas apibrėžiamas tik daugmaž.

Antrame etape algoritmas koreguodavo savo darbą: jeigu Libratus pastebėdavo, kad žaidėjas atliko netikėtą ėjimą, jis atskirai apskaičiuodavo jo pasekmes ir ieškojo saugių variantų, tokiu būdu atsižvelgdamas į blefo ar žmogaus klaidos tikimybę. Trečiajame etape Libratus pridėdavo duomenis apie kitų žaidėjų įvairiose situacijose statomų sumų dydžius, po to galutinai koreguodavo strategiją.

Straipsnyje mokslininkai padarė išvadą, kad į Libratus įdiegtas idėjas galima panaudoti, sprendžiant praktiškai bet kokias užduotis, kuriose žinoma ne visa informacija.

Turnyras, kuriame dalyvavo Libratus, vyko 2017 metų sausio mėnesį. 20 dienų trukusiose varžybose DI žaidė Teksaso holdemą* su keturiais geriausiais pasaulio žaidėjais – Jasonu Lesu, Dongu Kimu, Danieliu Mcaulay'iu ir Jimmy'iu Chow. Žaidimo rezultatai parodė, kad Libratus stipresnis už visus keturis dalyvius, ir laimėjo žetonų už $1,8 mln.



republic.ru

* Texas Holdem – pokerio rūšis, kur kortos „priklauso“ visiems žaidėjams, kai tuo tarpu traukimo (Draw) pokeryje kombinacijas galima sudaryti tik iš savo rankose laikomų kortų.

(46)
(2)
(44)

Komentarai (1)