Facebook и Университет Карнеги-Меллона создали очередную программу на основе искусственного интеллекта (ИИ), который одолел в честной схватке несколько выдающихся профессионалов покера. ИИ-боты уже заработали репутацию лучших профессиональных игроков в соревнованиях один на один, а теперь Facebook заявляет, что новая программа способна выиграть у профессионалов высшего класса в «любой показательной игре» с участием двух и более противников.

Искусственный интеллект, получивший имя Pluribus, одолел профессиональных игроков в двух разных форматах игры «Техасский холдем»: пять ИИ-ботов и один человек, а также один бот и пять реальных игроков. Создатели Pluribus написали в своем докладе для журнала Science, что создание такой программы для покера означает «важную веху в  развитии искусственного интеллекта».

В других играх, таких как шахматы и «Го», борьба идет в открытую. В отличие от них, в покере есть скрытая информация, а именно, какие карты на руках у соперника. Это обстоятельство обусловливает необходимость применения в покере различных сложных стратегий, которых нет в других играх, включая такой тонкий прием как блеф. В связи с этим, ИИ-боты до сих пор, как правило, испытывали трудности с принятием в расчет скрытой информации и эффективным ее использованием.

Блеф представляет собой особенно интересную проблему. Успешный блеф может кардинально изменить ход игры в вашу пользу, но стоит чуть переиграть, и обман раскроется. Таким образом, бот должен уметь грамотно сочетать блеф со ставками с реально хорошими картами на руках.

Pluribus представляет собой более продвинутую версию программы Libratus, разработанную Университетом Карнеги-Меллона, которая несколько лет назад победила профессиональных игроков в схватке один на один. Существует новый алгоритм поиска в Интернете, который позволяет Pluribus просчитывать все возможные варианты на несколько ходов вперед, а не только конец игры. Кроме того, у нового бота «более быстрые алгоритмы для автономных игр со скрытой информацией», а это значит, что он стал более эффективным в обучении приемам обращения со скрытой информацией в играх против собственных копий.

В результате Pluribus продемонстрировал намного более высокую эффективность, чем другие игровые ИИ-боты. Он использует менее 128 ГБ памяти и работает всего на двух графических процессорах. В 2016 году другая подобная программа, AlphaGo, использовала в поединке с профессионалом игры «го» Ли Седолом 1920 микропроцессоров и 280 графических процессоров. Pluribus обычно принимает решение вдвое быстрее, чем любой профессионал, тратя в среднем по 20 секунд на полную раздачу в игре против собственных копий.

В 12-дневной игре на 10 тысяч раздач Pluribus сразился с профессионалами, включая чемпионов Всемирной серии покера и турнира World Poker Tour. Среди них были Крис Фергюссон, Грег Мерсон, Даррен Эллиас и Джимми Чоу. Все они выиграли, по меньшей мере, миллион долларов в профессиональной игре, и у них был внушительный денежный стимул выложиться по максимуму в поединке с ботом.

«Если бы каждая фишка стоила доллар, Pluribus выиграл бы в среднем около 5 долларов за раздачу и мог бы зарабатывать около 1000 долларов в час, играя против пяти человек, – пишет Facebook. – Эти результаты считаются среди профессионалов покера максимально возможной победой».

Похоже, профи были заинтересованы теми стратегиями, которые использовал Pluribus, такими как, например, нетипичный (для людей) ход со ставкой после колла в предыдущем раунде. «Было невероятно увлекательно играть против ИИ-бота и наблюдать за некоторыми стратегиями, которые он выбирает, – сказал Майкл Гальяно. – Было несколько комбинаций, которые люди вообще никогда не применяют, особенно учитывая размеры ставок».

«Pluribus – очень трудный соперник, – сказал Фергюссон, – Его действительно трудно одолеть при любом раскладе. Он очень хорош в тонкой игре ставками на ривере, а также умеет извлекать максимум возможного из хорошей карты на руках».


Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *