Суперкомпьютер DeepMind самостоятельно освоил трехтысячелетний опыт человечества за 40 дней

Для справки: Первоисточники прямо указывают на существование игры в Го в Древнем Китае и Японии, по крайней мере, 2500 лет тому назад. Игра ведётся на стандартном поле размером 37 х 37 линий. Играют два соперника. Цель игры заключается в ограничении возможных ходов соперника, то есть отгородить камнями своего цвета (участвуют чёрные и белые камни) как можно большую территорию. Из-за большой вариативности ходов в сочетании с большим игровым полем, игра в Го традиционно считается сложнее шахмат, несмотря на вообщем-то простые правила, рассмотрение которых выходит за рамки данной статьи. Упрощённый вариант игры популярен в англоязычных странах как «реверси».

AlphaGo был настолько эффективным, потому что он был запрограммирован для использования миллионов ходов прошлых мастеров и мог предсказать собственные шансы на победу, соответствующим образом скорректировав свой игровой план.

Но теперь эта же команда создала машину, которая учится с нуля. Идея заключалась в том, чтобы ИИ самостоятельно разыгрывал партии в Го против себя же, анализируя ходы.

Google DeepMind, модифицированный до AlphaGo Zero, ознакомленный с правилами игры в Го, за 40 дней освоил эту игру с «tabula rasa» или с чистой доски.

Всего за три дня он победил все версии AlphaGo, и в течение 40 дней ИИ самостоятельно обнаружил принципы игры, к которым людям приходилось идти тысячи лет.

Он также разработал интригующие новые собственные стратегии и, по словам разработчиков, порой поднимался до настоящих моментов творчества.

Учёные в восторге от полученного результата и надеются распространить этот опыт на другие области для решения проблем реального мира, будь-то синтезирование новых белков, снижение потребления энергии или поиск новых революционных материалов.

Сам принцип «чистой таблички», в которой программа становится своим собственным учителем и оппонентом, играя в игры против себя и немного улучшая результат каждый раз, является весьма перспективным.

Тем более, что этот метод не нуждается в человеческих знаниях, данных или любом другом вмешательстве.

Суперкомпьютер DeepMind самостоятельно освоил трехтысячелетний опыт человечества за 40 дней

Добавить комментарий Отменить ответ

Архивы