» Суперкомпьютер DeepMind самостоятельно освоил трехтысячелетний опыт человечества за 40 дней
23.10.2017 10:04

Суперкомпьютер DeepMind самостоятельно освоил трехтысячелетний опыт человечества за 40 дней

Источник перевод для gearmix ()

Для справки: Первоисточники прямо указывают на существование игры в Го в Древнем Китае и Японии, по крайней мере, 2500 лет тому назад. Игра ведётся на стандартном поле размером 37 х 37 линий. Играют два соперника. Цель игры заключается в ограничении возможных ходов соперника, то есть отгородить камнями своего цвета (участвуют чёрные и белые камни) как можно большую территорию. Из-за большой вариативности ходов в сочетании с большим игровым полем, игра в Го традиционно считается сложнее шахмат, несмотря на вообщем-то простые правила, рассмотрение которых выходит за рамки данной статьи. Упрощённый вариант игры популярен в англоязычных странах как «реверси».

AlphaGo был настолько эффективным, потому что он был запрограммирован для использования миллионов ходов прошлых мастеров и мог предсказать собственные шансы на победу, соответствующим образом скорректировав свой игровой план.

Но теперь эта же команда создала машину, которая учится с нуля. Идея заключалась в том, чтобы ИИ самостоятельно разыгрывал партии в Го против себя же, анализируя ходы.

Google DeepMind, модифицированный до AlphaGo Zero, ознакомленный с правилами игры в Го, за 40 дней освоил эту игру с «tabula rasa» или с чистой доски.

Всего за три дня он победил все версии AlphaGo, и в течение 40 дней ИИ самостоятельно обнаружил принципы игры, к которым людям приходилось идти тысячи лет.

Он также разработал интригующие новые собственные стратегии и, по словам разработчиков, порой поднимался до настоящих моментов творчества.

Учёные в восторге от полученного результата и надеются распространить этот опыт на другие области для решения проблем реального мира, будь-то синтезирование новых белков, снижение потребления энергии или поиск новых революционных материалов.

Сам принцип «чистой таблички», в которой программа становится своим собственным учителем и оппонентом, играя в игры против себя и немного улучшая результат каждый раз, является весьма перспективным.

Тем более, что этот метод не нуждается в человеческих знаниях, данных или любом другом вмешательстве.

 



ПОХОЖИЕ ЗАПИСИ


© Gearmix 2013
Права на опубликованный перевод принадлежат владельцам вебсайта gearmix.ru
Все графические изображения, использованные при оформлении статьи принадлежат их владельцам. Знак охраны авторского права распространяется только на текст статьи.
Использование материалов сайта без активной индексируемой ссылки на источник запрещено.

Понравилась статья?
Поделись с друзьями!

x

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *