Программа AlphaGo, разработанная компанией DeepMind (одна из дочерних компаний Google), выиграла у профессионального игрока пять игр подряд. Об этом сообщает Nature.
Программа выиграла пять игр из пяти по турнирным правилам против Фаня Хуэя, чемпиона Европы по го. Кроме того, программа побеждает других компьютерных игроков в 99,8 процентов случаев. По словам Фаня Хуэя, программа играла очень по-человечески: «Если бы меня заранее не предупредили, я бы мог решить, что против меня играет немного странный, но очень сильный живой игрок».
Как отмечают разработчики, изначально алгоритм не учили играть и выигрывать в го — нейросеть самостоятельно обучалась игре на примере реальных партий. Всего программа за период обработала 30 миллионов комбинаций, что позволило ей выработать аналог интуитивной игры у человека. В сочетании с этим разработчики использовали традиционный метод перебора наилучших вариантов, которые используют слабые го-алгоритмы или программы, специализирующиеся в других играх.
В марте разработчики рассчитывают устроить матч AlphaGo против Ли Седоля, одного из сильнейших го-игроков в мире. Первый профессиональный дан он получил в возрасте 13 лет.
Го — одна из древнейших настольных игр и до сегодняшнего дня было принято считать что компьютер, даже при обладающий высокими вычислительными мощностями, не способен играть на равных с профессиональным игроком из-за высокого уровня абстракции и невозможности перебора всех доступных вариантов развития событий. Например, точно число допустимых комбинаций на гобане больше, чем число атомов в наблюдаемой Вселенной.
Кроме Google о намерении разработать алгоритм, обыгрывающий профессиональных игроков в го ранее сообщала Facebook. Их программа также играет «интуитивно» и способна оценивать позицию камней на гобане.
Николай Воронцов
N+1