11.22.02
ШІ AlphaZero знадобилося чотири години, щоб навчитися грати в шахи і обіграти програму-чемпіона
      Програма AlphaZero за чотири години навчилася грі в шахи, після чого перемогла Stockfish 8 - штучний інтелект, який вважався найкращим віртуальним шаховим гравцем. Про це йдеться в науковій роботі, препринт якої опублікований на сайті Arxiv.

Як повідомляється, в AlphaZero впровадили тільки правила шахів, але не стратегії і алгоритми гри. Всьому цьому програма навчалася самостійно. Якщо раніше всі шахові програми запам'ятовували ходи, зроблені людьми, і керувалися традиційними знаннями про гру, накопиченими людством за багатовікові експерименти, то нове покоління інтелекту отримує всі навички, граючи сам з собою.

Потім дослідники організували битву між Stockfish 8 і AlphaZero. Перед початком кожного ходу програмами давали хвилину на роздуми. Всього провели 100 ігор. AlphaZero перемогла 25 раз білими і ще 3 рази чорними. Решта гри зіграли внічию. Тобто, AlphaZero не допустив жодного програшу. Навички програми розробники назвали «надлюдськими».

За їх словами, нейронна мережа може передбачати ходи далеко вперед, може жертвувати фігурами для позиційних завоювань і не має забобонів і логічних установок. Штучний інтелект часом вибирає ходи, які людина майже напевно б відкинула, вибудовуючи з їх допомогою виграшні комбінації.

Наостанок зазначимо, що, крім шахів, Alpha Zero також навчили правилам сеги - японської настільної гри шахового типу. Як і в першому випадку, в програму включили тільки основні правила, але не завантажували можливі сценарії. Після двох годин навчання програма обіграла алгоритм Elmo з рахунком в 90: 8, ще дві гри закінчилися внічию.

Джерела: RepublicThe Guardian
Переглядів: 349 | Додав: dvi | Рейтинг: 0.0/0
Всього коментарів: 0
der="0" width="100%" cellspacing="1" cellpadding="2" class="commTable">
Ім'я *:Email:WWW:
Код *:
close