10.25.07
ШІ DeepMind AlphaStar розгромив професійних гравців StarCraft II з рахунком 10-1
      Система штучного інтелекту AlphaStar, розроблена фахівцями підрозділу Google DeepMind, продемонструвала вражаючі результати в поєдинку з професійними гравцями StarCraft II. Система AlphaStar змогла здобути 10 перемог поспіль TLO і MaNa в двох окремих серіях з п'яти ігор, які спочатку проходили в грудні. Після 10 поразок професіонали, нарешті, здобули перемогу над ШІ, коли MaNa зіграв з AlphaStar в поєдинку, який Blizzard і DeepMind демонстрували в режимі реального часу.

Битви між гравцями і AlphaStar велися на мапі Catalyst в злегка застарілій версії StarCraft II, яка була розроблена для проведення досліджень ШІ. Хоча TLO заявив під час трансляції, що він упевнений, що зможе перемогти ШІ, система AlphaStar змогла здобути перемоги у всіх п'яти іграх, кожен раз демонструючи абсолютно унікальні стратегії.

Однак слід зазначити, що у AlphaStar була невелика перевага перед TLO. По-перше, в матчі використовувалася раса протосів, яка не є кращою для TLO. Крім того, AlphaStar бачить гру не так, як звичайний гравець. Хоча ШІ обмежений в огляді туманом війни, він «бачить» всю карту повністю. Це означає, що AlphaStar може одночасно обробляти інформацію про власну базу, а також про ворожих юнітів, що не приховані туманом війни. Людині така можливість недоступна, йому потрібно переміщатися по карті, щоб бачити те, що відбувається на різних її ділянках.

Разом з тим, у AlphaStar не було переваг, які можна припустити у ШІ в порівнянні з людиною. У той час як TLO і MaNa теоретично обмежені в кількості кліків, які вони можуть фізично здійснювати в хвилину, на відміну від ШІ, AlphaStar фактично виконував менше дій в хвилину, ніж його опонент-людина, і значно менше, ніж використав би середній професійний гравець. Для ШІ також було встановлено час реакції близько 350 мілісекунд, що повільніше, ніж у більшості професіоналів. Хоча ШІ не квапився, він міг приймати більш розумні й ефективні рішення, які давали йому перевагу.

Відзначимо, досвід AlphaStar в грі заснований на поглибленому програмному навчанні, яку DeepMind називає AlphaStar League. У DeepMind використовували різні повтори ігор людей і тренували нейронну мережу на основі цих даних. Програма AlphaStar League працювала тиждень і за результатами кожного матчу генерувала нову інформацію, яка дозволяла відточувати стратегію ШІ. За цей тиждень було зіграно стільки матчів, що звичайному гравцеві для цього треба було б 200 років. В кінці тижневого сезону в DeepMind вибрали 5 індивідуальних агентів, які використовували найменш вірогідні стратегії і володіли найбільшими шансами на перемогу. Ці агенти використовувалися в 5 матчах проти TLO, які завершилися перемогою ШІ.

Бачачи, що ШІ вдалося перевершити професійного гравця, в DeepMind вирішили виставити AlphaStar проти експерта по протасам - гравця MaNa, який є дворазовим чемпіоном великих турнірів StarCraft II. Система AlphaStar пройшла ще один тиждень тренувань перед змаганнями, включаючи знання, отримані в рамках боїв з TLO. Коментатори відзначили, що ШІ в своїх матчах значно більше схожий на людину, використовуючи більш безладні і несподівані дії, одночасно коригуючи процес прийняття рішень і стиль. Як і у випадку з TLO, MaNa старався з усіх сил, але не зміг перемогти ні в одному з 5 матчів проти агентів AlphaStar. Таким чином, загальний рахунок змагання склав 10-0.

Потім відбувся ще один матч в режимі реального часу. У ньому використовувалася нова версія AlphaStar, яка не могла бачити всю карту відразу. В результаті, агент ухвалював рішення, ґрунтуючись на доступній інформації, на якій він сфокусований в поточний момент - як це робила б людина. Ця версія не тестувалася з іншими професійними гравцями перед матчем з MaNa. Завдяки тому, що у AlphaStar був обмежений огляд, MaNa зміг скористатися деякими слабкостями ШІ і здобути першу і поки що єдину перемогу.

Джерело: Engadget
Переглядів: 241 | Додав: dvi | Рейтинг: 0.0/0
Всього коментарів: 0
der="0" width="100%" cellspacing="1" cellpadding="2" class="commTable">
Ім'я *:Email:WWW:
Код *:
close