Blizzard и DeepMind выпускают набор инструментов StarCraft II AI

(Изображение: DeepMind)

Лаборатория искусственного интеллекта (ИИ) Google DeepMind и студия разработки игр Blizzard объявили о выпуске набора инструментов, направленных на ускорение исследований ИИ с помощью стратегии StarCraft II в реальном времени.

Набор инструментов, помеченный SC2LE, включает в себя API-интерфейс машинного обучения от Blizzard; итерация с открытым исходным кодом набора инструментов DeepMind PySC2; набор данных из 65 000 повторов анонимной игры, который будет расширен до более 500 000 в следующие несколько недель и поможет имитационному обучению для предсказания последовательности и долговременной памяти; набор мини-игр для тестирования производительности ИИ для конкретных задач StarCraft II, таких как сбор минералов, сбор газа и выбор юнитов; и совместный документ с изложением окружающей среды и исходных базовых результатов по эффективности ИИ.

Согласно сообщение в блоге DeepMind ученый-исследователь Ориол Виньялс, менеджер программ Стивен Гаффни и инженер-программист Тимо Эвальдс, тестирующий ИИ в играх, которые не были предназначены для таких исследований и в которых выдающиеся игроки-люди "имеют решающее значение для оценки производительности агентов".

«Часть долговечности StarCraft связана с богатым, многослойным игровым процессом, который также делает его идеальной средой для исследований ИИ», - говорится в сообщении в блоге.

Например, в то время как цель игры состоит в том, чтобы победить противника, игрок также должен выполнить и сбалансировать ряд подзадач, таких как сбор ресурсов или построение структур.

«Кроме того, для завершения игры может потребоваться от нескольких минут до одного часа, что означает, что действия, предпринятые в начале игры, могут не окупиться в течение длительного времени. Наконец, карта соблюдается лишь частично, то есть агенты должны использовать комбинацию памяти и планирования успеха ".

В игре StarCraft есть около 100 миллионов возможных действий, добавили они, в то время как в играх Atari, которые DeepMind также использовал для исследования ИИ, есть только 300 основных действий. Согласно DeepMind, популярность игры также означает, что есть большой объем данных для воспроизведения, а также большое количество противников для ИИ.

DeepMind сказал, что он имеет изолированные элементы, включая тип юнитов, здоровье и видимость карты, разбивая игру на «функциональные слои», а мини-игры помогают обеспечить управляемые фрагменты для ИИ для изучения основных действий.

«Наши первые исследования показывают, что наши агенты хорошо работают в этих мини-играх. Но когда дело доходит до полной игры, даже сильные базовые агенты, такие как A3C, не могут выиграть ни одной игры против даже самого простого встроенного ИИ», - пишет блог. Пост сказал, добавив, что один агент не смог выполнить тривиальные задачи, такие как ведение добычи своих работников.

«Мы надеемся, что выпуск этих новых инструментов будет опираться на работу, которую сообщество искусственного интеллекта уже проделало в StarCraft, стимулируя дополнительные исследования DeepRL и упрощая исследователям возможность сосредоточиться на границах нашего поля».

DeepMind объявил в ноябре, что будет использовать StarCraft II как платформа для тестирования ИИ и машинного обучения исследования, открывающие окружающую среду во всем мире.

«Мы тесно сотрудничали с командой StarCraft II для разработки API, который поддерживает нечто похожее на предыдущие боты, написанные с помощью« скриптового »интерфейса, позволяя программно контролировать отдельные юниты и получать доступ к полному состоянию игры (с некоторыми новыми опциями, а также ),» DeepMind сказал в это время.

«В конечном счете, агенты будут воспроизводить видео непосредственно с пикселей, поэтому, чтобы помочь нам, мы разработали новый интерфейс на основе изображений, который выводит упрощенные данные изображения RGB с низким разрешением для карты и мини-карты, а также возможность разбивать функции на отдельные «слои», такие как поле высоты местности, тип юнита, здоровье юнита и т. д. »

Механизм ИИ, следовательно, должен будет использовать навыки памяти, составления карт, долгосрочного планирования и адаптации к изменениям в планах с использованием информации, которая постоянно собирается, что приводит к иерархическому планированию и обучению с подкреплением.

DeepMind также использовал сложные игры, такие как Go, чтобы проверить AI, с его AI AlphaGo побеждает чемпиона мира Ке Джи в мае.

Go, древняя настольная игра, происходящая из Китая, имеет 10 ^ 761 возможных игр по сравнению с 10 ^ 120 возможными играми для шахмат.

DeepMind тогда отставной АльфаГо вместо этого сосредоточиться на использовании ИИ для создания продвинутых алгоритмов, чтобы помочь ученым разрабатывать лекарства от болезней, сокращать потребление энергии и изобретать новые материалы.

DeepMind работает с фондом Moorfields Eye Hospital и Университетским колледжем Лондонских больниц (UCLH) в Великобритании. чтение сканов с помощью алгоритмов , Он также сотрудничал с Национальной службой здравоохранения для проведения экспериментов с использованием машинного обучения для планировать использование лучевой терапии для отдельных пациентов с раком головы и шеи, что может сократить время ожидания процедур и высвободить больше времени для врачей по всей стране.

Похожие

АКЦИЯ Набор инструментов для сварщика на 1 злотый при покупке сварщика
Новости () вернуться к списку новостей 2016-08-23 печать Комплект: сварщик FSP-UP60 + инструменты для сварщика Сверхлегкий сварочный аппарат FSP-UP80 (2,3 кг с аккумулятором) предлагает новейшую технологию сварки волокон с центрированием по центру. Польский пользовательский интерфейс, польское руководство в книжной версии (а не электронное!),
Самые популярные RFID-чипы большой дальности для маркировки активов
Как вы можете выбрать наиболее подходящий для вашего проекта из сотен доступных моделей чипов RFID? Вот пять самых популярных, которые идеально подходят для многих приложений и подчеркивают преимущества внедрения системы RFID. RFID-метки в пластиковом корпусе - Confidex Steelwave Micro II Небольшая и легкая бирка, с помощью которой вы можете легко маркировать свои основные средства и оборудование независимо от материала, из которого они сделаны.