ScholarGate
Ассистент

Состязательный поиск и игра

Состязательный поиск — это исследование принятия решений в конкурентных условиях, когда агент должен выбирать ходы в игровом дереве против оппонента, который пытается достичь противоположного результата.

Найти тему в PaperMindСкороFind papers & topics
Tools & resources
Скачать слайды
Learn & explore
ВидеоСкоро

Definition

Состязательный поиск вычисляет ход для игрока путем исследования игрового дерева, в котором игроки поочередно делают ходы, используя принцип минимакса (каждый игрок оптимизирует, предполагая, что оппонент играет оптимально) вместе с отсечением и эвристической оценкой для работы с большими деревьями.

Scope

Эта тема охватывает поиск в играх для двух игроков с нулевой суммой и полной информацией: правило принятия решений минимакс, альфа-бета-отсечение, которое позволяет минимаксу пропускать заведомо нерелевантные ветви, оценочные функции и поиск с ограничением глубины для игр, слишком больших для точного решения, а также поиск по дереву Монте-Карло для игр с очень большими коэффициентами ветвления. В нем рассматривается, как моделируются игровые деревья и как вычислительные ограничения вынуждают использовать эвристические отсечения. Он не охватывает общий теоретико-игровой анализ равновесия многоагентных стимулов, который рассматривается в рамках многоагентных систем.

Core questions

  • Как правило минимакса определяет оптимальный ход против оптимального оппонента?
  • Как альфа-бета-отсечение исключает ветви, не влияя на минимаксное значение?
  • Как оценочные функции используются для отсечения поиска на фиксированной глубине в больших играх?
  • Когда поиск по дереву Монте-Карло предпочтительнее минимакса с ограничением глубины?

Key concepts

  • игровое дерево
  • минимаксное значение
  • альфа-бета-отсечение
  • оценочная (эвристическая) функция
  • поиск с ограничением глубины и эффект горизонта
  • игры с нулевой суммой и полной информацией
  • поиск по дереву Монте-Карло
  • упорядочивание ходов

Key theories

Правило принятия решений минимакс
В игре для двух игроков с нулевой суммой каждый игрок выбирает ход, который максимизирует его собственный гарантированный минимальный результат; распространение этих максимальных/минимальных значений вверх по игровому дереву дает оптимальный ход в корне.
Альфа-бета-отсечение
Отслеживая наилучшие значения, уже гарантированные максимизирующему и минимизирующему игрокам, альфа-бета-поиск доказывает, что определенные поддеревья не могут повлиять на окончательное решение, и пропускает их, возвращая точное минимаксное значение, при этом в лучшем случае примерно удваивая достижимую глубину за заданное время.
Поиск по дереву Монте-Карло
Когда коэффициенты ветвления слишком велики для исчерпывающего просмотра вперед, поиск по дереву Монте-Карло строит асимметричное дерево, управляемое рандомизированными прогонами и правилом выбора, балансирующим исследование и эксплуатацию, метод, который изменил компьютерную игру в таких играх, как Go.

Clinical relevance

Состязательный поиск породил знаковые системы ИИ, от шахматных движков, использующих альфа-бета-поиск, до программ Go, основанных на поиске по дереву Монте-Карло, и те же методы используются в автоматизированных переговорах, играх безопасности и любых условиях, моделируемых как состязание между оптимизирующими сторонами.

History

В статье Шеннона 1950 года компьютерные шахматы были представлены как минимаксный поиск с оценочной функцией, а теорема минимакса фон Неймана заложила теоретико-игровую основу. Альфа-бета-отсечение разрабатывалось в 1950-60-х годах и было строго проанализировано Кнутом и Муром (1975). Поиск по дереву Монте-Карло, формализованный в 2000-х годах, привел к следующему скачку в силе игры, особенно в Go.

Key figures

  • Claude E. Shannon
  • John von Neumann
  • Arthur Samuel
  • Donald E. Knuth
  • Ronald W. Moore

Related topics

Seminal works

  • shannon1950
  • knuth1975
  • browne2012

Frequently asked questions

Изменяет ли альфа-бета-отсечение ход, который выбрал бы минимакс?
Нет. Альфа-бета-отсечение возвращает точно такое же значение и ход, как и полный минимакс; оно лишь избегает исследования ветвей, которые заведомо не могут повлиять на результат. Его преимущество — скорость, и при хорошем упорядочивании ходов оно может искать примерно в два раза глубже за то же время.
Почему в таких играх, как Go, используется поиск по дереву Монте-Карло вместо минимакса?
Go имеет огромный коэффициент ветвления и не имеет простой точной оценочной функции, поэтому минимакс с фиксированной глубиной неэффективен. Поиск по дереву Монте-Карло вместо этого оценивает качество хода с помощью множества рандомизированных прогонов и избирательно развивает дерево в сторону многообещающих линий, что гораздо лучше масштабируется в таких играх.

Methods for this concept

Related concepts