Tìm kiếm đối kháng và chơi trò chơi
Tìm kiếm đối kháng là nghiên cứu về việc ra quyết định trong các môi trường cạnh tranh, nơi một tác nhân phải chọn các nước đi trong cây trò chơi chống lại một đối thủ đang cố gắng đạt được kết quả ngược lại.
Definition
Tìm kiếm đối kháng tính toán một nước đi cho người chơi bằng cách khám phá một cây trò chơi trong đó người chơi luân phiên lượt, sử dụng nguyên tắc minimax (mỗi người chơi tối ưu hóa giả định đối thủ chơi tối ưu) cùng với cắt tỉa và đánh giá theo kinh nghiệm để đối phó với các cây lớn.
Scope
Chủ đề này bao gồm tìm kiếm trong các trò chơi hai người chơi, tổng bằng không, thông tin hoàn hảo: quy tắc quyết định minimax, cắt tỉa alpha-beta cho phép minimax bỏ qua các nhánh không liên quan đã được chứng minh, các hàm đánh giá và tìm kiếm giới hạn độ sâu cho các trò chơi quá lớn để giải quyết chính xác, và tìm kiếm cây Monte Carlo cho các trò chơi có hệ số phân nhánh rất lớn. Nó đề cập đến cách các cây trò chơi được mô hình hóa và cách các giới hạn tính toán buộc phải cắt bỏ theo kinh nghiệm. Nó không bao gồm phân tích cân bằng lý thuyết trò chơi tổng quát về các khuyến khích đa tác nhân, được xử lý trong các hệ thống đa tác nhân.
Core questions
- Quy tắc minimax xác định một nước đi tối ưu chống lại một đối thủ tối ưu như thế nào?
- Cắt tỉa alpha-beta loại bỏ các nhánh mà không ảnh hưởng đến giá trị minimax như thế nào?
- Các hàm đánh giá được sử dụng như thế nào để cắt bỏ tìm kiếm ở một độ sâu cố định trong các trò chơi lớn?
- Khi nào thì tìm kiếm cây Monte Carlo được ưu tiên hơn minimax giới hạn độ sâu?
Key concepts
- cây trò chơi
- giá trị minimax
- cắt tỉa alpha-beta
- hàm đánh giá (kinh nghiệm)
- tìm kiếm giới hạn độ sâu và hiệu ứng chân trời
- trò chơi tổng bằng không thông tin hoàn hảo
- tìm kiếm cây Monte Carlo
- thứ tự nước đi
Key theories
- Quy tắc quyết định Minimax
- Trong một trò chơi hai người chơi tổng bằng không, mỗi người chơi chọn nước đi tối đa hóa kết quả tối thiểu được đảm bảo của mình; việc truyền các giá trị tối đa/tối thiểu này lên cây trò chơi sẽ cho ra nước đi tối ưu ở gốc.
- Cắt tỉa Alpha-beta
- Bằng cách theo dõi các giá trị tốt nhất đã được đảm bảo cho người chơi tối đa hóa và tối thiểu hóa, tìm kiếm alpha-beta chứng minh rằng một số cây con không thể ảnh hưởng đến quyết định cuối cùng và bỏ qua chúng, trả về giá trị minimax chính xác trong khi trong trường hợp tốt nhất làm tăng gấp đôi độ sâu có thể đạt được trong một thời gian nhất định.
- Tìm kiếm cây Monte Carlo
- Khi các hệ số phân nhánh quá lớn để tìm kiếm toàn diện, tìm kiếm cây Monte Carlo xây dựng một cây không đối xứng được hướng dẫn bởi các lần chạy ngẫu nhiên và một quy tắc lựa chọn cân bằng giữa khám phá và khai thác, một phương pháp đã thay đổi cách chơi của máy tính trong các trò chơi như cờ vây.
Clinical relevance
Tìm kiếm đối kháng đã tạo ra các hệ thống AI mang tính bước ngoặt, từ các công cụ cờ vua sử dụng tìm kiếm alpha-beta đến các chương trình cờ vây dựa trên tìm kiếm cây Monte Carlo, và các kỹ thuật tương tự cũng được áp dụng trong đàm phán tự động, trò chơi an ninh và bất kỳ môi trường nào được mô hình hóa như một cuộc cạnh tranh giữa các bên tối ưu hóa.
History
Bài báo năm 1950 của Shannon đã định hình cờ vua máy tính như tìm kiếm minimax với một hàm đánh giá, và định lý minimax của von Neumann đã cung cấp nền tảng lý thuyết trò chơi. Cắt tỉa alpha-beta được phát triển trong những năm 1950-60 và được phân tích chặt chẽ bởi Knuth và Moore (1975). Tìm kiếm cây Monte Carlo, được chính thức hóa vào những năm 2000, đã thúc đẩy bước nhảy vọt tiếp theo về sức mạnh chơi trò chơi, đặc biệt là trong cờ vây.
Key figures
- Claude E. Shannon
- John von Neumann
- Arthur Samuel
- Donald E. Knuth
- Ronald W. Moore
Related topics
Seminal works
- shannon1950
- knuth1975
- browne2012
Frequently asked questions
- Cắt tỉa alpha-beta có làm thay đổi nước đi mà minimax sẽ chọn không?
- Không. Cắt tỉa alpha-beta trả về chính xác cùng giá trị và nước đi như minimax đầy đủ; nó chỉ tránh khám phá các nhánh mà đã được chứng minh là không thể ảnh hưởng đến kết quả. Lợi ích của nó là tốc độ, và với thứ tự nước đi tốt, nó có thể tìm kiếm sâu hơn gấp đôi trong cùng một thời gian.
- Tại sao nên sử dụng tìm kiếm cây Monte Carlo thay vì minimax trong các trò chơi như cờ vây?
- Cờ vây có hệ số phân nhánh rất lớn và thiếu một hàm đánh giá chính xác đơn giản, do đó minimax độ sâu cố định không hiệu quả. Thay vào đó, tìm kiếm cây Monte Carlo ước tính chất lượng nước đi thông qua nhiều lần chơi ngẫu nhiên và phát triển cây một cách chọn lọc theo các đường đi hứa hẹn, điều này mở rộng quy mô tốt hơn nhiều trong các trò chơi như vậy.