ScholarGate
ผู้ช่วย

มาร์คอฟเชน มอนติคาร์โล

มาร์คอฟเชน มอนติคาร์โล (Markov chain Monte Carlo) สุ่มตัวอย่างจากการแจกแจงเป้าหมายที่ซับซ้อนโดยการจำลองมาร์คอฟเชนที่ออกแบบมาให้มีการแจกแจงนั้นเป็นกฎสถานะคงที่ (stationary law) ที่เป็นเอกลักษณ์

ค้นหาหัวข้อด้วย PaperMindเร็ว ๆ นี้Find papers & topics
Tools & resources
ดาวน์โหลดสไลด์
Learn & explore
วิดีโอเร็ว ๆ นี้

Definition

มาร์คอฟเชน มอนติคาร์โล (Markov chain Monte Carlo) คือกลุ่มของอัลกอริทึมที่ประมาณค่าความคาดหวังภายใต้การแจกแจงความน่าจะเป็นเป้าหมาย โดยการรันมาร์คอฟเชนแบบเออร์กอดิก (ergodic Markov chain) ซึ่งมีการแจกแจงสถานะคงที่คือเป้าหมาย และหาค่าเฉลี่ยของฟังก์ชันตามเส้นทางของเชน

Scope

หัวข้อนี้ครอบคลุมการออกแบบเคอร์เนลการเปลี่ยนสถานะ (transition kernels) ที่มีการแจกแจงสถานะคงที่ที่กำหนดไว้, อัลกอริทึม Metropolis-Hastings และกฎการยอมรับ, ตัวสุ่ม Gibbs (Gibbs sampler) สำหรับการปรับปรุงแบบมีเงื่อนไข, การวินิจฉัยการลู่เข้า (convergence diagnostics) และช่วง burn-in, ผลกระทบของสหสัมพันธ์ในตัวเอง (autocorrelation) ต่อความแปรปรวนของตัวประมาณค่า, และความเชื่อมโยงระหว่างเวลาการผสม (mixing times) กับต้นทุนการคำนวณของการสุ่มตัวอย่าง

Core questions

  • มาร์คอฟเชนถูกสร้างขึ้นมาอย่างไรเพื่อให้มีการแจกแจงสถานะคงที่ที่ต้องการ?
  • เหตุใดกฎการยอมรับของ Metropolis-Hastings จึงสร้างกฎสถานะคงที่ที่ถูกต้อง?
  • ตัวสุ่ม Gibbs ใช้ประโยชน์จากการแจกแจงแบบมีเงื่อนไขอย่างไร?
  • เชนต้องรันนานแค่ไหนก่อนที่ตัวอย่างจะใช้งานได้ และประเมินสิ่งนี้อย่างไร?

Key theories

การสร้าง Metropolis-Hastings
การเสนอการเคลื่อนที่จากเคอร์เนลแบบสุ่มและการยอมรับด้วยความน่าจะเป็นที่สร้างขึ้นจากอัตราส่วนความหนาแน่นเป้าหมาย จะทำให้เกิดเชนแบบผันกลับได้ (reversible chain) ซึ่งมีการแจกแจงสถานะคงที่ตรงตามเป้าหมาย โดยต้องการเพียงเป้าหมายจนถึงค่าคงที่ของการทำให้เป็นมาตรฐาน (normalising constant)
ค่าเฉลี่ยแบบเออร์กอดิกและการประมาณค่าแบบมอนติคาร์โล
เนื่องจากเชนเป็นแบบเออร์กอดิกโดยมีเป้าหมายเป็นการแจกแจงสถานะคงที่ ค่าเฉลี่ยตามเวลาของฟังก์ชันตามเชนจะลู่เข้าสู่ค่าคาดหวังเป้าหมายเกือบแน่นอน ซึ่งเป็นการยืนยันการใช้เส้นทางจำลองเป็นตัวอย่าง

Clinical relevance

มาร์คอฟเชน มอนติคาร์โล เป็นเครื่องมือสำคัญในสถิติแบบเบย์สมัยใหม่, ฟิสิกส์เชิงสถิติ, และการเรียนรู้ของเครื่องจักร (machine learning) ซึ่งช่วยให้สามารถอนุมานค่าจากการแจกแจงภายหลัง (posterior distributions) ที่มีมิติสูง, ฟังก์ชันพาร์ทิชัน (partition functions), และภูมิทัศน์พลังงาน (energy landscapes) ที่ไม่สามารถหาปริพันธ์เชิงวิเคราะห์ได้ ความน่าเชื่อถือของมันขึ้นอยู่กับความเร็วในการผสมของเชนพื้นฐาน

History

เชนการยอมรับ-ปฏิเสธ (acceptance-rejection chain) มีต้นกำเนิดจากอัลกอริทึม Metropolis ในปี 1953 สำหรับฟิสิกส์เชิงสถิติ ได้รับการขยายโดย Hastings ในปี 1970 และถูกนำมาใช้ใหม่สำหรับสถิติผ่านตัวสุ่ม Gibbs ของ Geman และ Geman ในปี 1984 และการประยุกต์ใช้แบบเบย์ที่มีอิทธิพลของ Gelfand และ Smith ประมาณปี 1990 ซึ่งได้จุดประกายการปฏิวัติการคำนวณแบบเบย์

Key figures

  • Nicholas Metropolis
  • W. Keith Hastings
  • Stuart Geman
  • Donald Geman

Related topics

Seminal works

  • robertCasella2004
  • hastings1970

Frequently asked questions

เหตุใดจึงใช้มาร์คอฟเชนในการสุ่มตัวอย่าง?
สำหรับการแจกแจงเป้าหมายที่มีมิติสูงหรือไม่ได้รับการทำให้เป็นมาตรฐาน การสุ่มตัวอย่างโดยตรงนั้นทำได้ยาก มาร์คอฟเชนที่ลู่เข้าสู่เป้าหมายช่วยให้คุณสามารถสร้างตัวอย่างที่ขึ้นต่อกันแต่มีการแจกแจงที่ถูกต้องหลังจากที่มันเข้าสู่สมดุลแล้ว
Burn-in คืออะไร?
เป็นส่วนเริ่มต้นของเชนที่ถูกทิ้งไป เนื่องจากเชนยังไม่ลู่เข้าสู่การแจกแจงสถานะคงที่ ดังนั้นสถานะเริ่มต้นเหล่านั้นอาจทำให้การประมาณค่าเกิดความคลาดเคลื่อนได้

Methods for this concept

Related concepts