ScholarGate
ผู้ช่วย

การสุ่มตัวอย่างแบบกิบส์ (Gibbs Sampling)

การสุ่มตัวอย่างแบบกิบส์จะสำรวจการแจกแจงภายหลัง (posterior) โดยการปรับปรุงพารามิเตอร์แต่ละตัวตามลำดับจากการแจกแจงแบบมีเงื่อนไขสมบูรณ์ (full conditional distribution) ของพารามิเตอร์นั้น โดยกำหนดให้พารามิเตอร์อื่น ๆ ทั้งหมดคงที่

ค้นหาหัวข้อด้วย PaperMindเร็ว ๆ นี้Find papers & topics
Tools & resources
ดาวน์โหลดสไลด์
Learn & explore
วิดีโอเร็ว ๆ นี้

Definition

การสุ่มตัวอย่างแบบกิบส์เป็นวิธีการ MCMC ที่วนรอบส่วนประกอบของเวกเตอร์พารามิเตอร์ โดยสุ่มแต่ละส่วนประกอบจากการแจกแจงภายหลังแบบมีเงื่อนไข (conditional posterior distribution) โดยกำหนดค่าปัจจุบันของส่วนประกอบอื่น ๆ ทั้งหมด ทำให้เกิดสายโซ่ที่มีการแจกแจงคงที่ (stationary distribution) เป็นการแจกแจงร่วมภายหลัง (joint posterior)

Scope

หัวข้อนี้ครอบคลุมการปรับปรุงแบบมีเงื่อนไขสมบูรณ์ซึ่งเป็นตัวกำหนดตัวสุ่มแบบกิบส์ สถานะของการสุ่มตัวอย่างแบบกิบส์ในฐานะกรณีพิเศษของ Metropolis-Hastings ที่มีโอกาสยอมรับเป็นหนึ่ง การใช้การเสริมข้อมูล (data augmentation) เพื่อสร้างเงื่อนไขที่สามารถจัดการได้ และกลยุทธ์การบล็อก (blocking) และการยุบรวม (collapsing) ที่ช่วยปรับปรุงการผสม (mixing)

Core questions

  • การแจกแจงแบบมีเงื่อนไขสมบูรณ์คืออะไร และนำมาใช้อย่างไรในการสุ่มตัวอย่างแบบกิบส์?
  • เหตุใดการสุ่มตัวอย่างแบบกิบส์จึงเป็นกรณีพิเศษของ Metropolis-Hastings?
  • การเสริมข้อมูลสร้างเงื่อนไขที่สามารถจัดการได้อย่างไร?
  • การบล็อกและการยุบรวมช่วยเพิ่มประสิทธิภาพของตัวสุ่มได้อย่างไร?

Key concepts

  • การแจกแจงแบบมีเงื่อนไขสมบูรณ์ (full conditional distribution)
  • การเสริมข้อมูล (data augmentation)
  • การบล็อก (blocking)
  • การยุบรวม (collapsing)
  • ตัวแปรแฝง (latent variables)
  • การปรับปรุงแบบส่วนประกอบ (componentwise updating)

Key theories

การปรับปรุงแบบมีเงื่อนไขสมบูรณ์ (Full-conditional updating)
การสุ่มพารามิเตอร์แต่ละตัวจากการแจกแจงแบบมีเงื่อนไขสมบูรณ์จะทำให้การแจกแจงร่วมภายหลังไม่เปลี่ยนแปลง เมื่อเงื่อนไขเป็นแบบสังยุค (conjugate) การปรับปรุงจะเป็นแบบปิด (closed-form) และการยอมรับจะเป็นไปโดยอัตโนมัติ
การเสริมข้อมูล (Data augmentation)
การแนะนำตัวแปรแฝงสามารถทำให้เงื่อนไขที่ไม่สามารถจัดการได้กลายเป็นมาตรฐานได้ เปลี่ยนปัญหาที่ยาก เช่น แบบจำลองแบบผสม (mixtures) และแบบจำลองโปรบิต (probit models) ให้เป็นการปรับปรุงแบบกิบส์ที่ตรงไปตรงมา

Clinical relevance

การสุ่มตัวอย่างแบบกิบส์ทำให้แบบจำลองแบบลำดับชั้น (hierarchical models) และแบบจำลองตัวแปรแฝง (latent-variable models) กลายเป็นเรื่องปกติ และเป็นพื้นฐานของซอฟต์แวร์ที่ใช้กันอย่างแพร่หลาย เช่น BUGS และ JAGS สำหรับการสร้างแบบจำลองเบย์เซียนประยุกต์ในชีวสถิติและสังคมศาสตร์

History

Geman และ Geman ได้นำเสนอตัวสุ่มแบบกิบส์ในปี 1984 สำหรับการฟื้นฟูภาพ โดยตั้งชื่อตามการแจกแจงแบบกิบส์ในฟิสิกส์เชิงสถิติ บทความของ Gelfand และ Smith ในปี 1990 ได้แสดงให้เห็นถึงการประยุกต์ใช้อย่างกว้างขวางกับการอนุมานแบบเบย์เซียน ซึ่งกระตุ้นให้เกิดการนำไปใช้อย่างแพร่หลาย

Debates

การผสมที่ช้าภายใต้การพึ่งพาที่แข็งแกร่ง (Slow mixing under strong dependence)
การปรับปรุงแบบกิบส์แบบส่วนประกอบอาจผสมได้ไม่ดีเมื่อพารามิเตอร์มีความสัมพันธ์กันสูง ซึ่งกระตุ้นให้เกิดการปรับพารามิเตอร์ใหม่ การบล็อก หรือทางเลือกอื่น ๆ ที่อิงตามการไล่ระดับ (gradient-based alternatives)

Key figures

  • Stuart Geman
  • Donald Geman
  • Alan Gelfand
  • Adrian Smith

Related topics

Seminal works

  • geman1984
  • gelfand1990

Frequently asked questions

เมื่อใดที่การสุ่มตัวอย่างแบบกิบส์เป็นทางเลือกที่ดี?
การสุ่มตัวอย่างแบบกิบส์เหมาะสำหรับแบบจำลองที่มีเงื่อนไขสมบูรณ์แบบสังยุคหรือแบบมาตรฐานอื่น ๆ เช่น แบบจำลองแบบลำดับชั้นและแบบจำลองตัวแปรแฝงจำนวนมาก แต่ก็อาจผสมได้ช้าเมื่อพารามิเตอร์มีความสัมพันธ์กันอย่างมาก

Methods for this concept

Related concepts