ScholarGate
ผู้ช่วย

กระบวนการดีริชเลต์และแบบจำลองผสม

กระบวนการดีริชเลต์เป็นค่าก่อนหน้า (prior) เหนือการแจกแจงที่มีลักษณะไม่ต่อเนื่อง ทำให้เป็นพื้นฐานตามธรรมชาติสำหรับแบบจำลองผสมที่อนุมานจำนวนกลุ่มจากข้อมูล

ค้นหาหัวข้อด้วย PaperMindเร็ว ๆ นี้Find papers & topics
Tools & resources
ดาวน์โหลดสไลด์
Learn & explore
วิดีโอเร็ว ๆ นี้

Definition

กระบวนการดีริชเลต์เป็นกระบวนการสุ่มที่ผลลัพธ์คือการวัดความน่าจะเป็น; แบบจำลองผสมกระบวนการดีริชเลต์จะทำการสังวัตน์การวัดแบบสุ่มที่ไม่ต่อเนื่องเหล่านี้กับเคอร์เนล ทำให้เกิดการผสมที่มีจำนวนส่วนประกอบแบบสุ่มที่กำหนดโดยข้อมูล

Scope

หัวข้อนี้ครอบคลุมกระบวนการดีริชเลต์และพารามิเตอร์ความเข้มข้นและมาตรวัดฐาน การนำเสนอแบบโพลยาเอิร์นและกระบวนการร้านอาหารจีน การจัดกลุ่มที่เกิดขึ้น และแบบจำลองผสมกระบวนการดีริชเลต์ที่ใช้สำหรับการประมาณความหนาแน่นและการจัดกลุ่มด้วยจำนวนส่วนประกอบที่ไม่จำกัด

Core questions

  • พารามิเตอร์ความเข้มข้นและมาตรวัดฐานของกระบวนการดีริชเลต์คืออะไร?
  • แบบโพลยาเอิร์นและกระบวนการร้านอาหารจีนอธิบายการจัดกลุ่มอย่างไร?
  • แบบจำลองผสมกระบวนการดีริชเลต์อนุมานจำนวนกลุ่มได้อย่างไร?
  • การอนุมานแบบเบย์เซียนสำหรับแบบจำลองเหล่านี้ดำเนินการอย่างไร?

Key concepts

  • กระบวนการดีริชเลต์
  • พารามิเตอร์ความเข้มข้น
  • มาตรวัดฐาน
  • กระบวนการร้านอาหารจีน
  • แผนภาพโพลยาเอิร์น
  • แบบจำลองผสมอนันต์
  • การจัดกลุ่ม

Key theories

กระบวนการดีริชเลต์
เฟอร์กูสันได้นิยามกระบวนการดีริชเลต์เพื่อให้ค่าของมันในการแบ่งส่วนจำกัดใดๆ มีการแจกแจงแบบดีริชเลต์ ทำให้ได้ค่าก่อนหน้าแบบคอนจูเกตที่เกือบจะแน่นอนว่าไม่ต่อเนื่องเหนือการแจกแจง
แบบจำลองผสมกระบวนการดีริชเลต์
การผสมเคอร์เนลต่อเนื่องกับการวัดที่แจกแจงแบบกระบวนการดีริชเลต์ทำให้ได้การประมาณความหนาแน่นที่ยืดหยุ่นและการจัดกลุ่มที่มีจำนวนส่วนประกอบที่ไม่จำกัด โดยมีการอนุมานผ่านการสุ่มตัวอย่างแบบกิบบส์

Clinical relevance

แบบจำลองผสมกระบวนการดีริชเลต์ทำการจัดกลุ่มตามแบบจำลองและการประมาณความหนาแน่นโดยไม่ต้องกำหนดจำนวนกลุ่ม ซึ่งมีคุณค่าในด้านจีโนมิกส์ การจำแนกประเภทย่อยของประชากร และการตั้งค่าอื่นๆ ที่ไม่ทราบจำนวนกลุ่ม

History

เฟอร์กูสันได้นิยามกระบวนการดีริชเลต์ในปี 1973 และอันโตเนียกได้นำเสนอแบบจำลองผสมของกระบวนการดีริชเลต์ในปี 1974 แนวทางของเอสโคบาร์และเวสต์ในการสุ่มตัวอย่างแบบกิบบส์ในปี 1995 ทำให้แบบจำลองผสมกระบวนการดีริชเลต์เป็นเครื่องมือที่ใช้งานได้จริงสำหรับการประมาณความหนาแน่นและการจัดกลุ่ม

Debates

ความไวต่อพารามิเตอร์ความเข้มข้น
จำนวนกลุ่มที่อนุมานได้ขึ้นอยู่กับพารามิเตอร์ความเข้มข้นและมาตรวัดฐาน ดังนั้นการเลือกค่าก่อนหน้าจึงส่งผลกระทบอย่างมากต่อข้อสรุปของการจัดกลุ่มและต้องได้รับการจัดการอย่างระมัดระวัง

Key figures

  • Thomas Ferguson
  • Charles Antoniak
  • Michael Escobar
  • Mike West

Related topics

Seminal works

  • ferguson1973
  • escobar1995

Frequently asked questions

แบบจำลองผสมกระบวนการดีริชเลต์ตัดสินใจได้อย่างไรว่ามีกี่กลุ่ม?
มันไม่ได้กำหนดจำนวนกลุ่มตายตัว; กระบวนการดีริชเลต์อนุญาตให้มีจำนวนกลุ่มได้ไม่จำกัด และค่าเบย์เซียนภายหลัง (posterior) ซึ่งขับเคลื่อนด้วยข้อมูลและพารามิเตอร์ความเข้มข้น จะกำหนดความน่าจะเป็นเหนือจำนวนกลุ่มที่ถูกครอบครองที่แตกต่างกัน

Methods for this concept

Related concepts