กระบวนการดีริชเลต์และแบบจำลองผสม
กระบวนการดีริชเลต์เป็นค่าก่อนหน้า (prior) เหนือการแจกแจงที่มีลักษณะไม่ต่อเนื่อง ทำให้เป็นพื้นฐานตามธรรมชาติสำหรับแบบจำลองผสมที่อนุมานจำนวนกลุ่มจากข้อมูล
Definition
กระบวนการดีริชเลต์เป็นกระบวนการสุ่มที่ผลลัพธ์คือการวัดความน่าจะเป็น; แบบจำลองผสมกระบวนการดีริชเลต์จะทำการสังวัตน์การวัดแบบสุ่มที่ไม่ต่อเนื่องเหล่านี้กับเคอร์เนล ทำให้เกิดการผสมที่มีจำนวนส่วนประกอบแบบสุ่มที่กำหนดโดยข้อมูล
Scope
หัวข้อนี้ครอบคลุมกระบวนการดีริชเลต์และพารามิเตอร์ความเข้มข้นและมาตรวัดฐาน การนำเสนอแบบโพลยาเอิร์นและกระบวนการร้านอาหารจีน การจัดกลุ่มที่เกิดขึ้น และแบบจำลองผสมกระบวนการดีริชเลต์ที่ใช้สำหรับการประมาณความหนาแน่นและการจัดกลุ่มด้วยจำนวนส่วนประกอบที่ไม่จำกัด
Core questions
- พารามิเตอร์ความเข้มข้นและมาตรวัดฐานของกระบวนการดีริชเลต์คืออะไร?
- แบบโพลยาเอิร์นและกระบวนการร้านอาหารจีนอธิบายการจัดกลุ่มอย่างไร?
- แบบจำลองผสมกระบวนการดีริชเลต์อนุมานจำนวนกลุ่มได้อย่างไร?
- การอนุมานแบบเบย์เซียนสำหรับแบบจำลองเหล่านี้ดำเนินการอย่างไร?
Key concepts
- กระบวนการดีริชเลต์
- พารามิเตอร์ความเข้มข้น
- มาตรวัดฐาน
- กระบวนการร้านอาหารจีน
- แผนภาพโพลยาเอิร์น
- แบบจำลองผสมอนันต์
- การจัดกลุ่ม
Key theories
- กระบวนการดีริชเลต์
- เฟอร์กูสันได้นิยามกระบวนการดีริชเลต์เพื่อให้ค่าของมันในการแบ่งส่วนจำกัดใดๆ มีการแจกแจงแบบดีริชเลต์ ทำให้ได้ค่าก่อนหน้าแบบคอนจูเกตที่เกือบจะแน่นอนว่าไม่ต่อเนื่องเหนือการแจกแจง
- แบบจำลองผสมกระบวนการดีริชเลต์
- การผสมเคอร์เนลต่อเนื่องกับการวัดที่แจกแจงแบบกระบวนการดีริชเลต์ทำให้ได้การประมาณความหนาแน่นที่ยืดหยุ่นและการจัดกลุ่มที่มีจำนวนส่วนประกอบที่ไม่จำกัด โดยมีการอนุมานผ่านการสุ่มตัวอย่างแบบกิบบส์
Clinical relevance
แบบจำลองผสมกระบวนการดีริชเลต์ทำการจัดกลุ่มตามแบบจำลองและการประมาณความหนาแน่นโดยไม่ต้องกำหนดจำนวนกลุ่ม ซึ่งมีคุณค่าในด้านจีโนมิกส์ การจำแนกประเภทย่อยของประชากร และการตั้งค่าอื่นๆ ที่ไม่ทราบจำนวนกลุ่ม
History
เฟอร์กูสันได้นิยามกระบวนการดีริชเลต์ในปี 1973 และอันโตเนียกได้นำเสนอแบบจำลองผสมของกระบวนการดีริชเลต์ในปี 1974 แนวทางของเอสโคบาร์และเวสต์ในการสุ่มตัวอย่างแบบกิบบส์ในปี 1995 ทำให้แบบจำลองผสมกระบวนการดีริชเลต์เป็นเครื่องมือที่ใช้งานได้จริงสำหรับการประมาณความหนาแน่นและการจัดกลุ่ม
Debates
- ความไวต่อพารามิเตอร์ความเข้มข้น
- จำนวนกลุ่มที่อนุมานได้ขึ้นอยู่กับพารามิเตอร์ความเข้มข้นและมาตรวัดฐาน ดังนั้นการเลือกค่าก่อนหน้าจึงส่งผลกระทบอย่างมากต่อข้อสรุปของการจัดกลุ่มและต้องได้รับการจัดการอย่างระมัดระวัง
Key figures
- Thomas Ferguson
- Charles Antoniak
- Michael Escobar
- Mike West
Related topics
Seminal works
- ferguson1973
- escobar1995
Frequently asked questions
- แบบจำลองผสมกระบวนการดีริชเลต์ตัดสินใจได้อย่างไรว่ามีกี่กลุ่ม?
- มันไม่ได้กำหนดจำนวนกลุ่มตายตัว; กระบวนการดีริชเลต์อนุญาตให้มีจำนวนกลุ่มได้ไม่จำกัด และค่าเบย์เซียนภายหลัง (posterior) ซึ่งขับเคลื่อนด้วยข้อมูลและพารามิเตอร์ความเข้มข้น จะกำหนดความน่าจะเป็นเหนือจำนวนกลุ่มที่ถูกครอบครองที่แตกต่างกัน