การสุ่มตัวอย่างแบบผกผัน (Inverse Transform Sampling)
การสุ่มตัวอย่างแบบผกผันสร้างตัวอย่างจากการแจกแจงเป้าหมายโดยการประเมินค่าผกผันของฟังก์ชันการแจกแจงสะสมที่ค่าสุ่มเอกรูป ซึ่งเปลี่ยนตัวแปรสุ่มเอกรูปให้เป็นตัวอย่างที่แม่นยำ
Definition
การสุ่มตัวอย่างแบบผกผันเป็นเทคนิคการสุ่ม U อย่างสม่ำเสมอบนช่วง (0,1) และส่งคืนค่าที่ฟังก์ชันการแจกแจงสะสมของเป้าหมายเท่ากับ U ซึ่งจะสร้างตัวอย่างที่แม่นยำจากการแจกแจงนั้น
Scope
หัวข้อนี้ครอบคลุมการแปลงปริพันธ์ความน่าจะเป็นที่รองรับวิธีการนี้ การประยุกต์ใช้กับการแจกแจงแบบต่อเนื่องและไม่ต่อเนื่อง การใช้วิธีผกผันเชิงตัวเลขเมื่อฟังก์ชันการแจกแจงสะสมผกผันไม่มีรูปแบบปิด และจุดแข็งและข้อจำกัดของวิธีนี้เมื่อเทียบกับการยอมรับ-ปฏิเสธ (acceptance-rejection) และอัลกอริทึมเฉพาะทาง
Core questions
- เหตุใดการใช้ฟังก์ชันการแจกแจงสะสมผกผันกับตัวแปรสุ่มเอกรูปจึงให้ผลลัพธ์เป็นการแจกแจงเป้าหมาย?
- วิธีการนี้ถูกปรับใช้กับการแจกแจงแบบไม่ต่อเนื่องผ่านฟังก์ชันผกผันทั่วไปได้อย่างไร?
- เทคนิคเชิงตัวเลขใดบ้างที่ใช้ผกผันฟังก์ชันการแจกแจงสะสมที่ไม่มีรูปแบบปิด?
- เมื่อใดที่การผกผันดีกว่าการยอมรับ-ปฏิเสธ (acceptance-rejection) หรืออัลกอริทึมเฉพาะการแจกแจง?
Key concepts
- ฟังก์ชันการแจกแจงสะสม
- ฟังก์ชันควอนไทล์
- การแปลงปริพันธ์ความน่าจะเป็น
- การผกผันเชิงตัวเลข
- ความเป็นฟังก์ชันทางเดียว (Monotonicity)
Key theories
- การแปลงปริพันธ์ความน่าจะเป็น
- ถ้า X มีฟังก์ชันการแจกแจงสะสม F แบบต่อเนื่อง แล้ว F(X) จะมีการแจกแจงเอกรูปบน (0,1); ในทางกลับกัน ฟังก์ชันผกผันของ F ที่ใช้กับตัวแปรสุ่มเอกรูปจะมีการแจกแจง F ซึ่งเป็นพื้นฐานที่แม่นยำของการผกผัน
- ฟังก์ชันผกผันทั่วไปสำหรับการแจกแจงแบบไม่ต่อเนื่องและแบบผสม
- เมื่อ F ไม่ได้เพิ่มขึ้นอย่างเคร่งครัด ฟังก์ชันควอนไทล์ที่กำหนดเป็นค่าอินฟิมัมของค่าที่ความน่าจะเป็นสะสมถึง U จะขยายการผกผันไปยังการแจกแจงแบบไม่ต่อเนื่องและแบบผสม ลดการสุ่มตัวอย่างเป็นการค้นหาผ่านความน่าจะเป็นสะสม
Clinical relevance
การผกผันเป็นกลไกหลักในการสร้างตัวแปรสุ่มแบบเอ็กซ์โพเนนเชียล (exponential), โคชี (Cauchy), โลจิสติก (logistic) และตัวแปรอื่นๆ อีกมากมาย สำหรับการจำลองจากการแจกแจงเชิงประจักษ์และแบบปรับพอดี และสำหรับการเชื่อมโยงการจำลองเข้ากับตัวเลขสุ่มทั่วไป เนื่องจากอินพุตเอกรูปเดียวจับคู่กับเอาต์พุตเดียว จึงช่วยให้สามารถใช้แผนการลดความแปรปรวนที่สร้างขึ้นจากความสุ่มร่วมกันได้
History
การแปลงปริพันธ์ความน่าจะเป็นได้รับการจัดตั้งขึ้นในสถิติทางคณิตศาสตร์ช่วงต้นศตวรรษที่ 20 และกลายเป็นเครื่องมือจำลองมาตรฐานเมื่อคอมพิวเตอร์ดิจิทัลทำให้การประเมินฟังก์ชันควอนไทล์เป็นเรื่องปกติ โดยเน้นในภายหลังที่การผกผันเชิงตัวเลขที่แม่นยำสำหรับการแจกแจงที่ไม่มีควอนไทล์ในรูปแบบปิด
Key figures
- Luc Devroye
- Christian P. Robert
- George Casella
Related topics
Seminal works
- devroye1986
- robert2004
Frequently asked questions
- เมื่อใดที่ไม่สามารถใช้การสุ่มตัวอย่างแบบผกผันได้โดยตรง?
- ต้องมีการประเมินฟังก์ชันการแจกแจงสะสมผกผัน สำหรับการแจกแจงเช่นการแจกแจงปกติ ซึ่งฟังก์ชันผกผันไม่มีรูปแบบปิดเชิงประถม เราจะใช้การประมาณเชิงตัวเลขที่แม่นยำหรือเปลี่ยนไปใช้วิธีอื่น เช่น การยอมรับ-ปฏิเสธ (acceptance-rejection)
- การผกผันใช้ได้กับการแจกแจงแบบไม่ต่อเนื่องหรือไม่?
- ได้ โดยใช้ฟังก์ชันผกผันทั่วไป เราจะส่งคืนค่าที่น้อยที่สุดที่ความน่าจะเป็นสะสมมีค่าอย่างน้อยเท่ากับการสุ่มเอกรูป ซึ่งเทียบเท่ากับการค้นหาในตารางความน่าจะเป็นสะสมสำหรับเป้าหมาย