เวลาหยุด (Stopping Times) และการหยุดเลือกได้ (Optional Stopping)
เวลาหยุดคือเวลาสุ่มที่สามารถรับรู้การมาถึงได้จากข้อมูลที่มีอยู่ และทฤษฎีการหยุดเลือกได้กล่าวว่าเกมที่เป็นธรรมซึ่งหยุด ณ เวลาดังกล่าวจะยังคงเป็นธรรม ซึ่งเป็นหลักการที่มีขอบเขตกว้างขวางอย่างน่าประหลาดใจ
Definition
เวลาหยุดคือเวลาสุ่มที่การตัดสินใจหยุดขึ้นอยู่กับข้อมูลที่มีอยู่จนถึงเวลานั้นเท่านั้น และทฤษฎีการหยุดเลือกได้ระบุว่าภายใต้เงื่อนไขที่เหมาะสม ค่าคาดหวังของมาร์ติงเกล (martingale) ที่ประเมิน ณ เวลาหยุดจะเท่ากับค่าคาดหวังเริ่มต้น
Scope
หัวข้อนี้ครอบคลุมคำจำกัดความของเวลาหยุดที่สัมพันธ์กับการกรอง (filtration) และซิกมา-พีชคณิต (sigma-algebra) ของเหตุการณ์ที่ทราบโดยเวลาหยุด กระบวนการที่หยุด (stopped process) ทฤษฎีการหยุดเลือกได้และการสุ่มเลือกได้ (optional sampling theorems) พร้อมเงื่อนไขความสามารถในการหาปริพันธ์ (integrability) และการมีขอบเขต (boundedness) ที่จำเป็น เอกลักษณ์ของวาลด์ (Wald's identities) สำหรับผลรวมที่หยุด ณ เวลาสุ่ม และการประยุกต์ใช้กับการล้มละลายของนักพนัน (gambler's ruin) ความน่าจะเป็นของการชน (hitting probabilities) และเวลาชนที่คาดหวัง (expected hitting times)
Core questions
- อะไรที่ทำให้เวลาสุ่มเป็นเวลาหยุด และทำไมความแตกต่างนั้นจึงสำคัญ?
- ภายใต้เงื่อนไขใดที่การหยุดมาร์ติงเกลยังคงรักษาค่าคาดหวังของมันไว้?
- ทำไมทฤษฎีการหยุดเลือกได้จึงล้มเหลวได้หากไม่มีข้อสมมติฐานเรื่องความสามารถในการหาปริพันธ์หรือการมีขอบเขต?
- เวลาหยุดให้ความน่าจะเป็นของการชนและระยะเวลาที่คาดหวังได้อย่างไร?
Key concepts
- เวลาหยุด (stopping time)
- กระบวนการที่หยุด (stopped process)
- การสุ่มเลือกได้ (optional sampling)
- เอกลักษณ์ของวาลด์ (Wald's identities)
- การล้มละลายของนักพนัน (gambler's ruin)
Key theories
- ทฤษฎีการหยุดเลือกได้ (Optional stopping theorem)
- หากเวลาหยุดมีขอบเขต หรือมาร์ติงเกลที่หยุดมีความสามารถในการหาปริพันธ์อย่างสม่ำเสมอ (uniformly integrable) หรือเวลามีค่าเฉลี่ยจำกัดพร้อมส่วนเพิ่มที่มีขอบเขต (bounded increments) แล้วค่าคาดหวังของมาร์ติงเกล ณ เวลาหยุดจะเท่ากับค่าเริ่มต้น ซึ่งเป็นความหมายที่แม่นยำว่าเกมที่เป็นธรรมไม่สามารถถูกเอาเปรียบได้ด้วยกฎการเลิกเล่นที่ชาญฉลาด
- เอกลักษณ์ของวาลด์ (Wald's identities)
- สำหรับผลรวมของตัวแปรอิสระที่มีการแจกแจงเหมือนกันซึ่งหยุด ณ เวลาหยุดที่มีค่าเฉลี่ยจำกัด ผลรวมที่คาดหวังจะเท่ากับค่าเฉลี่ยคูณด้วยเวลาหยุดที่คาดหวัง และเอกลักษณ์ที่สอดคล้องกันจะใช้ได้กับความแปรปรวน ซึ่งเป็นผลลัพธ์ที่ได้จากการหยุดเลือกได้ของมาร์ติงเกล
Clinical relevance
การหยุดเลือกได้เป็นกลไกการวิเคราะห์สำหรับการคำนวณความน่าจะเป็นของการล้มละลายและเวลาเล่นที่คาดหวังในการพนันและประกันภัย สำหรับความน่าจะเป็นของข้อผิดพลาดและขนาดตัวอย่างที่คาดหวังของการทดสอบอัตราส่วนความน่าจะเป็นแบบลำดับของวาลด์ (Wald's sequential probability ratio test) และสำหรับการคำนวณการผ่านครั้งแรก (first-passage calculations) ในการจัดคิว ความน่าเชื่อถือ และการกำหนดราคาของตัวเลือกทางการเงินแบบอเมริกัน (American-style financial options)
History
ดูบ (Doob) ได้กำหนดทฤษฎีการสุ่มเลือกได้สำหรับมาร์ติงเกล และวาลด์ (Wald) ซึ่งทำงานเกี่ยวกับการวิเคราะห์แบบลำดับในช่วงทศวรรษ 1940 ได้พัฒนาเอกลักษณ์สำหรับผลรวมที่หยุดแบบสุ่ม ซึ่งกรอบมาร์ติงเกลได้รวมและอธิบายในภายหลัง
Key figures
- Joseph L. Doob
- Abraham Wald
- David Williams
Related topics
Seminal works
- williams1991
Frequently asked questions
- ทำไมเวลาหยุดจึงต้องสามารถรับรู้ได้จากข้อมูลในอดีต?
- หากสามารถหยุดได้โดยอิงจากอนาคต ก็จะสามารถเลิกเล่นเกมที่เป็นธรรมได้อย่างแม่นยำในจังหวะที่เอื้ออำนวยและชนะได้อย่างเป็นระบบ ข้อกำหนดที่ว่าการตัดสินใจหยุดใช้ข้อมูลที่มีอยู่จนถึงปัจจุบันเท่านั้นคือสิ่งที่ทำให้การหยุดเลือกได้มีความซื่อสัตย์
- ทฤษฎีการหยุดเลือกได้ล้มเหลวเมื่อใด?
- อาจล้มเหลวเมื่อเวลาหยุดไม่มีขอบเขตและมาร์ติงเกลไม่มีความสามารถในการหาปริพันธ์อย่างสม่ำเสมอ เช่นในการเดินสุ่มอย่างง่ายที่ไม่จำกัด (unrestricted simple random walk) ซึ่งการหยุดที่การเยี่ยมชมระดับบวกครั้งแรกจะให้ค่าคาดหวังที่แตกต่างจากจุดเริ่มต้น