ทำไมเวลาหยุดจึงต้องสามารถรับรู้ได้จากข้อมูลในอดีต?

หากสามารถหยุดได้โดยอิงจากอนาคต ก็จะสามารถเลิกเล่นเกมที่เป็นธรรมได้อย่างแม่นยำในจังหวะที่เอื้ออำนวยและชนะได้อย่างเป็นระบบ ข้อกำหนดที่ว่าการตัดสินใจหยุดใช้ข้อมูลที่มีอยู่จนถึงปัจจุบันเท่านั้นคือสิ่งที่ทำให้การหยุดเลือกได้มีความซื่อสัตย์

ทฤษฎีการหยุดเลือกได้ล้มเหลวเมื่อใด?

อาจล้มเหลวเมื่อเวลาหยุดไม่มีขอบเขตและมาร์ติงเกลไม่มีความสามารถในการหาปริพันธ์อย่างสม่ำเสมอ เช่นในการเดินสุ่มอย่างง่ายที่ไม่จำกัด (unrestricted simple random walk) ซึ่งการหยุดที่การเยี่ยมชมระดับบวกครั้งแรกจะให้ค่าคาดหวังที่แตกต่างจากจุดเริ่มต้น

เวลาหยุด (Stopping Times) และการหยุดเลือกได้ (Optional Stopping)

เวลาหยุดคือเวลาสุ่มที่สามารถรับรู้การมาถึงได้จากข้อมูลที่มีอยู่ และทฤษฎีการหยุดเลือกได้กล่าวว่าเกมที่เป็นธรรมซึ่งหยุด ณ เวลาดังกล่าวจะยังคงเป็นธรรม ซึ่งเป็นหลักการที่มีขอบเขตกว้างขวางอย่างน่าประหลาดใจ

ค้นหาหัวข้อด้วย PaperMindเร็ว ๆ นี้Find papers & topics

Tools & resources

ดาวน์โหลดสไลด์

Learn & explore

วิดีโอเร็ว ๆ นี้

Definition

เวลาหยุดคือเวลาสุ่มที่การตัดสินใจหยุดขึ้นอยู่กับข้อมูลที่มีอยู่จนถึงเวลานั้นเท่านั้น และทฤษฎีการหยุดเลือกได้ระบุว่าภายใต้เงื่อนไขที่เหมาะสม ค่าคาดหวังของมาร์ติงเกล (martingale) ที่ประเมิน ณ เวลาหยุดจะเท่ากับค่าคาดหวังเริ่มต้น

Scope

หัวข้อนี้ครอบคลุมคำจำกัดความของเวลาหยุดที่สัมพันธ์กับการกรอง (filtration) และซิกมา-พีชคณิต (sigma-algebra) ของเหตุการณ์ที่ทราบโดยเวลาหยุด กระบวนการที่หยุด (stopped process) ทฤษฎีการหยุดเลือกได้และการสุ่มเลือกได้ (optional sampling theorems) พร้อมเงื่อนไขความสามารถในการหาปริพันธ์ (integrability) และการมีขอบเขต (boundedness) ที่จำเป็น เอกลักษณ์ของวาลด์ (Wald's identities) สำหรับผลรวมที่หยุด ณ เวลาสุ่ม และการประยุกต์ใช้กับการล้มละลายของนักพนัน (gambler's ruin) ความน่าจะเป็นของการชน (hitting probabilities) และเวลาชนที่คาดหวัง (expected hitting times)

Core questions

อะไรที่ทำให้เวลาสุ่มเป็นเวลาหยุด และทำไมความแตกต่างนั้นจึงสำคัญ?
ภายใต้เงื่อนไขใดที่การหยุดมาร์ติงเกลยังคงรักษาค่าคาดหวังของมันไว้?
ทำไมทฤษฎีการหยุดเลือกได้จึงล้มเหลวได้หากไม่มีข้อสมมติฐานเรื่องความสามารถในการหาปริพันธ์หรือการมีขอบเขต?
เวลาหยุดให้ความน่าจะเป็นของการชนและระยะเวลาที่คาดหวังได้อย่างไร?

Key concepts

เวลาหยุด (stopping time)
กระบวนการที่หยุด (stopped process)
การสุ่มเลือกได้ (optional sampling)
เอกลักษณ์ของวาลด์ (Wald's identities)
การล้มละลายของนักพนัน (gambler's ruin)

Key theories

ทฤษฎีการหยุดเลือกได้ (Optional stopping theorem): หากเวลาหยุดมีขอบเขต หรือมาร์ติงเกลที่หยุดมีความสามารถในการหาปริพันธ์อย่างสม่ำเสมอ (uniformly integrable) หรือเวลามีค่าเฉลี่ยจำกัดพร้อมส่วนเพิ่มที่มีขอบเขต (bounded increments) แล้วค่าคาดหวังของมาร์ติงเกล ณ เวลาหยุดจะเท่ากับค่าเริ่มต้น ซึ่งเป็นความหมายที่แม่นยำว่าเกมที่เป็นธรรมไม่สามารถถูกเอาเปรียบได้ด้วยกฎการเลิกเล่นที่ชาญฉลาด
เอกลักษณ์ของวาลด์ (Wald's identities): สำหรับผลรวมของตัวแปรอิสระที่มีการแจกแจงเหมือนกันซึ่งหยุด ณ เวลาหยุดที่มีค่าเฉลี่ยจำกัด ผลรวมที่คาดหวังจะเท่ากับค่าเฉลี่ยคูณด้วยเวลาหยุดที่คาดหวัง และเอกลักษณ์ที่สอดคล้องกันจะใช้ได้กับความแปรปรวน ซึ่งเป็นผลลัพธ์ที่ได้จากการหยุดเลือกได้ของมาร์ติงเกล

Clinical relevance

การหยุดเลือกได้เป็นกลไกการวิเคราะห์สำหรับการคำนวณความน่าจะเป็นของการล้มละลายและเวลาเล่นที่คาดหวังในการพนันและประกันภัย สำหรับความน่าจะเป็นของข้อผิดพลาดและขนาดตัวอย่างที่คาดหวังของการทดสอบอัตราส่วนความน่าจะเป็นแบบลำดับของวาลด์ (Wald's sequential probability ratio test) และสำหรับการคำนวณการผ่านครั้งแรก (first-passage calculations) ในการจัดคิว ความน่าเชื่อถือ และการกำหนดราคาของตัวเลือกทางการเงินแบบอเมริกัน (American-style financial options)

History

ดูบ (Doob) ได้กำหนดทฤษฎีการสุ่มเลือกได้สำหรับมาร์ติงเกล และวาลด์ (Wald) ซึ่งทำงานเกี่ยวกับการวิเคราะห์แบบลำดับในช่วงทศวรรษ 1940 ได้พัฒนาเอกลักษณ์สำหรับผลรวมที่หยุดแบบสุ่ม ซึ่งกรอบมาร์ติงเกลได้รวมและอธิบายในภายหลัง

Key figures

Joseph L. Doob
Abraham Wald
David Williams

Seminal works

williams1991

Frequently asked questions

ทำไมเวลาหยุดจึงต้องสามารถรับรู้ได้จากข้อมูลในอดีต?: หากสามารถหยุดได้โดยอิงจากอนาคต ก็จะสามารถเลิกเล่นเกมที่เป็นธรรมได้อย่างแม่นยำในจังหวะที่เอื้ออำนวยและชนะได้อย่างเป็นระบบ ข้อกำหนดที่ว่าการตัดสินใจหยุดใช้ข้อมูลที่มีอยู่จนถึงปัจจุบันเท่านั้นคือสิ่งที่ทำให้การหยุดเลือกได้มีความซื่อสัตย์
ทฤษฎีการหยุดเลือกได้ล้มเหลวเมื่อใด?: อาจล้มเหลวเมื่อเวลาหยุดไม่มีขอบเขตและมาร์ติงเกลไม่มีความสามารถในการหาปริพันธ์อย่างสม่ำเสมอ เช่นในการเดินสุ่มอย่างง่ายที่ไม่จำกัด (unrestricted simple random walk) ซึ่งการหยุดที่การเยี่ยมชมระดับบวกครั้งแรกจะให้ค่าคาดหวังที่แตกต่างจากจุดเริ่มต้น