停止时间和可选停止
停止时间是一种随机时间,其到来可以根据迄今为止的信息识别,而可选停止定理指出,在这样的时间停止的公平博弈仍然是公平的,这是一个具有惊人影响力的原则。
用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
Learn & explore
视频即将推出
Definition
停止时间是一个随机时间,在该时间停止的决定仅取决于截至该时间可用的信息,而可选停止定理指出,在适当条件下,在停止时间评估的鞅的期望值等于其初始期望值。
Scope
本主题涵盖了相对于过滤的停止时间的定义,以及由停止时间已知的事件的西格玛代数、停止过程、可选停止和可选抽样定理及其所需的积分性和有界性条件、瓦尔德关于在随机时间停止的和的恒等式,以及在赌徒破产、击中概率和预期击中时间方面的应用。
Core questions
- 是什么使随机时间成为停止时间,以及这种区别为何重要?
- 在什么条件下,停止鞅能保持其期望值不变?
- 为什么在没有可积性或有界性假设的情况下,可选停止定理会失效?
- 停止时间如何产生击中概率和预期持续时间?
Key concepts
- 停止时间
- 停止过程
- 可选抽样
- 瓦尔德恒等式
- 赌徒破产
Key theories
- 可选停止定理
- 如果停止时间有界,或者停止的鞅一致可积,或者时间具有有限均值且增量有界,那么鞅在停止时间的期望值等于其初始值,这精确地说明了公平博弈不能通过巧妙的退出规则来利用。
- 瓦尔德恒等式
- 对于在具有有限均值的停止时间停止的独立同分布变量之和,其期望和等于均值乘以预期停止时间,并且方差也存在相应的恒等式,这些结果是通过鞅可选停止获得的。
Clinical relevance
可选停止是计算赌博和保险中破产概率和预期游戏时间、瓦尔德序贯概率比检验的误差概率和预期样本量,以及排队论、可靠性和美式金融期权定价中首次通过计算的分析引擎。
History
杜布(Doob)提出了鞅的可选抽样定理,而瓦尔德(Wald)在20世纪40年代从事序贯分析工作时,推导出了随机停止和的恒等式,这些恒等式后来被鞅框架统一和解释。
Key figures
- Joseph L. Doob
- Abraham Wald
- David Williams
Related topics
Seminal works
- williams1991
Frequently asked questions
- 为什么停止时间必须能从过去的信息中识别出来?
- 如果一个人可以根据未来停止,他就可以在有利的时刻退出公平博弈并系统性地获胜;停止决定只能使用截至目前的信息这一要求,正是保持可选停止公平性的关键。
- 可选停止定理何时失效?
- 当停止时间无界且鞅不一致可积时,它可能会失效,例如在无限制的简单随机游走中,在首次访问正水平时停止会得到与起始值不同的期望值。