随机数生成
随机数生成产生表现得如同从目标概率分布中抽取的数列,为蒙特卡洛模拟、重采样和随机算法提供了随机输入。
用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
Learn & explore
视频即将推出
Definition
随机数生成是构建和分析算法的过程,这些算法从单位区间上的均匀源开始,生成近似于从指定概率分布中独立抽取的数字。
Scope
该领域涵盖了产生均匀伪随机序列的确定性算法,将均匀变量转换为任意分布样本的变换,针对无法以封闭形式求逆的密度采用的接受-拒绝方案,以及提高模拟估计器效率的方差缩减方法。硬件熵源和密码生成器被视为边界情况,但重点是用于统计模拟的生成器。
Sub-topics
Core questions
- 确定性算法如何产生通过随机性和均匀性统计测试的序列?
- 给定一个均匀生成器,如何从任意目标分布中获取样本?
- 当直接求逆难以处理时,接受-拒绝抽样如何从密度中抽样?
- 如何在不增加样本量的情况下减少模拟估计器的方差?
Key theories
- 伪随机均匀生成
- 具有长周期和良好晶格结构的递推关系产生确定性序列,这些序列在统计上与独立的均匀抽取无法区分;质量通过周期长度、均匀分布和一系列经验测试进行评估。
- 变换方法
- 概率积分变换及其相关方法将均匀变量映射到目标分布:只要可以评估逆累积分布函数,应用它就能获得精确的样本。
- 接受-拒绝抽样
- 通过从一个易于抽样且主导目标密度的包络中提出建议,并以等于密度比的概率接受建议,可以从无法求逆的密度中获得精确样本,其成本由包络的紧密程度决定。
Clinical relevance
可靠的随机数生成是蒙特卡洛积分、自助法和置换推断、贝叶斯后验抽样、随机实验以及跨科学领域的模拟研究的基础;具有短周期或晶格伪影的劣质生成器可能会悄无声息地偏倚模拟结果,因此生成器质量是可重现性的一个基本问题。
History
洛斯阿拉莫斯早期的蒙特卡洛工作依赖于简单的同余和中平方方案;随后的几十年揭示了它们的缺陷,并产生了关于晶格结构和均匀分布的严格理论,最终形成了长周期生成器和用于评估随机性的标准化测试套件。
Key figures
- Luc Devroye
- Donald Knuth
- Pierre L'Ecuyer
- John von Neumann
Related topics
Seminal works
- devroye1986
- knuth1997
Frequently asked questions
- 计算机生成的随机数是真正的随机数吗?
- 大多数是伪随机数:确定性算法从一个种子生成一个可重现的序列。精心设计的生成器具有非常长的周期并能通过统计测试,因此其输出在模拟目的上与真正的随机性无法区分,同时在种子固定时保持精确可重现性。
- 为什么逆累积分布函数如此核心?
- 如果U在(0,1)上是均匀的,那么将任何分布的逆累积分布函数应用于U,就会得到该分布的一个样本。这种概率积分变换是精确的,并且在可以计算逆函数时是默认方法。