为什么带宽比核更重要？

核形状的选择对准确性影响很小，但带宽直接控制着偏差-方差权衡：过小会导致估计结果尖锐且噪声大，过大则会平滑掉真实特征。

密度估计中的维度灾难是什么？

随着变量数量的增加，数据变得稀疏，达到给定精度所需的数据量呈爆炸式增长，因此非参数密度估计仅在低维且无额外结构的情况下才可靠。

密度估计在不假设参数形式的情况下，从样本中重建分布的形状，其中平滑参数控制着细节和噪声之间的权衡。

用 PaperMind 寻找选题即将推出Find papers & topics

Tools & resources

Learn & explore

视频即将推出

密度估计是从样本中估计随机变量概率密度函数的非参数问题，通常通过使用核和带宽平滑经验数据来完成。

本主题涵盖直方图及其箱宽选择、Parzen-Rosenblatt类型的核密度估计器、核和带宽的选择、均方积分误差的偏差-方差分解、插入法和交叉验证带宽选择、边界效应和自适应带宽、维度灾难以及平滑度类上的极小极大收敛速率。

核密度估计是用于探索数据的平滑分布图、非参数分类器和朴素贝叶斯模型的构建、生存分析中的风险和强度估计以及流行病学和生态学中空间点模式可视化的基础。

Rosenblatt于1956年引入了核密度估计器，Parzen于1962年发展了其理论。Silverman于1986年出版的专著使这些方法（包括实用的带宽选择）得到了广泛应用，此后极小极大分析进一步完善了最优性理论。

为什么带宽比核更重要？: 核形状的选择对准确性影响很小，但带宽直接控制着偏差-方差权衡：过小会导致估计结果尖锐且噪声大，过大则会平滑掉真实特征。
密度估计中的维度灾难是什么？: 随着变量数量的增加，数据变得稀疏，达到给定精度所需的数据量呈爆炸式增长，因此非参数密度估计仅在低维且无额外结构的情况下才可靠。