ScholarGate
Assistent

Dichteschätzung

Die Dichteschätzung rekonstruiert die Form einer Verteilung aus einer Stichprobe, ohne eine parametrische Form anzunehmen, wobei ein Glättungsparameter den Kompromiss zwischen Detail und Rauschen steuert.

Thema finden mit PaperMindDemnächstFind papers & topics
Tools & resources
Folien herunterladen
Learn & explore
VideoDemnächst

Definition

Die Dichteschätzung ist das nichtparametrische Problem der Schätzung der Wahrscheinlichkeitsdichtefunktion einer Zufallsvariablen aus einer Stichprobe, typischerweise durch Glättung der empirischen Daten mit einem Kern und einer Bandbreite.

Scope

Dieses Thema behandelt das Histogramm und seine Wahl der Klassenbreite, Kerndichteschätzer vom Parzen-Rosenblatt-Typ, die Wahl des Kerns und der Bandbreite, die Bias-Varianz-Zerlegung des mittleren integrierten quadratischen Fehlers, Plug-in- und Kreuzvalidierungs-Bandbreitenwahl, Randeffekte und adaptive Bandbreiten, den Fluch der Dimensionalität und Minimax-Konvergenzraten über Glättungsklassen.

Core questions

  • Wie glättet ein Kerndichteschätzer die Daten, und welche Rolle spielt die Bandbreite?
  • Wie bestimmt der Bias-Varianz-Kompromiss das optimale Maß an Glättung?
  • Wie wird die Bandbreite in der Praxis durch Kreuzvalidierung oder Plug-in-Regeln gewählt?
  • Warum wird die Dichteschätzung in hohen Dimensionen schwierig?

Key theories

Kerndichteschätzung
Das Platzieren eines glatten Kerns an jedem Datenpunkt und das Mitteln ergibt eine glatte Schätzung der Dichte; die Bandbreite steuert die Breite der Kerne und somit die Glätte der Schätzung.
Bias-Varianz-Kompromiss und Minimax-Raten
Eine kleine Bandbreite führt zu geringem Bias, aber hoher Varianz, und eine große Bandbreite zum Gegenteil; die optimale Bandbreite gleicht diese aus, und das resultierende Risiko nimmt mit der Minimax-Rate ab, die durch die Glätte der Dichte bestimmt wird.

Clinical relevance

Kerndichteschätzungen liegen den glatten Verteilungsplots zugrunde, die zur Datenexploration verwendet werden, der Konstruktion nichtparametrischer Klassifikatoren und Naive-Bayes-Modelle, der Gefahren- und Intensitätsschätzung in der Überlebensanalyse sowie der Visualisierung räumlicher Punktmuster in Epidemiologie und Ökologie.

History

Rosenblatt führte den Kerndichteschätzer 1956 ein und Parzen entwickelte seine Theorie 1962. Silvermans Monographie von 1986 machte die Methoden, einschließlich der praktischen Bandbreitenwahl, weithin zugänglich, und die Minimax-Analyse schärfte danach die Optimalitätstheorie.

Key figures

  • Murray Rosenblatt
  • Emanuel Parzen
  • Bernard Silverman
  • Larry Wasserman

Related topics

Seminal works

  • wasserman2006

Frequently asked questions

Warum ist die Bandbreite wichtiger als der Kern?
Die Wahl der Kernform hat wenig Einfluss auf die Genauigkeit, aber die Bandbreite steuert den Bias-Varianz-Kompromiss direkt: Ist sie zu klein, ist die Schätzung zackig und verrauscht; ist sie zu groß, werden reale Merkmale weggeglättet.
Was ist der Fluch der Dimensionalität bei der Dichteschätzung?
Mit zunehmender Anzahl von Variablen werden die Daten spärlicher, und die für eine gegebene Genauigkeit benötigte Menge wächst explosionsartig, sodass die nichtparametrische Dichteschätzung ohne weitere Struktur nur in niedrigen Dimensionen zuverlässig ist.

Methods for this concept

Related concepts