ScholarGate
Assistant

Modèles de processus gaussiens

Un processus gaussien établit une distribution a priori directement sur des fonctions, permettant ainsi d'effectuer une régression et une classification non paramétriques avec une incertitude calibrée.

Trouver un sujet avec PaperMindBientôtFind papers & topics
Tools & resources
Télécharger les diapositives
Learn & explore
VidéoBientôt

Definition

Un processus gaussien est une distribution sur des fonctions telle que les valeurs pour tout ensemble fini d'entrées suivent une distribution normale multivariée déterminée par une fonction de moyenne et un noyau de covariance ; le conditionnement sur les données observées donne une distribution a posteriori sur les fonctions utilisées pour la prédiction.

Scope

Ce sujet aborde la définition d'un processus gaussien par ses fonctions de moyenne et de covariance (noyau), la forme fermée de la distribution a posteriori pour la régression, le rôle du choix du noyau et des hyperparamètres dans l'encodage de la régularité, la classification via des processus gaussiens latents, et le coût computationnel des grands ensembles de données.

Core questions

  • Comment un noyau de covariance définit-il une distribution a priori sur des fonctions ?
  • Comment la distribution a posteriori de la régression par processus gaussien est-elle calculée sous forme fermée ?
  • Comment les hyperparamètres du noyau contrôlent-ils la régularité et l'échelle de longueur ?
  • Qu'est-ce qui rend l'inférence exacte par processus gaussien coûteuse pour les grands ensembles de données ?

Key concepts

  • noyau de covariance
  • fonction de moyenne
  • échelle de longueur
  • régression par processus gaussien
  • processus gaussien latent
  • vraisemblance marginale
  • extensibilité

Key theories

A priori dans l'espace des fonctions
La spécification des fonctions de moyenne et de covariance définit une distribution a priori cohérente sur les fonctions ; pour les vraisemblances gaussiennes, la moyenne et la variance a posteriori ont des formes fermées données par la matrice du noyau.
Limite du réseau de neurones
Neal a montré qu'un réseau de neurones à une seule couche avec un nombre infini d'unités cachées et des distributions a priori appropriées converge vers un processus gaussien, reliant ainsi les réseaux de neurones bayésiens aux distributions a priori des processus gaussiens.

Clinical relevance

Les processus gaussiens offrent une régression flexible avec incertitude pour les statistiques spatiales, l'émulation de modèles informatiques, l'interpolation de séries temporelles et l'optimisation bayésienne dans les domaines scientifiques et de l'ingénierie.

History

La régression par processus gaussiens trouve ses racines dans le krigeage en géostatistique et dans les travaux d'O'Hagan sur l'ajustement de courbes. La connexion établie par Neal en 1996 avec les réseaux de neurones et la monographie de Rasmussen et Williams en 2006 ont fait des processus gaussiens un outil central de l'apprentissage automatique et de la statistique bayésienne non paramétrique.

Debates

Passage à l'échelle pour les grands ensembles de données
Les coûts d'inférence exacte augmentent de manière cubique avec le nombre d'observations, de sorte qu'une grande partie de la recherche porte sur des méthodes parcimonieuses et approximatives qui échangent la précision contre l'extensibilité.

Key figures

  • Carl Edward Rasmussen
  • Christopher Williams
  • Radford Neal
  • Anthony O'Hagan

Related topics

Seminal works

  • rasmussen2006
  • neal1996

Frequently asked questions

Quel est le rôle du noyau dans un processus gaussien ?
Le noyau établit la covariance entre les valeurs de la fonction à différentes entrées, encodant des hypothèses telles que la régularité et l'échelle de longueur caractéristique ; son choix et ses hyperparamètres déterminent en grande partie la forme et la flexibilité de la fonction inférée.

Methods for this concept

Related concepts