ScholarGate
Ассистент

Сэмплирование по Гиббсу (статистические вычисления)

Сэмплирование по Гиббсу — это метод Монте-Карло для цепей Маркова, который позволяет сэмплировать многомерное распределение путем циклического перебора его переменных и последовательного извлечения каждой из них из ее полного условного распределения при заданных текущих значениях остальных переменных.

Найти тему в PaperMindСкороFind papers & topics
Tools & resources
Скачать слайды
Learn & explore
ВидеоСкоро

Definition

Сэмплирование по Гиббсу — это алгоритм Монте-Карло для цепей Маркова, который генерирует выборки из совместного распределения путем итеративного сэмплирования каждого компонента или блока компонентов из его условного распределения при условии всех остальных.

Scope

В данной теме сэмплирование по Гиббсу рассматривается как вычислительный алгоритм: построение сэмплера на основе полных условных распределений, его интерпретация как шага Метрополиса-Гастингса с вероятностью принятия, равной единице, стратегии блокировки и коллапсирования, улучшающие перемешивание, аугментация данных, а также сходимость алгоритма и его автокорреляционное поведение. Прикладной аспект байесовского вывода рассматривается отдельно в разделе «Байесовские вычисления».

Core questions

  • Как повторные выборки из полных условных распределений сходятся к целевому совместному распределению?
  • Почему сэмплер Гиббса является алгоритмом Метрополиса-Гастингса с вероятностью принятия, равной единице?
  • Как блокировка и коллапсирование улучшают перемешивание сэмплера?
  • Как аугментация данных вводит скрытые переменные для упрощения условных распределений?

Key concepts

  • Полное условное распределение
  • Аугментация данных
  • Блокировка и коллапсирование
  • Совместимость условных распределений
  • Перемешивание

Key theories

Сэмплирование из полных условных распределений
Последовательное сэмплирование каждой переменной из ее условного распределения при условии остальных определяет цепь Маркова, стационарным распределением которой является целевое совместное распределение, при условии, что условные распределения совместимы и цепь неприводима.
Аугментация данных и блокировка
Введение вспомогательных скрытых переменных может сделать полные условные распределения стандартными и легко сэмплируемыми, в то время как обновление коррелированных переменных блоками уменьшает автокорреляцию, которую в противном случае вызвали бы покомпонентные обновления.

Clinical relevance

Сэмплирование по Гиббсу является основным алгоритмом статистических вычислений, поскольку многие модели имеют простые, стандартные полные условные распределения; оно лежит в основе универсальных сэмплеров и применяется к смешанным моделям, моделям со скрытыми переменными, восстановлению изображений и анализу генетического сцепления.

History

Геман и Геман представили сэмплер Гиббса в 1984 году для восстановления изображений, назвав его в честь распределений Гиббса из статистической физики; статья Гельфанда и Смита 1990 года показала его широкую применимость, что привело к повсеместному внедрению в вычислительной статистике.

Key figures

  • Stuart Geman
  • Donald Geman
  • Alan Gelfand
  • Adrian Smith

Related topics

Seminal works

  • geman1984
  • gelfand1990

Frequently asked questions

Когда сэмплирование по Гиббсу особенно удобно?
Когда полные условные распределения являются стандартными распределениями, из которых можно сэмплировать напрямую. В этом случае не требуется настройка предложений или шагов принятия, поскольку каждое предложение принимается.
Почему сэмплер Гиббса может медленно перемешиваться?
Когда переменные сильно коррелированы, их пошаговое обновление перемещает цепь малыми шагами вдоль узких гребней, что приводит к высокой автокорреляции. Блокировка коррелированных переменных или репараметризация модели могут улучшить перемешивание.

Methods for this concept

Related concepts