ScholarGate
Ассистент

Модели со скрытыми переменными и смешанными распределениями

Модели со скрытыми переменными и смешанными распределениями объясняют наблюдаемые данные через скрытые переменные, подгоняя их путем попеременного вывода скрытой структуры и обновления параметров.

Найти тему в PaperMindСкороFind papers & topics
Tools & resources
Скачать слайды
Learn & explore
ВидеоСкоро

Definition

Модель со скрытыми переменными представляет каждое наблюдение как сгенерированное с помощью ненаблюдаемых переменных, например, какой компонент смеси произвел точку; алгоритм максимизации ожидания оценивает параметры путем итерации между вычислением ожидаемых значений скрытых переменных и максимизацией результирующего ожидаемого правдоподобия.

Scope

Эта тема охватывает вероятностные модели с ненаблюдаемыми переменными: модели конечных смесей, такие как гауссова смесь, скрытые марковские модели для последовательностей и алгоритм максимизации ожидания, который подгоняет их путем максимизации правдоподобия. Она также охватывает связь с мягкой кластеризацией, оценкой плотности и вариационным представлением EM как ограничения правдоподобия данных.

Core questions

  • Как скрытые переменные объясняют наблюдаемые данные?
  • Как алгоритм максимизации ожидания увеличивает правдоподобие на каждом шаге?
  • Как гауссовы смеси выполняют мягкую кластеризацию и оценку плотности?
  • Почему EM может сходиться только к локальному оптимуму?

Key theories

Алгоритм максимизации ожидания
EM чередует шаг ожидания, который выводит распределение по скрытым переменным, с шагом максимизации, который обновляет параметры, доказуемо никогда не уменьшая правдоподобие данных и сходясь к стационарной точке.
Модели гауссовых смесей
Моделирование данных как взвешенной суммы гауссовых компонент дает гибкие оценки плотности и мягкие присвоения кластеров, при этом каждой точке присваивается вероятность принадлежности к каждому компоненту.
EM как максимизация нижней границы
EM можно рассматривать как максимизацию вариационной нижней границы логарифмического правдоподобия, что является перспективой, которая обобщается на приближенный вывод в более сложных моделях со скрытыми переменными.

Clinical relevance

Модели со скрытыми переменными лежат в основе мягкой кластеризации, оценки плотности, вменения пропущенных данных и моделирования последовательностей с помощью скрытых марковских моделей в речевых технологиях и биоинформатике; алгоритм максимизации ожидания, на котором они основаны, является одной из наиболее широко используемых процедур оптимизации в статистике и машинном обучении.

History

Частные случаи идеи максимизации ожидания появились в генетике и задачах с неполными данными до того, как Демпстер, Лэрд и Рубин представили общую формулировку в 1977 году. Гауссовы смеси и скрытые марковские модели стали стандартными инструментами со скрытыми переменными, а вариационная переинтерпретация EM позже связала его с современными методами приближенного вывода.

Key figures

  • Arthur Dempster
  • Nan Laird
  • Donald Rubin

Related topics

Seminal works

  • dempster1977
  • bishop2006
  • murphy2012

Frequently asked questions

Что такое скрытая переменная?
Скрытая переменная — это ненаблюдаемая величина, включенная в модель для объяснения наблюдаемых данных, например, какой скрытый кластер сгенерировал точку данных. Модель выводит распределение по этим скрытым переменным, а не измеряет их напрямую.
Почему алгоритм EM может застрять?
EM увеличивает правдоподобие на каждом шаге, но гарантирует сходимость только к локальному максимуму или стационарной точке. Различные инициализации могут приводить к разным решениям, поэтому на практике его часто запускают несколько раз с разными начальными значениями.

Methods for this concept

Related concepts