ScholarGate
دستیار

فرایند دیریکله و مدل‌های آمیخته

فرایند دیریکله یک پیشین بر توزیع‌ها است که گسستگی آن، آن را به مبنایی طبیعی برای مدل‌های آمیخته تبدیل می‌کند که تعداد خوشه‌ها را از داده‌ها استنباط می‌کنند.

یافتن موضوع با PaperMindبه‌زودیFind papers & topics
Tools & resources
دریافت اسلایدها
Learn & explore
ویدیوبه‌زودی

Definition

فرایند دیریکله یک فرایند تصادفی است که تحقق‌های آن اندازه‌های احتمال هستند؛ یک مدل آمیخته فرایند دیریکله این اندازه‌های تصادفی گسسته را با یک هسته ترکیب می‌کند و یک آمیخته با تعداد تصادفی و تعیین‌شده توسط داده‌ها از مؤلفه‌ها را به دست می‌دهد.

Scope

این موضوع فرایند دیریکله و پارامتر تمرکز و معیار پایه آن، نمایش‌های کوزه پولیا و فرایند رستوران چینی، خوشه‌بندی‌ای که آن‌ها ایجاد می‌کنند، و مدل آمیخته فرایند دیریکله را که برای تخمین چگالی و خوشه‌بندی با تعداد نامحدودی از مؤلفه‌ها استفاده می‌شود، پوشش می‌دهد.

Core questions

  • پارامتر تمرکز و معیار پایه یک فرایند دیریکله چیست؟
  • چگونه کوزه پولیا و فرایند رستوران چینی خوشه‌بندی آن را توصیف می‌کنند؟
  • یک آمیخته فرایند دیریکله چگونه تعداد خوشه‌ها را استنباط می‌کند؟
  • استنباط پسین برای این مدل‌ها چگونه انجام می‌شود؟

Key concepts

  • فرایند دیریکله
  • پارامتر تمرکز
  • معیار پایه
  • فرایند رستوران چینی
  • طرح کوزه پولیا
  • مدل آمیخته بی‌نهایت
  • خوشه‌بندی

Key theories

فرایند دیریکله
فرگوسن فرایند دیریکله را به گونه‌ای تعریف کرد که مقادیر آن بر روی هر افراز متناهی، توزیع دیریکله‌ای داشته باشند و یک پیشین مزدوج و تقریباً مطمئناً گسسته بر توزیع‌ها ارائه دهد.
آمیخته‌های فرایند دیریکله
ترکیب یک هسته پیوسته بر روی یک اندازه با توزیع فرایند دیریکله، تخمین‌های چگالی انعطاف‌پذیر و خوشه‌بندی با تعداد نامحدودی از مؤلفه‌ها را به دست می‌دهد، با استنباط از طریق نمونه‌برداری گیبس.

Clinical relevance

آمیخته‌های فرایند دیریکله خوشه‌بندی مبتنی بر مدل و تخمین چگالی را بدون تعیین تعداد گروه‌ها انجام می‌دهند، که در ژنومیک، زیرگونه‌سازی جمعیت، و سایر تنظیماتی که تعداد خوشه‌ها ناشناخته است، ارزشمند است.

History

فرگوسن فرایند دیریکله را در سال ۱۹۷۳ تعریف کرد و آنتونیاک آمیخته‌های فرایندهای دیریکله را در سال ۱۹۷۴ معرفی کرد. رویکرد نمونه‌برداری گیبس اسکوبار و وست در سال ۱۹۹۵ آمیخته‌های فرایند دیریکله را به ابزاری عملی برای تخمین چگالی و خوشه‌بندی تبدیل کرد.

Debates

حساسیت به پارامتر تمرکز
تعداد خوشه‌های استنباط شده به پارامتر تمرکز و معیار پایه بستگی دارد، بنابراین انتخاب‌های پیشین به طور مادی بر نتایج خوشه‌بندی تأثیر می‌گذارند و باید با دقت مدیریت شوند.

Key figures

  • Thomas Ferguson
  • Charles Antoniak
  • Michael Escobar
  • Mike West

Related topics

Seminal works

  • ferguson1973
  • escobar1995

Frequently asked questions

یک آمیخته فرایند دیریکله چگونه تصمیم می‌گیرد که چند خوشه وجود دارد؟
این مدل تعداد خوشه‌ها را ثابت نمی‌کند؛ فرایند دیریکله به تعداد دلخواه زیادی خوشه اجازه می‌دهد، و پسین، که توسط داده‌ها و پارامتر تمرکز هدایت می‌شود، احتمال را بر روی تعدادهای مختلف خوشه‌های اشغال شده قرار می‌دهد.

Methods for this concept

Related concepts