فرایند دیریکله و مدلهای آمیخته
فرایند دیریکله یک پیشین بر توزیعها است که گسستگی آن، آن را به مبنایی طبیعی برای مدلهای آمیخته تبدیل میکند که تعداد خوشهها را از دادهها استنباط میکنند.
Definition
فرایند دیریکله یک فرایند تصادفی است که تحققهای آن اندازههای احتمال هستند؛ یک مدل آمیخته فرایند دیریکله این اندازههای تصادفی گسسته را با یک هسته ترکیب میکند و یک آمیخته با تعداد تصادفی و تعیینشده توسط دادهها از مؤلفهها را به دست میدهد.
Scope
این موضوع فرایند دیریکله و پارامتر تمرکز و معیار پایه آن، نمایشهای کوزه پولیا و فرایند رستوران چینی، خوشهبندیای که آنها ایجاد میکنند، و مدل آمیخته فرایند دیریکله را که برای تخمین چگالی و خوشهبندی با تعداد نامحدودی از مؤلفهها استفاده میشود، پوشش میدهد.
Core questions
- پارامتر تمرکز و معیار پایه یک فرایند دیریکله چیست؟
- چگونه کوزه پولیا و فرایند رستوران چینی خوشهبندی آن را توصیف میکنند؟
- یک آمیخته فرایند دیریکله چگونه تعداد خوشهها را استنباط میکند؟
- استنباط پسین برای این مدلها چگونه انجام میشود؟
Key concepts
- فرایند دیریکله
- پارامتر تمرکز
- معیار پایه
- فرایند رستوران چینی
- طرح کوزه پولیا
- مدل آمیخته بینهایت
- خوشهبندی
Key theories
- فرایند دیریکله
- فرگوسن فرایند دیریکله را به گونهای تعریف کرد که مقادیر آن بر روی هر افراز متناهی، توزیع دیریکلهای داشته باشند و یک پیشین مزدوج و تقریباً مطمئناً گسسته بر توزیعها ارائه دهد.
- آمیختههای فرایند دیریکله
- ترکیب یک هسته پیوسته بر روی یک اندازه با توزیع فرایند دیریکله، تخمینهای چگالی انعطافپذیر و خوشهبندی با تعداد نامحدودی از مؤلفهها را به دست میدهد، با استنباط از طریق نمونهبرداری گیبس.
Clinical relevance
آمیختههای فرایند دیریکله خوشهبندی مبتنی بر مدل و تخمین چگالی را بدون تعیین تعداد گروهها انجام میدهند، که در ژنومیک، زیرگونهسازی جمعیت، و سایر تنظیماتی که تعداد خوشهها ناشناخته است، ارزشمند است.
History
فرگوسن فرایند دیریکله را در سال ۱۹۷۳ تعریف کرد و آنتونیاک آمیختههای فرایندهای دیریکله را در سال ۱۹۷۴ معرفی کرد. رویکرد نمونهبرداری گیبس اسکوبار و وست در سال ۱۹۹۵ آمیختههای فرایند دیریکله را به ابزاری عملی برای تخمین چگالی و خوشهبندی تبدیل کرد.
Debates
- حساسیت به پارامتر تمرکز
- تعداد خوشههای استنباط شده به پارامتر تمرکز و معیار پایه بستگی دارد، بنابراین انتخابهای پیشین به طور مادی بر نتایج خوشهبندی تأثیر میگذارند و باید با دقت مدیریت شوند.
Key figures
- Thomas Ferguson
- Charles Antoniak
- Michael Escobar
- Mike West
Related topics
Seminal works
- ferguson1973
- escobar1995
Frequently asked questions
- یک آمیخته فرایند دیریکله چگونه تصمیم میگیرد که چند خوشه وجود دارد؟
- این مدل تعداد خوشهها را ثابت نمیکند؛ فرایند دیریکله به تعداد دلخواه زیادی خوشه اجازه میدهد، و پسین، که توسط دادهها و پارامتر تمرکز هدایت میشود، احتمال را بر روی تعدادهای مختلف خوشههای اشغال شده قرار میدهد.