تحلیل افتراقی درجه دوم
تحلیل افتراقی درجه دوم مشاهدات را تحت گروههای گاوسی چندمتغیره طبقهبندی میکند که مجاز به داشتن ماتریسهای کوواریانس متفاوت هستند و مرزهای تصمیمگیری منحنی ایجاد میکنند.
Definition
تحلیل افتراقی درجه دوم یک روش طبقهبندی است که هر گروه را به عنوان نرمال چندمتغیره با ماتریس کوواریانس خاص خود مدلسازی میکند و مشاهدات را با مقایسه امتیازات افتراقی درجه دوم مشتق شده از این چگالیها اختصاص میدهد.
Scope
این موضوع مدل طبقهبندی گاوسی با ماتریسهای کوواریانس خاص گروه، توابع افتراقی درجه دوم حاصل، موازنه در پارامترها نسبت به تحلیل افتراقی خطی، حساسیت به نمونههای کوچک و رویکردهای منظمسازی شده که بین قوانین خطی و درجه دوم درونیابی میکنند را پوشش میدهد.
Core questions
- چگونه کاهش فرض کوواریانس برابر، مرز تصمیمگیری را تغییر میدهد؟
- چه زمانی انعطافپذیری اضافه شده کوواریانسهای جداگانه طبقهبندی را بهبود میبخشد؟
- چرا تحلیل افتراقی درجه دوم در نمونههای کوچک بیشتر مستعد بیشبرازش است؟
- چگونه منظمسازی میتواند تخمینهای کوواریانس را پایدار کند؟
Key theories
- مدل گاوسی با کوواریانس نابرابر
- هنگامی که هر گروه نرمال چندمتغیره با ماتریس کوواریانس خاص خود است، نسبت لگاریتمی چگالیها در ویژگیها درجه دوم است، بنابراین مرز بهینه بیز بین گروهها یک سطح درجه دوم است.
- موازنه بایاس-واریانس با تحلیل افتراقی خطی
- تحلیل افتراقی درجه دوم یک کوواریانس جداگانه برای هر گروه تخمین میزند که بایاس را زمانی که کوواریانسها واقعاً متفاوت هستند کاهش میدهد اما واریانس را افزایش میدهد، بنابراین میتواند توسط قانون خطی در نمونههای کوچک پیشی گرفته شود.
Clinical relevance
تحلیل افتراقی درجه دوم زمانی به کار میرود که گروهها به طور قابل قبولی در پراکندگی و همچنین میانگینهای خود تفاوت داشته باشند و مرزهای انعطافپذیرتری نسبت به قانون خطی در مسائل طبقهبندی در علوم و مهندسی ارائه میدهد.
History
تمایز درجه دوم به عنوان بسط طبیعی افتراق خطی فیشر و گاوسی پس از حذف فرض یک ماتریس کوواریانس مشترک پدید آمد و بعدها با تحلیل افتراقی منظمسازی شده برای مدیریت دادههای با ابعاد بالا و نمونههای کوچک تکمیل شد.
Debates
- مرزهای خطی در مقابل درجه دوم
- اجازه دادن به کوواریانسهای خاص گروه میتواند مرزهای واقعاً منحنی را ثبت کند اما تعداد پارامترهای تخمین زده شده را چند برابر میکند، بنابراین انتخاب بین تحلیل افتراقی خطی و درجه دوم یک تصمیم بایاس-واریانس است که به اندازه نمونه حساس است.
Key figures
- T. W. Anderson
Related topics
Seminal works
- anderson2003
- hastie2009
- johnson2007
Frequently asked questions
- چه زمانی باید به جای LDA از QDA استفاده کنم؟
- زمانی از تحلیل افتراقی درجه دوم استفاده کنید که گروهها به نظر میرسد ساختارهای کوواریانس به طور قابل توجهی متفاوتی دارند و نمونه به اندازه کافی بزرگ است که بتوان یک ماتریس کوواریانس جداگانه برای هر گروه به طور قابل اعتماد تخمین زد.
- تحلیل افتراقی منظمسازی شده چیست؟
- این یک مصالحه است که هر کوواریانس گروه را به سمت یک تخمین تجمیع شده کوچک میکند و پارامتری را تنظیم میکند که به طور هموار بین تحلیل افتراقی درجه دوم و خطی درونیابی میکند.