تقليل الأبعاد
يشمل تقليل الأبعاد الأساليب متعددة المتغيرات التي تلخص العديد من المتغيرات المترابطة بعدد قليل من الكميات المشتقة، مع الحفاظ على أكبر قدر ممكن من البنية وتسهيل التفسير والتصور.
Definition
تقليل الأبعاد هو بناء تمثيل ذي أبعاد أقل للبيانات متعددة المتغيرات يحتفظ بمعيار مختار من المعلومات، مثل التباين، أو خطأ إعادة البناء، أو المسافة الزوجية، أو الارتباط بين المجموعات.
Scope
تغطي هذه المنطقة التقنيات التي تحول الملاحظات عالية الأبعاد إلى فضاء ذي أبعاد أقل. وهي تشمل الإسقاطات الخطية التي تزيد التباين (تحليل المكونات الرئيسية)، ونماذج العوامل الكامنة للتغاير المشترك (تحليل العوامل)، والتضمينات التي تحافظ على المسافة (التحجيم متعدد الأبعاد)، والأساليب التي تقلل مجموعتين من المتغيرات بشكل مشترك عن طريق زيادة الارتباط المتبادل (تحليل الارتباط الكنسي). ينصب التركيز على الأساليب الخطية والكلاسيكية التي تشكل أساس هذا التخصص؛ ويُعامل تعلم التنوع غير الخطي كامتداد.
Sub-topics
Core questions
- كيف يمكن استبدال مجموعة كبيرة من القياسات المترابطة بعدد قليل من المتغيرات المشتقة غير المترابطة بأقل قدر من فقدان المعلومات؟
- متى يجب أن يكون الحفاظ على التباين، أو الحفاظ على المسافة، أو تفسير العوامل الكامنة هو معيار التخفيض؟
- كم عدد الأبعاد المطلوبة لتمثيل البيانات بشكل كافٍ؟
- كيف تدعم التمثيلات المخفضة التصور، وإزالة الضوضاء، والنمذجة اللاحقة؟
Key theories
- الإسقاط الخطي الذي يزيد التباين
- المحاور الرئيسية الرائدة هي الاتجاهات المتعامدة التي تلتقط التباين الأقصى تباعاً، وهي تعادل المتجهات الذاتية لمصفوفة التغاير ولأفضل تقريب للمربعات الصغرى منخفض الرتبة للبيانات.
- نموذج العامل المشترك الكامن
- تُفسر الارتباطات المرصودة بين المتغيرات بعدد أقل من العوامل المشتركة غير المرصودة بالإضافة إلى التفرد الخاص بالمتغير، مما يفكك بنية التغاير إلى أجزاء مشتركة وفريدة.
Clinical relevance
يدعم تقليل الأبعاد تحليل البيانات الاستكشافي، وتصور البيانات، وإزالة الضوضاء من الإشارة، والضغط، والمعالجة المسبقة للميزات للانحدار والتصنيف عبر مجالات تتراوح من علم الجينوم إلى الاقتصاد القياسي وتحليل الصور.
History
نشأت وجهة النظر التي تزيد التباين مع صياغة بيرسون الهندسية لعام 1901 للخطوط والمستويات الأكثر ملاءمة، وتطورت إلى الطريقة الإحصائية الحديثة للمكونات الرئيسية بواسطة هوتيلينغ في عام 1933. نما تحليل العوامل بالتوازي من القياس النفسي، وتبعه التحجيم القائم على المسافة والارتباط الكنسي، وتوحيدها في المعالجة الموحدة لتقليل الأبعاد الموجودة في نصوص متعددة المتغيرات في منتصف القرن العشرين.
Key figures
- Karl Pearson
- Harold Hotelling
Related topics
Seminal works
- pearson1901
- mardia1979
- johnson2007
Frequently asked questions
- ما الفرق بين تقليل الأبعاد واختيار المتغيرات؟
- يحتفظ اختيار المتغيرات بمجموعة فرعية من المتغيرات الأصلية، بينما يقوم تقليل الأبعاد عادةً بإنشاء متغيرات مشتقة جديدة (مثل المكونات أو العوامل) تكون تركيبات من جميع المتغيرات الأصلية.
- هل تقليل الأبعاد خطي دائمًا؟
- لا. الأساليب الأساسية الكلاسيكية خطية، ولكن نفس الأهداف تُتبع بواسطة تقنيات تعلم وتضمين التنوع غير الخطي؛ وتبقى الأساليب الخطية أساسية وقابلة للتفسير.