بُعد VC والسعة
يقيس بُعد فابنيك-تشيرفونينكيس سعة فئة النموذج من خلال أكبر مجموعة من النقاط التي يمكن تصنيفها بجميع الطرق الممكنة، مما يحدد مدى تعقيد المتعلم.
Definition
بُعد فابنيك-تشيرفونينكيس لفئة من المصنفات هو أكبر عدد من النقاط التي يمكن للفئة تصنيفها بكل طريقة ممكنة؛ وهو مقياس للسعة يحد من مدى إمكانية إفراط الفئة في التجهيز (overfit)، وبالتالي كمية البيانات اللازمة للتعلم بشكل موثوق.
Scope
يغطي هذا الموضوع مقاييس ثراء فئة الفرضيات: مفهوم تفتيت مجموعة من النقاط، وبُعد فابنيك-تشيرفونينكيس كحجم لأكبر مجموعة مفتتة، ودالة النمو، وكيف تدخل مقاييس السعة هذه في حدود التعميم. ويوضح لماذا تحكم السعة، وليس عدد المعلمات وحده، القدرة على التعميم.
Core questions
- ماذا يعني أن تقوم فئة نموذج بتفتيت مجموعة من النقاط؟
- كيف يتم تعريف وحساب بُعد فابنيك-تشيرفونينكيس؟
- لماذا تحكم السعة بدلاً من عدد المعلمات التعميم؟
- كيف تدخل السعة في حدود الفجوة بين التدريب والخطأ الحقيقي؟
Key theories
- التفتيت والسعة
- تفتت الفئة مجموعة من النقاط إذا كان بإمكانها تحقيق كل تصنيف ممكن لها؛ وتحدد أكبر مجموعة من هذا القبيل بُعد فابنيك-تشيرفونينكيس، وهو مقياس خالٍ من التوزيع لمدى مرونة الفئة.
- التحكم في التقارب المنتظم بواسطة السعة
- تضمن السعة المحدودة أن الخطأ التجريبي يتقارب مع الخطأ الحقيقي بشكل منتظم عبر الفئة، لذلك لا يمكن للمتعلم ذي بُعد فابنيك-تشيرفونينكيس المحدود أن يفرط في التجهيز بشكل تعسفي مع نمو البيانات.
- السعة مقابل عدد المعلمات
- تحدد السعة، وليس العدد الخام للمعلمات، التعميم، لذلك يمكن أن يختلف نموذجان لهما نفس عدد المعلمات اختلافًا كبيرًا في كمية البيانات التي يتطلبانها.
Clinical relevance
يوفر بُعد فابنيك-تشيرفونينكيس المقياس المركزي للسعة في نظرية التعلم الكلاسيكية ويبرر ممارسة التحكم في تعقيد النموذج؛ وهو أساس التحليل القائم على الهامش لآلات المتجهات الداعمة ويؤطر الجهود المستمرة لفهم سبب تعميم بعض النماذج ذات السعة العالية جدًا.
History
قدم فابنيك وتشيرفونينكيس البُعد الذي يحمل اسميهما في أعمال تعود إلى أواخر الستينيات وورقة عام 1971 حول التقارب المنتظم، مؤسسين نظرية خالية من التوزيع للسعة. أصبح المفهوم أساسيًا لآلات المتجهات الداعمة وللتحليل الأوسع للتعميم.
Key figures
- Vladimir Vapnik
- Alexey Chervonenkis
Related topics
Seminal works
- vapnik1971
- vapnik1995
- hastie2009
Frequently asked questions
- ماذا يعني التفتيت؟
- تُفتت مجموعة من النقاط بواسطة فئة نموذج إذا كان، لكل تعيين ممكن للتصنيفات لتلك النقاط، ينتج بعض النماذج في الفئة هذا التصنيف بالضبط. حجم أكبر مجموعة قابلة للتفتيت هو بُعد فابنيك-تشيرفونينكيس.
- هل النموذج الذي يحتوي على المزيد من المعلمات دائمًا ذو سعة أعلى؟
- ليس بالضرورة. تُقاس السعة بواسطة بُعد فابنيك-تشيرفونينكيس أو الكميات ذات الصلة، والتي يمكن أن تختلف عن عدد المعلمات. المقياس الصحيح للتعقيد للتعميم هو السعة، وليس ببساطة عدد المعلمات التي يمتلكها النموذج.