Clasificación por Máquinas de Vectores de Soporte
La clasificación por máquinas de vectores de soporte separa clases mediante el hiperplano que maximiza el margen con respecto a los puntos de entrenamiento más cercanos, extendiéndose a límites no lineales a través de kernels.
Definition
La clasificación por máquinas de vectores de soporte es un método basado en el margen que selecciona el límite de decisión maximizando la distancia a los ejemplos de entrenamiento más cercanos de cada clase, opcionalmente en un espacio de características inducido por un kernel, equilibrando el ancho del margen con los errores de clasificación.
Scope
Este tema abarca el hiperplano de margen máximo, el papel de los vectores de soporte, la formulación de margen suave con variables de holgura para datos no separables, el problema de optimización dual y el truco del kernel que mapea implícitamente las características a un espacio de mayor dimensión para obtener límites de decisión no lineales.
Core questions
- Entre los límites de separación, ¿cuál generaliza mejor?
- ¿Cómo se manejan las clases no separables?
- ¿Cómo produce el truco del kernel límites no lineales sin mapas de características explícitos?
- ¿Qué puntos de entrenamiento determinan el límite?
Key theories
- Separación de margen máximo
- La elección del hiperplano de separación que maximiza el margen con respecto a los puntos más cercanos produce un límite determinado por un conjunto disperso de vectores de soporte y está motivada por los límites de generalización de la teoría del aprendizaje estadístico.
- Truco del kernel
- Dado que la optimización depende de los datos solo a través de productos internos, reemplazarlos con una función kernel corresponde a un límite de margen máximo en un espacio de características de mayor dimensión, lo que proporciona clasificadores no lineales a un costo lineal.
Clinical relevance
Las máquinas de vectores de soporte se utilizan ampliamente para la clasificación de alta dimensionalidad, como la categorización de texto, la bioinformática y el reconocimiento de imágenes, donde el principio del margen y los kernels manejan eficazmente muchas características y límites complejos.
History
La clasificación por máquinas de vectores de soporte surgió de la teoría del aprendizaje estadístico y se cristalizó en la formulación de redes de vectores de soporte de Cortes y Vapnik en 1995, después de lo cual los métodos de kernel se convirtieron en un paradigma central en el aprendizaje automático.
Debates
- Elección del kernel y la regularización
- El rendimiento depende en gran medida del kernel y del parámetro de regularización que controla la suavidad del margen; estos deben ajustarse y no existe una elección universalmente mejor.
Key figures
- Vladimir Vapnik
- Corinna Cortes
Related topics
Seminal works
- cortes1995
- hastie2009
- vapnik1998
Frequently asked questions
- ¿Qué son los vectores de soporte?
- Son los puntos de entrenamiento que se encuentran sobre o dentro del margen y que determinan la posición del límite de decisión; la solución depende solo de estos puntos.
- ¿Por qué usar un margen suave?
- Los datos reales rara vez son perfectamente separables, por lo que la formulación de margen suave permite que algunos puntos violen el margen a cambio de un límite más amplio y robusto, controlado por un parámetro de regularización.