ScholarGate
Assistent

Support Vector Classification

Die Support Vector Classification trennt Klassen durch die Hyperebene, die den Abstand zu den nächsten Trainingspunkten maximiert, erweitert auf nichtlineare Grenzen durch Kerne.

Thema finden mit PaperMindDemnächstFind papers & topics
Tools & resources
Folien herunterladen
Learn & explore
VideoDemnächst

Definition

Die Support Vector Classification ist eine margin-basierte Methode, die die Entscheidungsgrenze wählt, welche den Abstand zu den nächsten Trainingsbeispielen jeder Klasse maximiert, optional in einem Kernel-induzierten Merkmalsraum, wobei die Breite des Margins gegen Klassifikationsfehler abgewogen wird.

Scope

Dieses Thema behandelt die Maximum-Margin-Hyperebene, die Rolle von Stützvektoren (Support Vectors), die Soft-Margin-Formulierung mit Slack-Variablen für nicht trennbare Daten, das duale Optimierungsproblem und den Kernel-Trick, der Merkmale implizit in einen höherdimensionalen Raum abbildet, um nichtlineare Entscheidungsgrenzen zu erhalten.

Core questions

  • Welche der trennenden Grenzen generalisiert am besten?
  • Wie werden nicht trennbare Klassen behandelt?
  • Wie erzeugt der Kernel-Trick nichtlineare Grenzen ohne explizite Merkmalsabbildungen?
  • Welche Trainingspunkte bestimmen die Grenze?

Key theories

Maximum-Margin-Trennung
Die Wahl der trennenden Hyperebene, die den Abstand zu den nächsten Punkten maximiert, führt zu einer Grenze, die durch einen spärlichen Satz von Stützvektoren bestimmt wird und durch Generalisierungs-Grenzen aus der statistischen Lerntheorie motiviert ist.
Kernel-Trick
Da die Optimierung nur über die inneren Produkte von den Daten abhängt, entspricht deren Ersetzung durch eine Kernel-Funktion einer Maximum-Margin-Grenze in einem höherdimensionalen Merkmalsraum, was nichtlineare Klassifikatoren zu linearen Kosten ermöglicht.

Clinical relevance

Support Vector Machines werden häufig für hochdimensionale Klassifikationen wie Textkategorisierung, Bioinformatik und Bilderkennung eingesetzt, wo das Margin-Prinzip und Kerne viele Merkmale und komplexe Grenzen effektiv handhaben.

History

Die Support Vector Classification entwickelte sich aus der statistischen Lerntheorie und wurde 1995 in der Support-Vector-Networks-Formulierung von Cortes und Vapnik kristallisiert, wonach Kernel-Methoden zu einem zentralen Paradigma im maschinellen Lernen wurden.

Debates

Wahl des Kernels und der Regularisierung
Die Leistung hängt stark vom Kernel und vom Regularisierungsparameter ab, der die Weichheit des Margins steuert; diese müssen abgestimmt werden, und es gibt keine universell beste Wahl.

Key figures

  • Vladimir Vapnik
  • Corinna Cortes

Related topics

Seminal works

  • cortes1995
  • hastie2009
  • vapnik1998

Frequently asked questions

Was sind Stützvektoren?
Es sind die Trainingspunkte, die auf oder innerhalb des Margins liegen und die Position der Entscheidungsgrenze bestimmen; die Lösung hängt nur von diesen Punkten ab.
Warum einen Soft Margin verwenden?
Reale Daten sind selten perfekt trennbar, daher erlaubt die Soft-Margin-Formulierung, dass einige Punkte den Margin verletzen, im Austausch für eine breitere, robustere Grenze, die durch einen Regularisierungsparameter gesteuert wird.

Methods for this concept

Related concepts