Destek Vektör Sınıflandırması
Destek vektör sınıflandırması, sınıfları, en yakın eğitim noktalarına olan marjı maksimize eden hiperdüzlem aracılığıyla ayırır ve çekirdekler (kernels) vasıtasıyla doğrusal olmayan sınırlara genişletilir.
Tanım
Destek vektör sınıflandırması, her sınıfın en yakın eğitim örneklerine olan mesafeyi maksimize eden karar sınırını seçen, isteğe bağlı olarak çekirdek tarafından indüklenen bir özellik uzayında, marj genişliği ile sınıflandırma hatalarını dengeleyen marj tabanlı bir yöntemdir.
Kapsam
Bu konu, maksimum marjlı hiperdüzlemi, destek vektörlerinin rolünü, ayrıştırılamayan veriler için gevşek değişkenlerle (slack variables) yumuşak marj formülasyonunu, ikili optimizasyon problemini ve doğrusal olmayan karar sınırları elde etmek için özellikleri örtük olarak daha yüksek boyutlu bir uzaya eşleyen çekirdek hilesini (kernel trick) kapsamaktadır.
Temel sorular
- Ayırıcı sınırlar arasında hangisi en iyi genelleme yapar?
- Ayrıştırılamayan sınıflar nasıl ele alınır?
- Çekirdek hilesi, açık özellik eşlemeleri olmadan doğrusal olmayan sınırlar nasıl üretir?
- Hangi eğitim noktaları sınırı belirler?
Temel kuramlar
- Maksimum marjlı ayırma
- En yakın noktalara olan marjı maksimize eden ayırıcı hiperdüzlemi seçmek, seyrek bir destek vektörleri kümesi tarafından belirlenen bir sınır sağlar ve istatistiksel öğrenme kuramından gelen genelleme sınırları tarafından motive edilmektedir.
- Çekirdek hilesi (Kernel trick)
- Optimizasyon, verilere yalnızca iç çarpımlar aracılığıyla bağlı olduğundan, bunları bir çekirdek fonksiyonu ile değiştirmek, daha yüksek boyutlu bir özellik uzayında maksimum marjlı bir sınıra karşılık gelir ve doğrusal maliyetle doğrusal olmayan sınıflandırıcılar sağlar.
Klinik önem
Destek vektör makineleri, metin kategorizasyonu, biyoinformatik ve görüntü tanıma gibi yüksek boyutlu sınıflandırmalarda yaygın olarak kullanılmaktadır; bu alanlarda marj prensibi ve çekirdekler, çok sayıda özelliği ve karmaşık sınırları etkili bir şekilde ele almaktadır.
Tarihçe
Destek vektör sınıflandırması, istatistiksel öğrenme kuramından doğmuş ve 1995 yılında Cortes ve Vapnik'in destek-vektör-ağları (support-vector-networks) formülasyonunda kristalize olmuştur; bu tarihten sonra çekirdek yöntemleri makine öğrenmesinde merkezi bir paradigma haline gelmiştir.
Tartışmalar
- Çekirdek ve düzenlileştirme (regularization) seçimi
- Performans, çekirdeğe ve marj yumuşaklığını kontrol eden düzenlileştirme parametresine büyük ölçüde bağlıdır; bunlar ayarlanmalıdır ve evrensel olarak en iyi bir seçim bulunmamaktadır.
Öne çıkan isimler
- Vladimir Vapnik
- Corinna Cortes
İlgili konular
Temel eserler
- cortes1995
- hastie2009
- vapnik1998
Sıkça sorulan sorular
- Destek vektörleri nelerdir?
- Bunlar, karar sınırının konumunu belirleyen, marj üzerinde veya içinde yer alan eğitim noktalarıdır; çözüm yalnızca bu noktalara bağlıdır.
- Neden yumuşak marj (soft margin) kullanılır?
- Gerçek veriler nadiren mükemmel şekilde ayrıştırılabilir, bu nedenle yumuşak marj formülasyonu, daha geniş, daha sağlam bir sınır karşılığında bazı noktaların marjı ihlal etmesine izin verir ve bu bir düzenlileştirme parametresi ile kontrol edilir.