Destek Vektör Makineleri ve Çekirdek Yöntemleri
Destek vektör makineleri, sınıflar arasındaki marjı maksimize eden karar sınırını bulmaktadır ve çekirdek hilesi (kernel trick), bu tür doğrusal yöntemlerin zengin doğrusal olmayan özellik uzaylarında örtük olarak çalışmasına olanak tanımaktadır.
Tanım
Destek vektör makinesi, en yakın eğitim noktalarına olan mesafeyi maksimize eden ayırıcı hiperdüzlemi seçen bir sınıflandırıcıdır; çekirdek yöntemleri ise, yüksek boyutlu özellik uzayını açıkça inşa etmeden doğrusal algoritmaların doğrusal olmayan sınırları uydurmasına olanak tanıyarak, iç çarpımları bir çekirdek fonksiyonu aracılığıyla hesaplamak suretiyle bunu genelleştirmektedir.
Kapsam
Bu konu, maksimum marj sınıflandırmasını, destek vektör makinesinin primal ve dual formülasyonlarını, ayrılabilir olmayan veriler için destek vektörlerinin ve gevşek değişkenlerin rolünü, iç çarpımları çekirdek fonksiyonlarıyla değiştiren çekirdek hilesini, polinom ve radyal taban fonksiyonları gibi yaygın çekirdekleri ve çekirdekleştirmenin regresyon ve diğer doğrusal yöntemlere genişletilmesini kapsamaktadır.
Temel sorular
- Marjı maksimize etmek genellemeyi neden iyileştirme eğilimindedir?
- Dual formülasyon, çözümü destek vektörleri cinsinden nasıl ifade etmektedir?
- Çekirdek hilesi neyi başarmaktadır ve neden verimlidir?
- Sınıflar çakıştığında yumuşak marjlar ve gevşek değişkenler nasıl kullanılmaktadır?
Temel kuramlar
- Maksimum marj ayrımı
- Ayırıcı hiperdüzlemler arasında, en yakın noktalara olan marjı maksimize eden, birkaç destek vektörü tarafından belirlenen benzersiz bir çözüm vermekte ve iyi genelleme sınırları ile ilişkilendirilmektedir.
- Çekirdek hilesi
- Optimizasyon yalnızca iç çarpımlar aracılığıyla verilere bağlı olduğundan, bunları bir çekirdek fonksiyonuyla değiştirmek, doğrusal olmayan bir özellik haritasını örtük olarak değerlendirmekte ve doğrusal bir yöntemin maliyetiyle doğrusal olmayan sınırları uydurmaktadır.
- Yumuşak marj ve gevşek değişkenler
- Gevşek değişkenler ve bir düzenlileştirme parametresi aracılığıyla kontrollü marj ihlallerine izin vermek, destek vektör makinesini çakışan, gürültülü sınıflara uygulanabilir kılarken, marj genişliği ile eğitim hataları arasında bir denge sağlamaktadır.
Klinik önem
Destek vektör makineleri ve çekirdek yöntemleri, derin öğrenmeden önce önde gelen yüksek doğruluklu sınıflandırıcılar olup, özellikle metin ve biyoinformatik alanındaki orta büyüklükteki problemler için güçlü seçenekler olmaya devam etmektedir; çekirdek fikri ayrıca sınıflandırmanın çok ötesine genelleşmekte, çekirdek regresyonu, Gauss süreçleri ve çekirdekleştirilmiş temel bileşen analizi gibi alanlarda da ortaya çıkmaktadır.
Tarihçe
Maksimum marj fikri ve çekirdek hilesi, 1992 civarında Boser, Guyon ve Vapnik tarafından birleştirilmiş ve yumuşak marjlı destek vektör makinesi 1995 yılında Cortes ve Vapnik tarafından resmileştirilmiştir. 1990'ların sonları ve 2000'ler boyunca çekirdek yöntemleri, büyük ölçekli algısal görevlerde derin öğrenme tarafından büyük ölçüde yerinden edilmeden önce örüntü tanımada baskın hale gelmiştir.
Öne çıkan isimler
- Vladimir Vapnik
- Corinna Cortes
- Bernhard Scholkopf
İlgili konular
Temel eserler
- cortes1995
- vapnik1995
- bishop2006
Sıkça sorulan sorular
- Destek vektörü nedir?
- Destek vektörü, marj üzerinde veya içinde yer alan ve dolayısıyla karar sınırının konumunu belirleyen bir eğitim noktasıdır. Uydurulan sınıflandırıcı yalnızca bu noktalara bağlıdır, bu nedenle eğitim verilerinin geri kalanı atılabilmektedir.
- Çekirdek kullanmaya neden hile denmektedir?
- Çekirdek hilesi, bir algoritmanın verileri çok yüksek boyutlu veya hatta sonsuz boyutlu bir özellik uzayına eşlemiş gibi davranmasına olanak tanırken, yalnızca nokta çiftleri arasındaki çekirdek değerlerini hesaplamaktadır. Bu uzayı açıkça inşa etme maliyetinden kaçınmaktadır.