Denetimli Öğrenme
Denetimli öğrenme, bilinen hedef değerlerle eşleştirilmiş örneklerden tahmine dayalı modeller oluşturur; bu modeller, girdilerden çıktılara bir eşleme öğrenerek görülmemiş durumlara genellenebilmektedir.
Tanım
Denetimli öğrenme, girdi-çıktı çiftlerinden oluşan bir eğitim kümesinden bir fonksiyonun çıkarımını yapma görevidir; bu sayede fonksiyon yeni girdiler için çıktıyı tahmin eder. Öğrenme algoritması, aşırı uyumu (overfitting) önlemek amacıyla karmaşıklığı kontrol ederken, eğitim verilerindeki bir hata ölçüsünü minimize etmek için fonksiyonu seçmektedir.
Kapsam
Bu alan, etiketli verilerden öğrenmeyi (sınıflandırma ve regresyon dahil), öğrenmenin bir kayıp fonksiyonu ile ampirik risk minimizasyonu olarak formüle edilmesini, yanlılık-varyans dengesini, yeni girdilere genellemeyi ve başlıca model ailelerini (doğrusal ve genelleştirilmiş doğrusal modeller, en yakın komşu ve çekirdek yöntemleri, destek vektör makineleri, karar ağaçları ve torbalama (bagging) ile güçlendirme (boosting) gibi topluluk öğrenme yöntemleri) kapsamaktadır.
Alt konular
Temel sorular
- Bir model, etiketli örneklere nasıl uyarlanabilir ki görülmemiş veriler üzerinde iyi tahminler yapabilsin?
- Doğru tahmin hedefini hangi kayıp fonksiyonları ve risk ölçütleri formüle etmektedir?
- Model karmaşıklığı, yanlılık ile varyans arasında nasıl bir denge kurar?
- Sınıflandırma ve regresyon problemleri için hangi model aileleri uygundur?
Temel kuramlar
- Ampirik risk minimizasyonu
- Öğrenme, temel dağılımdaki beklenen kaybı minimize etmenin bir vekili olarak, eğitim örneklemindeki ortalama kaybı minimize eden bir fonksiyon seçimi olarak ele alınır ve ikisi arasındaki farkı kontrol etmek için düzenlileştirme (regularization) eklenmektedir.
- Yanlılık-varyans ayrışımı
- Beklenen tahmin hatası, kareli yanlılık, varyans ve indirgenemez gürültüye ayrışır; bu durum, aşırı basit modellerin neden yetersiz uyum sağladığını (underfit) ve aşırı esnek modellerin neden aşırı uyum sağladığını (overfit) açıklamakta ve karmaşıklık kontrolünü teşvik etmektedir.
- Marj tabanlı ve topluluk öğrenme
- Ayırıcı bir marjı maksimize etmek (destek vektör makineleri) ve birçok zayıf veya rastgele öğreniciyi birleştirmek (torbalama (bagging), güçlendirme (boosting), rastgele ormanlar), tekil, düzenlileştirilmemiş modellere göre genellikle daha iyi genelleme yapan sınıflandırıcılar üretmektedir.
Klinik önem
Denetimli öğrenme, spam filtrelerinden, kredi puanlamasından ve tıbbi tanı desteğinden görüntü ve konuşma tanımaya kadar çoğu kullanılan öngörücü sistemin temelini oluşturmaktadır. Temel zorluğu genellemedir; yani, geçmiş örnekleri uyan bir modelin gelecekteki veriler üzerinde de performans göstermesini sağlamaktır. Bu nedenle, genelleme hatasını tahmin etme ve kontrol etme yöntemleri bu alan için merkezi bir öneme sahiptir.
Tarihçe
Denetimli öğrenme, istatistiksel regresyon ve diskriminant analizinden, ayrıca perceptron ve en yakın komşu kuralları gibi erken dönem örüntü tanıma çalışmalarından gelişmiştir. 1990'lar, destek vektör makinelerini ve titiz bir istatistiksel öğrenme kuramını beraberinde getirmiştir; aynı on yıl ve sonrasında, torbalama (bagging), güçlendirme (boosting) ve rastgele ormanlar gibi karar ağacı toplulukları, tablo verisi tahmini için baskın araçlar haline gelmiştir.
Tartışmalar
- Yorumlanabilirlik ve öngörücü doğruluk
- Büyük topluluklar ve derin ağlar gibi yüksek doğruluklu modeller genellikle şeffaf değildir; bu durum, özellikle yüksek riskli kararlarda yorumlanabilir modellerin ne zaman tercih edilmesi gerektiği konusunda tartışmalara yol açmaktadır.
Öne çıkan isimler
- Vladimir Vapnik
- Leo Breiman
- Trevor Hastie
- Robert Tibshirani
İlgili konular
Temel eserler
- bishop2006
- hastie2009
- cortes1995
- breiman2001
Sıkça sorulan sorular
- Denetimli öğrenmeyi denetimsiz öğrenmeden ayıran nedir?
- Denetimli öğrenme, bilinen hedef etiketleri veya değerleri olan örnekleri kullanır ve yeni girdiler için bu hedefleri tahmin etmeyi öğrenir. Denetimsiz öğrenme ise etiketsiz verilerle çalışır ve bunun yerine kümeler veya düşük boyutlu gösterimler gibi yapıları keşfetmektedir.
- Genelleme neden merkezi bir endişe kaynağıdır?
- Bir model her zaman eğitim verilerine mükemmel şekilde uyacak şekilde ayarlanabilir, ancak bu, sinyal yerine gürültüyü yakalayabilir. Asıl amaç, görülmemiş veriler üzerinde doğruluktur; bu nedenle, düzenlileştirme (regularization) ve çapraz doğrulama (cross-validation) gibi eğitim ve test hatası arasındaki farkı tahmin etme ve kontrol etme yöntemleri esastır.