Denetimsiz Öğrenme
Denetimsiz öğrenme, etiketlenmemiş verilerdeki yapıyı keşfederek, taklit edilecek hedef çıktılar olmaksızın gruplandırmalar, düşük boyutlu gösterimler ve gizli faktörler bulmaktadır.
Tanım
Denetimsiz öğrenme, ilişkili hedef değerler olmaksızın yalnızca girdilerden yapı çıkarımıdır; algoritmalar, küme atamaları, düşük boyutlu koordinatlar veya gözlemlenen verilerin nasıl ortaya çıkmış olabileceğini açıklayan üretken gizli değişkenler gibi verilerin kompakt tanımlarını aramaktadır.
Kapsam
Bu alan, etiketlenmemiş verilerden öğrenmeyi kapsamaktadır: gruplara ayırma (kümeleme), boyut indirgeme ve manifold öğrenimi, beklenti-maksimizasyon algoritması ile uyarlanan gizli değişken ve karışım modelleri, yoğunluk tahmini ve verinin kendisinden eğitim sinyalleri oluşturan modern öz-denetimli ve gösterim öğrenimi.
Alt konular
Temel sorular
- Etiketler olmaksızın verilerden hangi yapı kurtarılabilir?
- Doğal gruplandırmalar veya kümeler nasıl tanımlanır ve keşfedilir?
- Yüksek boyutlu veriler, az sayıda koordinatla nasıl özetlenebilir?
- Gizli değişken modelleri, gözlemleri gizli nedenler aracılığıyla nasıl açıklar?
Temel kuramlar
- Gizli değişken modelleri ve EM
- Birçok denetimsiz model, veriyi üreten gizli değişkenler varsaymaktadır ve beklenti-maksimizasyon algoritması, gizli değişkenleri çıkarım yapma ile olasılığı artırmak için parametreleri güncelleme arasında geçiş yaparak bunları uyarlamaktadır.
- Boyut indirgeme
- Temel bileşen analizi ve manifold öğrenimi gibi yöntemler, en önemli varyasyonu koruyan düşük boyutlu gösterimler bularak görselleştirmeyi, sıkıştırmayı ve gürültü azaltmayı sağlamaktadır.
- Kümeleme yapısı
- Kümeleme, verileri benzer öğelerden oluşan gruplara ayırmaktadır; bu, küme içi mesafe, olasılıksal karışımlar veya yoğunluk aracılığıyla çeşitli şekillerde resmileştirilmekte olup, kümelerin doğru sayısı veya şekli için tek bir tanım bulunmamaktadır.
Klinik önem
Denetimsiz öğrenme, etiketlerin az veya hiç bulunmadığı durumlarda kritik öneme sahiptir; müşteri segmentasyonu, anomali tespiti, keşifsel veri analizi ve modern denetimli ve dil sistemlerini güçlendiren gösterimlerin ön eğitimi gibi alanları desteklemektedir; zira gerçek bir hedef bulunmadığından, denetimsiz sonuçları değerlendirmek başlı başına incelikli ve önemli bir sorundur.
Tarihçe
Denetimsiz öğrenme, istatistikteki kümeleme ve faktör analizi ile kendi kendini organize eden sinir ağlarına dayanmaktadır. 1977'de resmileştirilen beklenti-maksimizasyon algoritması, gizli değişken modellerinin uyarlanmasını birleştirmiş ve son yıllarda öz-denetimli gösterim öğrenimi, etiketlenmemiş veriler üzerinde büyük modellerin ön eğitimi için baskın bir paradigma haline gelmiştir.
Tartışmalar
- Denetimsiz sonuçlar nasıl değerlendirilir?
- Etiketler olmaksızın tek bir doğru cevap bulunmadığından, kümelemeleri veya öğrenilen gösterimleri değerlendirmek dolaylı kriterlere, sonraki görev performansına veya insan yorumuna dayanmaktadır ve farklı geçerlilik ölçütleri birbiriyle çelişebilmektedir.
Öne çıkan isimler
- Arthur Dempster
- Donald Rubin
- Geoffrey Hinton
- Christopher Bishop
İlgili konular
Temel eserler
- bishop2006
- hastie2009
- dempster1977
Sıkça sorulan sorular
- Bir model etiketler olmadan nasıl bir şey öğrenebilir?
- Denetimsiz yöntemler, veride zaten mevcut olan yapıyı kullanmaktadır; örneğin hangi noktaların birbirine yakın olduğu, hangi yönlerin en fazla varyasyonu taşıdığı veya hangi gizli faktörlerin gözlemleri üretmiş olabileceği gibi. Verinin kendi düzenlilikleri sinyali sağlamaktadır.
- Denetimsiz öğrenmeyi değerlendirmek neden zordur?
- Karşılaştırılabilecek gerçek bir hedef bulunmadığından, başarı dolaylı olarak değerlendirilmektedir; örneğin kümelerin ne kadar yorumlanabilir olduğu veya öğrenilen bir gösterimin daha sonraki denetimli bir göreve ne kadar yardımcı olduğu gibi. Farklı kriterler aynı sonucu farklı şekilde sıralayabilmektedir.