Bir model etiketler olmadan nasıl bir şey öğrenebilir?

Denetimsiz yöntemler, veride zaten mevcut olan yapıyı kullanmaktadır; örneğin hangi noktaların birbirine yakın olduğu, hangi yönlerin en fazla varyasyonu taşıdığı veya hangi gizli faktörlerin gözlemleri üretmiş olabileceği gibi. Verinin kendi düzenlilikleri sinyali sağlamaktadır.

Denetimsiz öğrenmeyi değerlendirmek neden zordur?

Karşılaştırılabilecek gerçek bir hedef bulunmadığından, başarı dolaylı olarak değerlendirilmektedir; örneğin kümelerin ne kadar yorumlanabilir olduğu veya öğrenilen bir gösterimin daha sonraki denetimli bir göreve ne kadar yardımcı olduğu gibi. Farklı kriterler aynı sonucu farklı şekilde sıralayabilmektedir.

Denetimsiz Öğrenme

Denetimsiz öğrenme, etiketlenmemiş verilerdeki yapıyı keşfederek, taklit edilecek hedef çıktılar olmaksızın gruplandırmalar, düşük boyutlu gösterimler ve gizli faktörler bulmaktadır.

PaperMind ile konu bulYakındaMakale ve konu bul

Tools & resources

Slaytları indir

Learn & explore

VideoYakında

Tanım

Denetimsiz öğrenme, ilişkili hedef değerler olmaksızın yalnızca girdilerden yapı çıkarımıdır; algoritmalar, küme atamaları, düşük boyutlu koordinatlar veya gözlemlenen verilerin nasıl ortaya çıkmış olabileceğini açıklayan üretken gizli değişkenler gibi verilerin kompakt tanımlarını aramaktadır.

Kapsam

Bu alan, etiketlenmemiş verilerden öğrenmeyi kapsamaktadır: gruplara ayırma (kümeleme), boyut indirgeme ve manifold öğrenimi, beklenti-maksimizasyon algoritması ile uyarlanan gizli değişken ve karışım modelleri, yoğunluk tahmini ve verinin kendisinden eğitim sinyalleri oluşturan modern öz-denetimli ve gösterim öğrenimi.

Alt konular

Temel sorular

Etiketler olmaksızın verilerden hangi yapı kurtarılabilir?
Doğal gruplandırmalar veya kümeler nasıl tanımlanır ve keşfedilir?
Yüksek boyutlu veriler, az sayıda koordinatla nasıl özetlenebilir?
Gizli değişken modelleri, gözlemleri gizli nedenler aracılığıyla nasıl açıklar?

Temel kuramlar

Gizli değişken modelleri ve EM: Birçok denetimsiz model, veriyi üreten gizli değişkenler varsaymaktadır ve beklenti-maksimizasyon algoritması, gizli değişkenleri çıkarım yapma ile olasılığı artırmak için parametreleri güncelleme arasında geçiş yaparak bunları uyarlamaktadır.
Boyut indirgeme: Temel bileşen analizi ve manifold öğrenimi gibi yöntemler, en önemli varyasyonu koruyan düşük boyutlu gösterimler bularak görselleştirmeyi, sıkıştırmayı ve gürültü azaltmayı sağlamaktadır.
Kümeleme yapısı: Kümeleme, verileri benzer öğelerden oluşan gruplara ayırmaktadır; bu, küme içi mesafe, olasılıksal karışımlar veya yoğunluk aracılığıyla çeşitli şekillerde resmileştirilmekte olup, kümelerin doğru sayısı veya şekli için tek bir tanım bulunmamaktadır.

Klinik önem

Denetimsiz öğrenme, etiketlerin az veya hiç bulunmadığı durumlarda kritik öneme sahiptir; müşteri segmentasyonu, anomali tespiti, keşifsel veri analizi ve modern denetimli ve dil sistemlerini güçlendiren gösterimlerin ön eğitimi gibi alanları desteklemektedir; zira gerçek bir hedef bulunmadığından, denetimsiz sonuçları değerlendirmek başlı başına incelikli ve önemli bir sorundur.

Tarihçe

Denetimsiz öğrenme, istatistikteki kümeleme ve faktör analizi ile kendi kendini organize eden sinir ağlarına dayanmaktadır. 1977'de resmileştirilen beklenti-maksimizasyon algoritması, gizli değişken modellerinin uyarlanmasını birleştirmiş ve son yıllarda öz-denetimli gösterim öğrenimi, etiketlenmemiş veriler üzerinde büyük modellerin ön eğitimi için baskın bir paradigma haline gelmiştir.

Tartışmalar

Denetimsiz sonuçlar nasıl değerlendirilir?: Etiketler olmaksızın tek bir doğru cevap bulunmadığından, kümelemeleri veya öğrenilen gösterimleri değerlendirmek dolaylı kriterlere, sonraki görev performansına veya insan yorumuna dayanmaktadır ve farklı geçerlilik ölçütleri birbiriyle çelişebilmektedir.

Öne çıkan isimler

Arthur Dempster
Donald Rubin
Geoffrey Hinton
Christopher Bishop

İlgili konular

Temel eserler

bishop2006
hastie2009
dempster1977

Sıkça sorulan sorular

Bir model etiketler olmadan nasıl bir şey öğrenebilir?: Denetimsiz yöntemler, veride zaten mevcut olan yapıyı kullanmaktadır; örneğin hangi noktaların birbirine yakın olduğu, hangi yönlerin en fazla varyasyonu taşıdığı veya hangi gizli faktörlerin gözlemleri üretmiş olabileceği gibi. Verinin kendi düzenlilikleri sinyali sağlamaktadır.
Denetimsiz öğrenmeyi değerlendirmek neden zordur?: Karşılaştırılabilecek gerçek bir hedef bulunmadığından, başarı dolaylı olarak değerlendirilmektedir; örneğin kümelerin ne kadar yorumlanabilir olduğu veya öğrenilen bir gösterimin daha sonraki denetimli bir göreve ne kadar yardımcı olduğu gibi. Farklı kriterler aynı sonucu farklı şekilde sıralayabilmektedir.