ScholarGate
Asistan

Kümeleme Analizi

Kümeleme analizi, çok değişkenli gözlemleri, önceden tanımlanmış etiketler olmaksızın, bir kümenin üyelerinin diğer kümelerin üyelerinden birbirine daha benzer olacak şekilde kümelere ayırmaktadır.

PaperMind ile konu bulYakındaMakale ve konu bul
Tools & resources
Slaytları indir
Learn & explore
VideoYakında

Tanım

Kümeleme analizi, nesnelerin benzerlik veya farklılık ölçütüne dayalı olarak denetimsiz bölümlemesi veya hiyerarşik organizasyonudur; gruplar önceden belirlenmek yerine verilerden keşfedilmektedir.

Kapsam

Bu alan, verilerin denetimsiz gruplandırılmasını kapsamaktadır. İçerisinde, iç içe geçmiş bir küme ağacı oluşturan hiyerarşik yöntemler, sabit sayıda küme için küme içi bir kriteri optimize eden k-ortalamalar gibi bölümleme yöntemleri ve kümeleri bir karışım dağılımının bileşenleri olarak ele alan model tabanlı yöntemler bulunmaktadır. Ayrıca, mesafe, bağlantı ve küme sayısının seçimi ile kümeleme çözümlerinin doğrulanması konularını da ele almaktadır.

Alt konular

Temel sorular

  • Etiketsiz çok değişkenli verilerde doğal gruplandırmalar nasıl keşfedilebilir?
  • Nesneler için benzerlik ve farklılık nasıl tanımlanmaktadır?
  • Kaç küme bulunmaktadır ve bu sayı nasıl seçilmektedir?
  • Bir kümeleme çözümü nasıl doğrulanmakta ve yorumlanmaktadır?

Temel kuramlar

Mesafe tabanlı gruplandırma
Çoğu kümeleme yöntemi, nesneler arasındaki bir farklılık ölçütüne ve bu farklılıkları gruplara dönüştüren bir bağlantı veya küme içi kareler toplamı gibi bir kurala dayanmaktadır.
Karışım modeli tabanlı küme görüşü
Model tabanlı kümeleme, her kümeyi bir olasılık karışımının bir bileşeni olarak kabul etmektedir; böylece kümeleme, parametre tahmini haline gelmekte ve küme sayısı bir model seçimi problemine dönüşmektedir.

Klinik önem

Kümeleme analizi, piyasa segmentasyonu, taksonomi, gen ekspresyonu gruplandırması, görüntü segmentasyonu ve hasta alt tiplerinin belirlenmesi dahil olmak üzere çeşitli alanlarda etiketsiz verilerdeki yapıyı keşfetmek için kullanılmaktadır.

Tarihçe

Sayısal kümeleme, yirminci yüzyılın ortalarındaki sayısal taksonomiden doğmuş ve hiyerarşik ve bölümleme algoritmalarına dönüştürülerek sistemleştirilmiştir. Sonlu karışım modelleri ve beklenti-maksimizasyon algoritması üzerine inşa edilen olasılıksal model tabanlı kümeleme, daha sonra bu alanı olabilirlik temeline oturtmuştur.

Tartışmalar

Küme sayısının belirlenmesi
Küme sayısını seçmek için üzerinde anlaşılmış tek bir yöntem bulunmamaktadır; kriterler boşluk istatistikleri ve siluet genişliklerinden karışım modelleri için bilgi kriterlerine kadar değişmekte olup, bunlar arasında farklılıklar görülebilmektedir.

Öne çıkan isimler

  • Leonard Kaufman
  • Peter Rousseeuw
  • Brian Everitt

İlgili konular

Temel eserler

  • everitt2011
  • kaufman1990
  • hastie2009

Sıkça sorulan sorular

Kümeleme, sınıflandırmadan nasıl farklılaşmaktadır?
Kümeleme denetimsizdir ve etiketsiz verilerden grupları keşfetmektedir; sınıflandırma ise denetimlidir ve gözlemleri önceden bilinen ve etiketlenmiş gruplara atamaktadır.
Kümeleme her zaman anlamlı gruplar bulur mu?
Hayır. Kümeleme algoritmaları herhangi bir veri setini bölümleyecektir, bu nedenle çözümlerin doğrulanması ve yorumlanması gerekmektedir; belirgin kümeler, gerçek bir yapıdan ziyade kullanılan yöntemi veya mesafe seçimini yansıtabilmektedir.

Bu kavram için yöntemler

İlgili kavramlar