Member-only story
Kümeleme Algoritmaları (Clustering)
Kümelemenin ne olduğunu, yöntemlerinin neler olduğunu ve bu yöntemlerin sınırlamaları ile avantajlarını öğrenelim.
Erişim İçin:
Önceki bölümde konuştuğumuz gibi, gözetimsiz öğrenme, etiketlerin veya istenen sonuçların olmadığı kullanım durumlarını ele alır. Bu nedenle, veriyi anlamlı bölümlere ve/veya hiyerarşilere ayırmak için kümeleriz veya veride yer alan değişkenler arasında ilişki kuran ilişki kuralları buluruz (örneğin, iki ürünün (x ve y) birlikte ne sıklıkta satın alındığı gibi).
Clustering (kümeleme), önceden tanımlanmış benzerlik/farklılık metriklerine göre benzer örneklerin doğal gruplarına (yani, kümelere) veri kayıtlarının toplanması ve böylece verilen veri kümesi hakkında faydalı bilgiler çıkarılması anlamına gelir. Herhangi bir kümenin içeriği birbirine benzer olmalıdır, bu duruma yüksek iç-küme benzerliği (intra-cluster similarity) denir. Buna karşılık, herhangi bir kümenin içeriği, diğer kümelerin içeriğinden çok farklı (yani, benzemez) olmalıdır, bu duruma da yüksek dış-küme ayrımı (inter-cluster separation) denir. Kümeleme analizinde rutin…