• Sonuç bulunamadı

5. KÜMELEME ANALİZİ

5.1. Kümeleme Analizinin Amacı

Segment analizi veya biyologların tabiri ile taksonomi analizi olarak da adlandırılan kümeleme analizinin genel amacı, gruplanmamış verileri benzerliklerine göre sınıflandırmak ve araştırmacıya uygun, işe yarar ve özetleyici bilgiler elde etmede yardımcı olmaktır (Doğan, 2008: 76).

Kümeleme analizinin genel amacı, toplanan çok sayıdaki gruplanmamış gözlemlerden oluşan veriyi birimlerin benzerliklerine göre anlamlı gruplardan oluşan özel alt kümelere bölerek veriyi indirgemektir. Böylece araştırmacı en az bilgi kaybıyla, daha net ve anlaşılabilir tanımlı gözlemlere sahip olacaktır. 1963 yılında Robert Sokal ve Peter Sneath’ın yazdığı “Sayısal Sınıflandırma İlminin Temelleri” adlı kitap bu alanda önemli bir adım olmuştur (Günay Atbaş, 2008: 10).

Kümeleme Analizi, doğal sınıflamaları hakkında açık bilgi bulunmayan durumlarda, anakütleye ilişkin tahminlerin yapılmasında yararlanılan bir yöntemler topluluğudur. Bu nedenle doğal gruplamaların açıkça bilindiği durumlarda toplumlarda alt kümelerin incelenmesi ayırma analizi (discriminat analysis) ile yapılır. Alt küme tanımlamaları açıkça yapılmamış ya da ayrı ayrı anakütle oldukları kesin bilinemeyen durumlarda birimleri birbirinden ayırmak, yeni tanımlamalar yapmak, yeni prototipler belirlemek, biyolojik materyaller için taksonomik sınıflandırma profilleri belirlemek amacıyla kümeleme analizinden yararlanılmaktadır (Özdamar, 1999: 258).

Bireylerin sınıflanması, ait oldukları kitlelerin (grupların) belirlenmesi ile uğraşan Kümeleme Analizinin bir diğer amacı ise, çok değişkenli bir veri grubunda birbirine benzer veya yakın olan gözlemlerin bir arada gruplandırılmasını sağlamasıdır. Çok yönlü amaçlar için kullanılabilir (Yıldız, 1998: 9).

Kümeleme Analizi, X veri matrisinde yer alan ve doğal gruplamaları kesin olarak bilinmeyen bireyleri, değişkenleri ya da birey ve değişkenleri birbirleri ile benzer olan alt kümelere ayırmaya yardımcı olan yöntemler topluluğudur. KA; birimleri p değişkene göre hesaplanan ve benzerlik ölçüsü olarak kullanılan bazı ölçüler kullanarak homojen gruplara bölmek amacıyla kullanılır (Güler, 2006: 3). Kümeleme analizi, sadece zaten mevcut olan verideki yapıyı değil fakat aynı zamanda az veya çok benzer bir veri setindeki yapıyı da ortaya çıkarmak için kullanılabilir (Kaufman ve Rousseeuw, 2005: 2).

Kümeleme analizi temelde aşağıda belirtilen dört değişik amaca yönelik olarak uygulanan bir yöntemdir. Bunlar (Doğan, 2008: 77):

 n sayıda birimi, nesneyi, oluşumu; p sayıda değişkene göre saptanan özelliklerine göre olabildiğince kendi içinde homojen ve kendi aralarında heterojen alt gruplara (kümelere) ayırmak.

 p sayıda değişkeni, n sayıda birimde saptanan değerlere göre ortak özellikleri açıkladığı varsayılan alt kümelere ayırmak ve ortak faktör yapıları ortaya koymak.

 Hem birimleri hem de değişkenleri birlikte ele alarak n birimi p değişkene göre ortak özellikli alt kümelere ayırmak.

 Birimleri, p sayıda değişken baz alınarak saptanan değerlere göre, taksonomik sınıflandırmaya tabi tutmak.

Kümeleme Analizinin yukarıda sayılan genel amaçlarının yanı sıra aşağıdaki özel amaçlarından da bahsedilebilir (Tatlıdil, 1996: 330):

 Gerçek tiplerin (cinslerin-ırkların) belirlenmesi,  Model uydurmanın kolaylaştırılması,

 Gruplar içi ön tahmin,  Hipotezlerin testi,

 Veri yapısının netleştirilmesi,

 Veri indirgenmesi (veriler yerine kümelerin değerlendirilmesi),  Aykırı değerlerin (outliers) bulunması.

5.2. Kümeleme Analizi ve Varsayımları

Kümeleme analizinin başlıca varsayımları, veri matrisinin analiz öncesi tahmin ve kriter değişkenleri alt matrislerine bölüştürülmemesi ve verilerin kısmen homojen kısmen heterojen olmasıdır. Ancak bu ikinci varsayım diskriminant analizinde olduğu gibi veri matrisinin analiz öncesi verilerin verilerdeki ayrılıklar veya benzerlikler saptanmaksızın gruplara ayrılmasından çok farklıdır. Bu açıklamaların ışığı altında kümeleme analizinin; tahminden çok tanımlama ile değişkenlerden çok bireylerle, kriter-tahmin değişkenleri ilişkilerinden çok tüm veri setindeki ilişkilerle ilgilendiği, bu analizde değişkenler arasındaki ilişkinin doğrusal olmasının şart olmadığı ve analizin seçilen kümeleme yöntemine göre nominal, ordinal, aralık veya kombine bir ölçekle ölçülmüş verilere uygulanabileceği söylenebilir (Öz, 2005: 46).

Kümeleme analizi ile veri kümesinde yer alan gözlemlerin benzerliklerine göre iki veya daha fazla gruba ayrılması amaçlanmaktadır. Kümeleme analizi, veri kümesinde yer alan değişkenlerin analizle ilgili veya ilgisiz olduğunu saptama ve ilgisiz değişkenleri ayıklama yeteneğine sahip değildir. Bu durum dikkate alınarak, değişkenlerin analize uygun olup olmadığı dikkatlice belirlenmelidir. Kümeleme analizinin sonucunda ortaya çıkan kümeler, değişkenlerle karakterize edilen gözlemlerin içsel yapısını ortaya koymaktadır (Doğan, 2008: 79).

Kümeleme Analizi, kümelerin sayısına veya küme yapılarına ilişkin herhangi bir varsayımda bulunmaz. Diğer çok değişkenli istatistiksel analiz yöntemlerinde önemli bir yer tutan normallik varsayımı, bu analizde prensipte kalmakta ve uzaklık değerlerinin normalliği yeterli görülmektedir (Güler, 2006: 4).

5.3. Kümeleme Analizinin Diğer Analizlerle İlişkisi 5.3.1. Kümeleme Analizi ve Diskriminant Analizi

Kümeleme Analizi benzer birimlerin başlangıçta tanımlanmamış sınıflara gruplanması ile ilgilidir ve en önemli amacı verilerin basitleştirilmesidir. Diskriminant Analizi ise, birimlerin bilinen gruplara ayrılması ile ilgilenir ve ilk amacı da yeni birimleri doğru gruplara atamaktır. Geleneksel yaklaşımlar ve İstatistiksel yaklaşımlar

KÜMELEME ANALİZİ Elif AKGÖZ dâhil pek çok yöntem, sınıflama probleminin iki türünün de çözümlenmesinde kullanılabilir (Yıldız, 1998: 16).

Kümeleme analizinde önceden tanımlanmış gruplara birimleri atayan diskriminant analizinin aksine önceden tanımlanmamış gruplar oluşturulur (Kaufman ve Rousseeuw, 2005: 2).

5.3.2. Kümeleme Analizi ve Faktör Analizi:

Bu iki yöntem arasında sıklıkla ortaya konulan bir ayrıma göre, kümeleme analizi birimlerin sınıflandırılması ile ilgilenirken, faktör analizi değişkenler arasındaki ilişkileri değerlendirir. Birçok temel farklılık faktör analizinin iyi formüle edilmiş bir doğrusal modeli düşüncesinden kaynaklanır. Böyle açık bir biçimde tanımlanmış bir model, veri yapılarının belirli görüşlerle ilgili hipotezlerin test edilmesine öncülük eden avantajlara sahiptir (Everitt, 1979: 170).

Benzer Belgeler