• Sonuç bulunamadı

DAVRANIŞ BİLİMLERİNDE İLERİ İSTATİSTİK DOKTORA

N/A
N/A
Protected

Academic year: 2021

Share "DAVRANIŞ BİLİMLERİNDE İLERİ İSTATİSTİK DOKTORA"

Copied!
19
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

DAVRANIŞ BİLİMLERİNDE İLERİ İSTATİSTİK

DOKTORA

Doç. Dr. ÖMAY ÇOKLUK BÖKEOĞLU

(2)

Kümeleme Analizi

• Belirli benzerliklerine göre birimlerin benzerliklerini ortaya koymak ve bu benzerlikleri esas alarak birimleri doğru kategorilere sınıflamaktır (Çokluk, Şekercioğlu ve Büyüköztürk, 2010).

• Analizin bu yönü, çok değişkenli analiz tekniklerinden biri olan

diskriminant analizine benzemektedir.

(3)

Kümeleme Analizi

(Çokluk ve diğ., 2010)

• Ancak kümeleme analizinde, diskriminant analizinin tersine birimlerin anlık durumu gözlendiği için, geleceğe yönelik tahminler yapmak

mümkün olamamaktadır. Diskriminant analizi ise, daha çok yeni bir gözlemin önceden bilinen bir gruba uygun bir şekilde dâhil edilmesi amacıyla kullanılmakta ve geleceğe yönelik öngörülerde

bulunulmasına izin vermektedir (Jensen, 1971; Akt. Selanik, 2007).

(4)

Kümeleme Analizi

(Çokluk ve diğ., 2010)

• Doğal sınıflamaları hakkında açıkça bilgi bulunmayan durumlarda, alt grupların yapılarını belirlemede kümeleme analizi kullanılırken, doğal gruplamaları açıkça bilinen toplumlarda alt kümelerin irdelenmesi

diskriminant analizi ile yapılır (Akın, 2008).

(5)

Kümeleme Analizi

(Çokluk ve diğ., 2010)

• Faktör analizi ile karşılaştırıldığında da kümeleme analizinin

objeleri/bireyleri gruplama, faktör analizinin ise değişkenleri gruplama amacına yönelik olduğu ifade edilebilir. Ayrıca faktör analizi

gruplandırmayı verilerdeki değişmelere (varyans-kovaryansa) bağlı

olarak yaparken, kümeleme analizi yakınlıklara (proximity) bağlı olarak

yapar (Hair ve ark., 2006).

(6)

Kümeleme Analizi

(Çokluk ve diğ., 2010)

• Literatürde kümeleme analizi için birçok algoritma öne sürülmüştür.

• Ancak kümeleme yöntemlerini genel olarak iki temel algoritma altında toplamak mümkündür. Bunlardan biri “hiyerarşik kümeleme

yöntemleri”, diğeri ise “hiyerarşik olmayan kümeleme yöntemleri”dir.

Hiyerarşik kümeleme yöntemleri özellikle küçük örneklemler (tipik

olarak n<250) için uygundur.

(7)

Kümeleme Analizi

(Çokluk ve diğ., 2010)

• Hiyerarşik kümeleme analizi yapmak için araştırmacılar, benzerlik ya da uzaklığın nasıl tanımlanacağına ve kümelerin nasıl birleşeceğine ya da ayrılacağına karar vermek durumundadırlar (Everitt ve Landau,

2001; Hair ve ark., 2006). Anderberg (1973) hiyerarşik kümeleme yöntemlerinin, araştırmacının incelediği veri setinde kaç grup

bulunduğunu başlangıçta bilmediği durumlarda çok uygun bir yöntem

olduğunu belirtmektedir.

(8)

Kümeleme Analizi

(Çokluk ve diğ., 2010)

• Ayrıca bu yöntemin araştırmacılara, inceledikleri veri setinde daha önce

gözlemlenmemiş ilişkileri gözleme ve ilkeleri keşfetme olanağı vermesi

nedeniyle de faydalı olduğunu belirtmektedir. Hiyerarşik olmayan

kümeleme yöntemleri, küme sayısının belirlenmiş olduğu durumlarda

kullanılır. Bir başka deyişle araştırmacının küme sayısı konusunda ön

bilgisinin olduğu durumlarda ya da küme sayısına karar verilmiş olması

durumunda kullanılması önerilmektedir (Özdamar, 2004).

(9)

Kümeleme Analizi

Kümeleme Yöntemleri

• I. Hiyerarşik Yöntemler

• A. Birleştirici/Toplamalı Yöntemler

• a.Bağlantı Teknikleri

• Tek Bağlantı

• Tam Bağlantı

• Ortalama Bağlantı (Çokluk ve diğ., 2010)

(10)

Kümeleme Analizi

Kümeleme Yöntemleri

• A. Birleştirici/Toplamalı Yöntemler

• b.Varyans Teknikleri

• Ward’s yöntemi

• c. Merkezileştime Teknikleri

• Medyan

• Centroid (Çokluk ve diğ., 2010)

(11)

Kümeleme Analizi

Kümeleme Yöntemleri

• B. Ayırıcı/Ayrımlı/Bölünmeli Yöntemler

• a. Bölünmüş ortalamalar

• b.otomatik etkileşme belirleme

(Çokluk ve diğ., 2010)

(12)

Kümeleme Analizi

II. Hiyerarşik Olmayan Yöntemler

A. K-Ortalama Yöntemi

B. Metoid Parçalama Yöntemi C. Yığma/Yığılma Yöntemi

D. Bulanık (Fuzzy) Kümeleme Yöntemi

(Çokluk ve diğ., 2010)

(13)

Kümeleme Analizi

(Çokluk ve diğ., 2010)

• Hiyerarşik Yöntemler: Hiyerarşik kümeleme yöntemleri özellikle küçük örneklemler (tipik olarak n<250) için uygundur. Hiyerarşik kümeleme analizi yapmak için araştırmacılar, benzerlik ya da uzaklığın nasıl

tanımlanacağına ve kümelerin nasıl birleşeceğine ya da ayrışacağına

karar vermek durumundadırlar (Everitt ve Landau, 2001; Hair ve ark.,

2006).

(14)

Kümeleme Analizi

(Çokluk ve diğ., 2010)

• Anderberg (1973) hiyerarşik kümeleme yöntemlerinin, araştırmacının

incelediği veri setinde kaç grup bulunduğunu başlangıçta bilmediği

durumlarda çok uygun bir yöntem olduğunu belirtmektedir. Ayrıca bu

yöntemin araştırmacılara, inceledikleri veri setinde daha önce

gözlemlenmemiş ilişkileri gözleme ve ilkeleri keşfetme olanağı vermesi

nedeniyle de faydalı olduğunu belirtmektedir.

(15)

Kümeleme Analizi

(Çokluk ve diğ., 2010)

• Hiyerarşik kümeleme teknikleri, kümeleri ardarda birlestirme sürecidir.

• Hiyerarşik kümeleme yöntemleri, veri matrisindeki

birimlerin/değişkenlerin başlangıçta kaç küme oluşturduğuna ve küme elemanlarını belirlemede başlangıçta hangi ölçütün seçildiğine göre iki temel gruba ayrılırlar: “Birleştirici/Toplamalı Hiyerarşik Kümeleme

Yöntemleri (Agglomerative)” ve “Ayırıcı/Bölünmeli Hiyerarşik Kümeleme Yöntemleri (Divisive)”

• Birleştirici/Toplamalı tekniklerde n adet nesne ardıl olarak gruplarda

birleştirilir.

(16)

Kümeleme Analizi

(Çokluk ve diğ., 2010)

• Ayırıcı/Bölünmeli tekniklerde n adet nesne ardıl olarak daha küçük kümelere ayrılır/bölünür.

• Birleştirici/Toplamalı teknikler, Ayırıcı/Bölünmeli tekniklere göre daha sık kullanılmaktadır.

• Tek bağlantı, tam bağlantı, ortalama bağlantı, merkezîleştirme ve Ward’s bağlantı yöntemi, çok yaygın olarak kullanılan yöntemlerdir.

• Hiyerarşik kümeleme analizi uç değerlere oldukça duyarlıdır.

(17)

Kümeleme Analizi

(Çokluk ve diğ., 2010)

• Bu nedenle yapılması gereken, farklı hiyerarşik tekniklerin uygulanıp bunların karşılaştırılmasıdır. Eğer farklı tekniklerin sonuçları genel hatlarıyla tutarlılık gösteriyorsa kümeleme işlemi yapılır.

• Büyük veri setlerinde hiyerarşik kümeleme analizi işlemleri çok uzun sürmektedir.

• Hiyerarşik yöntemle yapılan toplamalı ve bölünmeli gruplandırmalar geri alınamazlar. Bir grup, diğeri ile bir kez birleştirildikten sonra, daha sonraki adımlarda kesinlikle ayrılamaz.

• Hiyerarşik tekniklerin agaç diyagramları ile gösterilen sonuçlarına

dendogram denir.

(18)

Kümeleme Analizinin Asamaları

• Amaçların belirlenmesi ve değişkenlerin seçiminden sonra araştırmacı aşağıdaki soruları cevaplandırmalıdır (Hair ve ark.,2006):

1. Örneklem büyüklüğü yeterli midir?

2. Verilerde uç deger (outliers) var mı ve kaldırılabilir mi?

3. Gözlemlerin benzerlikleri nasıl belirlenmelidir?

4. Veriler standartlaştırılmalı mıdır?

(19)

Kaynak

• Çokluk, Ö., Şekercioğlu, G. & Büyüköztürk, Ş. (2010). Sosyal bilimler için çok değişkenli istatistik. Ankara: Pegem Akademi.

• ÖZDAMAR, K. (2004). Paket Programlar İle İstatistiksel Veri Analizi.

Eskişehir: Kaan Kitabevi.

• Hair, J., Black, W., Babin, B., Anderson, R., & Tatham, R. (2006).

Multivariate data analysis (6th ed.). Uppersaddle River, N.J.: Pearson

Prentice Hall.

Referanslar

Benzer Belgeler

Farklı kümeleme algoritmaları kullanılarak oluşturulan kümeler arasında bir değerlendirmede bulunulduğunda, korelasyon katsayıları ve öklit uzaklık ölçüsü

Değişkenler sürekli bir dağılıma sahipler, ancak normal dağılım göstermiyorlarsa, iki değişken arasındaki ilişkiyi açıklamak amacıyla Spearman Brown Sıra

Bağımlı/İlişkili Ölçümler için t Testi: İlişkili iki örneklem (ölçüm) ortalaması arasındaki farkın manidarlığını test etmek için

İkiden Fazla Ortalamanın Karşılaştırılmasına Yönelik Parametrik Teknikler: Bağımlı / İlişkili Ölçümler için Tek Yönlü Varyans analizi ANOVA.. Tekrarlı ölçümler için

İlişkisiz Örneklemler İçin İki Faktörlü ANOVA (Two- Way ANOVA for Independent Samples) (Büyüköztürk, 2004). • İki boyutlu varyans analizi için de geçerli olan

Karışık Desen (Mixed Design / Split Plot) ANOVA (Bir Faktörde Tekrarlı İki Faktörlü ANOVA) (Büyüköztürk, 2004).. • Tek faktör üzerinde tekrarlı ölçümler için

• Tek faktörlü ve çok faktörlü ölçme araçları için faktör analizi uygulamaları ve güvenirlik hesaplamaları.. Sosyal Bilimler için Veri Analizi

• Diğer yandan örneklem büyüklüklerinin aynı olması durumunda, bağımlı değişkenin her bir kategorisinde bağımsız değişkenlerin çok değişkenli normalliğe sahip