• Sonuç bulunamadı

Kümeleme Analizi

3. BÖLÜM: YÖNTEM VE TASARIM

3.4 VERİ ANALİZ YÖNTEMLERİ

3.4.3 Kümeleme Analizi

Fazla sayıdaki verinin çok sayıdaki değişkene bağlı olarak gruplandırılması konusunda kümeleme analizinden faydalanılmıştır. Kümeleme analizinin amacı; nesneleri saptanan özelliklerine göre olabildiğince kendi içinde benzer ve kendi aralarında farklı alt gruplara ayırmak, hem birimleri hem de değişkenleri birlikte ele alarak ortak özellikli alt kümelere ayırmak, birimlerin saptanan değerlere göre izledikleri karakteristik özellikleri ortaya koymak olarak açıklanabilir (Atbaş, 2008; Neil, 2002).

Bu çalışmada dergiler için oluşturulan boyutlardaki değişkenlere göre kümeleme analizi yapılmıştır. Kümeleme analizi yoluyla kullanım, yayın üretimi, ve uluslararası göstergeler alanlarında etkin dergiler ve konu alanları belirlenmiştir.

Çalışmamız için kullanılan en eski kümeleme algoritmalarından olan k-ortalama, 1967 yılında J.B. MacQueen tarafından geliştirilmiştir. K-ortalama kümeleme yöntemi küme sayısının araştırmacı tarafından belirlendiği yöntemdir. Temel mantığı n adet veri nesnesinden oluşan bir veri kümesini k adet kümeye bölümlemektir. K-ortalama yöntemi her verinin sadece bir kümeye ait olabilmesine izin verir. Bu nedenle, keskin bir kümeleme algoritmasıdır. K-ortalama kümeleme yönteminde ilgili kümenin merkez (centroid) değeri ile veri setindeki her objenin/nesnenin arasındaki farkın kareleri toplamının minimumu alınarak gerçekleştirilir. Gerçekleştirilen bölümleme işlemi sonunda elde edilen kümelerin, küme içi benzerliklerinin maksimum ve kümeler arası benzerliklerinin minimum olması amaçlanmaktadır (Işık ve Çamurcu, 2007).

K-ortalama kümeleme analizinin uygulanması için öncelikle verilerin belirlenmesi gerekmektedir. Daha sonraki aşamada belirlenen verilerin birbirleri ile benzerlik/farklılıklarının ortaya konması, son olarak uygun küme yöntemi yardımı ile

birimlerin/değişkenlerin uygun sayıda kümelere ayrılması işlemi yapılmaktadır. Kümeleme analizinde elde edilen kümelerin her birinin merkezi değişkenlerin ağırlıklı ortanca değerine göre hesaplanmaktadır. Bu merkezler kalıcı bir çözüm bulunana, algoritmanın gerektirdiği optimal lokasyonların oluşması ve centroidler yer değiştirmeyecek duruma gelene kadar iterasyon yapılmak suretiyle konumlandırılmaya devam ederler. Bu işlemde küme ağırlıklı değere sahip veya en yakın olan eleman küme merkezidir. Elemanlar kendilerine en yakın küme merkezine dahil olurlar. Her bir kümeye eklenen yeni eleman ile kümenin ağırlıklı ortalaması tekrar hesaplanarak yeni küme merkezi bulunmaktadır (Özdamar, 1999).

Çalışmamızda analiz edilen dergi ve konu alanları k-ortalama kümeleme analizi yapılarak gruplara ayrılmıştır. Bu şekilde birden çok değişken ele alındığında dergi/konu alanlarının kaç gruba ayrıldığı, gruplar içindeki dergi/konu alanlarının özellikleri hakkında bilgi sahibi olunmaktadır. Belirlenen birden fazla sayıdaki değişkene göre en etkin dergi/konu alanları da kümeleme analizi sonucunda elde edilen diğer bulgulardır.

K-ortalama kümeleme analizi ile çalışmamızda kullanılan çok sayıda ve birbiriyle ilişkili değişkene göre dergilerin bulunduğu kümeler belirlenmiştir. Bu şekilde her bir dergiye bir küme kodu atanmış ve bu kod derginin hangi küme içinde olduğunu göstermiştir.

3.4.3.1 Kümeleme Analizinde Kullanılan Değişkenler ve Küme Sayısının Belirlenmesi İyi bir kümeleme analizi aynı kümede yer alan birimler arasında benzerliğin, farklı kümelerde yer alan birimler arasında farklılığın olmasını gerektirmektedir. Bunun yanında kümeleme analizi sırasında elde edilen kayıp (missing) oranı, kümeler arası üye sayılarının benzerliği ve son küme merkezleri gibi ölçümler kümeleme analizinin geçerliliği ile ilgili olarak fikir vericidir. Belirtilen bu özelliklere uygun olarak kümeleme işleminin başarılı olmasında değişkenlerin ve küme sayısının belirlenmesi önem taşımaktadır.

Çalışmamızda yapılan kümeleme analizinde kullanılacak değişkenler için öncelikle faktör analizi sonuçlarından yararlanılmıştır. Faktör analizinin belirlediği boyutlardaki

değişkenlere göre yapılan kümeleme analizlerinde elde edilen kümeler görsel özelliklerden faydalanılarak değerlendirilmiştir. Çalışmamızda grafik olarak elde edilen kümelerde aynı gruptaki verilerin benzerlikleri, farklı gruptaki verilerin ayrılıkları ile ilgili özelliklerin olmadığı kümeler için kullanılan değişkenler ve küme sayısı tekrar değerlendirilmiştir. Bu durumda değişkenler çalışmamız için tanımladığımız türlerine uygun olarak sınıflandırılmış ve bir boyut altında iki farklı küme oluşturulabilmiştir. Çalışmamızda veri analizi sırasında çalışmanın bulgularını etkileyeceğini düşündüğümüz noktalar şunlardır;

 Çalışmada kullanılan değişkenlerin değerleri arasında çok büyük farklılıklar olması nedeniyle orijinal değerler kullanılmamış, logaritmik değerler alınmıştır.

 Kümeleme analizinin gerçekleştirildiği boyutlarda çok sayıda değişken olması nedeniyle kümelerdeki değişken ağırlıkları (son küme merkezleri) kümelere göre çok farklılık göstermiştir. Kümeleme sıralamasını belirleyen bu durumlarda sıralamanın belirlenmesinde tüm değişkenler değerlendirilerek karar verilmiştir.

3.4.3.2 Toplam Değerlendirmenin Yapılması

Çalışmamızda yukarıda belirtilen yöntemlerin kullanılması sonucu dergilerin toplam değerinin elde edilmesi amaçlanmıştır. Şekil 1’de çalışmamızda uygulanan yöntemler özetlenmektedir. Öncelikle belirlediğimiz değişkenlerin hangi boyutlar altında yer alacağı ve çok değişkenli boyutların neler olacağı belirlenmiş, bu boyutlara göre kümeleme analizi yapılmıştır. Yapılan kümeleme analizi sonucunda dergiye ait değerler kümeleme sonucundan yararlanılarak boyut bazında belirlenmiştir. Tüm boyutlar için elde edilen bu değerlerin toplanması sonucu dergilerin toplam değeri belirlenmiştir.

Şekil 1. Toplam değerin belirlenmesi aşamaları

Dergilerin toplam değeri ile ilgili formül:

TP = PKUL + PUG + PYAY + PBE (1)

TP = Dergilerin toplam değeri

PKUL = Kullanım boyutunda bulunduğu (A-E) arası kümeye göre 1-5 arası değer

PUG = Uluslararası Göstergeler boyutunda bulunduğu (A-E) arası kümeye göre 1-5 arası değer

PYAY = Yayın üretimi boyutunda bulunduğu (A-E) arası kümeye göre 1-5 arası değer

PBE = Bilimsel etki boyutunda bulunduğu (A-E) arası kümeye göre 1-5 arası değer

Konuların toplam değeri ise dergiler için yapılan kümeleme analizinden yararlanılarak tespit edilmiştir. Bu kapsamda dergilerin yer aldığı kümede aldığı değer, her bir kümede konu alanının geçiş sıklığı gibi kriterler değerlendirilerek konulara ait toplam değer bilgisi elde edilmiştir.

Konuların toplam değeri ile ilgili formül: (2) TP = Toplam Puan k = Küme = Küme değeri = Kümede geçme sıklığı

Benzer Belgeler