doi: 10.26579/jocrebe.88
Journal of Current Researches
on Business and Economics
(JoCReBE)
ISSN: 2547-9628http://www.jocrebe.com
Investigation of Happiness of Countries with K-Means Clustering
and Discriminant Analysis
Sadullah ÇELİK1 & Necmiye CÖMERTLER2 Keywords K-Means Clustering, Discriminant Analysis, Happiness. Abstract
The purpose of this study is to determine the effect degrees of happiness indicators on happiness and similar countries in terms of happiness. For this purpose, 156 countries included in the 2019 World Happiness Report were analyzed with K-Means clustering and discriminant analysis. Discriminant analysis was conducted to determine the functions that distinguish the 9 clusters obtained as a result of K-Means and the indicators that best represent the groups while creating these functions. K-Means cluster analysis results are visualized by combining them in two-dimensional space obtained from discriminant analysis. Thanks to the new visual obtained by using these two analysis results together, the K-Means clustering structures are better understood and the results are more easily interpreted. From this point of view, a new visualization approach based on discriminant analysis can be proposed in which the K-Means cluster analysis results can be interpreted. Discriminant analysis results obtained in the study were found to be compatible with the results of K-Means cluster analysis. In both methods, it was found that the "GDP Per Capita" indicator affected the happiness states of the countries the most. We believe that these results will provide important information by policy makers in increasing the happiness level of the countries. Article History Received 12 Feb, 2021 Accepted 6 Apr, 2021
K-Means Kümeleme ve Diskriminant Analizi ile Ülkelerin
Mutluluk Hallerinin İncelenmesi
Anahtar Kelimeler K-Means Kümeleme,
Diskriminant Analizi, Mutluluk.
Özet
Bu çalışmanın amacı, mutluluk göstergelerinin mutluluk üzerindeki etki derecelerini ve mutluluk bakımından benzer ülkeleri saptamaktır. Bu amaçla 2019 yılı Dünya Mutluluk Raporunda bulunan 156 ülke, K-Means kümeleme ve diskriminant analizi ile incelenmiştir. K-Means sonucunda elde edilen 9 kümeyi birbirinden ayıran fonksiyonları ve bu fonksiyonları oluştururken grupları en iyi temsil eden göstergeleri saptamak için diskriminant analizi yapılmıştır. K-Means kümeleme analizi sonuçları, diskriminant analizinden elde edilen iki boyutlu uzayda birleştirilerek görselleştirilmiştir. Bu iki analiz sonucunun birlikte kullanılmasıyla elde edilen yeni görsel sayesinde,
1 Corresponding Author. ORCID: 0000-0001-5468-475X. Arş. Gör. Dr., Aydın Adnan Menderes Üniversitesi, Nazilli İktisadi ve İdari Bilimler Fakültesi, Ekonometri Bölümü,
2 ORCID: 0000-0001-5468-475X. Prof.. Dr., Aydın Adnan Menderes Üniversitesi, Nazilli İktisadi ve İdari Bilimler Fakültesi, İktisat Bölümü, [email protected]
Year: 2021 Volume: 11 Issue: 1
Research Article/Araştırma Makalesi
For cited: Çelik, S. & Cömertler, N. (2021). Investigation of Happiness of Countries with K-Means Clustering
16 Çelik, S. & Cömertler, N. (2021). Investigation of Happiness of Countries with K-Means Clustering and Discriminant Analysis
Means kümeleme yapıları daha iyi anlaşılmış ve sonuçlar daha kolay yorumlanmıştır. Buradan hareketle, K-Means kümeleme analizi sonuçlarının yorumlanabildiği, diskriminant analizli tabanlı yeni bir görselleştirme yaklaşımı önerilebilir. Çalışmada elde edilen diskriminant analizi sonuçları K-Means kümeleme analizi sonuçları ile uyumlu çıkmıştır. Her iki yöntemde de ülkelerin mutluluk hallerini “Kişi Başına Düşen GSYH” göstergesinin en çok etkilediği bulunmuştur. Elde edilen bu sonuçların politika yapıcılar tarafından ülkelerin mutluluk düzeyini yükseltmede önemli bilgiler sunacağı kanaatindeyiz. Makale Geçmişi Alınan Tarih 12 Şubat 2021 Kabul Tarihi 6 Nisan 2021 1. Giriş
Mutluluk insanoğlunun tarih boyunca peşinden koştuğu en temel amaçlarından biri olmuştur. Aristo’nun Eudomania’sından Bentham’ın hazzı maksimize eden faydacı yaklaşımına kadar mutluluğu açıklamak için tarih boyunca birçok düşünür bu konuya odaklanmıştır. Mutluluk, bazen insanın nihai amacı olarak görülmüş, bazen bu dünyada erişilemeyeceğine inanılmış olsa da insanoğlunun ulaşmak için çabalamaktan hiç vazgeçmediği arzusu olmuştur (Cömertler, 2019a: 168). 1990 yılına kadar iktisatçılar, farklı ülkelerde ve zaman dilimlerinde mutluluğun belirleyicilerinin geniş ölçekli ampirik analizlerine katkıda bulunmaya başlamadılar. Bu çalışmalar, kişisel gelir, gelir dağılımı eşitsizliği, sağlık ve eğitim seviyeleri, demokrasi, yolsuzluk vb. gibi kişinin mutluluk derecesini etkileyen çeşitli sosyoekonomik değişkenleri tanımladı. Ekonomistler genellikle daha yüksek gelirin daha fazla mutluluk getirdiğini kabul ederler. Birçok ülkede ve farklı kültürlerde yapılan ampirik çalışmalar, böyle bir yaklaşımı sürekli olarak desteklemiş ve daha yüksek gelir ile daha fazla mutluluk arasında pozitif bir ilişki olduğunu göstermiştir (Taylor vd., 2018).
İnsanlar bugün ne kadar mutludur? Acaba geçmişte insanlar daha mı mutluydu? Farklı toplumlardaki insanlar hayatlarından ne kadar memnun? Yaşam koşullarımız mutluluğumuzu nasıl etkiliyor? Bunlar cevaplanması zor ama şüphesiz kişisel olarak olduğu kadar toplumsal açıdan da bilinmesi son derece önemli olan sorulardır. Bu nedenle bugün mutluluk sosyal bilimlerde önemli araştırma alanları arasında yer alır (Ortiz-Ospina ve Roser, 2013).
Bir ülkede yaşayanlar için mutluluğun ne anlama geldiğini, kendilerini ne kadar mutlu hissettiklerini ve mutluluklarını etkileyen faktörlerin neler olduğunu bilmek politika yapıcı ve uygulayıcılar için etkin ve başarılı politika uygulamalarını gerçekleştirmede son derece önemli ve gereklidir. Bu anlamda mutluluk endeksleri giderek daha önem kazanan bir araca dönüşmektedir (Cömertler, 2019b: 381). Mutluluk araştırmaları, endeksler ve raporlar ortak bazı sonuçları göstermektedirler. Mutlu insanlar çoğunlukla genç ve yaşlı, zengin, iyi eğitimli, evli, çocuklu, çalışan, sağlıklı, meyve ve sebze ağırlıklı beslenen, düzenli spor yapan, zayıf, düzenli bağış yapan, ibadet eden ya da meditasyon yapan kişilerdir. Öte yandan kişi başına düşen gelirin yüksek, işsizlik oranının düşük, gelir dağılımının daha adaletli, daha yeşil, daha güvenli, daha demokratik, sosyal desteğin (komşuluk, akrabalık ya da arkadaşlık) daha fazla olduğu ülkelerin insanları daha mutludurlar (Cömertler, 2019b: 399).
Dünya çapında, bölgesel ya da ulusal ölçekte çeşitli faktörlere bağlı olarak bireylerin mutluluk düzeylerini ve yaşam memnuniyetlerini sübjektif olarak ölçen birçok mutluluk endeksi bulunmaktadır. Bu çalışmada bu endekslerden biri olan
Journal of Current Researches on Business and Economics, 2021, 11 (1), 15-38. 17
Dünya Mutluluk Raporu göstergeleri kullanılmıştır. Dünya Mutluluk Raporu, 2012 yılından itibaren Birleşmiş Milletler Sürdürülebilir Kalkınma Çözümleri Ağı tarafından desteklenerek hazırlanmaktadır ve en son 2019 yılında yayınlanmıştır. Bu çalışmada 2019 yılında yayınlanan Dünya Mutluluk Raporunda ülkelerin mutluluk sıralamasında kullanılan “Kişi Basına Düşen GSYH”, “Sosyal Destek”, “Doğumda Sağlıklı Yaşam Beklentisi”, “Yaşam Seçimleri Yapma Özgürlüğü”, “Cömertlik” ve “Yolsuzluk Algısı” olmak üzere 6 adet mutluluk göstergesine çok değişkenli istatistiksel analiz tekniklerinden K-Means kümeleme ve diskriminant analizi uygulanmıştır. Bu analizlerle 6 gösterge bağlamında hangi ülkelerin benzeştiği ve hangilerinin diğerlerinden ayrıştığının saptanarak görsel olarak sunulması amaçlanmaktadır.
2. Mutluluk
Türk Dil Kurumunca mutluluk kelimesi “bütün özlemlere eksiksiz ve sürekli olarak ulaşılmaktan duyulan kıvanç durumu, mut, ongunluk, kut, saadet, bahtiyarlık, saadetlilik” olarak tanımlanmaktadır (TDK, 2019).
Ekonomistler, psikologlar, sosyologlar, mimarlar, nörologlar ve diğer alanlardan bilim insanları yaptıkları çalışmalarla mutluluk bilimi olarak adlandırılan yeni bir alanın gelişmesine katkıda bulunmuşlardır. Mutluluk ile gelir, sağlık, eğitim, istihdam, cinsiyet, yaş gibi demografik ve sosyo-ekonomik durumlar arasında bir ilişki olup olmadığı Adam Smith’den bu yana birçok iktisatçının da dikkatini çekmiştir. Ancak mutluluk konusundaki çalışmalar ekonomistlerce uzun yıllar ihmal edilmiş ve diğer sosyal bilimcilere bırakılmıştır (Cömertler, 2013: 8). Ekonomistlerin bu alana ilgisi 1970’lerden itibaren başlamakla beraber, 1990’lı yıllardan sonra ilgi giderek artmış ve hızla büyüyen bir mutluluk literatürü oluşmuştur.
İnsanları neyin mutlu ettiğini bireysel ve sosyo-ekonomik, kurumsal ve çevresel faktörlerle açıklayan çok sayıda çalışma bulunmaktadır. Literatürdeki çalışmalarda mutluluğun belirleyicileri üzerinde tam bir fikir birliği oluşmamakla birlikte genel olarak bulgular şöyle özetlenebilir3. Yaşla mutluluk arasında gençlerin ve yaşlıların
orta yaşlılardan daha mutlu olduğunu gösteren U biçiminde bir ilişki vardır. Kadınlar erkeklerden, ABD’de beyazlar Afrika kökenli Amerikalılardan, evli olanlar bekâr ya da birlikte yaşayanlardan, çocuğu olanlar olmayanlardan daha mutludur. Eğitim düzeyi ile birlikte mutluluk düzeyi de artmaktadır. Sağlık koşullarının kötüleşmesi mutluluğu azaltmaktadır. Düzenli ibadet etmek mutluluğu artırmaktadır. Kişiler gelirleri arttıkça, zenginleştikçe daha mutlu olmakta ama başkalarının geliri onlardan daha hızlı artıyorsa mutlulukları artmamaktadır. Gelir dağılımının bozulması ve enflasyon artışı mutluluğu olumsuz etkilemektedir. İşsizlik, boşanmak ya da ayrımcılığa maruz kalmak mutluluğu olumsuz etkilerken diğerlerinin de işsiz kalması, boşanması ya da ayrımcılığa maruz kalması durumunda bu negatif etki daha az olmaktadır. Öte yandan işsizlik, evlenme, boşanma, çocuk sahibi olma ve eşlerin ölümü gibi durumlardan birinin meydana gelmesi ile gerçekleşen mutluluk düzeyi sürekli olmamakta ve alışma süreci tamamlandıktan sonra başlangıçtaki mutluluk düzeyine geri dönülmektedir.
3 Geniş bir literatür değerlendirmesi için Frey and Stutzer (2002); Dolan, Peasgood ve White (2008); Stutzer ve Frey (2012); Layard, Clark ve C. Senik (2012) ve Clark (2018) çalışmalarına bakınız.
18 Çelik, S. & Cömertler, N. (2021). Investigation of Happiness of Countries with K-Means Clustering and Discriminant Analysis
Özgürlükler ve demokratikleşme düzeyinin artmasının mutluluk üzerinde pozitif etkisi olmaktadır. Sosyal dışlama mutluluğu azaltmaktadır. Komşulara, hükümete, polise vb kurumlara güvenin artması mutluluğu artırmaktadır. Kırda yaşayanlar büyük şehirlerde yaşayanlardan daha mutludur. Hava kirliliği, gürültü vb çevre kalitesindeki bozulmalar mutluluğu olumsuz etkilemektedir (Cömertler, 2019a: 173).
2.1. Mutluluğun Ölçülmesi (Mutluluk Endeksleri)
Mutluluk düzeyini ölçmek için mutluluk endeksleri kullanılmaktadır. Mutluluk endeksleri çeşitli faktörlere bağlı olarak bireylerin mutluluk düzeylerini ve yaşam memnuniyetlerini sübjektif olarak ölçmektedir. Bu endeksler hazırlanırken tek soruluk ya da çok sayıda sorudan oluşan anketlerle kişilerin mutluluk düzeylerini ve yaşam memnuniyetlerini belirttikleri anketlerle toplanan veriler kullanılmaktadır.
Mutluluk verilerinin üç farklı amaçla kullanıldığı görülmektedir. Birinci ve en yaygın kullanım amacı insanları neyin mutlu ettiğini başka bir deyişle mutluluğu etkileyen faktörlerin neler olduğunu ortaya koyan ampirik analizler yapmaktır. İkinci olarak, mutluluk verileri mutlu insanların neler yaptığını ortaya koyan ampirik analizler için kullanılmaktadır. Üçüncü olarak ise “Eğer kendi işinde çalışanlar ücretli çalışanlardan daha mutluysa neden insanlar hala başkaları için çalışmaya devam ediyor?”, “Ücretler sektörlere ve mesleklere göre neden farklılaşır?”, “Enflasyonun işsizlikle karşılaştırıldığında insana zararı ne kadardır” gibi ekonomik parodoksların çözümü için mutluluk verileri kullanılmaktadır (Clark, 2018:246).
Bireylerin yaşam memnuniyetlerini ve mutluluk düzeylerini subjektif olarak ölçen dünya çapında, bölgesel ya da ulusal ölçekte birçok çalışma bulunmaktadır. Bunlardan ilki ve diğerlerine de öncülük eden Bhutan Krallığında uygulanan Gayrisafi Milli Mutluluk Endeksidir. İlk olarak 1972 yılında Bhutan Kralı Jigme Singye Wangchuck tarafından gündeme getirilen Gayri Safi Milli Mutluluk (GSMM) kavramını ölçülebilir kılmak için eğitim, fiziksel sağlık, psikolojik refah, zaman kullanımı, yaşam standardı, kültürel çeşitlilik, iyi yönetişim, ekolojik çeşitlilik ile esneklik ve topluluğun canlılığı ile toplumsal ilişkiler olmak üzere dokuz alanı kapsayan bir endeks geliştirilmiştir. Kral Jigme Singye Wangchuck “Gayri Safi Milli Mutluluk Gayri Safi Yurtiçi Hasıladan daha önemlidir” derken sürdürülebilir kalkınmanın ilerleme kavramlarına karşı bütüncül bir yaklaşım benimsemesi ve refahın ekonomik olmayan yönlerine eşit önem vermesi gerektiğini ima etmektedir. GSMM Endeksi, hem yaşam standartları, sağlık ve eğitim gibi geleneksel sosyo-ekonomik ilgi alanlarını hem de kültür ve psikolojik refahın daha az geleneksel yönlerini içermektedir. Yalnızca öznel bir mutluluk psikolojik sıralaması olmaktan çok, Bhutan nüfusunun genel refahının bütünsel bir yansımasıdır (Ura, Alkire and Zangmo, 2010).
Dünya Mutluluk Veritabanı (World Happiness Database), RuutVeenhoven tarafından 2005 yılından itibaren oluşturulmaya başlamış ve hala devam etmekte olan bir veritabanıdır. Bu veritabanında mutluluk “kişinin bir bütün olarak yaşamından duyduğu memnuniyet” olarak tanımlanmakta ve mutluluk alanında
Journal of Current Researches on Business and Economics, 2021, 11 (1), 15-38. 19
yapılmış çalışmalar taranarak elde edilen veriler bir araya getirilmektedir (Veenhoven, 2019).
2006 yılından itibaren Yeni Ekonomi Vakfı (New Economic Foundation) tarafından yayınlanmakta olan Mutlu Gezegen Endeksi (Happy Planet Index), yaşam memnuniyeti, ortalama yaşam beklentisi, çıktıların eşitsizliği ve ekolojik ayak izi olmak üzere dört gösterge kullanılarak hesaplanmaktadır. Bu endeks, ulusların uzun, mutlu ve sürdürülebilir bir yaşama ulaşmada ne kadar başarılı olduklarını göstermektedir (Jeffrey, Wheatley and Abdallah, 2016).
Ekonomik Kalkınma ve İşbirliği Örgütü (OECD) tarafından 2011 yılından itibaren yıllık olarak hazırlanan Daha İyi Yaşam Endeksi (Better Life Index) 40 ülkeyi kapsamakta ve konut, gelir, iş, toplum, eğitim, çevre, sivil katılım, sağlık, mutluluk (yaşam memnuniyeti), güvenlik ve iş yaşam dengesi olmak üzere 11 alt endeksten oluşmaktadır (www.oecdbetterlifeindex.org).
2012 yılından itibaren Birleşmiş Milletler Sürdürülebilir Kalkınma Çözümleri Ağı tarafından desteklenen, Dünya Mutluluk Raporu (World Happiness Report), Gallup World Poll tarafından sağlanan veri seti kullanılarak hazırlanmaktadır. İlk veri seti 2005-2008 dönemine son veri seti ise 2016-2018 dönemine ait olan Dünya Mutluluk Raporu en son 2019 yılında yayınlanmıştır. Raporda mutluluk sıralamasını belirleyen göstergeler olarak kişi başına GSYH, sosyal destekler, Doğumda Sağlıklı Yaşam Beklentisi, yaşam seçimleri yapma özgürlüğü, cömertlik ve yolsuzluk algısı kullanılmıştır (Helliwell, 2019). Raporda;
Kişi başına düşen GSYH: Dünya Bankası, Dünya Kalkınma Göstergeleri’nden alınan
Satın alma Gücü Paritesine göre hesaplanmıştır.
Doğumda sağlıklı yaşam beklentisi: Dünya Sağlık Örgütünün Küresel Sağlık Gözlem
verilerinden alınıp uyarlanmıştır.
Sosyal destek: “Başınız dertte olsa ne zaman ararsanız yardımınıza koşacağına
inandığınız yakınlarınız ya da arkadaşlarınız var mı, yok mu?” sorusunun cevaplarının ulusal ortalaması Gallup World Poll veri setinden alınmıştır.
Yaşam seçimleri yapma özgürlüğü: “Hayatta ne yapacağınıza dair seçim yapma
özgürlüğünüzden memnun musunuz, değil misiniz?” sorusunun cevaplarının ulusal ortalaması Gallup World Poll veri setinden alınmıştır.
Cömertlik: “Geçen ay bir yardım kuruluşuna bağış yaptınız mı?” sorusunun
cevaplarının ulusal ortalaması Gallup World Poll veri setinden alınmıştır.
Yolsuzluk algısı: “Devlette yolsuzluk yaygın mıdır” ve “İş dünyasında yolsuzluk
yaygın mıdır?” sorularının cevaplarının ulusal ortalaması Gallup World Poll veri setinden alınmıştır.
3. Veri Seti
Bu çalışmada kullanılan veriler “kaggle” (https://www.kaggle.com/unsdsn/world-happiness/metadata) sitesinden indirilmiştir. Çalışmaya dünyadaki 156 ülke dâhil edilmiş ve bu ülkeler Ek 1’de verilmiştir. Tablo 1’de ülkelerin mutluluğunu ölçmede kullanılan göstergeler verilmiştir.
20 Çelik, S. & Cömertler, N. (2021). Investigation of Happiness of Countries with K-Means Clustering and Discriminant Analysis
Tablo 1: Mutluluk Göstergeleri Kişi Başına Düşen GSYH
Sosyal Destek
Doğumda Sağlıklı Yaşam Beklentisi Yaşam Seçimleri Yapma Özgürlüğü
Cömertlik Yolsuzluk Algısı
4. Metodoloji
4.1. Kümeleme Analizi
Kümeleme analizi büyük veri setlerinden anlamlı bilgilerin elde edilmesinde kullanılan önemli bir tekniktir. Kümeleme analizi nesneleri yakınlık kriterine göre sınıflandıran çok değişkenli istatistiksel bir tekniktir. Kümeleme analizinde amaç; kümeler arasındaki uzaklığın büyük, küme içi uzaklığın ise küçük olmasıdır. Başka bir ifadeyle, kümeler arası varyansın büyük, küme içi varyansın küçük olması amaçlanmaktadır. Şekil 1’de görüldüğü üzere, çeşitli veriler, her biri en benzer verileri içeren dört kümeye bölünmüştür.
Şekil 1: Kümeleme Örneği
Kümeleme analizi veri madenciliği ve makine öğreniminin (Zhou ve Yang, 2020) önemli bir bileşeni olup denetimsiz bir öğrenme sürecidir (Bianchi vd., 2016). Kümeleme analizi, görüntü işleme, örüntü tanıma, pazar araştırması ve veri analizi (Sharma, 2020) gibi birçok alanda kullanılmaktadır. Pazarlamacılar kümeleme
analizi sayesinde müşterilerini satın aldıkları ürünlere göre
sınıflandırabilmektedir. Kümeleme sayesinde biyoloji alanındaki bitki ve hayvan taksonomilerini türetmek, benzer fonksiyonlara sahip genleri kategorize etmek ve popülasyonların doğasında bulunan yapılara ilişkin içgörü elde etmek mümkündür. Ayrıca kümeleme sayesinde internet’teki belgeler sınıflandırılabilir ve kredi kartı sahtekârlıklarını da tespit etmek mümkündür (Tutorialpoint, 2020). Küme analizi, nihai sonucu bulmak için birçok farklı kümeleme algoritması kullanır. Kümeleme analizi veri işlemeden farklıdır, ancak kullanımına bağlı olarak bir adım olarak düşünülebilir (Planingtank, 2018). Bugün için farklı kategorilere ayrılabilen birçok farklı kümeleme algoritmaları mevcuttur (Xu ve Wunsch, 2005).
Journal of Current Researches on Business and Economics, 2021, 11 (1), 15-38. 21
Genel olarak kümeleme algoritmaları bölümleme tabanlı (Gerlhof vd., 1993), hiyerarşik tabanlı (Karypis vd., 1999), yoğunluk tabanlı (Hinneburg ve Keim, 1998), grid tabanlı (Liao vd., 2004), model tabanlı (Chen vd., 2014) ve kısıtlama tabanlı (Panadopoulos ve Agarwala, 2007) yöntemlerdir.
4.1.1. K-Means Kümeleme (K-Means Clustering)
K-Means bölümleme tabanlı bir kümeleme tekniği olup bölümleme belirli bir kriteri optimize edecek şekilde tane kümeye bir veri kümesi yerleştirmeye çalışır. Bu algoritmalar, kümelerin hiper-elipsoidal ve benzer boyutlarda olduğunu varsayar (Krypis vd., 1999). K-Means yönteminde amaç; tane elemanı tane kümeye kesişmeyecek şekilde bölümlemektir (Gürsakal, 2018: 254). K-Means kümeleme, en basit ve popüler denetimsiz makine öğrenme algoritmalarından biridir (Garbade, 2018).
K-Means algoritması aşağıdaki gibi çalışır (Nallathambi 2018; Gürsakal, 2018: 254):
tane kümenin merkezi (centroid) rassal olarak belirlenir.
Merkezler ve gözlemler arasındaki En Küçük Kare Öklid mesafesini hesaplayarak her bir gözlem en yakın ağırlık merkezine (merkez nokta) atanır. Yani, atanan merkez ile gözlem arasındaki En Küçük Kare Öklid mesafesi diğer merkezlere göre minimum olmalıdır.
Oluşan kümelerin merkezleri saptanır.
Her bir veri noktası için uzaklıklar yeniden belirlenerek veriler yeniden en yakın kümeye atanır.
Küme merkezleri kararlı bir dengeye yaklaşıncaya kadar bu iş tekrarlanarak uygulanır.
K-Means genellikle Öklid uzaklığını temel alarak kümeleme yapmaktadır. Denklem (1) de Öklid uzaklığının hesaplanması verilmiştir.
Bununla birlikte Manhattan veya Minkowskiuzaklığı gibi farklı hesaplamalar da kullanılmaktadır. K-Means algoritması her çalıştığında farklı gruplar döndürülmektedir. İlk başlangıç tahminleri rassal olup algoritma gruplar içerisinde homojenliğe ulaşıncaya kadar mesafeleri hesaplar. Yani, K-Means ilk tercihe çok duyarlıdır ve gözlem ve grup sayısı az olmadığı sürece, aynı kümelenmeyi elde etmek neredeyse imkânsızdır (Rungta, 2020).
K-Means kümelemedeki her yineleme için en yüksek değeri bulmanıza yardımcı olan yinelemeli bir kümeleme algoritmasıdır. Başlangıçta istenen sayıda küme seçilir. Bu kümeleme yönteminde, veri noktalarının grupta kümelenmesi gerekir. Daha büyük , aynı şekilde daha fazla ayrıntıya sahip daha küçük gruplar anlamına gelmektedir. Daha küçük bir , daha az ayrıntıya sahip daha büyük gruplar anlamına gelir. Algoritmanın çıktısı bir "etiketler" grubudur. Algoritma gruplarından birine veri noktası atar. K-Means kümelemede, her grup, her grup
22 Çelik, S. & Cömertler, N. (2021). Investigation of Happiness of Countries with K-Means Clustering and Discriminant Analysis
için bir ağırlık merkezi oluşturarak tanımlanır. Merkezler, kendilerine en yakın noktaları yakalayan ve onları kümeye ekleyen kümenin odağı gibidir (Guru99, 2020).
Şekil 2. K-Means Algoritması. Eğitim Örnekleri Noktalar Olarak Küme Ağırlıkları ise Çarpı Olarak Gösterilmiştir. (a) Orijinal Veri Kümesi. (b) Rassal İlk Küme Merkezleri. (c-f)
K-Means’ın İki Yinelemesini Çalıştırmanın Gösterimidir. Her Yinelemede, Her Eğitim Örneğini En Yakın Küme Ağırlık Merkezine Atanır (Eğitim Örneklerini, Atanan Küme Merkeziyle Aynı Renge "Boyayarak" Gösterilir); Daha Sonra Her Küme Merkezi Kendisine
Atanan Noktaların Ortalamasına Taşınır. Şekiller Michael Jordan'ın İzniyle Kullanılmıştır (Ng, 2000).
K-Means, belge sınıflama, suç yeri tespiti, müşteri segmentasyonu, oyuncu analizi, dolandırıcılık tespiti, çağrı kaydı detay analizi ve bilişim teknolojisi uyarılarının otomatik kümelenmesi gibi birçok alanda kullanılmaktadır.
Uygun Küme Sayısının Seçilmesi: K-Means ile bulunan bir diğer zorluk da küme
sayısının seçimidir. Kararlılığı artırmak için yüksek bir değer, yani çok sayıda grup ayarlanabilir, ancak bu aşırı veri sığdırma ile sonuçlanabilir. Aşırı veri sığdırma, yeni gelen veriler için modelin performansının önemli ölçüde azaldığı anlamına gelir. Algoritma, veri setinin küçük ayrıntılarını öğrenmekte ve genel modeli genelleştirmeye çalışmaktadır (Rungta, 2020).
Kümelerin sayısı veri kümesinin niteliğine, endüstriye, işletmeye bağlıdır. Ancak, uygun sayıda kümeyi seçmek için en pratik yöntem (2) denklemiyle yapılan hesaplamadır (Rungta, 2020).
K-Means kümeleme yönteminde elde edilen sonuçları değerlendirmek için toplam karesel hata kriteri (Summed Squared Error-SSE) dikkate alınmaktadır. Analizler sonucunda en düşük SSE değerine sahip kümeleme sonucu, en iyi sonucu vermektedir. Elemanların bulundukları kümenin merkez noktalarına olan
Journal of Current Researches on Business and Economics, 2021, 11 (1), 15-38. 23
uzaklıklarının karelerinin toplamı (3) denklemi kullanılarak hesaplanır (Tan vd., 2006).
Denklem (3)’teki iki eleman arasındaki standart Öklid Uzaklığı’nı, değeri kümesindeki bir elemanı ve ise kümesinin merkez noktasını belirtmektedir. Denklem (3)’te bulunan K-Means algoritması, iki boyutlu uzayda Öklid uzaklığına göre çalışmakta ve algoritma hiçbir eleman kümesini terk değiştirmeyinceye kadar çalışmaktadır.
Bu varsayımlar göz önüne alındığında, kümenin SSE’sini en aza indiren ağırlık merkezinin ortalama olduğu söylenebilir. Buna göre kümenin ağırlık merkezi (4) denklemindeki gibi hesaplanır (Tan vd., 2006).
Örneğin, iki boyutlu (2,1), (3,4) ve (4,7) noktaları içeren bir kümenin ağırlık
merkezi: olarak hesaplanır.
4.2. Diskriminant Analizi
Diskriminant analizi, bir dizi gözlemi önceden tanımlanmış gruplar halinde sınıflandırmak için kullanılan çok değişkenli bir istatistiksel tekniktir. Amaç, hangi grupların belirlenebileceğine bağlı olarak yordayıcı (tahminci) değişkenleri belirlemektir. Diskriminant modeli, grupların bilindiği bir dizi gözlem temelinde oluşturulmuştur. Bu gözlem kümesi, diskriminant analiz tekniğinin, diskriminant fonksiyonu olarak bilinen tahmincilerin bir dizi doğrusal fonksiyonunu oluşturduğu temeldeki geçmiş verilerdir. Bu Diskriminant fonksiyonu aşağıdaki gibidir (Verma, 2013).
Denklem (5)’teki bir sabit, diskriminant katsayıları ve bağımsız (öngörücü) değişkenleri belirtmektedir. Denklem (5)’teki gibi geliştirilen Diskriminant fonksiyonu, yeni bir gözlem kümesinin grubunu tahmin etmek için kullanılır. Bu diskriminant fonksiyonu bağımsız değişkenler üzerinde gözlemlenen değerlere göre özneyi iki gruptan birine sınıflandırmak için kullanılır.
Diskriminant analizi aslında diskriminant fonksiyon analizi olarak da bilinir, ancak kısaca diskriminant analizi terimi kullanılabilir. Bir veri setine diskriminant analizini uygulamak için grupların üyeliklerini gösteren bağımlı değişken ve gruplardaki elemanlara ait özelliklerin bulunduğu bağımsız değişkenlerin olması gerekmektedir. Diskriminant analizinde, bağımlı değişken kategorik, bağımsız değişkenler ise nicel değerler olmalıdır. Bağımlı değişken ikiden fazla sınıflandırmaya sahip olabilmektedir. Ancak iki sınıflandırma söz konusu olduğunda diskriminant analizi daha güçlüdür.
24 Çelik, S. & Cömertler, N. (2021). Investigation of Happiness of Countries with K-Means Clustering and Discriminant Analysis
Normal dağılım: Bağımsız değişkenler normal dağılıma uygun olmalıdır. Bunu doğrulamak için normallik testi kullanılabilir.
Varyans-kovaryans matrislerinin homojenliği: Her gruptaki kovaryans matrisi türdeş (homojen) olmalıdır. Bunu doğrulamak için Kovaryans Matrislerinin Eşitlik Testi kullanılabilir (Originlab, 2020). Eğer veriler normal dağılır, anacak varyans-kovaryans matrisi homojen değilse, bu takdirde “Karesel Diskriminant Analizi” yöntemi kullanılır (Gürsakal, 2019).
Aykırı değerler: Diskriminant analizi, aykırı değerlere duyarlıdır. Çalışmadaki bir grup ortalamayı etkileyen aykırı değerler içeriyorsa, bunlar değişkenliği de artıracaktır (Jain ve Kuriakose, 2019). Bu nedenle veri setinde aykırı değerler olmamalıdır.
Çoklu doğrusal bağlantı: Değişkenler arasında çoklu doğrusal bağlantı sorunu olmamalıdır. Bağımsız değişkenler birbiriyle ilişkilendirilirse, diskriminant fonksiyon katsayıları grup üyeliğini güvenilir bir şekilde tahmin edemez (Jain ve Kuriakose, 2019).
Değişkenler arasında çok yüksek korelasyon bulunmamalıdır
(Özdamar, 2013:323).
Diskriminant analizi, araştırmanın amacına bağlı olarak, tanısal veya tahmine dayalı analizler gerçekleştirilmesini sağlar (Tillmanns ve Krafft, 2017). Diskriminant analizinin temel amacı, bağımsız değişkenlerin doğrusal bir kombinasyonuna dayalı olarak grup üyeliğini tahmin etmektir. Bu tekniği kullanırken işlem, hem grup üyeliğinin hem de değişkenlerinin değerlerinin bilindiği bir dizi gözlemle başlar. İşlemin nihai sonucu, sadece aralık değişkenleri bilindiğinde grup üyeliğinin tahminine izin veren bir modeldir. Diskriminant analizinin ikinci bir amacı, grup üyeliği ile grup üyeliğini tahmin etmek için kullanılan değişkenler arasındaki ilişkiyi incelemektir. Bu, bağımsız değişkenlerin grup üyeliğini tahmin etmedeki göreceli önemi hakkında bilgi sağlar (Verma, 2013).
Diskriminant analizinde, bağımlı değişken doğası gereği kategoriktir. İki veya daha fazla kategoriye sahip olabilir. Bağımlı değişkenin ikiden fazla kategorisi varsa diskriminant analizinde kullanılan işlem çok karmaşık hale gelir. Ayrıca modelin verimliliği de bu durumda azalır. Bağımlı değişkenin yalnızca iki kategorisi varsa model çok güçlü hale gelir. Bağımlı değişken, kriter değişkeni olarak da bilinir. SPSS'te bağımlı değişken, gruplama değişkeni olarak bilinir (Verma, 2013). Amaç bağımsız değişkenler temelinde sınıflandırmaktır. Diskriminant analizindeki bağımsız değişkenler her zaman metriktir. Diğer bir deyişle, bağımsız değişkenler üzerinden elde edilen veriler ya aralık ya da oran ölçeğinde olmalıdır. Diskriminant analizinde, sınıflandırma matrisi, bir birey veya olayı iki gruptan birine sınıflandırırken bir modelin doğruluğunu ölçmede bir kıstas görevi görür. Sınıflandırma matrisi aynı zamanda karışıklık matrisi, atama matrisi veya tahmin matrisi olarak da bilinir. Sınıflandırma matrisi, diskriminant analizinde geliştirilen model tarafından mevcut veri noktalarının yüzde kaçının doğru bir şekilde sınıflandırıldığını söyler. Bu yüzde değer ’ye benzerdir (model tarafından açıklanan bağımlı değişkendeki varyasyon yüzdesi) (Verma, 2013).
Journal of Current Researches on Business and Economics, 2021, 11 (1), 15-38. 25
5. Bulgular
Çalışmada K-Means kümeleme yöntemi kullanılarak 156 ülke altı adet mutluluk göstergesine göre kümelere ayrılmıştır. Daha sonra diskriminant analizi ile ülkelerin iki boyutlu uzaydaki konumları belirlenmiş ve görsel olarak sunulmuştur. Son olarak K-Means kümeleme analizi sonucunda elde edilen kümeler, diskriminant analizi sonuçları ile birlikte değerlendirilmiştir.
5.1. Kümeleme Analizi Bulguları
Çalışmada kullanılan altı adet mutluluk göstergesi bakımından benzer olan ülkeleri saptamak için K-Means kümeleme analizi yapılmıştır. Ayrıca uygun küme sayısını belirlemek için (2) denkleminden yararlanılmıştır. Burada örneklem hacmini, ise küme sayısını belirtmekte ve aşağıdaki gibi hesaplanır:
Bu yönteme göre hesaplama sonucunda 9 kümenin oluşması beklenmektedir. K-Means kümeleme analizi sonucunda elde edilen 9 küme Tablo 2’de verilmiştir.
Tablo 2: K-Means Kümeleme Analizi Sonucunda Elde Edilen Kümeler
Kümeler Ülkeler Kümedeki
Ülke Sayısı
Küme 1 Ekvador, Peru, Libya, Bosna Hersek, Yunanistan, Kuzey Makedonya, Cezayir, Azerbeycan, Lübnan, Çin, Ürdün, Gabon, Güney Afrika, Arnavutluk, Venezuela, Nambiya, Ermenistan, İran, Tunus, Irak, Sri Lanka, Ukrayna, Mısır, Botsvana
24 Küme 2 Guatemala, El Salvador, Özbekistan, Nikaragua, Kosova, Jamaika,
Honduras, Bolivya, Paraguay, Filipinler, Moldova, Tacikistan, Kırgızistan, Endonezya, Vietnam, Butan, Nepal, Kamboçya, Filistin, Myanmar
20 Küme 3 Finlandiya, Danimarka, Norveç, İzlanda, Hollanda, İsviçre, İsveç,
Yeni Zelanda, Kanada, Avusturya, Avustralya, Lüksemburg, Birleşik Krallık, İrlanda, Almanya, Belçika, ABD, Birleşik Arap Emirlikleri, Malta, Fransa, Katar, Singapur, Bahreyn, Kuveyt, Japonya, Hong Kong
26
Küme 4 Burundi, Orta Afrika Cumhuriyeti 2
Küme 5 Nijerya, Kamerun, Fildişi Sahili, Moritanya, Svaziland, Zambiya,
Lesotho 7
Küme 6 Senegal, Somali, Nijer, Burkina Faso, Gine, Gambiya, Mozambik, Kongo (Kinşasa), Mali, Sierra Leone, Etiyopya, Uganda, Liberya, Madagaskar, Zimbabve, Yemen
16
Küme 7
Kosta Rika, İsrail, Çek Cumhuriyeti, Meksika, Tayvan, Şili, Sudi Arabistan, İspanya, Panama, Brezilya, Uruguay, İtalya, Slovakya, Trinidad & Tobago, Polonya, Litvanya, Kolombiya, Slovenya, Arjantin, Romanya, Kıbrıs, Tayland, Letonya, Güney Kore, Estonya, Mauritius, Kazakistan, Macaristan, Kuzey Kıbrıs, Portekiz, Rusya, Sırbistan, Karadağ, Hırvatistan, Dominik Cumhuriyeti, Türkiye, Malezya, Belarus, Moğolistan, Türkmenistan, Bulgaristan
41
Küme 8 Benin, Çad, Togo, Komorlar, Haiti, Suriye, Malawi, Afganistan, Güney
Sudan 9
Küme 9 Pakistan, Fas, Gana, Kongo (Brazzaville), Laos, Gürcistan, Kenya,
26 Çelik, S. & Cömertler, N. (2021). Investigation of Happiness of Countries with K-Means Clustering and Discriminant Analysis
Analiz sonucunda Tablo 2’de elde edilen 9 kümenin merkezleri arasındaki uzaklıklar Tablo 3’te verilmiştir.
Tablo 3: Küme Merkezleri Arasındaki Uzaklık
Küme 1 2 3 4 5 6 7 8 9 1 343,93 669,25 1438,21 619,98 817,00 336,36 958,95 517,57 2 343,93 791,05 1380,83 551,31 653,99 501,80 923,43 473,90 3 669,25 791,05 2041,92 1199,95 1410,97 393,55 1576,64 1087,04 4 1438,21 1380,83 2041,92 1016,12 816,12 1767,46 501,54 965,26 5 619,98 551,31 1199,95 1016,12 381,31 896,54 586,03 411,48 6 817,00 653,99 1410,97 816,12 381,31 1105,06 441,25 460,89 7 336,36 501,80 393,55 1767,46 896,54 1105,06 1288,17 824,08 8 958,95 923,43 1576,64 501,54 586,03 441,25 1288,17 531,85 9 517,57 473,90 1087,04 965,26 411,48 460,89 824,08 531,85
Tablo 3’teki sonuçlar dikkate alındığında; 1. ve 7. kümenin birbirine en yakın olduğu, 3. ve 4. kümenin ise en uzak olduğu söylenebilir. Buradan mutluluk düzeyleri açısından; 1. ve 7. kümede bulunan ülkelerin birbirine en yakın, 3. ve 4. kümelerde bulanan ülkelerin en uzak olduğu söylenebilir.
K-Means kümeleme analizi sonucunda hangi göstergelerin kümelerde daha etkili olduğunu saptamak için ANOVA testi sonuçlarına bakılır. K-Means kümeleme analizi sonucunda elde edilen ANOVA sonuçları Tablo 4’te verilmiştir.
Tablo 4: ANOVA Test Sonuçları
F p-değeri
Kişi Basına Düşen GSYH 222,746 0,000
Sosyal Destek 98,112 0,000
Doğumda Sağlıklı Yaşam Beklentisi 80,532 0,000 Yaşam Seçimleri Yapma Özgürlüğü 15,656 0,000
Cömertlik 7,508 0,000
Yolsuzluk Algısı 21,533 0,000
ANOVA sonuçları dikkate alındığında tüm göstergeler için p=0,000 bulunmuştur. Bu nedenle tüm göstergeler kümeleme analizinde anlamlı bir etkiye sahiptir (p<0,05 olduğu için). Dolayısıyla, göstergelerin 9 farklı küme için hesaplanan ortalamaları arasında (%5 anlamlılık düzeyi dikkate alınmıştır.) istatistiksel olarak anlamlı bir fark vardır. Başka bir ifadeyle göstergeler kümelere göre farklılık göstermektedir.
Diğer taraftan “Kişi Başına Düşen GSYH” göstergesi için F=222,746 çıkmıştır. Dolayısıyla 9 kümeli bir yapıda“Kişi Basına Düşen GSYH” en etkili göstergedir. Onu sırasıyla; “Sosyal Destek” (98,112), “Doğumda Sağlıklı Yaşam Beklentisi” (80,532), “Yolsuzluk Algısı” (21,533), “Yaşam Seçimleri Yapma Özgürlüğü” (15,656) ve “Cömertlik” (7,508) takip etmektedir. Dolayısıyla her bir ülkenin mutluluk düzeyi bakımından daha yüksek bir kümeye geçmesi için öncelikle “Kişi Başına Düşen GSYH”yı arttırması gerekmektedir. Çünkü ülkeler arasında, istatistiksel olarak en anlamlı farklılık “Kişi Başına Düşen GSYH” göstergesinde bulunmuştur. Bu göstergenin ardından sırasıyla; “Sosyal Destek”, “Doğumda Sağlıklı Yaşam
Journal of Current Researches on Business and Economics, 2021, 11 (1), 15-38. 27
Beklentisi”, “Yolsuzluk Algısı”, “Yaşam Seçimleri Yapma Özgürlüğü” ve “Cömertlik” gelmektedir.
EK 1’de görüldüğü üzere, “Kişi Başına Düşen GSYH” göstergesi en düşük olan; Burundi ve Orta Afrika Cumhuriyeti gibi ülkeler aynı kümde toplanmıştır. Bu durum ülkelerin mutluluk düzeyini belirlemede en etkili göstergenin “Kişi Başına Düşen GSYH” olduğunu göstermektedir. Bu nedenle ülkeler “Kişi Başına Düşen GSYH”ı yükseltmedikçe mutluluklarında kayda değer bir iyileşmeler beklemek yanlış olur. Bununla birlikte “Sosyal Destek” ve “Doğumda Sağlıklı Yaşam Beklentisi” göstergeleri de ülkelerin mutluluğunda önemli bir etkiye sahiptirler. Diğer taraftan “Yaşam Seçimleri Yapma Özgürlüğü”, “Yolsuzluk Algısı” ve “Cömertlik” göstergesi ülkelerin daha mutlu bir üst kümeye geçmesinde oldukça düşük bir etkiye sahiptirler.
5.2. Diskriminant Analizi Bulguları
Çalışmada K-Means kümeleme analizi sonucunda elde edilen 9 grubu birbirinden ayırmayı sağlayan fonksiyonları bulmak ve bu fonksiyonları oluştururken grupları en iyi şekilde ayırt eden bağımsız değişkenleri belirlemek için diskriminant analizi yapılmıştır. Elde edilen diskriminant fonksiyonları sayesinde grubu belli olmayan ülkeler ilgili gruba atanmıştır.
Analiz sonucunda değişkenler arasında düşük korelasyonların (r<0.80) olduğu bulunmuştur. Dolayısıyla değişkenler arasında çoklu doğrusal bağlantı sorunu yoktur. Diğer taraftan kovaryans matrisinin homojenliğini test etmek için Box’s M testi kullanılmıştır. Box-M istatistiği 338,824 ve marjinal anlamlılık düzeyi p=0,000 olduğundan kovaryanslar homojen değildir. Bu nedenle çalışmada “Karesel Diskriminat Analizi” kullanılmıştır. Karesel Diskriminat Analizi sonucunda elde edilen altı fonksiyonda anlamlı bulunmuştur. Grup ortalamalarına ilişkin analiz sonuçları Tablo 5’da verilmiştir.
Tablo 5: Grup Ortalamalarının Eşitliği Testleri
Wilks' Lambda F p-değeri
Kişi Başına Düşen GSYH ,076 222,746 ,000
Sosyal Destek ,158 98,112 ,000
Doğumda Sağlıklı Yaşam Beklentisi ,186 80,532 ,000
Yaşam Seçimi Yapma Özgürlüğü ,540 15,656 ,000
Cömertlik ,710 7,508 ,000
Yolsuzluk Algısı ,460 21,533 ,000
Tablo 5 dikkate alındığında, tüm bağımsız değişkenlerin ortalamaları bağımlı değişkenin gruplarına göre istatistiksel olarak (%5 anlamlılık düzeyine göre p=0,000<0.05) anlamalı olduğu görülmektedir. Bu nedenle diskriminant analizine dahil edilmek istenilen değişkenler seçilirken varyans analizinden faydalanmak yararlı olacaktır.
Diğer taraftan Tablo 5’ten elde edilen sonuçlar, K-Means kümeleme analizi sonucunda elde edilen ANOVA testi sonuçları ile uyumlu çıkmıştır. Dolayısıyla diskriminant analizi sonuçları, K-Means kümelemede ANOVA testi sonuçlarını destekler niteliktedir. Yine, “Kişi Başına Düşen GSYH” göstergesi için F=222,746 çıkmıştır. Bu nedenle 9 kümeli bir yapıda “Kişi Basına Düşen GSYH” en etkili
28 Çelik, S. & Cömertler, N. (2021). Investigation of Happiness of Countries with K-Means Clustering and Discriminant Analysis
göstergedir. Tablo 6’da her bir bağımsız değişkene ilişkin kanonik diskriminant fonksiyonu katsayıları verilmiştir.
Tablo 6: Standardize Edilmiş Kanonik Diskriminant Fonksiyonu Katsayıları Fonksiyon
1 2 3 4 5 6
Kişi Başına Düşen GSYH ,763 ,294 -,442 -,299 -,151 ,269
Sosyal Destek ,494 -,565 ,450 -,367 ,301 -,112
Doğumda Sağlıklı Yaşam
Beklentisi ,333 -,045 ,076 ,917 ,180 -,235
Yaşam Seçimi Yapma
Özgürlüğü ,218 -,062 ,418 ,181 -,910 ,100
Cömertlik ,083 ,280 ,349 ,134 ,434 ,796
Yolsuzluk Algısı ,038 ,735 ,287 -,324 ,238 -,539
Tablo 6 dikkate alındığında; 1. fonksiyonda “Kişi Başına Düşen GSYH” değişkeninin katsayısının diğer değişkenlerden daha büyük olduğu görülmektedir. Bu nedenle bu değişken 1. diskriminant fonksiyonunda diğer değişkenlere göre daha büyük etkiye sahip olup ülkelerin mutluluğunun aratmasında en büyük etkiye sahiptir. Benzer şekilde; 2. fonksiyonda “ Yolsuzluk Algısı”, 3. fonksiyonda “Sosyal Destek”, 4. fonksiyonda “Doğumda Sağlıklı Yaşam Beklentisi”, 5. fonksiyonda “Yaşam Seçimi Yapma Özgürlüğü”, 6. fonksiyonda ise “Cömertlik” değişkeni ülkelerin mutluluk düzeylerinin artmasında en büyük etkiye sahiptir.
K-Means kümeleme sonucunda elde edilen 9 kümenin iki boyutlu uzaydaki konumları aşağıdaki gibi görselleştirilmiştir.
Şekil 3: Küme Merkezlerinin Görsel Dağılımı
Şekil 3, 1. fonksiyona göre incelendiğinde 3. küme ile 4. kümenin birbirine en uzak olduğu, yani anlamlı bir şekilde ayrıldıkları söylenebilir. 2. fonksiyon dikkate alındığında ise 4. kümenin 7. kümeden anlamlı bir şekilde ayrıştığı söylenebilir.
Journal of Current Researches on Business and Economics, 2021, 11 (1), 15-38. 29
Ancak diğer kümelerin anlamlı bir şekilde ayrışıp ayrışmadığı konusunda kesin bir şey söylemek zordur.
Ek 1’deki değerler dikkate alındığında 3. küme; Finlandiya, Danimarka, Norveç, İzlanda, Hollanda, İsviçre, İsveç, Yeni Zelanda, Kanada, Avusturya, Avustralya, Lüksemburg, Birleşik Krallık, İrlanda, Almanya, Belçika, ABD, Birleşik Arap Emirlikleri, Malta, Fransa, Katar, Singapur, Bahreyn, Kuveyt, Japonya ve Hong Kong gibi “Kişi Başına Düşen GSYH”sı en yüksek olan ülkelerden oluşmaktadır. Diğer taraftan 4. küme ise Burundi ve Orta Afrika Cumhuriyeti gibi “Kişi Başına Düşen GSYH”sı en düşük olan ülkelerden oluşmaktadır. Dolayısıyla Şekil 3’te elde edilen görselin kümeleri anlamlı bir şekilde ayrışmakta ve Ek 1’i destekler niteliktedir. Benzer şekilde Ek 1’de görüldüğü üzere 4. ve 7. kümelerdeki ülkeler de “Kişi Başına Düşen GSYH” oranında büyük fark vardır.
Son olarak kümelerin ayrımının yapıldığı sınıflandırma tablosu dikkate alındığında doğru sınıflandırma yüzdesi oldukça yüksek bulunmuştur. Bu sonuç, diskriminant analizinde kullanılan değişkenlerin doğru seçilmiş olduğunu göstermektedir.
Tablo 7: Sınıflandırma Tablosu
1 2 3 4 5 6 7 8 9 Toplam Sayı 1 24 0 0 0 0 0 0 0 0 24 2 0 20 0 0 0 0 0 0 0 20 3 0 0 25 0 0 0 1 0 0 26 4 0 0 0 2 0 0 0 0 0 2 5 0 0 0 0 7 0 0 0 0 7 6 0 0 0 0 0 16 0 0 0 16 7 0 0 0 0 0 0 41 0 0 41 8 0 0 0 0 0 0 0 9 0 9 9 0 0 0 0 0 0 0 0 11 11 Yüzde (%) 1 100,0 ,0 ,0 ,0 ,0 ,0 ,0 ,0 ,0 100,0 2 ,0 100,0 ,0 ,0 ,0 ,0 ,0 ,0 ,0 100,0 3 ,0 ,0 96,2 ,0 ,0 ,0 3,8 ,0 ,0 100,0 4 ,0 ,0 ,0 100,0 ,0 ,0 ,0 ,0 ,0 100,0 5 ,0 ,0 ,0 ,0 100,0 ,0 ,0 ,0 ,0 100,0 6 ,0 ,0 ,0 ,0 ,0 100,0 ,0 ,0 ,0 100,0 7 ,0 ,0 ,0 ,0 ,0 ,0 100,0 ,0 ,0 100,0 8 ,0 ,0 ,0 ,0 ,0 ,0 ,0 100,0 ,0 100,0 9 ,0 ,0 ,0 ,0 ,0 ,0 ,0 ,0 100,0 100,0
Doğru Sınıflama Yüzdesi %99,4
Sınıflandırma tablosu dikkate alındığında kümelerin %99,4’ü doğru sınıflandırılmıştır. Bu sonuç ülkeler bazında yapılan sınıflandırmanın oldukça iyi olduğunu göstermektedir.
6. Sonuç
Bu çalışmada, 156 ülke, 6 adet mutluluk göstergesi kullanılarak kümelenmiştir. Ayrıca ülkeler ilgili göstergeler bağlamında aralarında oluşan ilişkiler ile kümelenme yapıları 2 boyutlu uzayda görselleştirilmiştir. Mutluluk göstergeleri olarak 2019 yılında yayınlanan Dünya Mutluluk Raporu’ndaki “Kişi Basına Düşen GSYH”, “Sosyal Destek”, “Doğumda Sağlıklı Yaşam Beklentisi”, “Yaşam Seçimleri Yapma Özgürlüğü”, “Cömertlik” ve “Yolsuzluk Algısı” kullanılmıştır. Bu görseller
30 Çelik, S. & Cömertler, N. (2021). Investigation of Happiness of Countries with K-Means Clustering and Discriminant Analysis
bağlamında ülkeleri kümelemek amacıyla K-Means kümeleme analizi kullanılmıştır. Ayrıca, söz konusu göstergeler bağlamında ülkelerin arasındaki ilişkileri görselleştirmek için diskriminant analizi kullanılmıştır. Bununla birlikte, küme yapılarını e kümeler arasındaki ilişki yapılarını daha iyi anlamak için K-Means kümele analizi ve diskriminant analizi sonuçları birlikte değerlendirilmiştir. K-Means kümeleme analizi sonuçlarına göre 9 kümeli bir yapının en uygun olduğuna kara verilmiş ve analiz sonucunda elde edilen kümeler Tablo 2’de verilmiştir. Tablo 2’deki 4. kümede Burundi ve Orta Afrika Cumhuriyeti ülkeleri toplanmış ve en dikkat çekici kümedir. Kümeler arasındaki uzaklıklar Tablo 3’te verilmiştir. Tablo 3 dikkate alındığında 3. ve 4. kümenin en uzak, 1. ve 7. kümenin en yakın olduğu görülmektedir. Bu sonuçlar Tablo 2’deki bulguları destekleyerek 4. kümedeki ülkelerin en düşük mutluluğa sahip olduğunu ve 4. kümedeki ülkelerin (Burundi, Orta Afrika Cumhuriyeti) istatistiksel olarak diğer ülkelerden anlamlı bir şekilde farklılaştığını göstermektedir. Burada hemen akla şu soru geliyor, acaba bu farklılığın temel sebebi nedir? Bu sorunun yanıtını bulmak için Tablo 4’teki ANOVA sonuçlarına gitmemiz gerekir. Tablo 4’teki ANOVA sonuçlarına göre “Kişi Basına Düşen GSYH” göstergesinin ülkelerin kümelenmesinde en büyük etkiye sahip olduğu görülmektedir. Nitekim Ek 1 dikkate alındığında Burundi ve Orta Afrika Cumhuriyeti’nin “Kişi Basına Düşen GSYH” da en son sıralarda oldukları görülmektedir. Dolayısıyla tüm bu bulgular K-Means kümeleme analizinin etkin bir şekilde çalıştığını desteklemektedir. Bununla birlikte Tablo 4’teki sonuçlardan ülkelerin mutluluk düzeylerinin yükselmesinde etkili olan göstergeler en çoktan en aza doğru sırasıyla; “Kişi Başına Düşen GSYH” (222,746), “Sosyal Destek” (98,112), “Doğumda Sağlıklı Yaşam Beklentisi” (80,532), “Yolsuzluk Algısı” (21,533), “Yaşam Seçimleri Yapma Özgürlüğü” (15,656) ve “Cömertlik” (7,508)’dir. Bu sonuçlardan ülkelerin mutluluk düzeyi açısından daha yüksek bir üst kümeye geçebilmesi öncelikli olarak “Kişi Başına Düşen GSYH”sını arttırması gerektiği söylenebilir.
K-Means kümeleme analizi sonucunda 9 kümeyi birbirinden ayırmayı sağlayan fonksiyonları bulmak için çok değişkenli istatistiksel tekniklerden diskriminant analizi yapılmıştır. Bu sayede grubu belli olmayan ülkeler ilgili gruba atanmıştır. Bağımlı değişkenlerin varyansları homojen çıkmadığından çalışmada “Karesel Diskriminant Analizi” kullanılmış ve analiz sonucunda Tablo 5’teki değerler bulunmuştur. Tablo 6’dan tüm bağımsız değişkenlerin ortalamalarının bağımlı değişkenin gruplarına göre istatistiksel olarak (%5 anlamlılık düzeyine göre p=0,000<0.05) anlamalı çıkmıştır. Bu nedenle diskriminant analizine dahil edilecek değişkenler seçilirken varyans analizinden yararlanılmıştır. Nitekim Tablo 6’da elde edilen sonuçlar da Tablo 4’teki ANOVA sonuçlarını desteklemektedir. Tablo 6’da kanonik diskriminant fonksiyonu katsayıları verilmiştir. Elde edilen 6 fonksiyon dikkate alındığında; 1. fonksiyonda “Kişi Başına Düşen GSYH” değişkeninin katsayısının diğer değişkenlerden daha büyük olduğu görülmektedir. Bu nedenle bu değişken 1. fonksiyonda diğer değişkenlere göre daha büyük etkiye sahip olup ülkelerin mutluluğunun aratmasında en büyük etkiye sahiptir. Benzer şekilde; 2. fonksiyonda “ Yolsuzluk Algısı”, 3. fonksiyonda “Sosyal Destek”, 4. fonksiyonda “Doğumda Sağlıklı Yaşam Beklentisi”, 5. fonksiyonda “Yaşam Seçimi Yapma Özgürlüğü”, 6. fonksiyonda ise “Cömertlik” değişkeni ülkelerin mutluluk
Journal of Current Researches on Business and Economics, 2021, 11 (1), 15-38. 31
düzeylerinde en büyük etkiye sahiptir. Son olarak Şekil 3 1. fonksiyonu dikkate alındığında 3. küme ile 4. kümenin birbirine en uzak olduğu, yani anlamlı bir şekilde ayrıştıkları görülmektedir. 2. fonksiyona göre alındığında ise 4. ve 7. kümenin birbirinden anlamlı bir şekilde ayrıldığı söylenebilir. Ancak diğer kümelerin anlamlı bir şekilde ayrılıp ayrılmadığı konusunda kesin bir şey söylemek zordur.
Çalışmada diskriminant analizi sonuçlarının K-Means kümeleme analizi sonuçları ile uyumlu çıkmış olması, K-Means analiz sonuçlarının doğruluğunun test edilmesini sağlamıştır. Bu sayede, K-Means kümeleme analizi sonuçlarını değerlendirebilecek diskriminant analizi tabanlı bir görsel yöntem önerilebilir. Ayrıca diskriminant analizi sonucunda Tablo 5’te elde edilen sonuçlar, K-Means kümeleme analizi sonucunda Tablo 4’teki ANOVA test sonuçları ile örtüşmektedir. Her iki yöntemde de ülkelerin mutluluk hallerini “Kişi Başına Düşen GSYH” göstergesinin en çok etkilediği bulunmuştur. Bu bulgu literatürde daha önce yapılan çalışmalarla uyumludur (Güzel, 2017; Aksoy ve Taşyaka, 2020; Öztürk ve Suluk, 2020 ). Elde edilen tüm bu sonuçlar dikkate alındığında ülkeler vatandaşlarının daha mutlu olmalarını istiyorsa öncelikli olarak ekonomiye daha fazla yatırım yapmalı ve refah seviyesini arttırmanın yollarını aramalıdır.
Kaynakça
AKSOY, A. ve TAŞKAYA, S. (2020). “Ülkelerin Makroekonomik Göstergeleri İle Mutluluk Düzeyleri Arasındaki İlişki”, Üçüncü Sektör Sosyal Ekonomi Dergisi, 55(2), 1188-1201.
BIANCHI, F. M., LIVI, L. ve RIZZI, A. (2016). “Two Density-based k-means Initialization Algorithms for Non-metric Data Clustering”, Pattern Analysis and Applications, 19(3), 745-763.
CHEN, L. S.,PRENTICE, R. L. ve WANG, P. (2014). “A Penalized EM Algorithm in Corporating Missing Data Mechanism for Gaussian Parameter Estimation”, Biometrics, 70(2), 312-322.
CLARK, A. E. (2018). “Four Decades of the Economics of Happiness: Where Next?”, The Review of Income and Wealth, 64(2), 245-269.
CLARK, A. E., LAYARD, R. ve SENIK, C. (2012). The Causes of Happiness and Misery. In J. HELLIWELL, R. LAYARD, and J. SACHS (eds.) World Happiness Report 2012, Columbia Earth Institute, New York.
CÖMERTLER ŞİMŞİR, N. (2013). “Türkiye’de Mutluluk Ekonomisinin Belirleyicilerinin Ekonometrik Analizi”, Finans Politik ve Ekonomik Yorumlar, 50 (579), 7-22.
CÖMERTLER, N. (2019a). “Suç ve Mutluluk” GÜVEL, E.A. VE AKTAN, C.C. (Editörler), Kriminoloji ve İktisat, Suç ve Ceza İktisadı Üzerine İncelemeler (168-184). SOBİAD Hukuk ve İktisat Araştırmaları Yayınları.
CÖMERTLER, N. (2019b). “Dünyanın Mutluluk Halleri”, (Ed.) YENİPAZARLI, A., Seçilmiş Konularla 21. Yüzyılda Dünya Ekonomisi içinde, Seçkin Yayıncılık, Ankara, 377-407.
32 Çelik, S. & Cömertler, N. (2021). Investigation of Happiness of Countries with K-Means Clustering and Discriminant Analysis
DOLAN, P., PEASGOOD, T. ve WHİTE M. (2008). “Do We Reaally Know What Makes us Happy? A Review of the Economic Literature on the Factors Associated with Subjective Well-being”, Journal of Economic Psychology, 29, 94-122. FREY, S.B. ve STUTZER A. (2002). “Economics of Happiness”, World Economics,
3(1), 1-17.
GARBADE, M. J. (2018). “Understanding K-Means Clustering in Machine Learning”, https://towardsdatascience.com/understanding-k-means-clustering-in-machine-learning-6a6e67336aa1, (02.09.2020).
GERLHOF, C., KEMPER, A., KILGER, C. ve MOERKOTTE, G. (1993). “Partition-based Clustering in Object Bases: From Theory to Practice”, In International Conference on Foundations of Data Organization and Algorithms (pp. 301-316), Springer, Berlin, Heidelberg.
GURU99 (2020). “Unsupervised Machine Learning: What is, Algorithms, Example”, https://www.guru99.com/unsupervised-machine-learning.html,
(10.08.2020).
GÜRSAKAL, N. (2018). “Makine Öğrenmesi”, Dora Yayınları, Bursa.
GÜRSAKAL, S. (2019). “Sosyal Bilimlerde SPSS Uygulamalı Çok Değişkenli İstatistiksel Analiz Teknikleri”, Dora Yayıncılık, Bursa, 1. Baskı.
GÜZEL, S. (2018). Gelir Eşitsizliği, Refah ve Mutluluk. Anemon Muş Alparslan Üniversitesi Sosyal Bilimler Dergisi, 6(3), 389-394.
HELLIWELL, J. F. (2019). “How to Open Doors to Happiness? (in Global Happiness and Well being Policy Report 2019)”, Sustainable Development Solution Network, New York.
HINNEBURG, A. ve KEIM, D. A. (1998). “An Efficient Approach to Clustering in Large Multi Media Databases with Noise”.
JAIN, S. ve KURIAKOSE, M. (2019). “Discriminant Analysis – Simplified. International Journal of Contemporary Dental and Medical Reviews”, Article ID: 031219, doi: 10.15713/ins.ijcdmr.139.
JEFFREY, K.,WHEATLEY, H. ve ABDALLAH S. (2016). “The Happy Planet Index: 2016. A Global Index of Sustainable well-being”, New Economics Foundation, London.
KARYPİS, G., HAN, E. H. ve KUMAR, V. (1999). Chameleon: Hierarchical Clustering Using Dynamic Modeling. Computer, 32(8), 68-75.
LIAO, W. K.,LIU, Y. ve CHOUDHARY, A. (2004). “A Grid-based Clustering Algorithm Using Sdaptive Mesh Refinement”. In 7th Workshop on Mining Scientific and Engineering Data Sets of SIAM International Conference on Data Mining, 22, 61-69.
NALLATHAMBI, J. (2018). “R Series — K Means Clustering (Silhouette)”, https://medium.com/codesmart/r-series-k-means-clustering-silhouette-794774b46586, (12.08.2020).
Journal of Current Researches on Business and Economics, 2021, 11 (1), 15-38. 33
OECD (2020). www.oecdbetterlifeindex.org, (25.08.2020).
ORIGINLAB (2020). Discriminant Analysis.
https://www.originlab.com/doc/Origin-Help/Discriminant-Analysis, (1.09.2020).
ORTIZ-OSPINA, E., & ROSER, M. (2013). Happiness and Life Satisfaction. Our World
in Data.
ÖZDAMAR, K. (2013). “Paket Programları ile İstatistiksel Veri Analizi-2 (Çok Değişkenli Analizler)”, Kaan Kitapevi, Eskişehir, 9. Baskı.
ÖZTÜRK, S., & SULUK, S. (2020). Mutluluk Ekonomisi: G8 Ülkeleri Açısından Ekonomik Büyüme ve Mutluluk Arasındaki İlişkinin İncelenmesi. Süleyman
Demirel Üniversitesi Sosyal Bilimler Enstitüsü Dergisi, (37), 226-249.
PAPADOPOULOS, J. S. ve AGARWALA, R. (2007). “COBALT: Constraint-based Alignment Tool for Multiple Protein Sequences”, Bioinformatics, 23(9), 1073-1079.
PLANINGTANK (2018). “Cluster Analysis”, https://planningtank.com/computer-applications/cluster-analysis, (20.08.2020).
RUNGTA, K. (2020). “K-means Clustering in R with Example”,
https://www.guru99.com/r-k-means-clustering.html, (15.08.2020). SHARMA, R. (2020). “Cluster Analysis in Data Mining: Applications”, Methods &
Requirements, https://www.upgrad.com/blog/cluster-analysis-data-mining/, (17.08.2020).
STUTZER, A. ve FREY, B. S. (2012). “Recent Developments in the Economics of Happiness: A Selective Overview”, Recent Developments in the Economics of Happiness: A Selective Overview. IZA Discussion Paper, (7078).
TAN, P. N., STEINBACH, M. ve KUMAR, V. (2006). “Classification: Basic Concepts, Decision Trees, and Model Evaluation”, Introduction to Data Mining, 1, 145-205.
TAVOR, T., GONEN, L. D., WEBER, M., & SPİEGEL, U. (2018). The Effects of Income Levels and Income Inequalities on Happiness. Journal of Happiness
Studies, 19(7), 2115-2137.
TDK (2020).
http://www.tdk.gov.tr/index.php?option=com_gts&arama=gts&guid=TDK .GTS.5d7e4a0299e9e4.33373442. (10.08.2020).
TILLMANNS, S. ve KRAFFT, M. (2017). “Logistic Regression and Discriminant Analysis”, Handbook of Market Research, 1-39.
TUTORIALPOINT (2020). “Data Mining - Cluster Analysis”,
https://www.tutorialspoint.com/data_mining/dm_cluster_analysis.htm, (1.08.2020).
URA, K., ALKIRE S. ve ZANGMO T. (2010). “Case Study: Bhutan Gross National Happiness and GNH Index,(in: World Happiness Report 2010)”, United Nations.
34 Çelik, S. & Cömertler, N. (2021). Investigation of Happiness of Countries with K-Means Clustering and Discriminant Analysis
VEENHOVEN, R. (2019). “Happiness in Nations, World Database of Happiness”, Erasmus University Rotterdam, The Netherlands.
VERMA J.P. (2013). “Application of Discriminant Analysis: For Developing a Classification Model”, In: Data Analysis in Management with SPSS Software, Springer, India.
XU, R. ve WUNSCH, D. (2005). “Survey of Clustering Algorithms”, IEEE Transactions on Neural Networks, 16(3), 645-678.
ZHOU, K. ve YANG, S. (2020). “Effect of Cluster Size Distribution on Clustering: A Comparative Study of K-means and Fuzzy c-means Clustering”, Pattern Analysis and Applications, 23(1), 455-466.
Ek 1. Çalışmada Kullanılan Veri Seti
rank Coun tr y or reg ion Sc or e G DP per ca pi ta So cial s uppor t H eal thy l ife expect an cy Fr ee dom to mak e l ife cho ices G en ero sit y P erc ept io n s of co rr upt ion 1 Finland 7.769 1.340 1.587 0.986 0.596 0.153 0.393 2 Denmark 7.600 1.383 1.573 0.996 0.592 0.252 0.410 3 Norway 7.554 1.488 1.582 1.028 0.603 0.271 0.341 4 Iceland 7.494 1.380 1.624 1.026 0.591 0.354 0.118 5 Netherlands 7.488 1.396 1.522 0.999 0.557 0.322 0.298 6 Switzerland 7.480 1.452 1.526 1.052 0.572 0.263 0.343 7 Sweden 7.343 1.387 1.487 1.009 0.574 0.267 0.373 8 New Zealand 7.307 1.303 1.557 1.026 0.585 0.330 0.380 9 Canada 7.278 1.365 1.505 1.039 0.584 0.285 0.308 10 Austria 7.246 1.376 1.475 1.016 0.532 0.244 0.226 11 Australia 7.228 1.372 1.548 1.036 0.557 0.332 0.290 12 Costa Rica 7.167 1.034 1.441 0.963 0.558 0.144 0.093 13 Israel 7.139 1.276 1.455 1.029 0.371 0.261 0.082 14 Luxembourg 7.090 1.609 1.479 1.012 0.526 0.194 0.316 15 United Kingdom 7.054 1.333 1.538 0.996 0.450 0.348 0.278 16 Ireland 7.021 1.499 1.553 0.999 0.516 0.298 0.310 17 Germany 6.985 1.373 1.454 0.987 0.495 0.261 0.265 18 Belgium 6.923 1.356 1.504 0.986 0.473 0.160 0.210 19 United States 6.892 1.433 1.457 0.874 0.454 0.280 0.128 20 Czech Republic 6.852 1.269 1.487 0.920 0.457 0.046 0.036 21 United Arab Emirates 6.825 1.503 1.310 0.825 0.598 0.262 0.182 22 Malta 6.726 1.300 1.520 0.999 0.564 0.375 0.151 23 Mexico 6.595 1.070 1.323 0.861 0.433 0.074 0.073 24 France 6.592 1.324 1.472 1.045 0.436 0.111 0.183 25 Taiwan 6.446 1.368 1.430 0.914 0.351 0.242 0.097 26 Chile 6.444 1.159 1.369 0.920 0.357 0.187 0.056 27 Guatemala 6.436 0.800 1.269 0.746 0.535 0.175 0.078 28 Saudi Arabia 6.375 1.403 1.357 0.795 0.439 0.080 0.132
Journal of Current Researches on Business and Economics, 2021, 11 (1), 15-38. 35 29 Qatar 6.374 1.684 1.313 0.871 0.555 0.220 0.167 30 Spain 6.354 1.286 1.484 1.062 0.362 0.153 0.079 31 Panama 6.321 1.149 1.442 0.910 0.516 0.109 0.054 32 Brazil 6.300 1.004 1.439 0.802 0.390 0.099 0.086 33 Uruguay 6.293 1.124 1.465 0.891 0.523 0.127 0.150 34 Singapore 6.262 1.572 1.463 1.141 0.556 0.271 0.453 35 El Salvador 6.253 0.794 1.242 0.789 0.430 0.093 0.074 36 Italy 6.223 1.294 1.488 1.039 0.231 0.158 0.030 37 Bahrain 6.199 1.362 1.368 0.871 0.536 0.255 0.110 38 Slovakia 6.198 1.246 1.504 0.881 0.334 0.121 0.014 39 Trinidad & Tobago 6.192 1.231 1.477 0.713 0.489 0.185 0.016 40 Poland 6.182 1.206 1.438 0.884 0.483 0.117 0.050 41 Uzbekistan 6.174 0.745 1.529 0.756 0.631 0.322 0.240 42 Lithuania 6.149 1.238 1.515 0.818 0.291 0.043 0.042 43 Colombia 6.125 0.985 1.410 0.841 0.470 0.099 0.034 44 Slovenia 6.118 1.258 1.523 0.953 0.564 0.144 0.057 45 Nicaragua 6.105 0.694 1.325 0.835 0.435 0.200 0.127 46 Kosovo 6.100 0.882 1.232 0.758 0.489 0.262 0.006 47 Argentina 6.086 1.092 1.432 0.881 0.471 0.066 0.050 48 Romania 6.070 1.162 1.232 0.825 0.462 0.083 0.005 49 Cyprus 6.046 1.263 1.223 1.042 0.406 0.190 0.041 50 Ecuador 6.028 0.912 1.312 0.868 0.498 0.126 0.087 51 Kuwait 6.021 1.500 1.319 0.808 0.493 0.142 0.097 52 Thailand 6.008 1.050 1.409 0.828 0.557 0.359 0.028 53 Latvia 5.940 1.187 1.465 0.812 0.264 0.075 0.064 54 South Korea 5.895 1.301 1.219 1.036 0.159 0.175 0.056 55 Estonia 5.893 1.237 1.528 0.874 0.495 0.103 0.161 56 Jamaica 5.890 0.831 1.478 0.831 0.490 0.107 0.028 57 Mauritius 5.888 1.120 1.402 0.798 0.498 0.215 0.060 58 Japan 5.886 1.327 1.419 1.088 0.445 0.069 0.140 59 Honduras 5.860 0.642 1.236 0.828 0.507 0.246 0.078 60 Kazakhstan 5.809 1.173 1.508 0.729 0.410 0.146 0.096 61 Bolivia 5.779 0.776 1.209 0.706 0.511 0.137 0.064 62 Hungary 5.758 1.201 1.410 0.828 0.199 0.081 0.020 63 Paraguay 5.743 0.855 1.475 0.777 0.514 0.184 0.080 64 Northern Cyprus 5.718 1.263 1.252 1.042 0.417 0.191 0.162 65 Peru 5.697 0.960 1.274 0.854 0.455 0.083 0.027 66 Portugal 5.693 1.221 1.431 0.999 0.508 0.047 0.025 67 Pakistan 5.653 0.677 0.886 0.535 0.313 0.220 0.098 68 Russia 5.648 1.183 1.452 0.726 0.334 0.082 0.031 69 Philippines 5.631 0.807 1.293 0.657 0.558 0.117 0.107 70 Serbia 5.603 1.004 1.383 0.854 0.282 0.137 0.039 71 Moldova 5.529 0.685 1.328 0.739 0.245 0.181 0.000 72 Libya 5.525 1.044 1.303 0.673 0.416 0.133 0.152 73 Montenegro 5.523 1.051 1.361 0.871 0.197 0.142 0.080 74 Tajikistan 5.467 0.493 1.098 0.718 0.389 0.230 0.144 75 Croatia 5.432 1.155 1.266 0.914 0.296 0.119 0.022 76 Hong Kong 5.430 1.438 1.277 1.122 0.440 0.258 0.287 77 Dominican Republic 5.425 1.015 1.401 0.779 0.497 0.113 0.101 78 Bosniaand Herzegovina 5.386 0.945 1.212 0.845 0.212 0.263 0.006
36 Çelik, S. & Cömertler, N. (2021). Investigation of Happiness of Countries with K-Means Clustering and Discriminant Analysis
79 Turkey 5.373 1.183 1.360 0.808 0.195 0.083 0.106 80 Malaysia 5.339 1.221 1.171 0.828 0.508 0.260 0.024 81 Belarus 5.323 1.067 1.465 0.789 0.235 0.094 0.142 82 Greece 5.287 1.181 1.156 0.999 0.067 0.000 0.034 83 Mongolia 5.285 0.948 1.531 0.667 0.317 0.235 0.038 84 North Macedonia 5.274 0.983 1.294 0.838 0.345 0.185 0.034 85 Nigeria 5.265 0.696 1.111 0.245 0.426 0.215 0.041 86 Kyrgyzstan 5.261 0.551 1.438 0.723 0.508 0.300 0.023 87 Turkmenistan 5.247 1.052 1.538 0.657 0.394 0.244 0.028 88 Algeria 5.211 1.002 1.160 0.785 0.086 0.073 0.114 89 Morocco 5.208 0.801 0.782 0.782 0.418 0.036 0.076 90 Azerbaijan 5.208 1.043 1.147 0.769 0.351 0.035 0.182 91 Lebanon 5.197 0.987 1.224 0.815 0.216 0.166 0.027 92 Indonesia 5.192 0.931 1.203 0.660 0.491 0.498 0.028 93 China 5.191 1.029 1.125 0.893 0.521 0.058 0.100 94 Vietnam 5.175 0.741 1.346 0.851 0.543 0.147 0.073 95 Bhutan 5.082 0.813 1.321 0.604 0.457 0.370 0.167 96 Cameroon 5.044 0.549 0.910 0.331 0.381 0.187 0.037 97 Bulgaria 5.011 1.092 1.513 0.815 0.311 0.081 0.004 98 Ghana 4.996 0.611 0.868 0.486 0.381 0.245 0.040 99 Ivory Coast 4.944 0.569 0.808 0.232 0.352 0.154 0.090 100 Nepal 4.913 0.446 1.226 0.677 0.439 0.285 0.089 101 Jordan 4.906 0.837 1.225 0.815 0.383 0.110 0.130 102 Benin 4.883 0.393 0.437 0.397 0.349 0.175 0.082 103 Congo (Brazzaville) 4.812 0.673 0.799 0.508 0.372 0.105 0.093 104 Gabon 4.799 1.057 1.183 0.571 0.295 0.043 0.055 105 Laos 4.796 0.764 1.030 0.551 0.547 0.266 0.164 106 South Africa 4.722 0.960 1.351 0.469 0.389 0.130 0.055 107 Albania 4.719 0.947 0.848 0.874 0.383 0.178 0.027 108 Venezuela 4.707 0.960 1.427 0.805 0.154 0.064 0.047 109 Cambodia 4.700 0.574 1.122 0.637 0.609 0.232 0.062 110 Palestinian Territories 4.696 0.657 1.247 0.672 0.225 0.103 0.066 111 Senegal 4.681 0.450 1.134 0.571 0.292 0.153 0.072 112 Somalia 4.668 0.000 0.698 0.268 0.559 0.243 0.270 113 Namibia 4.639 0.879 1.313 0.477 0.401 0.070 0.056 114 Niger 4.628 0.138 0.774 0.366 0.318 0.188 0.102 115 Burkina Faso 4.587 0.331 1.056 0.380 0.255 0.177 0.113 116 Armenia 4.559 0.850 1.055 0.815 0.283 0.095 0.064 117 Iran 4.548 1.100 0.842 0.785 0.305 0.270 0.125 118 Guinea 4.534 0.380 0.829 0.375 0.332 0.207 0.086 119 Georgia 4.519 0.886 0.666 0.752 0.346 0.043 0.164 120 Gambia 4.516 0.308 0.939 0.428 0.382 0.269 0.167 121 Kenya 4.509 0.512 0.983 0.581 0.431 0.372 0.053 122 Mauritania 4.490 0.570 1.167 0.489 0.066 0.106 0.088 123 Mozambique 4.466 0.204 0.986 0.390 0.494 0.197 0.138 124 Tunisia 4.461 0.921 1.000 0.815 0.167 0.059 0.055 125 Bangladesh 4.456 0.562 0.928 0.723 0.527 0.166 0.143 126 Iraq 4.437 1.043 0.980 0.574 0.241 0.148 0.089 127 Congo (Kinshasa) 4.418 0.094 1.125 0.357 0.269 0.212 0.053 128 Mali 4.390 0.385 1.105 0.308 0.327 0.153 0.052
Journal of Current Researches on Business and Economics, 2021, 11 (1), 15-38. 37 129 Sierra Leone 4.374 0.268 0.841 0.242 0.309 0.252 0.045 130 Sri Lanka 4.366 0.949 1.265 0.831 0.470 0.244 0.047 131 Myanmar 4.360 0.710 1.181 0.555 0.525 0.566 0.172 132 Chad 4.350 0.350 0.766 0.192 0.174 0.198 0.078 133 Ukraine 4.332 0.820 1.390 0.739 0.178 0.187 0.010 134 Ethiopia 4.286 0.336 1.033 0.532 0.344 0.209 0.100 135 Swaziland 4.212 0.811 1.149 0.000 0.313 0.074 0.135 136 Uganda 4.189 0.332 1.069 0.443 0.356 0.252 0.060 137 Egypt 4.166 0.913 1.039 0.644 0.241 0.076 0.067 138 Zambia 4.107 0.578 1.058 0.426 0.431 0.247 0.087 139 Togo 4.085 0.275 0.572 0.410 0.293 0.177 0.085 140 India 4.015 0.755 0.765 0.588 0.498 0.200 0.085 141 Liberia 3.975 0.073 0.922 0.443 0.370 0.233 0.033 142 Comoros 3.973 0.274 0.757 0.505 0.142 0.275 0.078 143 Madagascar 3.933 0.274 0.916 0.555 0.148 0.169 0.041 144 Lesotho 3.802 0.489 1.169 0.168 0.359 0.107 0.093 145 Burundi 3.775 0.046 0.447 0.380 0.220 0.176 0.180 146 Zimbabwe 3.663 0.366 1.114 0.433 0.361 0.151 0.089 147 Haiti 3.597 0.323 0.688 0.449 0.026 0.419 0.110 148 Botswana 3.488 1.041 1.145 0.538 0.455 0.025 0.100 149 Syria 3.462 0.619 0.378 0.440 0.013 0.331 0.141 150 Malawi 3.410 0.191 0.560 0.495 0.443 0.218 0.089 151 Yemen 3.380 0.287 1.163 0.463 0.143 0.108 0.077 152 Rwanda 3.334 0.359 0.711 0.614 0.555 0.217 0.411 153 Tanzania 3.231 0.476 0.885 0.499 0.417 0.276 0.147 154 Afghanistan 3.203 0.350 0.517 0.361 0.000 0.158 0.025 155 Central African Republic 3.083 0.026 0.000 0.105 0.225 0.235 0.035 156 South Sudan 2.853 0.306 0.575 0.295 0.010 0.202 0.091
38 Çelik, S. & Cömertler, N. (2021). Investigation of Happiness of Countries with K-Means Clustering and Discriminant Analysis
E-ISSN:
2547-9628 Strategic Research Academy ©
© Copyright of Journal of Current Researches on Business and Economics is the property of Strategic Research Academy and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use.