• Sonuç bulunamadı

Verilerin Normal Dağılımda Olup Olmadıklarının İrdelenmesi

2.6 İstatistik Test Çalışmaları ve Doğruluk Analizleri

2.6.2 Verilerin Normal Dağılımda Olup Olmadıklarının İrdelenmesi

Parametrik olmayan testler, her hangi bir parametreye, belirli dağılıma ve varyansa bağlanmadan işlemler yapan ve aralıklı ya da oransal verilerin yerine isimsel (nominal) ya da sıralı (ordinal) veriler kullanarak işlem yapım yöntemleridir. Dolayısıyla bu testler bazı durumlarda parametrik testlere göre daha zayıftırlar. Fakat çoğu zaman verilerin parametrik testlerin gerektirdiği şartları sağlayamadığı durumlar söz konusudur [32]. Bilindiği gibi veriler isimsel, sıralı, aralıklı (interval) ya da oransal (proportional, ratio) ölçekle elde edilirler. Bazı gözlemler belirli ölçme araçları (anket, soru formları, benzer ölçekle geliştirilmiş indeksler, araçlar) aracılığı ile elde edilirler. Bu veriler skor değerler olarak ele alınır. Bu verilerin bazıları aralıklı ölçekli veri ya da yaklaşık aralıklı ölçekli veri olarak kabul edilir [33].

Aralıklı ve oransal ölçekli verilerde dağılım varsayımları kurulabilir ve parametreler hesaplanabilir. İsimsel, sıralı ölçekli ve skor değerlerden oluşan verilerde dağılım varsayımı kurulmaz ve parametre tahmini yapılamaz. Ancak kategorilere göre sayısal frekanslar ve gözlenme oranları tahminleri yapılabilir.

Verilerin ölçümlerinde kullanılan ölçekler hipotezlerin test edilmesinde önemli rol oynarlar. Parametrik yöntemler; ilgili parametreye, belirli bir dağılıma ve varyans kavramına dayanarak işlemler yapan esnek olmayan istatistiksel yöntemlerdir. Parametrik olmayan yöntemler; parametreye, belirli bir dağılıma ve varyansa dayanmadan islemler yapan genellikle veriler yerine onların sıralama puanlarını

26

kullanarak işlem yapan esnek istatistiksel yöntemlerdir. Parametrik olmayan yöntemler aşağıdaki koşullarda uygulanmalıdır:

 Değişkenin belirli herhangi bir dağılıma uygun davranması şart değildir. Ancak belirli bir dağılıma uygun olması uygulanacak testin gücünü artırır.

 Değişken, isimsel, sıralı ölçekli ise parametrik yöntemler uygulanmaz. Parametrik yöntemlerin uygulanamadığı ya da uygulanmak istenmediği durumlarda uygulanır.

 Gerçek gözlem değerleri yerine sıralama puanları, skor değerleri analizde kullanılır. Kümedeki gözlemlerin homojen yapı oluşturması şart değildir.  Değişkenin parametrelerinin bilinmesi (µ ve σ2, P, Q) şart değildir. Birim

sayısının (n) belirli bir sınırının olması gerekmez.

Hipotezler parametre gerekmeksizin de kurulabilir. Araştırmacı, bilim adamı kendi geliştirdiği yaklaşımları serbestçe hipotez kurarak test edebilir. Parametrik olmayan yöntemlerin uygulanması zorunluluğu olan durumlar da vardır. Parametrik yöntemlerin uygulanması gereken durumlar aşağıda belirtilmiştir.

 İsimsel ve sıralı ölçekli verilerde belirli bir dağılıma, modele uygun olan birliktelik (association) ve uyuşum (interrater reliability, concordace) analizleri parametrik olmayan yöntemlerle yapılabilir.

 İsimsel, sıralı, isimsel ya da sıralı ölçeğe indirgenmiş verilerde bağımsızlık analizi yapılabilir. Sıralama puanlarına dönüştürülerek bağımsız iki ya da (k) grubun benzerliğinin analizi yapılabilir.

 Sıralama puanlarına dönüştürülerek bağımlı iki ya da (k) grubun ortanca değerlerinin benzerliği analiz edilebilir.

Parametrik olmayan testlerde de bir sıfır hipotezi ve bir karşıt hipotez kurulur. Fakat buradaki hipotezler bir parametrik değeri hedef almayan, belirli bir dağılımı varsaymayan hipotezlerdir [33].

27  2

(Chi-Kare) Uyum Testi

Sonsuz sayıda elemandan oluşan bir ana kümeden n elemanlı bir örnek küme seçilmiş olsun. Örnek kümenin elemanları standartlaştırıldıktan sonra (k) sayıda sınıfa,

(2.17) eşitliğine göre ayrılır. Sınıf genişliği,

(2.18)

biçiminde hesaplanır. Bağıl sınıf yığılmasının kuramsal değeri,

(

)

(

)

(2.19) olarak hesaplandıktan sonra Chi-Kare uyum testi bağıntısı

( )

(2.20) eşitliğinden elde edilir. Bu değer 2 tablo değeri ile karşılaştırılır. Değer, tablo değerinden küçükse veriler normal dağılımda, değilse normal dağılımda değildir. 2 uyum testiyle irdelenen verilerin sayısı 30’dan fazla olmalı ve kuramsal sınıf yığılmaları 4’den küçük olan sınıflar komşu sınıflardan biriyle birleştirilmelidir [34].

Kolmogorov-Simirnov (K-S) Testi (Alternatif 2 Yöntemi)

Bu test 2 testinin alternatifidir. 2 testi hem parametrik hem de parametrik olmayan testler için kullanılmasına rağmen, Kolmogorov-Simirnov testi bazı durumlarda, özellikle verileri keyfi gruplara ayırmadığı için  2 testinden daha etkindir. Bu test, örneğe ait dağılımın, herhangi bir hipotik dağılım modeline uyup uymadığını test eder [35]. Tek örnek ve iki örnek için ayrı ayrı uygulanır.

Tek örnek için K-S testi Bu test için veriler;

(2.21) formülü ile standartlaştırılırlar.

28

Hem teorik standart verilere ait %’de kümülatif frekans eğrisi hem de örneğe ait standartlaştırılmış verilerin %’de kümülatif frekans eğrisi aynı frekans üzerine çizilir. Bu iki eğri arasındaki maksimum farka (Dmak) bakılır.

Dmak teorik değerleri hazırlanmış tablolardan ya da pratik olarak,

( )

, D(0.01) =

, D(0.001) =

(2.22) şeklinde hesaplanır. Eğer, Dmak > D (teorik) ise “örnek dağılım, karşılaştırıldığı dağılıma

uygun değildir” olarak karar verilir [33].

Lilliefors Testi

Lilliefors testi Kolmogorov-Smirnov testinin bir uyarlamasıdır. Verilerin normal dağılımlı anakitleden gelip gelmediğini gösteren sıfır hipotezinin test edilmesinde kullanılır. Test adımları şunlardır:

1. Verilere dayalı olarak anakitle ortalaması ve varyansının kestirimi yapılır.

2. Sonra, bu kestirim değerleri ile normal dağılımın deneysel dağılım fonksiyonu ve kümülatif dağılım fonksiyonu arasındaki maksimum uyuşumsuzluk bulunur. Kolmogorov-Smirnov testinde olduğu gibi, bu test istatistiğidir.

3. Son olarak, maksimum uyuşumsuzluğun istatistiksel olarak anlamlı addedilebilecek derecede büyük olup olmadığı değerlendirilir. Bu, sıfır hipotezinin reddedilmesi demektir. Bu testin Kolmogorov-Smirnov testine göre daha karmaşık hale geldiği nokta burasıdır. Verilere dayalı kestirim ile varsayılan kümülatif dağılım fonksiyonu verilere yaklaştırıldığından, maksimum uyuşumsuzluk olması gerektiğinden daha küçük hale getirilmiş olur. Bu nedenle test istatistiğinin “sıfır dağılımı” stokastik olarak Kolmogorov-Smirnov dağılımından daha küçük olur. Bu Lilliefors dağılımı olarak adlandırılır. Günümüze kadar bu dağılım için tablolar Monte Carlo metodları ile hesaplanmıştır [36].

29

Jarque-Bera Testi

İstatistikte Jarque-Bera testi uyuşum (iyi uyum) testi olarak bilinir. Bu test örnek verilerin normal dağılımla eşleşen çarpıklık (skewness) ve basıklığa (kurtosis) sahip olup olmadığının irdelenmesidir. Testin ismi Carlos Jarque ve Anil K. Bera’dan gelmektedir. Eğer veriler normal dağılımdan geliyorsa, Jarque-Bera istatistiği asimptotik olarak çift serbestlik dereceli 2 dağılımına sahip olur. Bu nedenle istatistik, verilerin normal dağılımdan gelip gelmediği hipotezini test etmede kullanılabilir. Normal dağılımlı veriler için beklenen çarpıklık ve basıklık 0’dır. Küçük örnekler için 2 yaklaşımı fazla hassastır, genellikle sıfır hipotezinin doğru olduğu halde reddedilmesine neden olur. Bu da 1. tipte test hatasına sebebiyet verir.

Jarque-Bera testi, geniş örneklerde kritik değerlerin kestirimi için genellikle 2 dağılımını kullanır. Lilliefors ise küçük örneklerde kullanılır [36].

Varyansın Test Edilmesi

Bir kümeden elde edilen varyans ile bilinen bir varyans değerinin eşit olup olmadıklarını belirlemek için kümeye 2 testi uygulanır. Hesaplanan test büyüklüğü, tablo değerlerinden küçük ise sıfır hipotezi kabul, aksi durumda reddedilir.

Birbirinden bağımsız ve normal dağılımlı iki kümenin varyansları oranları elde edildikten sonra F-dağılımına bakılır. Hesaplanan test büyüklüğü, tablo değerlerinden küçük ise sıfır hipotezi kabul, aksi durumda reddedilir.

Benzer Belgeler