• Sonuç bulunamadı

Çözüm 2: Böyle bir problemin iki örnekli Kolmogorow-Smirnow uyum testine göre çözümünde ilk işlem adımı olarak,

9.6. Normal Dağılımla İlgili Diğer Uyum İyiliği Test Yöntemleri

9.6.3. Shapiro-Wilk W Testi

Shapiro-Wilk normal dağılım uyum iyiliği testi, gözlemlerin kuramsal normal dağılımdan çeşitli yönleriyle olan sapmaların tespit edilmesi amacıyla kullanılan bir diğer parametrik olmayan istatistik veri analizi testidir. Böyle bir istatistik hipotez testi ilk defa S. Shapiro ve M. Wilk tarafından 1965 yılında geliştirilerek yayınlanmıştır. Özellikleri nedeniyle bu yöntem aynı zamanda regresyon-korelasyon bazlı bir istatistik test olmaktadır. Bilindiği gibi Shapiro-Wilk W testinde temel düşünce olarak; apsisin aritmetik, ordinatın ise logaritmik bir ölçekte düzenlenmiş normal olasılık grafiğindeki, (x,y) ilişkilerinden oluşan birikimli normal dağılım verilerinin bir regresyon doğrusu üzerinde bulunacağı koşulu prensibinden faydalanılmaktadır.

Bu amaçla, n sayıda verilmiş bir veri kümesi elemanlarının Shapiro-Wilk W test yöntemine göre normal dağılımda olup olmadıklarını belli bir 1S yanılma olasılığı düzeyine göre istatistik olarak irdeleyebilmek için, öncelikle konuyla ilgili bir sıfır hipotezinin kurulması gerekmektedir. Shapiro-Wilk W normal dağılım uyum iyiliği testi için böyle bir hipotez,

H0: Veriler normal dağılımdır

Hs: Veriler normal dağılımda değildir.

şeklinde kurulabilir. Bu şekilde kurulmuş bir sıfır hipotezine ilişkin standart dağılımlı rastgele değişkeni veya diğer adıyla test büyüklüğünün hesaplanabilmesi için sırası ile aşağıdaki işlemler yapılır.

Örnekleme küme elemanları(yani tüm veriler), işaretleri de göz önüne alınarak, küçükten büyüğe doğru

) ( )

3 ( ) 2 ( ) 1

( x x ... xn

x 9-29

biçiminde sıralanırlar. Bu verilerin

 

n xˆ x

şeklinde elde edilen ortalama değerinden faydalanarak,

s2

(xixˆ)2

gibi bir diğer ara parametre değeri hesaplanır.

Örnek veri kümesindeki n eleman sayısı;

1) Çift sayı ise; k0,5n formülünden hesaplanarak, daha önceden hazırlanarak tablo halinde verilmiş olan Shapiro-Wilk W testi çizelgelerinden ani1 değerleri ile

k

i

i i n i

n x x

a b

1

1

1( ) 9-30a

gibi bir katsayı değeri hesaplanır.

2) Tek sayı ise; k0,5(n1)alınarak sıralı veri kümesindeki xk1 elemanı veri kümesinin medyanı olup b değerinin hesaplanmasında dikkate alınmaktadır.

Çünkü, tek sayılı durumda ak10 sonucuna yol açacağından, b değeri bu durumda,

ban(xnx1)...ak2(xk2xk) 9-30b formülünden hesaplanacaktır. Burada geçen

an,.an1,...,ak1

katsayıları aynı şekilde Shapiro-Wilk W testi çizelgelerden alınmaktadır (Ek Tablo 8).

 Bu işlemlerin sonucunda sıfır hipotezi ile ilgili test büyüklüğü

2 2

1 2 1

2

ˆ) (

) (

S b x x

x a

W n

i i n

i i i

9-31

olarak hesaplanır.

Daha sonra W test büyüklüğüne ilişkin Wn, sınır değeri; 1S yanılma olasılığına ve n veri sayısının çeşitli değerlerine göre önceden hazırlanmış Shapiro-Wilk W testi tablolarından alınır (Tablo 27).

Sonuçta, bu iki değerin karşılaştırılmasından, eğer WWn, ise; H0 sıfır hipotezi kabul, H seçenek hipotezi de ret edilir. s

Yorum: Bu yöntemde, örnekleme kümenin sıralı istatistikleri ile, standart normal dağılımın sıralı istatistiklerinin beklenen değer, varyans ve kovaryanslarından oluşan matris dikkate alınarak hesaplanan Shapiro-Wilk test istatistiğinin tablo değerlerinden küçük olduğu durumlarda, veri setinin 1S yanılma olasılığına göre normal dağılımdan geldiğine ilişkin H0 hipotez kabul, yani verilerin normal dağılımda olduklarına karar verilir.

Tablo 27 :  1S Yanılma olasılığına göre düzenlenmiş Shapiro-Wilk

Tersi durumda; WWn, olması halinde; H0 sıfır hipotezi ret, Hs seçenek hipotezi kabul edilir.

Yorum: Bu yöntemde, örnekleme kümenin sıralı istatistikleri ile, standart normal dağılımın sıralı istatistiklerinin beklenen değer, varyans ve kovaryanslarından oluşan matris dikkate alınarak hesaplanan Shapiro-Wilk test istatistiğinin tablo değerlerinden büyük olduğu, Hs hipotezin kabul durumunda, dağılımın normal dağılımda olmadığını göstermesi, yani test istatistiğinin WWn, tablo değerinden büyük olması durumunda verilerin normal dağılımdan geldiğine ilişkin bir kanıt bulunmamaktadır söylenebilir.

Neticede, burada söylemek gerekirse; Shapiro-Wilk W testi, örneklemde çok sayıda aynı değere sahip verinin yer aldığı durumlarda çok doğru sonuçlar vermez. Ancak küçük ve orta büyüklükte (veri sayısı<3000) örneklemler için en güvenilir sonuçları veren bir normal dağılıma uyum iyiliği testidir denebilir.

Örnek 1: Bir verniyer okumaları sonucunda elde edilmiş ölçü değerleri, 202 166 153 141 131 133 132 131 129 125

119 li

olarak verilmiştir. Bu verilerin 1S0.05 yanılma olasılığına göre normal dağılımda olup olmadıklarının Shapiro-Wilk W testi ile irdelenmesi istenmektedir.

Çözüm 1: Bu problemde n11 tek sayıda eleman bulunmaktadır. Böyle bir problemin çözümü için paragraf 9.6.3 ‘de Shapiro-Wilk hipotez testi yöntemi ile ilgili anlatılan işlemler süreci sırası ile uygulanır. Bu amaçla, hipotez testinin ilk işlem adımı olarak

H0

: Veriler normal dağılımdır

Hs: Veriler normal dağılımda değildir.

şeklinde bir sıfır hipotezi kurulur. Sıfır hipotezi ile ilgili test büyüklüğünü hesaplayabilmek için örnek veri kümesindeki eleman sayısı n11 olması nedeniyle uygulanacak Shapiro-Wilk W testinin özellikleri gereği aşağıdaki hesaplamalar yapılır. Örnekleme küme elemanları (yani tüm veriler), işaretleri de göz önüne alınarak, küçükten büyüğe doğru

li119 125 129 131 131 132 133 141 153 166 202

biçiminde sıralanırlar.

 Bu verilerin ortalama değeri,

 

142 olmaktadır. Burada verilmiş olan küme ortalaması değerinden faydalanarak da

s2

(xixˆ)2

5708

ara değeri olarak hesaplanır.

 Örnek veri kümesindeki n11 eleman sayısı tek olduğu için,

alınarak b değeri, yukarda söylenmiş olduğu gibi

( ) ( ) ( ) ( ) ( ) katsayıları n11 için daha önceden hazırlanarak hizmete sunulmuş olan EK tablo 8 ‘de verilmiş Shapiro-Wilk tablosundan,

5601

değeri olarak hesaplanır.

 Bu işlemlerin sonucunda sıfır hipotezi ile ilgili test büyüklüğü,

78813 , 5708 0

626355 , 4498 ˆ)

( ) (

2 2

1

2 1

2

S b x x

x a

W n

i i n

i i i

olarak elde edilir.

Daha sonra,  1S 0,05 yanılma olasılığı ve n11 değerlerine göre daha önceden hazırlanmış Tablo 15‘deki; Shapiro-Wilk W testi tablosundan test için sınır değeri aşağıdaki şekilde alınır.

Wn,W11,0,050,850

Sonuçta; bu iki değerin karşılaştırmasından WWn, olduğu için, H0 hipotezi kabul, Hs hipotezi ret edilir.

Yorum: Bu yöntemle gerçekleştirilen bir normal dağılım uyum iyiliği testine göre bu örnek veri kümesinin elemanları 1S0,05 yanılma olasılığına göre normal dağılımda oldukları kabul edilebilirler.

Örnek 2: Bir verniyer okumaları sonucunda elde edilmiş ölçü değerleri, 160

207 153 141 131 133 132 129 125

119 li

olarak verilmiştir. Bu verilerin  1S 0,05 yanılma olasılığına göre normal dağılımda olup olmadıklarının Shapiro-Wilk W testine göre irdelenmek istenmektedir.

Çözüm 2: Bu problemde n10 çift sayıda eleman bulunmaktadır. Böyle bir problemin çözümü için, örnek 1 de olduğu gibi, paragraf 9.6.3 ‘de Shapiro-Wilk test yöntemi ile ilgili anlatılan işlem adımları süreç biçiminde uygulanır. Bu amaçla, hipotez testinin ilk işlem adımı olarak,

H : Veriler normal dağılımdır 0

H : Veriler normal dağılımda değildir. s

şeklinde bir sıfır hipotezi kurulur. Böyle bir sıfır hipotezi ile ilgili test büyüklüğünü hesaplayabilmek için örnek veri kümesindeki eleman sayısı n10 olması nedeniyle uygulanacak Shapiro-Wilk W testinin özellikleri gereği aşağıdaki hesaplamalar sırası ile gerçekleştirilir.

Örnekleme küme elemanları(yani tüm veriler), işaretleri de göz önüne alınarak, küçükten büyüğe doğru

li 119 125 129 131 132 133 141 153 160 207 biçiminde sıralanırlar. Bu verilerin ortalama değeri,

 

143 olmaktadır. Burada verilmiş olan küme ortalaması değerinden faydalanarak da

s2

(xixˆ)2

5950

ara değeri olarak hesaplanır.

 Örnek veri kümesindeki n10 eleman sayısı çift olduğu için, önceden hazırlanarak hizmete sunulmuş olan EK Tablo 8 ‘deki Shapiro- Wilk tablosundan,

ve buna bağlı olarak da

843776 ,

24681 b

bir diğer ara değerleri olarak hesaplanır.

 Bu işlemlerin sonucunda sıfır hipotezi ile ilgili test büyüklüğü

7868645 ,

5950 0 626355 , 4498 ˆ)

( ) (

2 2

1

2 1

2

S b x x

x a

W n

i i n

i i i

olarak hesaplanır.

Daha sonra,  1S 0,05 yanılma olasılığı ve n10 değerlerine göre daha önceden hazırlanmış Tablo 27 ‘deki; Shapiro-Wilk W testi tablosundan test için sınır değeri,

Wn,W10,0,050,842 olarak alınır.

Sonuçta; bu iki değerin karşılaştırılmasından WWn, olduğu için, H0 sıfır hipotezi kabul, Hs seçenek hipotezi ret edilir.

Yorum: Bu yöntemle gerçekleştirilen bir normal dağılım uyum iyiliği testine göre örnek küme elemanları  1S0,05 yanılma olasılığına göre normal dağılımda kabul edilebilirler.

Benzer Belgeler