• Sonuç bulunamadı

Çözüm 2: Böyle bir problemin iki örnekli Kolmogorow-Smirnow uyum testine göre çözümünde ilk işlem adımı olarak,

9.6. Normal Dağılımla İlgili Diğer Uyum İyiliği Test Yöntemleri

9.6.1. Jarque-Bera Testi

Jarque-Bera testi bir örnekleme ile ilgili n sonlu sayıda gözlemlerden kurulu bir deneysel kümenin kuramsal normal dağılıma uyum iyiliğini ölçen genel durumuyla 9.5 bölümünde anlatılmış olan çarpıklık ve basıklık testlerinin bir diğer şekilde ifade edilmiş halidir. Bu test yöntemi ilk defa bir ekonometrici olan A. K. Bera ve C. M. Jarque tarafından kullanılmış olduğu için bu isimle anılmaktadır. Temel düşüncesi veya konusu itibariyle bu test yöntemi, bölüm 9.5 anlatılmış olan normal dağılım testlerinde olduğu gibi, kuramsal normal dağılım eğrisinin geometrik özelliklerinden olan basıklık ve simetrik olma özelliklerine dayanmaktadır. Bu nedenle, Jarque-Bera normal dağılım uyum iyiliği testi bir momentler prensibine dayanan parametrik 2 bazlı test türlerinden sayılmaktadır. Bu amaçla, geliştirilmiş ve kullanılmakta olan böyle

bir testin sıfır hipotezi, H0

: Veriler normal dağılımdır

Hs: Veriler normal dağılımda değildir.

şeklinde kurulabilir. Sıfır hipotezi ile ilgili test büyüklüğü deneysel kümenin basıklık ve çarpıklık ölçütlerinin birlikte gerçekleştirilmiş dönüşümlerinden elde edilebilir. Bu nedenle, sıfır hipotezi daha ayrıntılı olarak, beklenen çarpıklığın sıfır değerinde ve beklenen basıklığın fazlalığı üç değerinde olacağı prensiplerine dayalı geliştirilmiş bir bileşik hipotez olmaktadır. Bu amaçla, mevcut sıfır hipotezinin geçerliliğinin irdelenmesi için geliştirilmiş test büyüklüğü,

4 ) ) 3 ( (

6

2

2 

K

n S

JB 9-25

formülünden hesaplanır. Bu amaçla kullanılmakta olan (9-25) test büyüklüğü hesaplama formülünde geçen her bir eleman,

n : Veri sayısını (veya genellikle serbestlik derecesini), S : Örneklemenin çarpıklık ölçüsünü,

K : Örneklemenin basıklık ölçüsünü

göstermektedir. Burada sözü edilen son iki istatistik değerler,

32

analitik bağıntılarından faydalanılarak farklı dereceden moment değerlerine göre hesaplanabilir.

Burada, her iki formülde geçen, deneysel ortalama, 2 ikinci merkezsel moment veya varyans değeri; sırasıyla 3 üçüncü ve 4 dördüncü merkezsel momentlerdir.

Sonuçta, bu değerlerin kullanılması ile (9-25) ‘deki formülden hesaplanacak bir JB test büyüklüğü istatistiği anlamda f 2 serbestlik derecesine göre asimtotik olarak 2-dağılımına yaklaşır. Bir örnekleme veri kümesinde çarpıklığı sıfırdan ve basıklık da üç değerinden sapmalar gösterdikçe, JB test büyüklüğü değeri de benzer oranlarda fazlalıklar göstermektedir. Tersi durumda, bu fazlalıklar küçüleceğinden her zaman sözü edilen değerlere bir yakınsama yaşanacak, kısaca yakınsayacaktır.

Üçüncü işlem adımında, f 2 ve 1S yanılma olasılığına göre ilgili 2 -dağılımı tablosundan 2f, tablo sınır değeri alınır. Daha sonra, deneysel veri kümesi elemanlarından hesaplanmış olan JB test büyüklüğü ile 2f, tablo sınır değeri karşılaştırılır. Her iki değerin birbiriyle karşılaştırılması neticesinde, eğer JB<2f, ise; Ho hipotezi kabul, Hs seçenek hipotezi ret edilir.

Tersi durumda eğer JB>2f, olursa, Ho hipotezi ret, Hs seçenek hipotezi kabul edilir.

Yorum: Sıfır hipotezinin geçerli olması halinde, veriler 1S yanılma olasılığına göre normal dağılımda oldukları kabul edilebilir.

Not: Burada konuyla ilgili bir durumu vurgulamak gerekirse; Jarque-Bera testinde deneysel kümenin basıklığı ve çarpıklığı birlikte ele alınarak hipotez testinin irdelemesi gerçekleştirilmiştir. H seçenek hipotezinin geçerli olduğu s durumlarda verilerin normal dağılımda olmamasına neden olan parametre çarpıklık mı? yoksa basıklık mı? dır kararı açık bir biçimde verilememektedir.

Böyle bir durum için burada tekrar hatırlatmak gerekirse; bu gibi istekler için daha detaylı bilgi veren basıklık ve çarpıklık ölçütleri ayrı ayrı yeniden, bölüm 9.5 de anlatıldığı şekilde irdelemek gerekir.

Bu amaçla, önce çarpıklık c1S ve basıklık c2K3 rastgele değişkenlerinin her ikisi de merkezi olmayan birer normal dağılımda olduklarından bunlar kendi standart sapmalarına bölünerek merkezi normal dağılıma sahip standart rastgele değişkenler haline dönüştürülürler. Bu durumda her biri için standartlaştırılmış rastgele değişken değerleri,

c) Çarpıklık için test büyüklüğü :

1 6

1

c n

z 9-26a

d) Basıklık için test büyüklüğü :

2 24

2

c n

z 9-26b

olarak hesaplanır. Sonra, bu (9-26a) ve (9-26b) standart rastgele değişken değerleri standart normal dağılım tablolarından çift taraflı yanılma olasılığına göre alınacak,

12

z sınır değerleri ile karşılaştırılır(Şekil 27). Bu gibi bir karşılaştırma neticede;

Eğer z1

12

z ve z2

12

z ise; verilerin dağılımında çarpıklık ve basıklık yoktur hükmüne varılır. Sonuçta yorum; 1S yanılma olasılığına göre bu veriler normal dağılımdadır denebilir.

 Tersi durumda eğer z1

12

z ve z2

12

z bulunmuş ise; bu verilerin dağılımında hem çarpıklık hem de basıklık vardır. Dolayısı ile yorum; bu verilerin  1S yanılma olasılığına göre normal dağılımda olmadıklarına hüküm verilir.

z1

12

z ve z2

12

z olması halinde, çarpıklık var ancak basık olmadıklarına karar verilir.

Ancak, bu durumda dağılımın çarpıklığı hangi yöne doğru olduğu belirsiz olduğundan, sağa ya da sola çarpık bir dağılımdadırlar denir.z2

12

z ve z2

12

z çarpık değil ancak basıktır denir.

Yorum; bu ölçütlere göre veriler normal dağılımda oldukları söylenemez.

Örnek: Bir önceki örnekte verilmiş olan verniyer okuması değerlerinin, xi= 17,5 18,4 18,5 18,6 19,2 19,2 19,4 19,5 19,6 olmadıklarının irdelenmesi istenmektedir.

Çözüm: Böyle bir problemin Jarque-Bera testi göre istatistik olarak irdelenebilmesi için burada da bir önceki örnek çözümde yapılan işlemlere benzer şekilde hareket edilerek, önce her bir ölçüye ilişkin düzeltme değerleri hesaplanır.

Bu amaçla; ölçülerin aritmetik ortalaması alınarak, kesin değeri :

 

21,918 .

değerleri hesaplanır. Bu değerlere göre,

0581

27855

ara değerlerinden faydalanılarak ilgili test büyüklüğü,

1125 göre çarpık ve basık olmadıkları söylenebilir.

Bu yoruma rağmen verileri daha detaylı bir şekilde irdelemek amacıyla, ikinci bir hipotez testi olarak, çarpıklık ve basıklık durumları ayrı ayrı ele alınarak yeniden test edilmeleri istenirse; böyle bir işlem için,

Ho : Veriler çarpık ya da basıktır.

Hs : Veriler çarpık ya da basık değildir.

şeklinde bir sıfır hipotez kurulur. Sonra, sıfır hipotezine göre bunların herbirine ilişkin test büyüklüğü değerleri,

a) Çarpıklık için test büyüklüğü : 0,168 olasılığına göre normal dağılım tablosundan çift taraflı test değeri olarak,

96

alınır. Sonuçta: bu iki test büyüklüğü ile tablo sınır değerlerinin birbirileri ile karşılaştırılmalarından,

96 , 1 168

,

0 0,975

1 2

1   

z

z

z

olduğu için H0 sıfır hipotezi kabul, Hs seçenek hipotezi ret edilir (Şekil 29).

Yorum: Bu ölçüler, ortalama değeri xˆ21,918mm. ve birim ölçünün deneysel standart sapması s2,145mm. parametre değerlerine,  0,05 yanılma olasılığı ve f=2 serbestlik derecesine göre normal dağılımdadırlar söylenebilir.

Diğer bir ifade ile bu ölçüler arasında anlamlı bir çarpıklık olmadığı kararına varılmıştır.

Benzer şekilde, basıklık irdelemesi için de

z2 1,041< 0,975 1,96

1 2  

z

z

olduğundan H sıfır hipotezi kabul, 0 H seçenek hipotezi ret edilir. s

Yorum: bu ölçüler, ortalama değeri xˆ21,918mm. ve birim ölçünün deneysel standart sapması s2,145mm. değerlerine,  0,05 yanılma olasılığı ve f=2 serbestlik derecesine göre normal dağılımdadır denebilir. Aynı zamanda bu ölçülerin dağılımında, anlamlı bir çarpıklık olmadığı gibi anlamlı bir basıklıkta bulunmadığından söz edilebilir.

9.6.2. D’Agostino 2 Testi

D’Agostinonun 2 test yönteminde konuyla ilgili, diğer hipotez testlerinde olduğu gibi, kuramsal normal dağılımın geometrisiyle ilişkili olan çarpıklık ve basıklık özelliklerinden faydalanılır. Bu amaçla kurulacak bir sıfır hipotezi,

H0

: Veriler normal dağılımdır

Hs: Veriler normal dağılımda değildir.

biçiminde ifade edilebilir.

Böyle bir hipotez testinin 1S yanılma olasılığına göre istatistik olarak irdelenebilmek için sıfır hipotezi ile ilgili standart rastgele değişkenin hesaplanmasında aşağıdaki işlemler sırası ile gerçekleştirilir. Bu gibi bir işlem sürecinde; önce, n deneysel veri sayısı seçilerek b1 çarpıklık ve b2

bağıntılarından hesaplanır. Burada, önce b çarpıklık değeri için, 1

)

değeri elde edilir. Buradan hesaplanmış olan Z( b1)N(0,1)

standart normal dağılıma sahip bir rastgele değişken olmaktadır. Benzer şekilde bir dönüşüm de, b basıklık değeri için uygulanırsa, 2

1

standart rastgele değişkeni elde edilir. Bu değer de )

parametrelerine göre standart normal dağılımda olmaktadır.

Daha sonra her iki Z( b1) ve Z(b2) standart rastgele değişken değerlerinin kareleri toplamından sıfır hipotezi ile ilgili standart dağılımlı rastgele değişken değeri ya da test büyüklüğü,

1

2

2

2

2Z( b )  Z(b )

 9-28

biçiminde bulunabilir. Bu değer f 2 serbestlik derecesine göre 2-dağılımında olur. Sıfır hipotezin istatistik irdelenmesi amacıyla, bu test büyüklüğü, 1S yanılma olasılığı ve f 2 serbestlik derecesine göre ilgili 2-dağılım tablosundan alınan 2f, kritik değeri ile karşılaştırılması neticesinde, eğer 2<

2 ,

f ise H0 sıfır hipotezi kabul, Hs seçenek hipotezi ret edilir.

Yorum: Bu veriler; seçilen 1S yanılma olasılığına ve f 2 serbestlik derecesine göre normal dağılımda oldukları kabul edilebilirler.

Tersi durumda eğer 2>2f, olursa; H0 sıfır hipotezi ret, Hs seçenek hipotezi kabul edilebilir.

Yorum: bu veriler seçilen 1S yanılma olasılığına ve f 2 serbestlik derecesine göre artık normal dağılımda olmadıkları söylenebilir.

Örnek: Bir önceki örnekte verilmiş olan verniyer okuması değerlerinin, xi= 17,5 18,4 18,5 18,6 19,2 19,2 19,4 19,5 19,6

19,7 19,8 20,2 20,3 20,4 20,6 20,7 20,8 21,1 21,2 21,3 21,4 21,5 21,6 21,7 21,8 21,9 22,1 22,2 22,3 22,4 22,6 22,7 22,8 22,9 23,2 23,3 23,4 23,5 23,6 23,7 23,8 24,1 24,3 24,5 24,7 24,9 25,2 25,5 25,8 26,5mm.

D’Agostino 2-testine göre; 0,05 yanılma olasılığı ile normal dağılımda olup olmadıkları irdelenmek istenmektedir.

Çözüm: Böyle bir problemin D’Agostino 2 testine göre çözümü için paragraf 9.6.2 ‘de anlatılmış konuda olduğu gibi benzer bir işlem yolu izlenir. Böyle bir işlem yolunun izlenmesi sonucunda uygulanacak hipotezin ilk işlem adımı olarak,

H0: Veriler normal dağılımdır

Hs: Veriler normal dağılımda değildir.

biçiminde bir sıfır hipotezi kurulur. İkinci işlem adımında bu sıfır hipotezi ile ilgili bir test büyüklüğü hesaplanır. Bu amaçla gerçekleştirilecek hipotezle ilgili ilk işlem adımı olarak, burada ölçülerin ortalamasını hesaplamak için veri sayısı

50

n olmak üzere;

Kesin değeri(aritmetik ortalama) :

 

21,918 . 50

ˆ 1 x mm

x 

deneysel standart sapması da :

   

2,145 .

1 50

ˆ) ( 1

ˆ)

( 2

2 1

1 2

2

x mm x n

x

s xi i 









 

 







 

olarak hesaplanır. Daha sonra, çarpıklık ve basıklık değerleri ile ilgili parametre değerleri,

0581

formüllerinden elde edilmiş olur.

Not: burada dikkat edilirse; b1 çarpıklık ve b2 basıklık değerleri Jarque- Bera testindeki b1S ve b2 K değerlerine eşit değerler olmaktadır. Daha sonra buradan, dağılımın çarpıklığı için,

177859862

ara değerlerinden faydalanılarak,

2303

rastgele değişken değeri hesaplanır. Benzer şekilde, basıklık değeri için de

2,882352941

0,357060188

ara değerlerinden faydalanılarak standart rastgele değişken değeri,

2235

olarak hesaplanır.

Sonuçta sıfır hipotezine ilişkin test büyüklüğü, normal dağılımlı bu iki rastgele değişkenden (9-28) formülüne göre,

( 1)

2

( 2)

2 1,55

2

0Z bZ b

olarak elde edilir.

Daha sonra bu test büyüklüğü değeri istatistik olarak irdelemesini sağlamak amacıyla, f 2 serbestlik derecesine ve 1S0,05 yanılma olasılığına göre ilgili 2-dağılım tablosundan alınan 2f, 22,0,055,99 değeri ile bir karşılaştırması gerçekleştirilir.

Burada yapılan karşılaştırma neticesinde, 02<2f, olduğundan H0 sıfır hipotezi kabul, H seçenek hipotezi ret edilir. s

Yorum: Bu veriler; seçilen  1S0,05 yanılma olasılığına ve f 2 serbestlik derecesine göre normal dağılımda oldukları kabul edilebilirler.

Bu yoruma rağmen verilerin çarpıklık ve basıklık yönünden daha detaylı bir şekilde irdelenebilmesi yönünden, bu verilere ikinci bir hipotez testi olarak, çarpıklık ve basıklık testleri yeniden uygulanabilir. Böyle bir işlem için diğer yöntemlerde olduğu gibi, önce

Ho : Veriler çarpık ya da basıktır.

Hs : Veriler çarpık ya da basık değildir.

şeklinde bir sıfır hipotez kurulur. Sonra, sıfır hipotezine göre bunların herbirine ilişkin test büyüklüğü değerleri,

a) Çarpıklık için test büyüklüğü : Z( b1)0,2391 c) Basıklık için test büyüklüğü : Z(b2)1,2235

olarak hesaplanır. Bu test büyüklükleri ile ilgili sınır değeri ya da kritik bir değer, daha önceki konulardaki benzer düşünceden hareket edilerek,  0,05 yanılma olasılığı ile ilgili normal dağılım tablosundan çift taraflı değeri için,

96 ,

975 1

, 0

1 2  

z

z

olarak alınır. Sonuçta bu iki değerin karşılaştırmasından 2391

, 0 ) ( b1

Z > 0,975 1,96

1 2  

z

z

olduğu için H0 sıfır hipotezi ret, Hs seçenek hipotezi kabul edilir(Şekil 31).

Yorum: Bu ölçüler, ortalama değeri xˆ21,918mm. ve birim ölçünün deneysel standart sapması s2,145mm. değerlerine,  0,05 yanılma olasılığı ve f=2 serbestlik derecesine göre normal dağılımda olmadıkları söylenebilir. Neticede, bu ölçüler arasında anlamlı bir çarpıklığın olduğuna karar verilir.

Buna rağmen basıklık testi parametresi için, 2235 , 1 ) (b2

Z < 0,975 1,96

1 2  

z

z

durumu geçerli olduğundan H0 sıfır hipotezi kabul, Hs seçenek hipotezi ret edilir.

Yorum: bu ölçüler, ortalama değeri xˆ21.918mm. ve birim ölçünün deneysel standart sapması s2.145mm. değerlerine, 0.05 yanılma olasılığı ve f=2 serbestlik derecesine göre normal dağılımdadır denebilir. Aynı zamanda ölçülerin dağılımında, anlamlı bir çarpıklık olmasına karşılık, anlamlı bir basıklıktan söz edilememektedir.

Benzer Belgeler