Test dağılımları - Hipotez Testi ve Test Dağılımları

6.4. Hipotez Testi ve Test Dağılımları

6.4.2. Test dağılımları

x ml’dir. Bu durumda hipotezler aşağıdaki gibi olacaktır:

120

0: 

H (Firmanın ifadesi doğru) 120

1:

H (Firmanın ifadesi yanlış)

6.4.2. Test dağılımları

İstatistik açıdan hipotez testi yapılırken, kullanılacak test dağılımının belirlenmesi ikinci basamağı meydana getirmektedir. Test istatistiği seçilirken hipotez testinin ne amaçla yapıldığının ve eldeki verilerin özelliğinin ne olduğunun bilinmesi gerekmektedir.

İstatistikte genellikle aşağıda belirtilen üç farklı olayın veya sonucun ihtimali belirlenmeye çalışılmaktadır;

1) Ana kitleden çekilen örneklerin belirli bir özellik açısından ana kitleyi temsil edip etmediği,

2) Belirli bir değişken açısından gruplar arasında fark olup olmadığı yani, iki örnek ortalamasının veya ortalamalar arasındaki farkın farklılığı tesadüften mi kaynaklandığı yoksa gerçek mi,

3) İki değişken arasında istatistik açıdan önemli bir ilişki olup olmadığı.

Hangi istatistik test kullanılacağına karar verilirken öncelikle hipotez testinin ne amaçla yapıldığına karar verilmelidir. İlgilenilen değişken için gruplar arasında fark olup olmadığı ile mi ilgileniliyor, yoksa değişkenler arasında ilişkinin varlığımı belirlenmeye çalışılıyor. İlişki testleri iki değişken arasında ilişki olup olmadığını incelerken, farklılık testleri ilgilenilen değişken bakımından gruplar arasında fark olup olmadığını incelemektedir.

İkinci olarak veri setinde bulunan verilerin düzenlenmiş olup olmaması kullanılacak testin seçimi açısından büyük önem taşımaktadır. Sınıflandırılmış verilerde, daha çok her bir gruba giren frekanslar ilgi odağı olmaktadır. Sınıflandırılmamış verilerde ise merkezi eğilim veya merkezi yayılma ölçüleri ile tanımlanan veriler üzerinde çalışılmaktadır. Test seçiminde dikkat edilmesi gereken üçüncü husus, verilerin dağılımına ilişkin bir varsayımın yapılıp yapılmadığı ile alakalıdır. Parametrik testler verilerin dağılımına parametrik olmayan testlerden daha bağlıdır. Parametrik testlerin kullanılabilmesi için, değişken ölçüm düzeyinin oran veya aralık olması, verilerin normal dağılım göstermesi veya normal dağılıma yakın bir dağılıma sahip olması ve homojen varyans olması gerekmektedir (Boneu, 1960; Wilcox, 1987). Oysa parametrik olmayan testlerde verilerin dağılımı daha az önem taşımaktadır ve bu sebeple dağılımdan bağımsız testler olarak ta bilinmektedirler. Amacımıza ulaşabilmek için parametrik mi yoksa parametrik olmayan testler kullanılacağına karar verirken, sahip olunan verilerin ölçüm düzeyi büyük önem taşımaktadır. Genellikle sınıf ve sıra verilerde parametrik olmayan testler kullanılıyorken, aralık ve oran verilerde parametrik testler kullanılmaktadır.

Ancak zaman zaman oran/aralık veriler ile sıra/sınıf veriler birbiri ile karşılaştırılmaktadır. Bu durumda her iki test grubunu da kullanmak mümkün olabilmektedir. Lord (1953) parametrik testlerin sıra verilere de uygulanabileceğini savunmuştur. Dördüncü olarak, iki veya daha fazla grup karşılaştırılıyorken, bu grupların birbirinden bağımsız gözlemleri mi içerdiği, yoksa karşılaştırılan grupların verileri arasında ilişkimi olduğu bilinmelidir. Zira bu durum test

seçimini doğrudan doğruya etkilemektedir. Test seçiminde dikkat edilecek son husus, karşılaştırılan grup sayısı ile alakalıdır. Grup sayısı arttığında kullanılan testler ile, az olduğunda kullanılan testler birbirinden farklılık göstermektedir.

Veri setinde bulunan gözlemlerin dağılımının beklenen teorik bir dağılıma uyup uymadığının test edilmesinde “uygunluk (Goodness of fit) testi” kullanılmaktadır. Ayrıca her hangi bir veri setinde bulunan gözlemlerin dağılımının normal olup olmadığının belirlenmesinde eğrilik ve diklik katsayılarından yararlanılmaktadır. Öncelikle ilgili katsayılar hesaplanmakta, daha sonra istatistik hipotez testi ile dağılımın normal olup olmadığı test edilmektedir.

İki veya daha fazla grubu birbiri ile karşılaştırmada kullanılan testler ise Çizelge 6.3’te özetlenmiştir.

Çizelge 6.3. Gruplar Arasında Farklılık Olup Olmadığının Belirlenmesinde Kullanılan Testler

Veri özelliği Test tipi Veri tipi Grup

sayısı Test adı

Sınıflandırılmış Parametrik olmayan İlişkisiz

İlişkili

1 1 2 2+

2 3+

Binomial Ki kare testi

Fisher tam olasılık testi Ki kare testi

McNemar Testi Cochran Q testi Sınıflandırılmamış Parametrik olmayan İlişkisiz

İlişkili

1 2 2 2+

2 2 3+

Kolmogorov-Simirnov tek örnek testi

Kolmogorov-Simirnov çift örnek testi

Mann-Whitney U testi Medyan testi

Kruskal-Wallis H testi İşaret testi (sign test)

Wilcoxon işaretli mertebeler testi Friedman two way anova

Parametrik İlişkisiz

İlişkili

İlişkili/ilişkisiz 1 2 2+

2 3+

t testi t testi

Tek ve Çift Yönlü varyans analizi T testi

Basit faktöryel varyans analizi Tek yönlü kovaryans analizi

İki yönlü basit faktöryel ilişkisiz varyans analizi

Değişkenler arasında istatistik açıdan önemli bir ilişkinin olup olmadığı konusu da istatistikte sık incelenen konuların başında gelmektedir. Değişkenler arasında ilişki olup olmadığının belirlenmesinde kullanılan testler Çizelge 6.4’te verilmiştir.

Çizelge 6.4. Değişkenler Arasında İlişki Olup Olmadığının Belirlenmesinde Kullanılan Testler

Veri özelliği Test tipi Test adı

Sınıflandırılmış Parametrik olmayan

Phi katsayısı

Pearson olağanlık katsayısı (contingency coefficient) Cramer V

Goodman ve Kruskal lamda ()ölçüsü Goodman ve Kruskal tau değeri ( ⁾

Sınıflandırılmamış

Parametrik olmayan

Kendall tau ( ) a değeri Kendall tau ( ) b değeri Kendall tau ( ) c değeri

Goodman ve Kruskal gama ( ) ölçüsü (tek yönlü simetrik ilişki ölçümü) Somer d değeri (asimetrik ilişki ölçümü)

Spearman sıra korelasyon katsayısı Mantel-Haenszel ki kare

Kendall kısmi sıra korelasyon katsayısı Kısmi gama ( ) ölçüsü

Parametrik Pearson moment korelasyonu Pearson kısmi korelasyonu Eta değeri

Standartlaştırılmamış regresyon katsayısı Standartlaştırılmış regresyon katsayısı Part korelasyon

Hipotez testinde test dağılımları olarak (i) z dağılımı, (ii) t dağılımı, (iii) Ki kare )

(² dağılımı ve (iv) F dağılımı olmak üzere 4 farklı dağılım kullanılmaktadır. Şimdi bu dağılımları ayrı ayrı inceleyelim.

1. z dağılımı:

Daha önceki bölümlerde standart normal dağılım olarak incelediğimiz bu dağılım, normal dağılımın özel bir halidir. Standart normal dağılımın ortalaması ()sıfır ve standart sapması () 1’dir. Bu dağılımda değerler, sürekli tesadüfi değişkenin değerinin temsil eden

“z” değerleridir. “z” değeri aynı zamanda “standart birim” veya “standart skor” olarak da isimlendirilmektedir. “z” değerleri, tesadüfi değişkenlerin ortalamadan standart sapma olarak uzaklıkları ifade etmektedir. Örneğin z=2 ise, bu değer ortalamanın 2 standart sapma sağındaki değeri ifade etmektedir. “z” değerleri 0 ile 3.90 arasında değişen değerler almaktadır. Standart normal dağılımdan yararlanarak iki değer arasında kalan alanı bulmak

için hazırlanmış olan “z” tablosundan yararlanılmaktadır. “z” tablosunda satırlar virgülden sonra bir duyarlılığa sahip “z” değerlerini sütunlar ise virgülden sonraki duyarlılıkları ifade etmektedir. Bu tablo kullanılırken ilgili z değerinin karşısında bulunan değer 0 ile ilgilenilen

“z” değeri arasında kalan alanı vermektedir.

Eğer ana kitleye ait standart sapma biliniyorsa veya örnek hacmi yeterince büyükse (n>30), test dağılımı olarak “z dağılımı” kullanılmalıdır.

2. t dağılımı

Sürekli bir olasılık dağılımı olan t dağılımı, standart normal dağılımın özel bir halidir.

t dağılımı standart normal dağılımdan daha yayvan olan özel bir dağılımdır. Bu dağılımın tek parametresi serbestlik derecesidir. Bu dağılımın ortalaması sıfır, standart sapması

) 2 /(SD

SD ’dir. Örnek hacmi 30’u geçtiğinde (n>30), bu dağılım standart normal dağılıma dönüşmektedir. t dağılımın ait eğrinin şekli serbestlik derecesine bağlıdır. Bu dağılımın serbestli derecesi örnek hacminin 1 eksiğine eşittir (SD n1). t dağılımında kullanılacak olan test istatistiği bulunurken serbestlik derecesi ve güven katsayıları için hazırlanmış t tablosundan yararlanılmaktadır. t tablosu tek taraflı hazırlanabileceği gibi, çift taraflı olarak da hazırlanabilmektedir. Tablo tek taraflı hazırlandığında, t dağılımı simetrik olduğundan bulunan t değeri negatif taraf için negatif, pozitif taraf için pozitif olup birbirine eşittir.

Hipotez testlerinde ana kitleye ait standart sapma bilinmediğinde, örnek hacmi küçük olduğunda (n<30) ve ana kitleden çekilen örnekler normal veya normale yakın dağıldıklarında t dağılımı kullanılmaktadır.

3. Ki kare ( ) dağılımı ²

Ki kare dağılımı simetrik olmayıp sağa çarpık olan sürekli bir olasılık dağılımıdır.

Serbestlik derecesi (n-1) arttıkça çarpıklık azalmaktadır. Her bir serbestlik derecesi için ayrı bir  dağılımı söz konusudur. Serbestlik derecesi 30’dan büyük olan ²  dağılımları simetrik ² hale gelmekte ve normal dağılıma dönüşmektedirler. Aşağıda farklı serbestlik dereceleri için ki kare  dağılımının şekli gösterilmiştir. ²

 dağılımı ikiden fazla grup olan deneme sonuçlarına ait hipotezlerin test 2

edilmesinde, çapraz tablolar oluşturularak bağımsızlık testlerinin yapılmasında, homojenlik

testinin gerçekleştirilmesinde ve ana kitleye ait varyans veya standart sapmaların karşılaştırılmasında kullanılmaktadır.

SD=1

SD=4 SD=20

Farklı Serbestlik Derecelerinde  Dağılımları ²

 dağılımı özellikle ikiden fazla sonuca sahip denemelerde hipotez testini 2

gerçekleştirmek için kullanılmaktadır. Bu denemelerin 4 temel özelliği bulunmaktadır.

Bunlardan birincisi n sayıda denemenin yapılıyor olmasıdır. İkinci olarak her bir denemenin 2’den fazla sonucu bulunmaktadır. Denemelerin bağımsız olması ise üçüncü temel özelliği oluşturmaktadır. Son olarak olasılılar deneme boyunca sabit olmaktadır. Bu tür denemeler

“multinomial deneme” adı verilmektedir. Tesadüfen seçilmiş kişilere “amerikan otomobili”

“japon otomobili” nden daha iyi midir şeklinde sorulsa, kişilerin bu soruya vereceği cevap evet, hayır veya karasızım olacaktır. Bu örnekte soru yöneltilen her bir kişi deneme sayısını ifade etmektedir ve kişilerden alınan cevapları ikiden fazla sonucu kapsamaktadır. Ayrıca her bir kişinin verdiği cevapta birbirinden bağımsızdır. Dolayısıyla bu multinomial denemeye iyi bir örnek teşkil etmektedir. Bu gibi durumlarda  dağılımı hipotez testi için ² kullanılmaktadır. Burada gözlenen frekansların beklenen teorik bir dağılıma uyup uymadığı test edilmektedir (Goodness of fit test).  dağılımı aynı zamanda bağımsızlık testi ve ² homojenlik testi içinde kullanılmaktadır.

4. F dağılımı:

İki farklı örnekten veya ana kitleden hesaplanan varyansın karşılaştırılmasında F dağılımı kullanılmaktadır. F dağılımı v ve ₁ v2 olmak üzere iki tam sayılı parametresi olan sürekli bir olasılık dağılımıdır. v payın serbestlik derecesini, ₁ v2 ise paydanın serbestlik derecesini ifade etmektedir. F dağılımı simetrik olmayan, sağa çarpık bir dağılımdır. Her bir

serbestlik derecesi çifti için farklı bir dağılım olduğundan çok sayıda F dağılımı vardır. Örnek hacimleri birbirinden farklı iki örnekten hesaplanan varyansların karşılaştırılmasında ₂

2 2 1

S F  S

eşitliği kullanılmaktadır. Bu oranın normal koşullarda 1 olması beklenmektedir. Ancak bu oran genellikle birden farklıdır ve dolayısıyla çok sayıda F değeri mevcuttur. Bu F değerlerinin gösterdiği dağılım ise F dağılımıdır.

F Dağılımı F

F dağılım tablosundan yararlanırken iki farklı serbestlik derecesi olduğu unutulmamalıdır. İlgili serbestlik derecelerine ait F değeri F(v₁, v₂) şeklinde gösterilmektedir.

F tablosunda sütunlar paya ait (v ), satırlar ise paydaya aittir (₁ v2). Bu durumda eğer F(7, 15) için F tablosundan F değeri bulunacaksa tabloya aşağıdaki gibi bakılır:

SD ... 7

15 ... (F)

İstatistikte kullanılan testleri, kullandıkları test dağılımlarına göre de sınıflandırmak mümkündür. Kullandıkları test dağılımlarına göre istatistik testler Çizelge 6.5’te verilmiştir.

Çizelge 6.5. Kullandıkları Test Dağılımlarına Göre İstatistik Testler

Test dağılımı Test adı

Binomial

Ki kare

Binomiyal (n<26, p=0.5) İşaret testi (<26 fark) Ki kare testi

Pearson olağanlık katsayısı Friedman 2 yönlü varyans analizi

Tek yönlü kolmogorov-simirnov testi (n1+n2<60) Kruskal-Wallis testi

McNemar testi Medyan testi Phi katsayısı

Varyans ve kovaryans analizi

2 ve daha fazla grupta eş varyans analizi Çoklu korelasyon

Çoklu regresyon

Regresyon katsayılarının testi 2 gruplu ortalama karşılaştırmaları Pearson korelasyon katsayısı Spearman Rho

Kendall tau c

Eğrilik katsayısının testi Diklik katsayısının testi Mann-Whitney U (n1+n2<20) İşaret testi (>25 fark)

Wilcoxon testi (>25 fark)

Belgede 6.1. Örnekleme ve Örnekleme Dağılımı (sayfa 24-31)