HİPOTEZ TESTLERİNE GİRİŞ

(1)

BÖLÜM 9

HİPOTEZ TESTLERİNE GİRİŞ

Önceki bölümlerde temel olasılık kavramlarının yanında parametre tahmini ve tahmin edicilerin özellikleri incelendi. Bir parametre için iyi bir tahmin edici bulduktan sonra gözlemlere dayalı bir tahmin değeri elde edilir. Bu tahminin kitle parametresini temsil edip etmediği sınanmalıdır. Bu bölümde, kitle parametrelerine ilişkin hipotez testleri ile ilgili temel kavramlar ile normal dağılımın parametrelerine ilişkin hipotez testleri incelenecektir.

Daha sonra, kitle parametrelerine ilişkin hipotez testleri ile test istatistiklerinin bulunma yöntemleri üzerinde durulacaktır. Bayes testleri ile kitle parametrelerine ait güven aralıkları da bu bölümde incelenecek konular arasındadır.

9.1. Genel Kavramlar

Bu kısımda, hipotez testleri ile ilgili temel tanım ve kavramlar kısaca özetlenecektir.

Burada, parametre kümesi reel sayıların bir alt kümesi olup  ile gösterilecektir.

Tanım 9.1.1 Kitlenin parametresi hakkındaki herhangi bir iddiaya hipotez denir 

Genellikle, iki tür hipotezden bahsedilir. Bunlar; H ile gösterilen yokluk hipotezi ve

₀

H (bazen

a

H ) ile gösterilen alternatif hipotezlerdir. Ayrıca,

₁

     ve

₀ ₀^c

0 0c

     olmak üzere bu hipotezler genellikle, herhangi bir   için H

₀

:   

₀

ve H

_a

:   şeklinde ifade edilir. Hipotez testlerinde amaç deneysel gözlemlere bağlı

₀^c

olarak kitle parametreleri hakkında istatistiki sonuç çıkarımlar yapmaktır. Yani, yapılan denemeler sonunda elde edilen gözlem değerlerine göre H

₀

:    yokluk hipotezinin

₀

:

0^c

H

a

  alternatif hipotezine karşı test edilmesidir. Sonuçta, gözlem değerlerine bağlı

(2)

olarak H

₀

:    hipotezi ya red edilir ya da red edilemez. Hipotez testi problemi genel

₀

olarak

0

:

0

H   karşı H

_a

:  

₀^c

şeklinde ifade edilir. Ayrıca, hipotezler basit ve karmaşık olmak üzere de iki gruba ayrılır.

Parametre kümesinde sadece bir elemanı olan hipotezlere basit (simple) hipotez, birden fazla eleman olan hipotezlere de karmaşık hipotez denir. Örneğin, H

₀

:   

₀

bir basit hipotezdir (  

₀

{ } 

₀

) dır. Diğer taraftan, H

_a

:   

₀

veya H

_a

:   

₀

gibi hipotezler karmaşık hipotezlerdir.

Tanım 9.1.2 H yokluk hipotezini red etmek için oluşturulan bir kurala test denir.

₀

Gözlem değerlerine bağlı olarak, H yokluk hipotezinin red edileceği noktaların kümesine

₀

testin red bölgesi denir ve R ile gösterilir 

1

,

2

, ,

_n

X X  X parametresi  olan kitleden bir örneklem, bu örneklemin gözlem değerleri ( , , , x x

_{1 2}

 x 

_n

) ve  yı tahmin etmek için de ( ) T X

 istatistiği önerilmiş olsun. Bu istatistiğin değerine t diyelim ( ( ) T x  t

 ). Buna göre, red bölgesi R olan ( ) T X

 tahmin edicisine bağlı olarak test kuralı

  ^{1 ,} ^{( )}

0 , ( )

^c

x T x

  T x 

    

 

R R

şeklinde ifade edilebilir. Yani, ( ) T X

 istatistiğinin değeri R nin bir elemanı ise

0

:

0

H    yokluk hipotezi red edilir. Aksi halde red edilemez. Burada, ( )  x

 test istatistiğinin gözlem değeri olup ( )  X

 , sadece 0 ve 1 değerlerini alan Bernoulli rasgele değişkenidir. Yani ( )  X

 test istatistiği olup, ( )  x

 bu test istatistiğinin gözlem değeridir.

Örneğin, X X

₁

,

₂

, ,  X

_n

rasgele değişkenlerinin değerleri ( , , , x x

_{1 2}

 x 

_n

) şeklinde gözlenmiş ve test kuralı, “ x

_n

 ise 3 H

0

:   yokluk hipotezi red edilir” şeklinde

0

oluşturulmuş ise testin red bölgesi,  { : x x

_n

 3}

R  şeklinde olur. Bu durumda test kuralı,

(3)

  ^{1 ,} _{0 ,}

ⁿ

³ ₃

n

x x

  x 

   



olarak yazılır. Hipotez testlerinde amaç böyle bir kuralın oluşturulması yani, testin red bölgesinin belirlenmesidir. Bu kuralın nasıl elde edileceğine ilişkin birçok yöntem öne sürülebilir. Ancak, parametrelerin en çok olabilirlik tahmin edicilerine bağlı olarak oluşturulan en çok olabilirlik oran testleri öne çıkmaktadır.

Hipotez testlerinde genellikle örneklemin normal dağılımdan geldiği varsayılır. Veriler normal dağılıma uygun değilse, dönüşümler yapılarak normallik varsayımları sağlatılır.

Normal olmayan durumlarda, merkezi limit teoreminden faydalanılır.

( ,

2

)

N   dağılımından bir örneklem X X

1

,

2

, ,  X

_n

olsun. Normal dağılımın beklenen değerine ilişkin hipotezler varyansın durumuna göre değişir. Aşağıdaki örneklerde, önceden belirlenen ve testin anlam düzeyi olarak bilinen   birinci tür hata olasılığı ile testin gücü bu bölümün üçüncü kısımında incelenecektir. Dolayısı ile, bu kısımda testlerin gücü ayrıntıya girilmeden verilecektir. Testin gücü denildiği zaman H yokluk hipotezinin red

₀

edilmesi olasılığını anlayacağız.

A) Kitle varyansı 

²

biliniyor:

1

,

2

, ,

_n

X X  X beklenen değeri  _varyansı 

²

olan normal dağılımdan bir örneklem ise n X (

_n

 

₀

) /  ~ (0,1) N dir. ~ Z N (0,1) ve ( P Z  z

_

)  olmak üzere, normal  dağılımın beklenen değeri  için hipotez testleri aşağıda özetlenmiştir. Aşağıdaki test istatistiğinin hesaplanan değeri her üç durumda da aynıdır ( z

_h

 n x (

_n

 

₀

) /  ). Ayrıca

z

_

değerleri standart normal dağılım tablosundan bulunur.

1. H

₀

:   

₀

yokluk hipotezinin H

_a

:   

₀

alternatif hipotezine karşı testi problemini düşünelim. Burada, H

₀

:   

₀

hipotezi yerine H

₀

:   

₀

de yazılabilir. Bu problem için test fonksiyonu,

  ^{1 ,}

0 , diğer yerlerde z

h

z

x

^

  

  



(4)

şeklindedir. Yani, z

_h

 z

_

ise H

₀

:   

₀

hipotezi H

_a

:   

₀

alternatif hipotezine karşı red edilir. Testin red bölgesi ile red bölgesinin alanı Şekil (9.1.1a) da verilmiştir.

Şekil 9.1.1a H

₀

:   

₀

hipotezinin H

_a

:   

₀

alternatif hipotezine karşı testi problemi için red bölgesi ve alanı (varyans biliniyor)

2. H

0

:   

0

yokluk hipotezinin H

_a

:   

0

alternatif hipotezine karşı testi problemi ( H

0

:   

0

hipotezi yerine H

0

:   

0

de yazılabilir) için test fonksiyonu,

  ^{1 ,}

0 , diğer yerlerde z

h

z

x

^

   

  



olup z

_h

  z

_

ise H

₀

:   

₀

yokluk hipotezi H alternatif hipotezine karşı red edilir.

_a

Yine testin red bölgesi ile red bölgesinin alanı Şekil (9.1.1b) de verildiği gibidir.

Şekil 9.1.1b H

₀

:   

₀

hipotezinin H

_a

:   

₀

alternatif hipotezine karşı testi problemi için red bölgesi ve alanı (varyans biliniyor)

3. H

₀

:   

₀

yokluk hipotezinin H

_a

:   

₀

alternatif hipotezine karşı testi problemi için test fonksiyonu,

  ^{1 ,}

^{/ 2}

0 , diğer yerlerde z

h

z

x

^

  

  



olup, | z

_h

|  z

__/2

ise H

₀

:   

₀

hipotezi H alternatif hipotezine karşı red edilir. Testin

_a

red bölgesi ile red bölgesinin alanı (Şekil 9.1.1c) de verildiği gibidir.

(5)

Şekil 9.1.1c H

₀

:   

₀

hipotezinin H

_a

:   

₀

alternatif hipotezine karşı testi problemi için red bölgesi ve alanı (varyans biliniyor)

B) Kitle varyansı 

²

bilinmiyor:

Kitle varyansı 

²

bilinmiyorsa S örneklem varyansı ile tahmin edilir.

_n²

S nin değeri

_n²



2

için kullanılır. X ler bağımsız

i

X

_i

~ ( , N  

²

) ise, n X (

_n

  ) / S

_n

~ t

_n_₁

olduğu altıncı bölümde gösterildi. P t (

_n_₁

 t

_n_₁

( ))   olmak üzere, varyansın bilinmediği  durumda, normal dağılımın beklenen değeri için oluşturulacak hipotez testleri aşağıda özetlenmiştir. Aşağıdaki test istatistiğinin hesaplanan değeri her üç durumda da



0

 /

h n n

t  n x   s dir. t

_n_₁

( )  değerleri t-dağılım tablosundan bulunabilir.

1. H

₀

:   

₀

yokluk hipotezinin H

_a

:   

₀

alternatif hipotezine karşı testi problemi için test fonksiyonu,

  ^{1 ,}

¹

^{( )}

0 , diğer yerlerde

h n

t t

x 

  

^

  



şeklindedir. Yani, t

_h

 t

_n_₁

( )  ise H

₀

:   

₀

hipotezi H

_a

:   

₀

alternatif hipotezine karşı red edilir. Testin red bölgesi ile red bölgesinin alanı Şekil (9.1.2a) da verildiği gibidir.

Şekil 9.1.2a H

₀

:   

₀

hipotezinin H

_a

:   

₀

alternatif hipotezine karşı testi

problemi için red bölgesi ve alanı (varyans bilinmiyor)

(6)

2. H

₀

:   

₀

yokluk hipotezinin H

_a

:   

₀

alternatif hipotezine karşı testi problemi için test fonksiyonu,

  ^{1 ,}

¹

^{( )}

0 , diğer yerlerde

h n

t t

x 

   

^

  



şeklinde olup t

_h

  t

_n_₁

( )  ise H

₀

:   

₀

hipotezi H

_a

:   

₀

alternatif hipotezine karşı red edilir. Testin red bölgesi ile red bölgesinin alanı Şekil (9.1.2b) de verildiği gibidir.

Şekil 9.1.2b H

₀

:   

₀

hipotezinin H

_a

:   

₀

alternatif hipotezine karşı testi problemi için red bölgesi ve alanı (varyans bilinmiyor)

3. H

₀

:   

₀

yokluk hipotezinin H

_a

:   

₀

alternatif hipotezine karşı testi problemini düşünelim. Bu problem için de test fonksiyonu

  ^{1 ,}

¹

^{( / 2)}

0 , diğer yerlerde

h n

t t

x 

  

^

  



şeklindedir. Yani, | t

_h

|  t

_n_₁

( / 2)  ise H

₀

:   

₀

yokluk hipotezi H

_a

:   

₀

alternatif hipotezine karşı red edilir. Testin red bölgesi ile red bölgesinin alanı Şekil (9.1.2c) de verilmiştir.

Şekil 9.1.2c H

₀

:   

₀

hipotezinin H

_a

:   

₀

alternatif hipotezine karşı testi

problemi için red bölgesi ve alanı (varyans bilinmiyor)

(7)

C) Kitle varyansı 

²

için testler:

1

,

2

, ,

_n

X X  X beklenen değeri  , varyansı 

²

olan normal dağılımdan bir örneklem olsun. H

₀

: 

²

 

₀²

yokluk hipotezini

i) H

_a

: 

²

 

₀²

ii) H

_a

: 

²

 

₀²

iii) H

_a

: 

²

 

₀²

alternatif hipotezlerine karşı   anlam düzeyinde test etmek isteyelim. S nin dağılımı

_n²

2 2

0

:

0

H    hipotezi altında ( n  1) S

_n²

/ 

₀²

~ 

_n²_₁

olup H hipotezinin reddine ilişkin

₀

test kuralları ve red bölgeleri ile kritik değerleri K

_h

 ( n  1) S

_n²

/ 

₀²

olmak üzere aşağıda verilmiştir. Burada X

_n²__1,_

değerleri ki-kare dağılım tablosundan bulunur.

Şekil 9.1.3a

H

₀

: 

²

 

₀² hipotezinin

H

_a

: 

²

 

₀² alternatifine karşı testi için red bölgesi ve red bölgesinin alanı

Buna göre, K

_h

 

_n²__1,_

ise H

₀

: 

²

 

₀²

yokluk hipotezi   anlam düzeyinde

2 2

:

0

H

a

   alternatif hipotezine karşı red edilir (şekil (9.1.3.a)).

Şekil 9.1.3b

H

₀

: 

²

 

₀² hipotezinin

H

_a

: 

²

 

(8)

Benzer şekilde, K

_h

 

_n²_{ }_1,1 _

ise H

₀

: 

²

 

₀²

yokluk hipotezi   anlam düzeyinde

2 2

:

0

H

a

   alternatif hipotezine karşı red edilir (Şekil (9.1.3b)).

Şekil 9.1.3c

H

₀

: 

²

 

₀² hipotezinin

H

_a

: 

²

 

Ayrıca, K

_h

 

_n²_{ }_1,1 __{/ 2}

veya K

_h

 

_n²__{1, / 2}_

ise H

₀

: 

²

 

₀²

yokluk hipotezi   anlam düzeyinde H

_a

: 

²

 

₀²

alternatif hipotezine karşı red edilir (Şekil (9.1.3c)).

Örnek 9.1.1 Bir istatistik dersinden öğrencilerin notları beklenen değeri  _{, varyansı}



2

olan normal dağılıma sahiptir. Rasgele seçilen 50 öğrencinin notları aşağıda verilmiştir.

50 Öğrencinin istatistik dersinden aldığı notlar

67 50 65 26 72 25 64 68 20 30 65 72 30 26 12 67 17 16 65 75 20 12 21 60 81 29 51 37 80 44 40 26 71 43 50 75 55 65 76 38 47 24 87 38 47 43 80 24 45 59

a) 

²

 400 olsun (kitle varyansı biliniyor). H

₀

:   45 yokluk hipotezini

: 45

H

a

  alternatif hipotezine karşı   0.05 anlam düzeyinde test etmek isteyelim.

( ) 0.05

P Z  z

_

 ise normal dağılım tablosundan z

_

 1.645 dir. Buradan,

(

0

) / 50 (48 45) / 20 1.06

h n

z  n x      

(9)

olup bu değer 1.645 den küçüktür ( z

_h

 1.06 1.645   z

_

) yani, H

₀

:   45 hipotezi

  0.05 anlam düzeyinde H

_a

:   45 alternatif hipotezine karşı red edilemez. Testin red bölgesi { : x n x (

_n

 45) / 20 1.645} 

 olup red bölgesinin alanı Şekil (9.1.4a) da verilmiştir.

Şekil 9.1.4a Örnek (9.1.1a) daki hipotez testi propblemi için testin red bölgesi ve red bölgesinin alanı (   0.05 )

Aynı hipotezi   0.025 anlam düzeyinde test etmek isteseydik, ( P Z  z

_

) 0.025  için z

_

 1.96 olup, z

_h

 1.06 1.96   z

_

olduğundan H

0

:   45 yokluk hipotezi

0.025   anlam düzeyinde de H

_a

:   45 alternatif hipotezine karşı red edilemez. Bu problem için testin red bölgesi { : x n x (

_n

 45) / 20 1.96} 

 olup red bölgesinin alanı Şekil

(9.1.4b) de verilmiştir.

Şekil 9.1.4b Örnek (9.1.1a) daki hipotez testi propblemi için testin red bölgesi ve red bölgesinin alanı (   0.025 )

b) Testin gücünün H yokluk hipotezinin red edilmesi olasılığı olduğunu söylemiştik.

₀

Testin gücü ileride tekrar tartışılacaktır (Tanım 9.3.2)).   0.05 için testin güç fonksiyonu

( ( )   ile gösterirsek),

(10)

0 0

1 0

0 0

( ) ( )

( ) ( Red)

( ) ( ) ( )

n n

n

n X n X

P H P z P z

n X n n

P z P Z z

    

  

   

   

    

  

       

                

      

                 



0.05



50 ( 45)

1.645 (1, )

P Z  20    P Z z 

          

dir. İkinci testin (   0.025 ) güç fonksiyonu ise,

2 0

50 ( 45)

0.025

( ) ( Red) 1.96 ( (2, ))

P H

_

P Z 20  P Z z

               

 

olarak hesaplanmıştır.  nün değişik değerleri için z

_

(1, )  ve z

_

(2, )  değerleri ile bu değerlere karşılık gelen olasılıklar (yani, testin gücü) normal dağılım tablosundan bulunarak aşağıda tablo halinde verilmiştir.

Tablo değerlerinden de görüldüğü gibi testin gücü,  anlam düzeyine bağlıdır ve her iki testin de fonksiyonu  nün artan bir fonksiyonudur. Bununla birlikte, testin gücü hipotezlere de bağlıdır. Alternatif hipotez H

_a

:   

₀

olarak alınmış olsaydı, testin gücü

 nün azalan bir fonksiyonu olurdu.

 ₄₀ ₄₂ ₄₄ ₄₅ ₄₆ ₄₈ ₅₀ ₅₂ ₅₄ ₅₆ ₅₈ ₆₀

(1)

z

_

3.41 2.71 1.99 1.645 1.29 0.58 -0.12 -0.83 -1.54 -2.24 -2.95 -3.66

1

( )

  0.0003 0.0033 0.023 0.05 0.098 0.281 0.548 0.797 0.938 0.987 0.998 0.999 (2)

z

_

3.73 3.02 2.31 1.96 1.61 0.90 0.19 -0.51 -1.22 -1.93 -2.64 -3.34

2

( )

  0.000 0.0013 0.01 0.025 0.054 0.184 0.425 0.695 0.889 0.973 0.996 0.999

c) Şimdi, kitle varyansının bilinmediğini varsayalım ve H

₀

:   40 yokluk hipotezini

: 40

H

a

  alternatif hipotezine karşı test etmek isteyelim. Verilerden 

²

nin tahmin değeri,

 

² ⁵⁰

 

² ⁵⁰

2 2 2

1 1 1

50( ) 467.84

1 49 49

n

n i n i n i n

i i i

s x x x x x x

n

_ _ _

 

        

       

(11)

olarak hesaplanmıştır. Bilindiği gibi H hipotezi altında

₀

n X (

_n

 

₀

) / S

_n

~ t

_n_₁

olup, (

0

) /

h n n

t  n x   s olmak üzere, t

_h

 t

_n_₁

( )  ise H

₀

:   40 hipotezi H

_a

:   40 alternatif hipotezine karşı   anlam düzeyinde red edilir. Test istatistiğinin değeri

(

0

) / 50 (48 40) / 21.63 2.62

h n n

t  n x   s   

olup kritik değerler   0.05 ve   0.025 için t

49

 0.05   1.6759 , t

₄₉

(0.025) 2.0086  şeklinde t  tablosundan bulunmuştur. Her iki test için de, t

_h

 t

_n_₁

( )  olduğundan,

0

: 40

H   hipotezi   0.05 ve   0.025 anlam düzeylerinde H

_a

:   40 alternatif hipotezine karşı red edilir 

Uygulamada, iki kitlenin beklenen değerlerinin karşılaştırılması da varyansın bilinip bilinmemesi durumuna göre yukarıdaki gibi yapılır. N (  

_x

,

²_x

) dağılımından bir örneklem

1

,

2

, ,

_n

X X  X ve bu örneklemden bağımsız N (  

_y

,

²_y

) dağılımından başka bir örneklem de Y Y

_{1 2}

, , ,  Y

_m

olsun. H

0

: 

_x

 

_y

yokluk hipotezinin (veya H

0

: 

_x

 

_y

 0 hipotezinin) H

_a

: 

_x

 

_y

, H

_a

: 

_x

 

_y

ve H

_a

: 

_x

 

_y

alternatif hipotezlerine karşı testi problemini inceleyelim.   

x

 

y

denirse, problem H

₀

:   yokluk hipotezinin 0

: 0

H

a

  , H

_a

:   ve 0 H

_a

:   alternatif hipotezlerine karşı test edilmesine 0 dönüşür. Buradan,

(

_n _m

) (

_n

) (

_m

)

_x _y

E X  Y  E X  E Y       ve

2 2

(

_n _m

) (

_n

) (

_m

) (

_x

/ ) (

_y

/ )

Var X  Y  Var X  Var Y   n   m olduğundan,

2 2

~ ( , ( / ) ( / ) )

n m x y x y

X  Y N     n   m

ve

2 2

( X

_n

 Y

_m

) / ( 

_x

/ ) ( n  

_y

/ ) ~ (0,1) m N

dir. Ayrıca ( X

_n

 Y

_m

) / ( 

_x²

/ ) ( n  

²_y

/ ) m istatistiğinin gözlenen değerini

(12)

2 2

( ) / ( / ) ( / )

h n m x y

z  x  y  n   m

ile gösterelim.

A) Her iki kitlenin de varyansı biliniyor olsun. Bu durumda,

1. H

0

: 

_x

 

_y

yokluk hipotezi H

_a

: 

_x

 

_y

alternatif hipotezine karşı  _{ anlam} düzeyinde testi için test kuralı “ z

_h

 z

_

ise H yokluk hipotezi red edilir” şeklinde olur.

₀

2. H

0

: 

_x

 

_y

hipotezi H

_a

: 

_x

 

_y

alternatif hipotezine karşı  _{ anlam} düzeyinde test edilmek istendiğinde ise test kuralı “ z

_h

  için z

_

H hipotezi red edilir”

₀

şeklindedir.

3. H

0

: 

_x

 

_y

hipotezi H

_a

: 

_x

 

_y

alternatif hipotezine karşı  _{ anlam} düzeyinde test edilmek istenirse, test kuralı “ | z

_h

|  z

__/2

ise H yokluk hipotezi red edilir”

₀

şeklinde oluşturulur.

B) Kitlelerin varyansları bilinmiyor olsun. Bu durumda, kitle varyanslarının durumuna

göre uygulanacak testler farklılıklar gösterir. Kitle varyansları aynı ( 

_x²

 

²_y

) ise varyans gerek X X

₁

,

₂

, ,  X

_n

gerekse Y Y

_{1 2}

, , ,  Y

_m

örneklem değerlerinden tahmin edilebilir.

Ancak, her iki kitlenin de varyansı aynı olduğundan varyansı iki örneklem de kullanılarak (toplam n m  örnek değer ile) tahmin edildiğinde daha iyi bir sonuç vermesi beklenir.

Buna göre, 

²

^yi X X

1

,

2

, ,  X

_n

örnekleminden S

_{n X}²_,

ile, Y Y

_{1 2}

, , ,  Y

_m

örnekleminden

de S

_{m Y}²_,

ile tahmin ederiz. Bu iki örneklemin beraber kullanılması halinde ise 

²

^,

2 2

, ,

2

( 1) ( 1)

2

n X m Y

p

n S m S

S n m

  

  

ile tahmin edilir. İki örneklem bir birinden bağımsız olduğundan S de

_P²



²

nin yansız bir tahmin edicisidir. Diğer taraftan, Var X (

_n

 Y

_m

) (  

²_x

/ ) ( n  

_y²

/ ) m  

²

((1/ ) (1/ )) n  m olup, [( X

_n

 Y

_m

) (  

_x

 

_y

)] / [ S

_p

(1/ ) (1/ ) ] ~ n  m t

_{n m}_{ }₂

dir. Buna göre,

[( ) ( )] / [ (1/ ) (1/ ) ]

h n m x y p

t  x  y     s n  m

(13)

olmak üzere,

1. H

0

: 

_x

 

_y

yokluk hipotezinin H

_a

: 

_x

 

_y

alternatif hipotezine karşı  _{ anlam} düzeyinde testi problemi için test kuralı “ t

_h

 t

_{n m}_{ }₂

( )  ise H hipotezi red edilir”

₀

şeklindedir.

2. H

0

: 

_x

 

_y

yokluk hipotezi H

_a

: 

_x

 

_y

alternatif hipotezine karşı   anlam düzeyinde test edilmek istenirse test kuralı “ t

_h

  t

_{n m}_{ }₂

( )  ise H hipotezi red edilir”

₀

şeklinde oluşturulur.

3. H

₀

: 

_x

 

_y

yokluk hipotezi H

_a

: 

_x

 

_y

alternatif hipotezine karşı   anlam düzeyinde test edilmek istendiğinde test kuralı, “ | t

_h

|  t

_{n m}_{ }₂

( / 2)  ise H yokluk

₀

hipotezi red edilir” şeklinde olur.

Örnek 9.1.2 Bir istatistik dersinin sınavı aynı anda iki farklı gruba uygulansın. Bu gruplardan rasgele seçilen 16 şar öğrencinin sınav notları aşağıda verilmiştir.

A Grubu (X) B Grubu (Y)

60 65 60 70 75 80 65 69 70 72 65 64 50 62 67 66

83 78 63 67 69 73 79 67 49 84 73 67 48 66 63 72

Verilere ait bazı özet bilgiler;

2 2

1 1 ,

1123 , 79587 , 70.1875 , 51.095

n n

i i n n X

i i

x x x s



  

 

2 2

1 1 ,

1038 , 68682 , 64.8750, 89.45

n n

i i m m Y

i i

y y y s



  

 

ve

2 2 2 2 2 2

, , , , , ,

2

( 1) ( 1) (16 1) (16 1)

70.27 2 (16 16) 2 2

n X m Y n X m Y n X m Y

p

n s m s s s s s

s n m

      

   

   

olarak hesaplanmıştır. Buna göre, birleştirilmiş standart hata s

_p

 8.38 olup H

₀

: 

_x

 

_y

yokluk hipotezinin H

_a

: 

_x

 

_y

alternatif hipotezine karşı testi problemini ele alalım. Test istatistiğinin değeri,

 

( ) ( ) (70.1875 64.8750) 16 70.1875 64.8750 (1/ ) (1/ ) 8.38 (1/16) (1/16) 8.38 2 1.8

n m x y

h p

x y

t s n m

 

    

   

 

(14)

olup, kritik değer   0.05 için t  dağılım tablosundan t

₃₀

(0.05) 1.6973  olarak bulunur.

Buna göre, t

_h

 1.8 1.6973   t

₃₀

( )  olduğundan, H

₀

: 

_x

 

_y

hipotezi H

_a

: 

_x

 

_y

alternatif hipotezine karşı   0.05 anlam düzeyinde red edilir. Bu hipotez testi problemine ait testin red bölgesi ve red bölgesinin alanı Şekil (9.1.5) de verilmiştir.

Şekil 9.1.5 Örnek (9.1.2) deki hipotez testi propblemi için testin red bölgesi ve red bölgesinin alanı (   0.05 )

Yani,   0.05 anlam düzeyinde birinci grup ikinci gruba göre ortalamada daha iyidir (daha yüksek beklenen değere sahiptir) 

C) Bir önceki örnekte, iki kitlenin varyanslarının aynı olduğu kabul edildi. Kitle varyansları farklı ise, başka testlerin uygulanması gerektiğini söylemiştik. Öyleyse, böyle bir test yapılmadan önce, kitle varyanslarının aynı olup olmadığının sınanması (

2 2

0

:

_x _x

H    yokluk hipotezinin H

_a

: 

²_x

 

_x²

alternatif hipotezine karşı test edilmesi)

gerekir. Bunun için, S

_{n X}²_,

ve S

_{m Y}²_,

örneklem varyanslarının oranına bakmak yeterlidir.

2,

S

n X

ve S

_{m Y}²_,

oranlarının dağılımının serbestlik dereceleri n  ve 1 m  olan F 1 olduğunu biliyoruz. H

₀

: 

²_x

 

²_y

yokluk hipotezi altında (ortak varyansa 

²

diyelim),

 

2 2 2

, ,

2 2 2

, ,

[( 1) / ] / ( 1)

~ 1, 1

[( 1) / ] / ( 1)

n X n X

n Y m Y

S n S n

F F n m

S m S m



 

   

 

(15)

dir. Burada, F istatistiği F  max{ S

_{n X}²_,

, S

_{m Y}²_,

}/ min{ S

_{n X}²_,

, S

_{m Y}²_,

} olarak alındığında, maksimuma karşılık gelen serbestlik derecesi df , minimum olana karşılık gelen serbestlik

₁

derecesi de df olmak üzere,

₂

F  max{ S

_{n X}²_,

, S

_{m Y}²_,

} / min{ S

_{n X}²_,

, S

_{m Y}²_,

} ~ ( F df df

₁

,

₂

) olur.

Buradan,   anlam düzeyinde, H

₀

: 

_x²

 

²_y

hipotezi H

_a

: 

_x²

 

²_y

alternatif hipotezine karşı test edilmek istenirse, F istatistiğinin gözlem (hesaplanan) değeri s

_{n X}²_,

ve s

_{m Y}²_,

örneklem varyanslarının hesaplanan değerleri ve F

_h

 max{ s

_{n X}²_,

, s

_{m Y}²_,

} / min{ s

_{n X}²_,

, s

_{m Y}²_,

} olmak üzere, F

_h

 F

¹^^^/2

( df df

₁

,

₂

) ise H

₀

: 

_x²

 

²_y

yokluk hipotezi red edilir. Yani kitle varyansları farklıdır.

Yukarıdaki örnekte (Örnek (9.1.2)) varyansların eşit olduğu varsayılmış ve varyanslar

2,

51.095 s

n X

 ve s

_{m Y}²_,

 89.45 olarak gözlenmişti. Buradan,

2 2

, , 0.95

2 2

, ,

max{ , } max{51.095 ,89.45} 89.45

1.75 2.40 (15,15) min{51.095 ,89.45} 51.095

min{ , }

n X m Y h

n X m Y

s s

F F

s s

     

olduğundan H

₀

: 

²_x

 

_y²

yokluk hipotezi red edilemez. Yani, varyansların aynı olduğu varsayımı istatistiki olarak anlamlıdır.

Aynı kitle üzerinden, farklı zamanlarda iki ayrı deneyin yapıldığını düşünelim.

Örneğin, bir istatistik dersinde öğrencilerin arasınav ortalamaları ile belli bir süre sonra uygulanan final sınavlarının ortalamalarının karşılaştırılması, öğrencilerin başarılarında bir gelişmenin olup olmadığının sınanmasıdır. Bu durumda, verileri iki ayrı veri gibi değerlendirmek yerine, aradaki farkların sıfır olduğunun test edilmesi daha anlamlı olur (belli bir artış da dikkate alınabilir). Bununla ilgili aşağıdaki örneği ele alalım.

Örnek 9.1.3 Bir istatistik dersinden rasgele seçilen 16 öğrencinin arasınav ve final

notları aşağıdadır. Buna göre, arasınavdan sonra öğrencilerin başarılarında bir artış olup

olmadığını   0.05 anlam düzeyinde test etmek isteyelim. İki ayrı örnek aynı kitle

üzerinden alındığı için, varyansları karşılaştırmaya gerek yoktur. Elde edilen farklardan

oluşan verilere ait varyans tahmininin dikkate alınması yeterlidir. Öğrencilerin başarılarında

(16)

bir gelişmenin sınanması demek, H

₀

: 

_x

 

_y

yokluk hipotezinin H

_a

: 

_x

 

_y

(veya

a

:

x y

H    ) alternatif hipotezine karşı test edilmesi demektir. Bu problem yerine,

i i i

Z   Y X fark verileri ( H

₀

: 

_x

 

_y

hipotezi altında ( E X

_n

 Y

_n

) 0  ) kullanılarak

1

,

2

, ,

_n

Z Z  Z örneklemine göre, H

₀

:   hipotezi 0 H

_a

:   (veya 0 H

_a

:   ) 0 alternatif hipotezine karşı test edilir.

Arasınav, X Final, Y Fark, Z Y X  

70 72 65 64 50 62 60 65 60 70 75 80 -10 -7 -5 6 25 18

67 66 49 84 73 67 65 69 83 78 63 67 -2 3 34 -6 -10 0

48 66 63 72 69 73 79 67 21 7 16 -5

Buna göre, fark verilerine ait gözlenen örneklem ortalama ve varyansı 5.3125

z

n

 ve

² ¹⁶

 

²

1

(1/15) 185.56

z i n

i

s z z



   

olarak hesaplanmıştır.   0.05 için tablo değeri t

₁₅

(0.05) 1.753  olup

/ 4(5.3125) /13.62 1.56 1.753

15

(0.05)

h n z

t  n z s     t

olduğundan H

₀

:   hipotezi 0 H

_a

:   alternatif hipotezine karşı red edilemez. Yani, 0 öğrencilerin arasınav ortalamaları ile final ortalamaları aynıdır. Başka bir deyişle, öğrenciler arasınavdan sonra başarılarını geliştirmek için hiçbir çaba göstermemiştir. Ayrıca,

| t

_h

| 1.56 2.131    t

15

(0.025) olduğundan H

₀

:   hipotezi, aynı anlam düzeyinde 0

: 0

H

a

  alternatif hipotezine karşı da red edilemez 

9.2. Olabilirlik Oran Testleri

Bir önceki kısımda, normal dağılımın parametrelerine ilişkin istatistiki sonuç çıkarımlar

üzerinde duruldu. Daha önce de belirtildiği gibi, test bir kuraldır. Hipotez testlerinde amaç

bu kuralın belirlenmesidir. Bir çok test kuralı parametrelerin en çok olabilirlik tahmin

edicilerine bağlı olarak geliştirilen olabilirlik oranının değerine göre oluşturulur. Bu

kısımda, herhangi bir kitlenin parametreleri için olabilirlik oran testlerinin (yani test

kuralının) elde edilme yöntemi üzerinde durulacaktır.

(17)

1

,

2

, ,

_n

X X  X parametresi  (   ) olan kitleden bir örneklem olsun. H

0

:  

0

yokluk hipotezinin H

_a

:   alternatif hipotezine karşı test edilmesi problemini ele

₀^c

alalım.  nın olabilirlik fonksiyonu ( ; L  X  x )

  ,  nın en çok olabilirlik tahmin edicisi ˆ  ve H

₀

:   hipotezi altında

₀

 nın en çok olabilirlik tahmin edicisi de  ˆ

₀

olsun.

Tanım 9.2.1 X X

₁

,

₂

, ,  X

_n

parametresi  olan kitleden bir örneklem olsun.

0

:

0

H    yokluk hipotezinin H

_a

:   alternatif hipotezine karşı testi problemi için,

₀^c

olabilirlik oranı,

 

⁰ ⁰

sup ( ; )

( ; ˆ ) sup ( ; ) ( ; ˆ )

L X x

x L X x L X x



 

  



 

 

    

olup olabilirlik oran testi, red bölgesi 0   için c 1  { : ( ) x  x  c }

 

R olan bir kuraldır 

Tanıma göre, H

₀

:   yokluk hipotezinin

₀

H

_a

:   alternatif hipotezine karşı

₀^c

test edilmesi için en çok olabilirlik kuralı,

  ^{1 ,} ^{( )}

0 , . . x c

x d y

   

   



şeklinde yazılabilir. Önceden belirlenen bir  sayısı (testin anlam düzeyi, birinci tür hata olasılığı) kullanılarak c sayısı belirlenir. Belirlenen c sayısına göre ( )  x  c

 oluyorsa,

0

:

0

H    hipotezi red edilir. c sabitinin belirlenmesi testin red bölgesinin belirlenmesi olup, hesaplanan ( )  x

 değeri testin red bölgesi içinde kalıyorsa, H

₀

:   hipotezi red

₀

edilir. Şimdi, olabilirlik oran testlerinin elde edilmesi ile ilgili birkaç örnek verelim.

Örnek 9.2.1 a) ( ,1) N  dağılımından bir örneklem X X

₁

,

₂

, ,  X

_n

olsun. Önceden

belirlenen 

₀

sayısı için H

₀

:   

₀

yokluk hipotezini H

_a

:   

₀

alternatif hipotezine

karşı test etmek isteyelim.    olduğu için parametre kümesi    dir.  nün en çok

olabilirlik tahmin edicisi ˆ   X

_n

dir. Ayrıca, H

₀

:   

₀

hipotezi altında parametre

kümesi (  

₀

{ } 

₀

) tek elemanlı bir küme olup  _nün H hipotezi altındaki en çok

₀

(18)

olabilirlik tahmin edicisi de 

₀

dır (parametre kümesinde alabileceği başka değer yoktur).

Yani  ˆ

₀

 

₀

dir. Buradan olabilirlik oranı ( )  x

 ,

 

0

/2 2

1 0 0

/2 2

1

sup ( ; ) ( ; ˆ ) (2 ) exp 1 2

( ) sup ( ; ) ( ; ˆ ) 1

(2 ) exp 2

n n

i i n n

i n

i

L X x x

L X x

x L X x L X x

x x



  

 

  



 

 



 

    

  

  

   

 

 

 



 

    

2 2 2

0 0

1 1

exp ( ) ( ) exp ( )

2 2 2

n n

i i n n

i i

x  x x n x 

 

   

                 

şeklinde yazılır. Ayrıca,

2 2 2

0 0

1 1

( ) ( ) ( )

n n

i i n n

i i

x  x x n x 



 



  

 

olup 0   için testin red bölgesinin c 1  { : ( ) x  x  c }

 

R olduğunu biliyoruz. Buradan,

1 0 2 1 0

2

1

( ) exp ( ) | | ln( )

2

ⁿ ⁿ

x c n x c x c c

                n 

 



ve  ( ) x  c

₁

 | x

_n

 

₀

|  c

 dikkate alındığında red bölgesi,  { : | x x

_n

 

₀

|  c }

R  olan

test kuralı

  ^{1 , |}

⁰

^|

0 , . .

x

n

c

x d y

    

  



olarak yazılır. Testin  anlam düzeyi seçilerek c sabiti belirlenir.

b) Aynı örneklem için H

₀

:   

₀

yokluk hipotezinin H

_a

:   

₀

alternatif hipotezine karşı test edilmesi problemini ele alalım. Yine  

₀

{ } 

₀

olduğundan en çok olabilirlik tahmin edicileri  ˆ

₀

 

₀

ve ˆ   X

_n

dir. Alternatif hipotez altında,   

₀

ise

0

x

n

  olur ( x

_n

 

₀

 ). Buna göre, 0  ( ) x  c

₁

 ise x

_n

 dir. Yani, c

 

₁

^exp 

₀



² ₁



₀



²

² ^{ln( )}

₁

2

ⁿ ⁿ

x c n x c x c

                   n

olduğundan,

(19)

0

2

1 0

2

1

| x

_n

| ln( ) c x

_n

ln( ) c x

_n

c

n n

 

        

dir. Dolayısı ile, red bölgesi  { : x x

_n

 c }

R  olan test fonksiyonu

  ^{1 ,}

0 , . . x

n

c

x d y

  

  



şeklinde yazılır. Yine, testin  anlam düzeyi seçilerek c sabiti belirlenir.

c) X X

₁

,

₂

, ,  X

_n

beklenen değeri  olan üstel dağılımdan bir örneklem olsun.

Önceden belirlenen bir 

₀

sayısı ( 

₀

  ) için

^

H

⁰

:   

⁰

hipotezinin H

_a

:   

₀

alternatif hipotezine karşı testi problemini ele alalım.  nın en çok olabilirlik tahmin edicisi

ˆ X

n

  ve  

₀

{ } 

₀

olduğundan  ˆ

₀

 

₀

dır. Olabilirlik oranı ise,

0 01

0 1

1 0 0

1

( ) exp ( ; ˆ )

( ) ( / ) exp

( ; ˆ )

( ) exp ( )

n n

i i n n

n n

n n n i

i

L X x x n x

x x n

L X x

x x x

 

  

 

 



 



 

    

  

              

 



  

  

olup,

1 0 2

( ) x c ( ) exp( ( x

_n ⁿ

n x

_n

) / ) c

     



denkliği dikkate alındığında  ( ) x  c

₁

 ile bazı a ve b reel sayıları için x

_n

 ve a x

_n

 b denk önermelerdir. Bu durum, aşağıdaki grafikte de görülmektedir (Şekil (9.2.1)). Yani, bazı , a b   için

0 2

( ) exp( ( x

_n ⁿ

 nx

_n

) /  )  c  x

_n

 a ve x

_n

 b önermeleri denktir. Buna göre, ^   ^x ^ ^c

 ise bazı , a b   için

^

x

_n

 a veya x

_n

 olup b testin red bölgesi,  { : x x

_n

 a veya x

_n

 b }

R  olarak yazılabilir.

Şekil 9.2.1 Örnek (9.2.1) deki hipotez testi probleminin red bölgesi ve red bölgesinin alanı

(20)

Buradan da, olabilirlik oran testi

  ^{1 ,} ^veya

0 , . .

n n

x a x b

x d y

   

  

 şeklinde olur 

Olabilirlik oran testleri birden fazla kitle parametresinin testi için de kullanılabilir.

Örneğin, X X

₁

,

₂

, ,  X

_n

parametresi  olan kitleden bir örneklem, Y Y

_{1 2}

, , ,  Y

_m

de parametresi  olan başka bir kitleden alınan başka bir örneklem olsun. Bu durumda parametre kümesi,   {( , ):    

_

,  

_

} şeklinde olup ( X Y ,

_i

, )

_i

i  1, 2,3,..., n ortak olasılık veya olasılık yoğunluk fonksiyonu ( , ; , ) f x y   olan kitleden alındığında,  ve  için herhangi bir istatistiki sonuç çıkarımda olabilirlik oran yöntemi kullanılabilir.

Örnek 9.2.2 X X

₁

,

₂

, ,  X

_n

beklenen değeri  olan üstel dağılımdan bir örneklem ve bu örneklemden bağımsız, beklenen değeri  olan başka bir üstel dağılımdan bir örneklem de Y Y

_{1 2}

, , ,  Y

_m

olsun. Buna göre, H

₀

:    yokluk hipotezinin H

_a

:    alternatif hipotezine karşı test edilmesi problemini ele alalım. Bu durumda olabilirlik fonksiyonu,

1 1 1 1

( , ; , )

^{n m}

( ,

_i _j

; , )

^{n m} _X

( ; ) ( ; )

_i _Y _j

i j i j

L   X x Y y f x y   f x  f y 

   

       

   

1 1

exp

ⁿ

exp

ⁿ

n m

i j

i i

x y

 

 

 

   

      

     

şeklinde olup log-olabilirlik fonksiyonu da

1 1

( , ) ln( ( , ; , )) ln( )

ⁿ _i

ln( )

ⁿ _j

i i

L X x Y y n x m y

     



_



_

         

    

şeklinde yazılabilir. Buradan, birinci türevlerin sıfıra eşitlenmesi ile  ve  nün en çok

olabilirlik tahmin edicileri (ikinci türevler bu noktalarda negatiftir), ˆ   X

_n

ve ˆ   Y

_m

olur. Ayrıca, H

₀

:    yokluk hipotezi altında (    olup bu ortak değere 

₀

diyelim)

olabilirlik fonksiyonu,

HİPOTEZ TESTLERİNE GİRİŞ

BÖLÜM 9