BÖLÜM 9
HİPOTEZ TESTLERİNE GİRİŞ
Önceki bölümlerde temel olasılık kavramlarının yanında parametre tahmini ve tahmin edicilerin özellikleri incelendi. Bir parametre için iyi bir tahmin edici bulduktan sonra gözlemlere dayalı bir tahmin değeri elde edilir. Bu tahminin kitle parametresini temsil edip etmediği sınanmalıdır. Bu bölümde, kitle parametrelerine ilişkin hipotez testleri ile ilgili temel kavramlar ile normal dağılımın parametrelerine ilişkin hipotez testleri incelenecektir.
Daha sonra, kitle parametrelerine ilişkin hipotez testleri ile test istatistiklerinin bulunma yöntemleri üzerinde durulacaktır. Bayes testleri ile kitle parametrelerine ait güven aralıkları da bu bölümde incelenecek konular arasındadır.
9.1. Genel Kavramlar
Bu kısımda, hipotez testleri ile ilgili temel tanım ve kavramlar kısaca özetlenecektir.
Burada, parametre kümesi reel sayıların bir alt kümesi olup ile gösterilecektir.
Tanım 9.1.1 Kitlenin parametresi hakkındaki herhangi bir iddiaya hipotez denir
Genellikle, iki tür hipotezden bahsedilir. Bunlar; H ile gösterilen yokluk hipotezi ve
0H (bazen
aH ) ile gösterilen alternatif hipotezlerdir. Ayrıca,
1 ve
0 0c0 0c
olmak üzere bu hipotezler genellikle, herhangi bir için H
0:
0ve H
a: şeklinde ifade edilir. Hipotez testlerinde amaç deneysel gözlemlere bağlı
0colarak kitle parametreleri hakkında istatistiki sonuç çıkarımlar yapmaktır. Yani, yapılan denemeler sonunda elde edilen gözlem değerlerine göre H
0: yokluk hipotezinin
0:
0cH
a alternatif hipotezine karşı test edilmesidir. Sonuçta, gözlem değerlerine bağlı
olarak H
0: hipotezi ya red edilir ya da red edilemez. Hipotez testi problemi genel
0olarak
0
:
0H karşı H
a:
0cşeklinde ifade edilir. Ayrıca, hipotezler basit ve karmaşık olmak üzere de iki gruba ayrılır.
Parametre kümesinde sadece bir elemanı olan hipotezlere basit (simple) hipotez, birden fazla eleman olan hipotezlere de karmaşık hipotez denir. Örneğin, H
0:
0bir basit hipotezdir (
0{ }
0) dır. Diğer taraftan, H
a:
0veya H
a:
0gibi hipotezler karmaşık hipotezlerdir.
Tanım 9.1.2 H yokluk hipotezini red etmek için oluşturulan bir kurala test denir.
0Gözlem değerlerine bağlı olarak, H yokluk hipotezinin red edileceği noktaların kümesine
0testin red bölgesi denir ve R ile gösterilir
1
,
2, ,
nX X X parametresi olan kitleden bir örneklem, bu örneklemin gözlem değerleri ( , , , x x
1 2 x
n) ve yı tahmin etmek için de ( ) T X
istatistiği önerilmiş olsun. Bu istatistiğin değerine t diyelim ( ( ) T x t
). Buna göre, red bölgesi R olan ( ) T X
tahmin edicisine bağlı olarak test kuralı
1 , ( )
0 , ( )
cx T x
T x
R R
şeklinde ifade edilebilir. Yani, ( ) T X
istatistiğinin değeri R nin bir elemanı ise
0
:
0H yokluk hipotezi red edilir. Aksi halde red edilemez. Burada, ( ) x
test istatistiğinin gözlem değeri olup ( ) X
, sadece 0 ve 1 değerlerini alan Bernoulli rasgele değişkenidir. Yani ( ) X
test istatistiği olup, ( ) x
bu test istatistiğinin gözlem değeridir.
Örneğin, X X
1,
2, , X
nrasgele değişkenlerinin değerleri ( , , , x x
1 2 x
n) şeklinde gözlenmiş ve test kuralı, “ x
n ise 3 H
0: yokluk hipotezi red edilir” şeklinde
0oluşturulmuş ise testin red bölgesi, { : x x
n 3}
R şeklinde olur. Bu durumda test kuralı,
1 , 0 ,
n3 3
n
x x
x
olarak yazılır. Hipotez testlerinde amaç böyle bir kuralın oluşturulması yani, testin red bölgesinin belirlenmesidir. Bu kuralın nasıl elde edileceğine ilişkin birçok yöntem öne sürülebilir. Ancak, parametrelerin en çok olabilirlik tahmin edicilerine bağlı olarak oluşturulan en çok olabilirlik oran testleri öne çıkmaktadır.
Hipotez testlerinde genellikle örneklemin normal dağılımdan geldiği varsayılır. Veriler normal dağılıma uygun değilse, dönüşümler yapılarak normallik varsayımları sağlatılır.
Normal olmayan durumlarda, merkezi limit teoreminden faydalanılır.
( ,
2)
N dağılımından bir örneklem X X
1,
2, , X
nolsun. Normal dağılımın beklenen değerine ilişkin hipotezler varyansın durumuna göre değişir. Aşağıdaki örneklerde, önceden belirlenen ve testin anlam düzeyi olarak bilinen birinci tür hata olasılığı ile testin gücü bu bölümün üçüncü kısımında incelenecektir. Dolayısı ile, bu kısımda testlerin gücü ayrıntıya girilmeden verilecektir. Testin gücü denildiği zaman H yokluk hipotezinin red
0edilmesi olasılığını anlayacağız.
A) Kitle varyansı
2biliniyor:
1
,
2, ,
nX X X beklenen değeri varyansı
2olan normal dağılımdan bir örneklem ise n X (
n
0) / ~ (0,1) N dir. ~ Z N (0,1) ve ( P Z z
) olmak üzere, normal dağılımın beklenen değeri için hipotez testleri aşağıda özetlenmiştir. Aşağıdaki test istatistiğinin hesaplanan değeri her üç durumda da aynıdır ( z
h n x (
n
0) / ). Ayrıca
z
değerleri standart normal dağılım tablosundan bulunur.
1. H
0:
0yokluk hipotezinin H
a:
0alternatif hipotezine karşı testi problemini düşünelim. Burada, H
0:
0hipotezi yerine H
0:
0de yazılabilir. Bu problem için test fonksiyonu,
1 ,
0 , diğer yerlerde z
hz
x
şeklindedir. Yani, z
h z
ise H
0:
0hipotezi H
a:
0alternatif hipotezine karşı red edilir. Testin red bölgesi ile red bölgesinin alanı Şekil (9.1.1a) da verilmiştir.
Şekil 9.1.1a H
0:
0hipotezinin H
a:
0alternatif hipotezine karşı testi problemi için red bölgesi ve alanı (varyans biliniyor)
2. H
0:
0yokluk hipotezinin H
a:
0alternatif hipotezine karşı testi problemi ( H
0:
0hipotezi yerine H
0:
0de yazılabilir) için test fonksiyonu,
1 ,
0 , diğer yerlerde z
hz
x
olup z
h z
ise H
0:
0yokluk hipotezi H alternatif hipotezine karşı red edilir.
aYine testin red bölgesi ile red bölgesinin alanı Şekil (9.1.1b) de verildiği gibidir.
Şekil 9.1.1b H
0:
0hipotezinin H
a:
0alternatif hipotezine karşı testi problemi için red bölgesi ve alanı (varyans biliniyor)
3. H
0:
0yokluk hipotezinin H
a:
0alternatif hipotezine karşı testi problemi için test fonksiyonu,
1 ,
/ 20 , diğer yerlerde z
hz
x
olup, | z
h| z
/2ise H
0:
0hipotezi H alternatif hipotezine karşı red edilir. Testin
ared bölgesi ile red bölgesinin alanı (Şekil 9.1.1c) de verildiği gibidir.
Şekil 9.1.1c H
0:
0hipotezinin H
a:
0alternatif hipotezine karşı testi problemi için red bölgesi ve alanı (varyans biliniyor)
B) Kitle varyansı
2bilinmiyor:
Kitle varyansı
2bilinmiyorsa S örneklem varyansı ile tahmin edilir.
n2S nin değeri
n2
2için kullanılır. X ler bağımsız
iX
i~ ( , N
2) ise, n X (
n ) / S
n~ t
n1olduğu altıncı bölümde gösterildi. P t (
n1 t
n1( )) olmak üzere, varyansın bilinmediği durumda, normal dağılımın beklenen değeri için oluşturulacak hipotez testleri aşağıda özetlenmiştir. Aşağıdaki test istatistiğinin hesaplanan değeri her üç durumda da
0 /
h n n
t n x s dir. t
n1( ) değerleri t-dağılım tablosundan bulunabilir.
1. H
0:
0yokluk hipotezinin H
a:
0alternatif hipotezine karşı testi problemi için test fonksiyonu,
1 ,
1( )
0 , diğer yerlerde
h n
t t
x
şeklindedir. Yani, t
h t
n1( ) ise H
0:
0hipotezi H
a:
0alternatif hipotezine karşı red edilir. Testin red bölgesi ile red bölgesinin alanı Şekil (9.1.2a) da verildiği gibidir.
Şekil 9.1.2a H
0:
0hipotezinin H
a:
0alternatif hipotezine karşı testi
problemi için red bölgesi ve alanı (varyans bilinmiyor)
2. H
0:
0yokluk hipotezinin H
a:
0alternatif hipotezine karşı testi problemi için test fonksiyonu,
1 ,
1( )
0 , diğer yerlerde
h n
t t
x
şeklinde olup t
h t
n1( ) ise H
0:
0hipotezi H
a:
0alternatif hipotezine karşı red edilir. Testin red bölgesi ile red bölgesinin alanı Şekil (9.1.2b) de verildiği gibidir.
Şekil 9.1.2b H
0:
0hipotezinin H
a:
0alternatif hipotezine karşı testi problemi için red bölgesi ve alanı (varyans bilinmiyor)
3. H
0:
0yokluk hipotezinin H
a:
0alternatif hipotezine karşı testi problemini düşünelim. Bu problem için de test fonksiyonu
1 ,
1( / 2)
0 , diğer yerlerde
h n
t t
x
şeklindedir. Yani, | t
h| t
n1( / 2) ise H
0:
0yokluk hipotezi H
a:
0alternatif hipotezine karşı red edilir. Testin red bölgesi ile red bölgesinin alanı Şekil (9.1.2c) de verilmiştir.
Şekil 9.1.2c H
0:
0hipotezinin H
a:
0alternatif hipotezine karşı testi
problemi için red bölgesi ve alanı (varyans bilinmiyor)
C) Kitle varyansı
2için testler:
1
,
2, ,
nX X X beklenen değeri , varyansı
2olan normal dağılımdan bir örneklem olsun. H
0:
2
02yokluk hipotezini
i) H
a:
2
02ii) H
a:
2
02iii) H
a:
2
02alternatif hipotezlerine karşı anlam düzeyinde test etmek isteyelim. S nin dağılımı
n22 2
0
:
0H hipotezi altında ( n 1) S
n2/
02~
n21olup H hipotezinin reddine ilişkin
0test kuralları ve red bölgeleri ile kritik değerleri K
h ( n 1) S
n2/
02olmak üzere aşağıda verilmiştir. Burada X
n21,değerleri ki-kare dağılım tablosundan bulunur.
Şekil 9.1.3a
H
0:
2
02 hipotezininH
a:
2
02 alternatifine karşı testi için red bölgesi ve red bölgesinin alanıBuna göre, K
h
n21,ise H
0:
2
02yokluk hipotezi anlam düzeyinde
2 2
:
0H
a alternatif hipotezine karşı red edilir (şekil (9.1.3.a)).
Şekil 9.1.3b
H
0:
2
02 hipotezininH
a:
2
02 alternatifine karşı testi için red bölgesi ve red bölgesinin alanıBenzer şekilde, K
h
n2 1,1 ise H
0:
2
02yokluk hipotezi anlam düzeyinde
2 2
:
0H
a alternatif hipotezine karşı red edilir (Şekil (9.1.3b)).
Şekil 9.1.3c
H
0:
2
02 hipotezininH
a:
2
02 alternatifine karşı testi için red bölgesi ve red bölgesinin alanıAyrıca, K
h
n2 1,1 / 2veya K
h
n21, / 2ise H
0:
2
02yokluk hipotezi anlam düzeyinde H
a:
2
02alternatif hipotezine karşı red edilir (Şekil (9.1.3c)).
Örnek 9.1.1 Bir istatistik dersinden öğrencilerin notları beklenen değeri , varyansı
2olan normal dağılıma sahiptir. Rasgele seçilen 50 öğrencinin notları aşağıda verilmiştir.
50 Öğrencinin istatistik dersinden aldığı notlar
67 50 65 26 72 25 64 68 20 30 65 72 30 26 12 67 17 16 65 75 20 12 21 60 81 29 51 37 80 44 40 26 71 43 50 75 55 65 76 38 47 24 87 38 47 43 80 24 45 59
a)
2 400 olsun (kitle varyansı biliniyor). H
0: 45 yokluk hipotezini
: 45
H
a alternatif hipotezine karşı 0.05 anlam düzeyinde test etmek isteyelim.
( ) 0.05
P Z z
ise normal dağılım tablosundan z
1.645 dir. Buradan,
(
0) / 50 (48 45) / 20 1.06
h n
z n x
olup bu değer 1.645 den küçüktür ( z
h 1.06 1.645 z
) yani, H
0: 45 hipotezi
0.05 anlam düzeyinde H
a: 45 alternatif hipotezine karşı red edilemez. Testin red bölgesi { : x n x (
n 45) / 20 1.645}
olup red bölgesinin alanı Şekil (9.1.4a) da verilmiştir.
Şekil 9.1.4a Örnek (9.1.1a) daki hipotez testi propblemi için testin red bölgesi ve red bölgesinin alanı ( 0.05 )
Aynı hipotezi 0.025 anlam düzeyinde test etmek isteseydik, ( P Z z
) 0.025 için z
1.96 olup, z
h 1.06 1.96 z
olduğundan H
0: 45 yokluk hipotezi
0.025
anlam düzeyinde de H
a: 45 alternatif hipotezine karşı red edilemez. Bu problem için testin red bölgesi { : x n x (
n 45) / 20 1.96}
olup red bölgesinin alanı Şekil
(9.1.4b) de verilmiştir.
Şekil 9.1.4b Örnek (9.1.1a) daki hipotez testi propblemi için testin red bölgesi ve red bölgesinin alanı ( 0.025 )
b) Testin gücünün H yokluk hipotezinin red edilmesi olasılığı olduğunu söylemiştik.
0Testin gücü ileride tekrar tartışılacaktır (Tanım 9.3.2)). 0.05 için testin güç fonksiyonu
( ( ) ile gösterirsek),
0 0
1 0
0 0
( ) ( )
( ) ( Red)
( ) ( ) ( )
n n
n
n X n X
P H P z P z
n X n n
P z P Z z
0.05
50 ( 45)
1.645 (1, )
P Z 20 P Z z
dir. İkinci testin ( 0.025 ) güç fonksiyonu ise,
2 0
50 ( 45)
0.025( ) ( Red) 1.96 ( (2, ))
P H
P Z 20 P Z z
olarak hesaplanmıştır. nün değişik değerleri için z
(1, ) ve z
(2, ) değerleri ile bu değerlere karşılık gelen olasılıklar (yani, testin gücü) normal dağılım tablosundan bulunarak aşağıda tablo halinde verilmiştir.
Tablo değerlerinden de görüldüğü gibi testin gücü, anlam düzeyine bağlıdır ve her iki testin de fonksiyonu nün artan bir fonksiyonudur. Bununla birlikte, testin gücü hipotezlere de bağlıdır. Alternatif hipotez H
a:
0olarak alınmış olsaydı, testin gücü
nün azalan bir fonksiyonu olurdu.
40 42 44 45 46 48 50 52 54 56 58 60
(1)
z
3.41 2.71 1.99 1.645 1.29 0.58 -0.12 -0.83 -1.54 -2.24 -2.95 -3.66
1
( )
0.0003 0.0033 0.023 0.05 0.098 0.281 0.548 0.797 0.938 0.987 0.998 0.999 (2)
z
3.73 3.02 2.31 1.96 1.61 0.90 0.19 -0.51 -1.22 -1.93 -2.64 -3.34
2
( )
0.000 0.0013 0.01 0.025 0.054 0.184 0.425 0.695 0.889 0.973 0.996 0.999
c) Şimdi, kitle varyansının bilinmediğini varsayalım ve H
0: 40 yokluk hipotezini
: 40
H
a alternatif hipotezine karşı test etmek isteyelim. Verilerden
2nin tahmin değeri,
2 50
2 502 2 2
1 1 1
1 1 1
50( ) 467.84
1 49 49
n
n i n i n i n
i i i
s x x x x x x
n
olarak hesaplanmıştır. Bilindiği gibi H hipotezi altında
0n X (
n
0) / S
n~ t
n1olup, (
0) /
h n n
t n x s olmak üzere, t
h t
n1( ) ise H
0: 40 hipotezi H
a: 40 alternatif hipotezine karşı anlam düzeyinde red edilir. Test istatistiğinin değeri
(
0) / 50 (48 40) / 21.63 2.62
h n n
t n x s
olup kritik değerler 0.05 ve 0.025 için t
49 0.05 1.6759 , t
49(0.025) 2.0086 şeklinde t tablosundan bulunmuştur. Her iki test için de, t
h t
n1( ) olduğundan,
0
: 40
H hipotezi 0.05 ve 0.025 anlam düzeylerinde H
a: 40 alternatif hipotezine karşı red edilir
Uygulamada, iki kitlenin beklenen değerlerinin karşılaştırılması da varyansın bilinip bilinmemesi durumuna göre yukarıdaki gibi yapılır. N (
x,
2x) dağılımından bir örneklem
1
,
2, ,
nX X X ve bu örneklemden bağımsız N (
y,
2y) dağılımından başka bir örneklem de Y Y
1 2, , , Y
molsun. H
0:
x
yyokluk hipotezinin (veya H
0:
x
y 0 hipotezinin) H
a:
x
y, H
a:
x
yve H
a:
x
yalternatif hipotezlerine karşı testi problemini inceleyelim.
x
ydenirse, problem H
0: yokluk hipotezinin 0
: 0
H
a , H
a: ve 0 H
a: alternatif hipotezlerine karşı test edilmesine 0 dönüşür. Buradan,
(
n m) (
n) (
m)
x yE X Y E X E Y ve
2 2
(
n m) (
n) (
m) (
x/ ) (
y/ )
Var X Y Var X Var Y n m olduğundan,
2 2
~ ( , ( / ) ( / ) )
n m x y x y
X Y N n m
ve
2 2
( X
n Y
m) / (
x/ ) ( n
y/ ) ~ (0,1) m N
dir. Ayrıca ( X
n Y
m) / (
x2/ ) ( n
2y/ ) m istatistiğinin gözlenen değerini
2 2
( ) / ( / ) ( / )
h n m x y
z x y n m
ile gösterelim.
A) Her iki kitlenin de varyansı biliniyor olsun. Bu durumda,
1. H
0:
x
yyokluk hipotezi H
a:
x
yalternatif hipotezine karşı anlam düzeyinde testi için test kuralı “ z
h z
ise H yokluk hipotezi red edilir” şeklinde olur.
02. H
0:
x
yhipotezi H
a:
x
yalternatif hipotezine karşı anlam düzeyinde test edilmek istendiğinde ise test kuralı “ z
h için z
H hipotezi red edilir”
0şeklindedir.
3. H
0:
x
yhipotezi H
a:
x
yalternatif hipotezine karşı anlam düzeyinde test edilmek istenirse, test kuralı “ | z
h| z
/2ise H yokluk hipotezi red edilir”
0şeklinde oluşturulur.
B) Kitlelerin varyansları bilinmiyor olsun. Bu durumda, kitle varyanslarının durumuna
göre uygulanacak testler farklılıklar gösterir. Kitle varyansları aynı (
x2
2y) ise varyans gerek X X
1,
2, , X
ngerekse Y Y
1 2, , , Y
mörneklem değerlerinden tahmin edilebilir.
Ancak, her iki kitlenin de varyansı aynı olduğundan varyansı iki örneklem de kullanılarak (toplam n m örnek değer ile) tahmin edildiğinde daha iyi bir sonuç vermesi beklenir.
Buna göre,
2yi X X
1,
2, , X
nörnekleminden S
n X2,ile, Y Y
1 2, , , Y
mörnekleminden
de S
m Y2,ile tahmin ederiz. Bu iki örneklemin beraber kullanılması halinde ise
2,
2 2
, ,
2
( 1) ( 1)
2
n X m Y
p
n S m S
S n m
ile tahmin edilir. İki örneklem bir birinden bağımsız olduğundan S de
P2
2nin yansız bir tahmin edicisidir. Diğer taraftan, Var X (
n Y
m) (
2x/ ) ( n
y2/ ) m
2((1/ ) (1/ )) n m olup, [( X
n Y
m) (
x
y)] / [ S
p(1/ ) (1/ ) ] ~ n m t
n m 2dir. Buna göre,
[( ) ( )] / [ (1/ ) (1/ ) ]
h n m x y p
t x y s n m
olmak üzere,
1. H
0:
x
yyokluk hipotezinin H
a:
x
yalternatif hipotezine karşı anlam düzeyinde testi problemi için test kuralı “ t
h t
n m 2( ) ise H hipotezi red edilir”
0şeklindedir.
2. H
0:
x
yyokluk hipotezi H
a:
x
yalternatif hipotezine karşı anlam düzeyinde test edilmek istenirse test kuralı “ t
h t
n m 2( ) ise H hipotezi red edilir”
0şeklinde oluşturulur.
3. H
0:
x
yyokluk hipotezi H
a:
x
yalternatif hipotezine karşı anlam düzeyinde test edilmek istendiğinde test kuralı, “ | t
h| t
n m 2( / 2) ise H yokluk
0hipotezi red edilir” şeklinde olur.
Örnek 9.1.2 Bir istatistik dersinin sınavı aynı anda iki farklı gruba uygulansın. Bu gruplardan rasgele seçilen 16 şar öğrencinin sınav notları aşağıda verilmiştir.
A Grubu (X) B Grubu (Y)
60 65 60 70 75 80 65 69 70 72 65 64 50 62 67 66
83 78 63 67 69 73 79 67 49 84 73 67 48 66 63 72
Verilere ait bazı özet bilgiler;
2 2
1 1 ,
1123 , 79587 , 70.1875 , 51.095
n n
i i n n X
i i
x x x s
2 2
1 1 ,
1038 , 68682 , 64.8750, 89.45
n n
i i m m Y
i i
y y y s
ve
2 2 2 2 2 2
, , , , , ,
2
( 1) ( 1) (16 1) (16 1)
70.27
2 (16 16) 2 2
n X m Y n X m Y n X m Y
p
n s m s s s s s
s n m
olarak hesaplanmıştır. Buna göre, birleştirilmiş standart hata s
p 8.38 olup H
0:
x
yyokluk hipotezinin H
a:
x
yalternatif hipotezine karşı testi problemini ele alalım. Test istatistiğinin değeri,
( ) ( ) (70.1875 64.8750) 16 70.1875 64.8750 (1/ ) (1/ ) 8.38 (1/16) (1/16) 8.38 2 1.8
n m x y
h p
x y
t s n m
olup, kritik değer 0.05 için t dağılım tablosundan t
30(0.05) 1.6973 olarak bulunur.
Buna göre, t
h 1.8 1.6973 t
30( ) olduğundan, H
0:
x
yhipotezi H
a:
x
yalternatif hipotezine karşı 0.05 anlam düzeyinde red edilir. Bu hipotez testi problemine ait testin red bölgesi ve red bölgesinin alanı Şekil (9.1.5) de verilmiştir.
Şekil 9.1.5 Örnek (9.1.2) deki hipotez testi propblemi için testin red bölgesi ve red bölgesinin alanı ( 0.05 )
Yani, 0.05 anlam düzeyinde birinci grup ikinci gruba göre ortalamada daha iyidir (daha yüksek beklenen değere sahiptir)
C) Bir önceki örnekte, iki kitlenin varyanslarının aynı olduğu kabul edildi. Kitle varyansları farklı ise, başka testlerin uygulanması gerektiğini söylemiştik. Öyleyse, böyle bir test yapılmadan önce, kitle varyanslarının aynı olup olmadığının sınanması (
2 2
0
:
x xH yokluk hipotezinin H
a:
2x
x2alternatif hipotezine karşı test edilmesi)
gerekir. Bunun için, S
n X2,ve S
m Y2,örneklem varyanslarının oranına bakmak yeterlidir.
2,
S
n Xve S
m Y2,oranlarının dağılımının serbestlik dereceleri n ve 1 m olan F 1 olduğunu biliyoruz. H
0:
2x
2yyokluk hipotezi altında (ortak varyansa
2diyelim),
2 2 2
, ,
2 2 2
, ,
[( 1) / ] / ( 1)
~ 1, 1
[( 1) / ] / ( 1)
n X n X
n Y m Y
S n S n
F F n m
S m S m
dir. Burada, F istatistiği F max{ S
n X2,, S
m Y2,}/ min{ S
n X2,, S
m Y2,} olarak alındığında, maksimuma karşılık gelen serbestlik derecesi df , minimum olana karşılık gelen serbestlik
1derecesi de df olmak üzere,
2F max{ S
n X2,, S
m Y2,} / min{ S
n X2,, S
m Y2,} ~ ( F df df
1,
2) olur.
Buradan, anlam düzeyinde, H
0:
x2
2yhipotezi H
a:
x2
2yalternatif hipotezine karşı test edilmek istenirse, F istatistiğinin gözlem (hesaplanan) değeri s
n X2,ve s
m Y2,örneklem varyanslarının hesaplanan değerleri ve F
h max{ s
n X2,, s
m Y2,} / min{ s
n X2,, s
m Y2,} olmak üzere, F
h F
1/2( df df
1,
2) ise H
0:
x2
2yyokluk hipotezi red edilir. Yani kitle varyansları farklıdır.
Yukarıdaki örnekte (Örnek (9.1.2)) varyansların eşit olduğu varsayılmış ve varyanslar
2,
51.095
s
n X ve s
m Y2, 89.45 olarak gözlenmişti. Buradan,
2 2
, , 0.95
2 2
, ,
max{ , } max{51.095 ,89.45} 89.45
1.75 2.40 (15,15) min{51.095 ,89.45} 51.095
min{ , }
n X m Y h
n X m Y
s s
F F
s s
olduğundan H
0:
2x
y2yokluk hipotezi red edilemez. Yani, varyansların aynı olduğu varsayımı istatistiki olarak anlamlıdır.
Aynı kitle üzerinden, farklı zamanlarda iki ayrı deneyin yapıldığını düşünelim.
Örneğin, bir istatistik dersinde öğrencilerin arasınav ortalamaları ile belli bir süre sonra uygulanan final sınavlarının ortalamalarının karşılaştırılması, öğrencilerin başarılarında bir gelişmenin olup olmadığının sınanmasıdır. Bu durumda, verileri iki ayrı veri gibi değerlendirmek yerine, aradaki farkların sıfır olduğunun test edilmesi daha anlamlı olur (belli bir artış da dikkate alınabilir). Bununla ilgili aşağıdaki örneği ele alalım.
Örnek 9.1.3 Bir istatistik dersinden rasgele seçilen 16 öğrencinin arasınav ve final
notları aşağıdadır. Buna göre, arasınavdan sonra öğrencilerin başarılarında bir artış olup
olmadığını 0.05 anlam düzeyinde test etmek isteyelim. İki ayrı örnek aynı kitle
üzerinden alındığı için, varyansları karşılaştırmaya gerek yoktur. Elde edilen farklardan
oluşan verilere ait varyans tahmininin dikkate alınması yeterlidir. Öğrencilerin başarılarında
bir gelişmenin sınanması demek, H
0:
x
yyokluk hipotezinin H
a:
x
y(veya
a
:
x yH ) alternatif hipotezine karşı test edilmesi demektir. Bu problem yerine,
i i i
Z Y X fark verileri ( H
0:
x
yhipotezi altında ( E X
n Y
n) 0 ) kullanılarak
1
,
2, ,
nZ Z Z örneklemine göre, H
0: hipotezi 0 H
a: (veya 0 H
a: ) 0 alternatif hipotezine karşı test edilir.
Arasınav, X Final, Y Fark, Z Y X
70 72 65 64 50 62 60 65 60 70 75 80 -10 -7 -5 6 25 18
67 66 49 84 73 67 65 69 83 78 63 67 -2 3 34 -6 -10 0
48 66 63 72 69 73 79 67 21 7 16 -5
Buna göre, fark verilerine ait gözlenen örneklem ortalama ve varyansı 5.3125
z
n ve
2 16
21
(1/15) 185.56
z i n
i
s z z
olarak hesaplanmıştır. 0.05 için tablo değeri t
15(0.05) 1.753 olup
/ 4(5.3125) /13.62 1.56 1.753
15(0.05)
h n z
t n z s t
olduğundan H
0: hipotezi 0 H
a: alternatif hipotezine karşı red edilemez. Yani, 0 öğrencilerin arasınav ortalamaları ile final ortalamaları aynıdır. Başka bir deyişle, öğrenciler arasınavdan sonra başarılarını geliştirmek için hiçbir çaba göstermemiştir. Ayrıca,
| t
h| 1.56 2.131 t
15(0.025) olduğundan H
0: hipotezi, aynı anlam düzeyinde 0
: 0
H
a alternatif hipotezine karşı da red edilemez
9.2. Olabilirlik Oran Testleri
Bir önceki kısımda, normal dağılımın parametrelerine ilişkin istatistiki sonuç çıkarımlar
üzerinde duruldu. Daha önce de belirtildiği gibi, test bir kuraldır. Hipotez testlerinde amaç
bu kuralın belirlenmesidir. Bir çok test kuralı parametrelerin en çok olabilirlik tahmin
edicilerine bağlı olarak geliştirilen olabilirlik oranının değerine göre oluşturulur. Bu
kısımda, herhangi bir kitlenin parametreleri için olabilirlik oran testlerinin (yani test
kuralının) elde edilme yöntemi üzerinde durulacaktır.
1
,
2, ,
nX X X parametresi ( ) olan kitleden bir örneklem olsun. H
0:
0yokluk hipotezinin H
a: alternatif hipotezine karşı test edilmesi problemini ele
0calalım. nın olabilirlik fonksiyonu ( ; L X x )
, nın en çok olabilirlik tahmin edicisi ˆ ve H
0: hipotezi altında
0 nın en çok olabilirlik tahmin edicisi de ˆ
0olsun.
Tanım 9.2.1 X X
1,
2, , X
nparametresi olan kitleden bir örneklem olsun.
0
:
0H yokluk hipotezinin H
a: alternatif hipotezine karşı testi problemi için,
0colabilirlik oranı,
0 0sup ( ; )
( ; ˆ ) sup ( ; ) ( ; ˆ )
L X x
L X x
x L X x L X x
olup olabilirlik oran testi, red bölgesi 0 için c 1 { : ( ) x x c }
R olan bir kuraldır
Tanıma göre, H
0: yokluk hipotezinin
0H
a: alternatif hipotezine karşı
0ctest edilmesi için en çok olabilirlik kuralı,
1 , ( )
0 , . . x c
x d y
şeklinde yazılabilir. Önceden belirlenen bir sayısı (testin anlam düzeyi, birinci tür hata olasılığı) kullanılarak c sayısı belirlenir. Belirlenen c sayısına göre ( ) x c
oluyorsa,
0
:
0H hipotezi red edilir. c sabitinin belirlenmesi testin red bölgesinin belirlenmesi olup, hesaplanan ( ) x
değeri testin red bölgesi içinde kalıyorsa, H
0: hipotezi red
0edilir. Şimdi, olabilirlik oran testlerinin elde edilmesi ile ilgili birkaç örnek verelim.
Örnek 9.2.1 a) ( ,1) N dağılımından bir örneklem X X
1,
2, , X
nolsun. Önceden
belirlenen
0sayısı için H
0:
0yokluk hipotezini H
a:
0alternatif hipotezine
karşı test etmek isteyelim. olduğu için parametre kümesi dir. nün en çok
olabilirlik tahmin edicisi ˆ X
ndir. Ayrıca, H
0:
0hipotezi altında parametre
kümesi (
0{ }
0) tek elemanlı bir küme olup nün H hipotezi altındaki en çok
0olabilirlik tahmin edicisi de
0dır (parametre kümesinde alabileceği başka değer yoktur).
Yani ˆ
0
0dir. Buradan olabilirlik oranı ( ) x
,
0
/2 2
1 0 0
/2 2
1
sup ( ; ) ( ; ˆ ) (2 ) exp 1 2
( ) sup ( ; ) ( ; ˆ ) 1
(2 ) exp 2
n n
i i n n
i n
i
L X x x
L X x
x L X x L X x
x x
2 2 2
0 0
1 1
1 1
exp ( ) ( ) exp ( )
2 2 2
n n
i i n n
i i
x x x n x
şeklinde yazılır. Ayrıca,
2 2 2
0 0
1 1
( ) ( ) ( )
n n
i i n n
i i
x x x n x
olup 0 için testin red bölgesinin c 1 { : ( ) x x c }
R olduğunu biliyoruz. Buradan,
1 0 2 1 0
2
1( ) exp ( ) | | ln( )
2
n nx c n x c x c c
n
ve ( ) x c
1 | x
n
0| c
dikkate alındığında red bölgesi, { : | x x
n
0| c }
R olan
test kuralı
1 , |
0|
0 , . .
x
nc
x d y
olarak yazılır. Testin anlam düzeyi seçilerek c sabiti belirlenir.
b) Aynı örneklem için H
0:
0yokluk hipotezinin H
a:
0alternatif hipotezine karşı test edilmesi problemini ele alalım. Yine
0{ }
0olduğundan en çok olabilirlik tahmin edicileri ˆ
0
0ve ˆ X
ndir. Alternatif hipotez altında,
0ise
0
x
n olur ( x
n
0 ). Buna göre, 0 ( ) x c
1 ise x
n dir. Yani, c
1exp
0
2 1
0
22 ln( )
12
n nx c n x c x c
n
olduğundan,
0
2
1 02
1| x
n| ln( ) c x
nln( ) c x
nc
n n
dir. Dolayısı ile, red bölgesi { : x x
n c }
R olan test fonksiyonu
1 ,
0 , . . x
nc
x d y
şeklinde yazılır. Yine, testin anlam düzeyi seçilerek c sabiti belirlenir.
c) X X
1,
2, , X
nbeklenen değeri olan üstel dağılımdan bir örneklem olsun.
Önceden belirlenen bir
0sayısı (
0 ) için
H
0:
0hipotezinin H
a:
0alternatif hipotezine karşı testi problemini ele alalım. nın en çok olabilirlik tahmin edicisi
ˆ X
n ve
0{ }
0olduğundan ˆ
0
0dır. Olabilirlik oranı ise,
0 01
0 1
1 0 0
1
( ) exp ( ; ˆ )
( ) ( / ) exp
( ; ˆ )
( ) exp ( )
n n
i i n n
n n
n n n i
i
L X x x n x
x x n
L X x
x x x
olup,
1 0 2
( ) x c ( ) exp( ( x
n nn x
n) / ) c
denkliği dikkate alındığında ( ) x c
1 ile bazı a ve b reel sayıları için x
n ve a x
n b denk önermelerdir. Bu durum, aşağıdaki grafikte de görülmektedir (Şekil (9.2.1)). Yani, bazı , a b için
0 2
( ) exp( ( x
n n nx
n) / ) c x
n a ve x
n b önermeleri denktir. Buna göre, x c
ise bazı , a b için
x
n a veya x
n olup b testin red bölgesi, { : x x
n a veya x
n b }
R olarak yazılabilir.
Şekil 9.2.1 Örnek (9.2.1) deki hipotez testi probleminin red bölgesi ve red bölgesinin alanı
Buradan da, olabilirlik oran testi
1 , veya
0 , . .
n n
x a x b
x d y
şeklinde olur
Olabilirlik oran testleri birden fazla kitle parametresinin testi için de kullanılabilir.
Örneğin, X X
1,
2, , X
nparametresi olan kitleden bir örneklem, Y Y
1 2, , , Y
mde parametresi olan başka bir kitleden alınan başka bir örneklem olsun. Bu durumda parametre kümesi, {( , ):
,
} şeklinde olup ( X Y ,
i, )
ii 1, 2,3,..., n ortak olasılık veya olasılık yoğunluk fonksiyonu ( , ; , ) f x y olan kitleden alındığında, ve için herhangi bir istatistiki sonuç çıkarımda olabilirlik oran yöntemi kullanılabilir.
Örnek 9.2.2 X X
1,
2, , X
nbeklenen değeri olan üstel dağılımdan bir örneklem ve bu örneklemden bağımsız, beklenen değeri olan başka bir üstel dağılımdan bir örneklem de Y Y
1 2, , , Y
molsun. Buna göre, H
0: yokluk hipotezinin H
a: alternatif hipotezine karşı test edilmesi problemini ele alalım. Bu durumda olabilirlik fonksiyonu,
1 1 1 1
( , ; , )
n m( ,
i j; , )
n m X( ; ) ( ; )
i Y ji j i j
L X x Y y f x y f x f y
1 1
1 1
exp
nexp
nn m
i j
i i
x y
şeklinde olup log-olabilirlik fonksiyonu da
1 1
1 1
( , ) ln( ( , ; , )) ln( )
n iln( )
n ji i