ifadesinin dağılımı yaklaşık olarak p serbestlik dereceli 2’ dir

(1)

13. HAFTA

Kitle Ortalaması Hakkında Büyük Örneklem Sonuç Çıkarımları

Örneklem çapı büyük olduğunda, normallik varsayımları sağlanmasa da  için hipotez testleri ve güven bölgeleri oluşturulabilir. Örneklem çapı n değeri büyük olduğunda, örneklemin alındığı kitlenin dağılımı kesikli olsa da, kitle ortalaması için sonuç çıkarımı yapılabilir.

Büyük örneklemin avantajı, sadece örneklem ortalama vektörü X ve örneklem varyans- kovaryans matrisiS gibi temel istatistiklerin kullanılması ile kaybolan örneklem bilgisini dengeler. Diğer taraftan X ve S istatistikleri normal kitleler için yeterli istatistikler olduğundan, dağılım çok değişkenli normal dağılıma yakın olduğunda sonuç çıkarımlarında daha etkin örneklem bilgisinden faydalanılacaktır.

 hakkındaki bütün büyük örneklem sonuç çıkarımları ² dağılımına bağlıdır.

1

( ) S ( ) ( ) 1( )

X X n X S X

 n   



  

 

       

ifadesinin dağılımı yaklaşık olarak p serbestlik dereceli ²’ dir. Buradan

1 2

[ ( ) ( ) _p( )] 1

P n X ^S^ X       dır.

Sonuç: ,X X₁ ₂,...,X , ortalama vektörü_n  ve pozitif tanımlı varyans-kovaryans matrisi olan bir kileden rasgele bir örneklem olsun. n ve (n p ) büyük olduğunda, H₀:  ₀ hipotezinin,

1: 0

H   hipotezine karşı anlam düzeyli yaklaşık testinde

1 2

( x ) ( x ) _p( )

n  ^S^    ise H hipotezi reddedilir. ₀

Bu test daha önce normallik varsayımı sağlandığında verilen T² n X( )^S^¹( X ) istatistiği ile karşılaştırıldığında, test istatistiklerinin yapısı aynı ancak kritik değerler farklıdır.

n ve (n p ) yeterince büyük olduğunda, bu iki kritik değer yaklaşık aynı olacaktır.

(2)

Sonuç: ,X X₁ ₂,...,X , ortalama vektörü_n  ve pozitif tanımlı varyans-kovaryans matrisi olan bir kileden rasgele bir örneklem olsun. n ve (n p ) büyük olduğunda,

x 2_p( ) l Sl l    ^n

aralığı (1) yaklaşık olasılığı ile her l için l ’yü içerir.  Sonuç olarak (1)’lık eşanlı güven aralığı ifadeleri

2 11

1 1

2 22

2 2

2

( ) 'i içerir

( ) 'yi içerir

p

pp

p p p

x s

n x s

n

x s

n

  



 



olarak elde edilir. Bununla birlikte, her ( , _i _k) ; ,i k1, 2,...,p çifti için örneklem ortalama merkezli elipsler

1

[ _i _i _k _k] ⁱⁱ ^ik ⁱ ⁱ 2_p( )

ik kk k k

s s x

n x x

s s x

    



 

   

        , ( , _i _k)’yı içerir.

Örnek : Bir müzik öğreticisi Fillandiya’daki, Finli öğrencilerin yerli müzik alışkanlıklarını araştırmıştır. 12 yaşındaki 96 Finli öğrencinin 7 değişkene ilişkin gözlem değerlerine ait temel istatistikler aşağıdaki gibidir:

x i s _ii X :Ezgi, Hava 1 28.1 5.76

X :Ses uyumu 2 26.6 5.85

X :Tempo(tarz) 3 35.4 3.82

X :Ölçü 4 34.2 5.12

X :Deyim kurma tarzı 5 23.6 3.76

X :Denge 6 22.0 3.93

X :Stil 7 22.7 4.03

(3)

Bireysel , _i i1, 2,...,7 ortalama bileşenleri için %90 eşanlı güven aralıklarını elde ediniz.

Çözüm : Burada 1  0.90 ve  0.10 olur. Böylece %90 eşanlı güven sınırları

2

7(0.10) ⁱⁱ ; 1,2,...,7

i

x s i

 n

 

ifadesinden elde edilir. Burada ₇²(0.10) 12.02 dir. Eşanlı güven aralıkları sırasıyla,

1 1

2 2

3 3

4 4

için; 28.1 12.02 5.76 veya 26.06 30.14 96

için; 26.6 12.02 5.85 veya 24.53 28.67 96

için; 35.4 12.02 3.82 veya 34.05 36.75 96

için; 34.2 12.02 5.12 veya 32.39 3 96

 

  

5 5

6 6

7 7

6.01 için; 23.6 12.02 3.76 veya 22.27 24.93

96

için; 22.0 12.02 3.93 veya 20.61 23.39 96

için; 22.7 12.02 4.03 veya 21.27 24.13 96

 

  

biçiminde elde edilir.

Amerikalı öğrencilerin yerli müzik alışkanlarına ilişkin ortalama vektör

 

0 31 27 34 31 23 22 22

  olmak üzere, Finli ve Amerikalı öğrenciler arasında fark var mıdır?

Amerikalı öğrencilerin  ortalama vektörünün Ezgi, Tarz ve Ölçü bileşenleri, Finli öğrenciler ₀ için elde edilen aralıkların dışında kaldığından; Amerikalı ve Finli öğrencilerin müzik alışkanlıkları farklıdır.

(4)

İki Çok Değişkenli Kitle Ortalama Vektörünün Karşılaştırılması

Bu kısımda iki bağımlı ve iki bağımsız kitlenin ortalamaları karşılaştırılacaktır.

Bağımlı İki Çok Değişkenli Kitle Ortalamasının Karşılaştırılması

Bağımlı iki kitlenin karşılaştırılmasına önce-sonra veya eş karşılaştırma da denmektedir. p boyutlu X rasgele vektörü için 2 deneme(önceki ve sonraki) ve n tane deneysel birim sözkonusudur. Buradan j inci birim için iki bağımlı kitleye ilişkin veri yapısı;

11_j:

X 1 inci deneme, 1 inci değişken

12_j:

X 1 inci deneme, 2 inci değişken _

1_pj:

X 1 inci deneme, p inci değişken ---

21_j:

X 2 inci deneme, 1 inci değişken

22_j:

X 2 inci deneme, 2 inci değişken _

2_pj:

X 2 inci deneme, p inci değişken

biçimindedir ve p tane eş karşılaştırmaya ilişkin rasgele değişkenler

1 11 21

2 12 22

1 2

j j j

pj pj pj

D X X

 



olarak elde edilir.

1 , 2 ,...,

j j j pj

D  D D D  olsun ve j1, 2,...,n için

(5)

1 2

( )

j

p

E D 





  

 

  

  



ve

( _j) _d Cov D  

olduğu kabul edilsin. Eğer X N_p( , )  ise, D_j N_p( , _d) dir. Buradan D D₁, ₂,...,D , _n ( , )

p d

N   ’den bağımsız rasgele vektörler ise,  ortalama farkları vektörü hakkında sonuç çıkarımları T istatistiğine göre yapılır. ²

Sonuç: D D₁, ₂,...,D farkları, _n N_p( , _d)kitlesinden rasgele bir örneklem olsun. Buradan  ve

 ne olursa olsun d

2 1

,

( 1)

( ) ( )

( )

d p n p

n p

T n D S D F

  ^  n p^ _

  

 

dir. Normallik varsayımı sağlanmadığında n ve (n p )’ nin her ikisi de yeterince büyük ise T ² istatistiğinin dağılımı yaklaşık ²_p’dir. Burada

1

1 ⁿ

j j

D D

n _

  ^ve

1

1 ( ) ( )

1

n

d j j

j

S D D D D

n _ 

  

 

farklara ilişkin örneklem ortalama vektörü ve örneklem varyans-kovaryans matrisidir.

1_j, 2_j,..., _pj

D D D fark rasgele değişkenlerinin gözlem değerleri

1 2 , 1, 2,...,

j j j pj

d d d  d  j n olsun. D_j N_p( , _d) olduğunda

0

1

: 0

H H







hipotezinin testi için eğer

2 1

,

( 1)

( )

d p n p

n p

T n d S d F

n p 



 

 



ise H hipotezi reddedilir. Burada, d ve ₀ S , D ve _d S tahmin edicilerinin örneklemlerden _d elde edilen değerleridir.

(6)

Bununla birlikte  ortalama vektörün , _i i1, 2,...,p bireysel ortalama farkları için (1)

’lık eşanlı güven aralıkları

2 ,

( 1)

: ( ) , 1, 2,...,

( )

di

i i p n p

p n s

d F i p

n p n

  ^ _  



ile verilir. Burada d_i, d ’nin i inci elemanı ve ²

di

s , S ’nin i inci diagonal elemanıdır. _d

n ve (n p )’ nin her ikisi de yeterince büyük ise ⁽ ¹⁾ _, ( ) ²( )

( ) ^{p n p} ^p

p n F

n p^ _   

 dir ve bu durumda

normallik varsayımlarına ihtiyaç yoktur.

Örnek: (Alpar, 2009). Bir çocuk gelişim uzmanı A gibi bir hastalığa yakalanan çocukların kavrama ve denge düzeylerini verilecek bir eğitimle değişeceğini iddia etmektedir. Bu amaçla A hastalığına yakalanan çocuklardan 21 tanesini rasgele seçerek kavrama denge düzeylerini hem eğitimden önce, hem de eğitimden sonra gözleyerek aşağıdaki değerleri elde etmiştir.

Eğitimin etkili olup olmadığını %5 anlam düzeyinde göre test ediniz. Eğer farklılık var ise farklılığı yaratan bileşeni belirleyerek, tüm sonuçlarınızı yorumlayınız.

Birimler

Eğitimden Önce Eğitimden Sonra Farklar

Kavrama (x_{11 j})

Denge (x_{12 j})

Kavrama (x_{21 j})

Denge

(x_{22 j}) d1j x11jx21j d₂_j x₁₂_jx₂₂_j

1 25 2.0 26 2.3 -1 -0.3

2 22 2.2 22 1.6 0 0.6

3 28 2.7 29 3.0 -1 -0.3

4 35 2.7 39 3.3 -4 -0.6

5 37 3.0 36 4.1 1 -1.1

6 48 1.0 51 1.7 -3 -0.7

7 49 2.7 48 3.3 1 -0.6

8 36 1.8 36 2.0 0 -0.2

9 42 2.0 43 2.4 -1 -0.4

10 40 3.4 42 2.9 -2 0.5

11 40 1.6 43 2.0 -3 -0.4

12 32 2.1 33 2.2 -1 -0.1

13 30 2.2 34 3.0 -4 -0.8

(7)

14 28 0.9 31 1.3 -3 -0.4

15 26 1.8 28 2.4 -2 -0.6

16 34 1.2 36 2.1 -2 -0.9

17 38 1.6 40 2.6 -2 -1.0

18 40 1.8 41 2.5 -1 -0.7

19 43 2.0 45 2.5 -2 -0.5

20 35 2.1 36 2.7 -1 -0.6

21 43 2.3 44 2.9 -1 -0.6

Çözüm:

0

1

: 0

H H







olmak üzere öncelikle

2 _d1

T n d S d ^

değeri elde edilmelidir. Bunun için farklara ilişkin örneklem değerleri 1.524

0.462

d  

   , 1.9619 0.0810 0.0810 0.1765

Sd  

  

  olmak üzere ¹ 0.519554 0.23844

0.23844 5.77515

Sd^   

  

olarak bulunur. Buradan,

 

2 1

0.519554 0.23844 1.524 21 1.524 0.462

0.23844 5.77515 0.462 1.524

21 0.68164 2.30473

0.462 44.17

T n d S d d^

 

   

       

 

    

 2

p , n21 ve  0.05 için tablo değeri

, ( ) 2,19(0.05) 3.52

p n p

F _  F



dir ve buradan kritik değer

(8)

,

( 1) 2(21 1)

( ) (3.52)

( ) (21 2)

7.41

p n p

p n F

n p^ _   ^

 

 olarak bulunur ve

2 44.17 7.41

T   olduğundan H₀ hipotezi reddedilir ve eğitim yönteminin etkili olduğu sonucuna varılır. Hipotezin reddine sebep olan bileşenin yani eğitimin kavrama ve denge düzeylerinin her ikisinde mi, yoksa sadece birinde mi etkili olup olmadığını görmek için

’nın bileşenleri olan  ve ₁  ortalama farkları için %95’lik eşanlı güven aralıkları elde ₂ edilmelidir. Buradan;

1

2

1 1 ,

( 1)

: ( ( ) )

( )

1.9619 ( 1.524 7.41 )

21 ( 2.356 ; 0.692)

d p n p

p n s

d F

n p n

  ^ _ 



 

 

ve

2

2 2 ,

( 1)

: ( ( ) )

( )

0.1765 ( 0.462 7.41 )

21 ( 0.716 ; 0.213)

d p n p

p n s

d F

n p n

  ^ _ 



 

 

dır.  ve ₁  ortalama farkları için elde edile güven sınırları incelendiğinde, aralıkların her ikisi ₂ de H₀ hipotezinde iddia edilen “0” değerini içermemektedir. Bu da H₀ hipotezinin reddedilmesine her iki bileşeninde sebep olduğunu göstermektedir. Yani A hastalığına yakalanan çocuklara verilen eğitim, çocukların kavrama ve denge düzeylerinin gelişmesini sağlamıştır.