FEN EDEBİYAT FAKÜLTESİ istatistik BÖLÜMÜ

(1)

65

T.C.

ONDOKUZ MAYIS ÜNİVERSİTESİ

FEN EDEBİYAT FAKÜLTESİ iSTATİSTİK BÖLÜMÜ

ÇOK DEĞİŞKENLİ İSTATİSTİK I DERSİ

DOÇ. DR. YÜKSEL ÖNER

9. Hafta

[email protected] www.omu.edu.

(2)

65 BÖLÜM 4

ÇOK DEĞİŞKENLİ HİPOTEZ TESTLERİ

Çok değişkenli kitleler için parametrelere ilişkin hipotezlerin test edilmesinde kullanılan test istatistikleri iki yaklaşıma göre türetilmektedir.

i) Olabilirlik Oran Testi (O.O.T) ii) Bileşim Kesişim Testi (BKT) 4.1 Olabilirlik Oran Testi

Bu yaklaşım kitle parametrelerinin en çok olabilirlik tahmin edicilerine dayalı bir yöntemdir.

Öncelikle 𝐻₀ ve 𝐻₁ hipotezleri altında parametrelerin en çok olabilirlik tahmin edicileri belirlenir ve bu hipotezler altında örnekleme ait olabilirlik fonksiyonu maksimize edilir. Elde edilen iki fonksiyon birbirine oranlanarak test istatistiği kurulmaya çalışılır.

𝜃 : Kitleye ait tüm parametreleri kapsayan parametre vektörü Ω : Parametre vektörü için parametre uzayı

𝜃₀ : Elemanları bilinen bir vektör

Ω₀ : Parametre uzayının ve 𝜃 ₀ vektörünün tanımlı olduğu alt uzay olmak üzere (Ω₀ ⊂ Ω) hipotezler;

𝐻₀: 𝜃 = 𝜃₀ veya 𝐻₀: 𝜃 ∈ Ω₀

𝐻₁: 𝜃 ≠ 𝜃₀ veya 𝐻₀: 𝜃 ∉ Ω₀ (𝑦𝑎 𝑑𝑎 𝜃 ∈ Ω) (4.1) olur. Eğer boy(Ω) = 𝑣 ve boy(Ω₀) = 𝑣₀ ise 𝑣₀ < 𝑣 dir.

𝐿(𝜃) örneklemin olabilirlik fonksiyonu ve max

𝜃∈Ω0

𝐿(𝜃): 𝐿(𝜃)’nın 𝐻₀ hipotezi altındaki maksimum değeri ve max

𝜃∈Ω𝐿(𝜃): 𝐿(𝜃)’nın 𝐻₁ hipotezi altındaki maksimum değeri olmak üzere, test istatistiği;

Λ =

𝜃∈Ω0max𝐿(𝜃)

max 𝜃∈Ω𝐿(𝜃) , 0 ≤ Λ ≤ 1 (4.2) şeklinde ifade edilir ve Wilks’in Olabilirlik Oran İstatistiği olarak bilinir.

Örneğin; 𝑋~𝑁_𝑝(𝜇 , Σ) dağılımı verilsin. Bu durumda parametre vektörü;

𝜃^′= [𝜇₁ 𝜇₂… 𝜇_𝑝; 𝜎₁₁ 𝜎₁₂ … 𝜎_1𝑝 𝜎₂₂ 𝜎₂₃… 𝜎_2𝑝 … 𝜎_𝑝𝑝 ] olur. Böylece Ω-parametre uzayı için boy(Ω) = 𝑣 = 𝑝 +^𝑝(𝑝+1)

2 dir. 𝜇₀^′ = [𝜇₁₀ 𝜇₂₀ … 𝜇_𝑝0]: 𝑝 × 1 bilinen bir vektör olmak üzere 𝜃₀^′ = [𝜇₁₀ 𝜇₂₀… 𝜇_𝑝0; 𝜎₁₁ 𝜎₁₂ … 𝜎_1𝑝 𝜎₂₂ 𝜎₂₃… 𝜎_2𝑝 … 𝜎_𝑝𝑝 ] olsun. Bu 𝜃₀

(3)

66

vektörünün tanımlı olduğu uzay Ω₀ ise Ω₀ ⊂ Ω ve boy(Ω₀) = 𝑣₀ =^𝑝(𝑝+1)

2 , (𝑣 > 𝑣₀) olur.

Buna göre test edilecek hipotezler;

𝐻₀: 𝜇 = 𝜇₀

𝐻₁: 𝜇 ≠ 𝜇₀ (4.3) iken, test istatistiği Eşitlik (4.2) gereğince;

Λ =

𝜇∈Ω0max𝐿(𝜃)

max 𝜇∈Ω𝐿(𝜃) , 0 ≤ Λ ≤ 1 (4.4) şeklinde yazılabilir. 𝑐 > 0 bir sabit olmak üzere, eğer Λ < c ise 𝐻₀ hipotezi ret edilir. Karar verme kriteri olan 𝑐 noktası Λ istatistiğinin örnekleme dağılımı üzerinde 𝛼 önem seviyesinde belirlenecek olan kritik değer olarak alınabilir. Λ istatistiğinin örnekleme dağılımı için;

i) İstatistiğin alabileceği değerlere karşılık bu değerleri alma olasılıkları belirlenerek kesin bir olasılık dağılımı kurulabilir.

ii) Örnek hacminin yeterince büyük olması durumunda dönüşümler uygulayarak bilinen olasılık dağılımlarına dönüştürülmek suretiyle yaklaşık bir olasılık dağılımı kullanılabilir. Uygulanacak dönüşüm sonrasında;

−2𝑙𝑛Λ = −2ln [

𝜇∈Ω0max𝐿(𝜃)

max 𝜇∈Ω𝐿(𝜃)] ~𝜒_𝑣−𝑣² ₀ (4.5) istatistiği elde edilmektedir. Buna göre Λ < c iken −2𝑙𝑛Λ > −2lnc = 𝜒_𝑣−𝑣² ₀_∶𝛼 ise 𝐻₀ hipotezi ret edilir.

4.2 Bileşim Kesişim Testi

Bu test için amaç çok değişkenli kitleyi uygun bir dönüşümle, çok değişkenli kitledeki değişkenlerin doğrusal fonksiyonundan oluşan tek değişkenli kitleye dönüştürmektir. Böylece Eşitlik (4.1) veya (4.3) ile verilen hipotezler yerine dönüşüm kitlesinin parametreleri üzerine kurulacak olan hipotezler test edilir. Bu yeni hipotezleri test etmek için gerekli olan test istatistikleri tek değişkenli istatistiksel analizde verilen test istatistiklerinin genelleştirilmiş şekli olacaktır. Eğer çok değişkenli kitle 𝑋 ∶ 𝑝 × 1 ve parametreleri; ortalama vektörü 𝜇: 𝑝 × 1 ve varyans kovaryans matrisi Σ ∶ 𝑝 × 𝑝 olmak üzere test edilecek hipotezler Eşitlik (4.3)’deki gibi olsun. 𝑎 ∶ 1 × 𝑝 boyutlu bilinen bir vektör olsun. 𝑌 = 𝑎 𝑋 = 𝑎₁𝑋₁+ 𝑎₂𝑋₂+ ⋯ + 𝑎_𝑝𝑋_𝑝 dönüşümü çok değişkenli kitleyi tek değişkenli kitleye dönüştüren doğrusal dönüşümdür. Bu dönüşüm kitlesi için parametreler; kitle ortalaması 𝐸(𝑌) = 𝑎 𝜇 ve kitle varyansı 𝜎_𝑌² = 𝑎Σ𝑎^′ olur. Bu kitle parametresi ile ilgili hipotezler Eşitlik (4.3)’de verilen hipotezlerde her iki taraf 𝑎 vektörü ile soldan çarpılarak oluşturulur.

(4)

67 𝐻₀: 𝑎 𝜇 = 𝑎 𝜇₀

𝐻₁: 𝑎 𝜇 ≠ 𝑎 𝜇₀ (4.6) Bileşim kesişim testinin amacı yeni oluşturulan bu hipotezleri test etmek için ihtiyaç duyulan test istatistiğini tek değişkenli istatistiğin kavramlarından yararlanarak türetmektir. Verilen karar çok değişkenli kitle üzerinde değerlendirilir.

4.3 Çok Değişkenli Normal Kitlede Kitle Ortalama Vektörüne Ait Hipotez Testi

𝑋~𝑁_𝑝(𝜇 , Σ) dağılımına sahip bir çok değişkenli kitle verilsin ve 𝜇: 𝑝 × 1 kitle ortalama vektörü bilinmiyor olsun. Bu parametre ile ilgili hipotez testinde test istatistiğinin belirlenmesi, Σ matrisinin bilinip bilinmemesine bağlıdır.

i) 𝚺 biliniyor kabul edelim.

𝜇₀ ∈ 𝐼𝑅^𝑝 bilinen bir kolon vektörü iken test edilecek hipotezler 𝐻₀: 𝜇 = 𝜇₀

𝐻₁: 𝜇 ≠ 𝜇₀ (4.7) şeklindedir. Bu hipotezleri test etmek için gerekli olan test istatistiği Bölüm 4.1 ve 4.2’de bahsedilen yöntemlerin her ikisi ile de türetilebilir.

i.a) Olabilirlik Oran Testi ile:

Verilen çok değişkenli kitleden rastgele çekilen 𝑛 birimlik ir örnek 𝑋₁, 𝑋₂, … , 𝑋_𝑛 olsun.

𝑖 = 1, 2, … , 𝑛 için 𝑋_𝑖~𝑁_𝑝(𝜇 , Σ) ve 𝑋_𝑖’ler bağımsızdır. Bu durumda örneğin olabilirlik fonksiyonu;

𝐿 (𝜇 , Σ) = 𝑓(𝑥₁, 𝑥₂, … , 𝑥_𝑛) = ∏^𝑛_𝑖=1𝑓_𝑋_𝑖( 𝑥_𝑖)

= ∏ ¹

(2𝜋)^𝑝/2|Σ|^1/2𝑒𝑥𝑝 {−¹

2( 𝑥_𝑖− 𝜇)^′Σ⁻¹( 𝑥_𝑖 − 𝜇)}

𝑛𝑖=1

= (2𝜋)^{−𝑛𝑝/2}|Σ|^−𝑛/2𝑒𝑥𝑝 {−¹

2∑^𝑛_𝑖=1( 𝑥_𝑖− 𝜇)^′Σ⁻¹( 𝑥_𝑖 − 𝜇)} (4.8) olur. Bu fonksiyonun 𝐻₀ hipotezi altında maksimum değeri;

max𝜇∈Ω₀𝐿 (𝜇 , Σ) = 𝐿 (𝜇₀ , Σ)

= (2𝜋)^{−𝑛𝑝/2}|Σ|^−𝑛/2𝑒𝑥𝑝 {−¹

2∑^𝑛_𝑖=1( 𝑥_𝑖− 𝜇₀)^′Σ⁻¹( 𝑥_𝑖− 𝜇₀)} (4.9) olacaktır. Şimdi ∑^𝑛_𝑖=1( 𝑥_𝑖 − 𝜇₀)^′Σ⁻¹( 𝑥_𝑖 − 𝜇₀) ifadesini ele alalım ve bu terim içerisinde 𝑆 = ¹

𝑛−1∑^𝑛_𝑖=1(𝑥_𝑖 − 𝑋)(𝑥_𝑖 − 𝑋)^′⇒ (𝑛 − 1)𝑆 = ∑^𝑛_𝑖=1(𝑥_𝑖 − 𝑋)(𝑥_𝑖− 𝑋)^′terimini türetmeye çalışalım. Toplam altındaki ifade 1 × 1 tipinde bir skaler ifade olduğundan, İz’i kendisine eşit

(5)

68

olacaktır, bu sebeple İz’i alınabilir. Bunu uygulamaktaki amaç İz operatörünün özelliklerinden yararlanarak vektör veya matris çarpımlarına yer değiştirebilme imkânı sağlamaktır. Bu durumda;

∑^𝑛_𝑖=1( 𝑥_𝑖− 𝜇₀)^′Σ⁻¹( 𝑥_𝑖− 𝜇₀)= ∑^𝑛_𝑖=1İ𝑧 [( 𝑥_𝑖 − 𝜇₀)^′Σ⁻¹( 𝑥_𝑖 − 𝜇₀)]

= ∑^𝑛_𝑖=1İ𝑧 [Σ⁻¹( 𝑥_𝑖 − 𝜇₀) ( 𝑥_𝑖 − 𝜇₀)^′] ; ( İçerideki her iki parantez içerisine 𝑋 ekle çıkart)

= ∑^𝑛_𝑖=1İ𝑧 [Σ⁻¹( 𝑥_𝑖 − 𝑋 + 𝑋 − 𝜇₀) ( 𝑥_𝑖 − 𝑋 + 𝑋 − 𝜇₀)^′]

= ∑^𝑛_𝑖=1İ𝑧 {Σ⁻¹[(𝑥_𝑖 − 𝑋 )(𝑥_𝑖− 𝑋 )^′+ 2(𝑥_𝑖 − 𝑋 ) (𝑋 − 𝜇₀)^′+ (𝑋 − 𝜇₀) (𝑋 − 𝜇₀)^′]}

= İ𝑧 {Σ⁻¹∑^𝑛_𝑖=1(𝑥_𝑖− 𝑋 )(𝑥_𝑖 − 𝑋 )^′+ 2Σ⁻¹∑^𝑛_𝑖=1(𝑥_𝑖− 𝑋 ) (𝑋 − 𝜇₀)^′+ 𝑛(𝑋 − 𝜇₀) (𝑋 − 𝜇₀)^′}, [∑ (𝑥

𝑖− 𝑋 ) (𝑋 − 𝜇

0)^′ =[∑ 𝑥

𝑖− 𝑛𝑋

𝑛𝑖=1 ] (𝑋 − 𝜇

0)^′= (𝑛𝑋 − 𝑛𝑋 )

𝑛𝑖=1 (𝑋 − 𝜇

0)^′ = 0 olduğundan son ifadenin ikinci terimi sıfırdır.]

= İ𝑧 {Σ⁻¹(𝑛 − 1)𝑆 +∑ (𝑥_𝑖− 𝑋 ) (𝑋 − 𝜇

0)^′+ 𝑛

𝑛𝑖=1 (𝑋 − 𝜇

0) (𝑋 − 𝜇

0)^′}

= (𝑛 − 1)İ𝑧(Σ⁻¹𝑆) + 𝑛İ𝑧 [Σ⁻¹(𝑋 − 𝜇

0) (𝑋 − 𝜇

0)^′]

= (𝑛 − 1)İ𝑧(Σ⁻¹𝑆) + 𝑛İ𝑧 [(𝑋 − 𝜇

0)^′Σ⁻¹(𝑋 − 𝜇

0)] , ( ikinci terimdeki köşeli parantez içerisi 1 × 1 olduğundan bu ifadenin İz’i kendisine eşit olacaktır. Böylece;

= (𝑛 − 1)İ𝑧(Σ⁻¹𝑆)+ 𝑛(𝑋 − 𝜇₀)^′Σ⁻¹(𝑋 − 𝜇₀) (4.10) elde edilir. Bu sonuç Eşitlik (4.9)’da yerine yazılırsa;

𝐿 (𝜇₀ , Σ) = (2𝜋)^{−𝑛𝑝/2}|Σ|^−𝑛/2𝑒𝑥𝑝 {−¹

2[(𝑛 − 1)İ𝑧(Σ⁻¹𝑆)+ 𝑛(𝑋 − 𝜇₀)^′Σ⁻¹(𝑋 − 𝜇₀)]}

(4.11) elde edilir. Olabilirlik fonksiyonunun 𝐻₁ hipotezi altında maksimum değeri;

max 𝜇∈Ω𝐿 (𝜇 , Σ) = 𝐿(𝑋 , Σ) = (2𝜋)^{−𝑛𝑝/2}|Σ|^−𝑛/2𝑒𝑥𝑝 {−¹

2∑^𝑛_𝑖=1( 𝑥_𝑖 − 𝑋 )^′Σ⁻¹( 𝑥_𝑖− 𝑋 )} (4.12) Burada da toplam altındaki ifade 1 × 1 tipinde bir skaler ifade olduğundan, İz’i kendisine eşit olacaktır, bu sebeple İz’i alınabilir. Bu durumda:

∑^𝑛_𝑖=1( 𝑥_𝑖− 𝑋 )^′Σ⁻¹( 𝑥_𝑖− 𝑋 )= ∑^𝑛_𝑖=1İ𝑧 [( 𝑥_𝑖 − 𝑋 )^′Σ⁻¹( 𝑥_𝑖− 𝑋 )]

= ∑^𝑛_𝑖=1İ𝑧 [Σ⁻¹( 𝑥_𝑖− 𝑋 )( 𝑥_𝑖 − 𝑋 )^′] = İ𝑧 [Σ⁻¹∑^𝑛_𝑖=1( 𝑥_𝑖 − 𝑋 )( 𝑥_𝑖 − 𝑋 )^′]

= (𝑛 − 1)İ𝑧(Σ⁻¹𝑆) (4.13)

(6)

69 bulunur. Bu sonuç Eşitlik (4.12)’de yerine yazılırsa;

max 𝜇∈Ω𝐿 (𝜇 , Σ) = 𝐿( 𝑋 , Σ) = (2𝜋)^{−𝑛𝑝/2}|Σ|^−𝑛/2𝑒𝑥𝑝 {−¹

2[(𝑛 − 1)İ𝑧(Σ⁻¹𝑆)]} (4.14) elde edilir. Böylece Eşitlik (4.4) gereğince Wilks’in olabilirlik oran istatistiği;

Λ =

𝜇∈Ω0max𝐿(𝜇 ,Σ)

max 𝜇∈Ω𝐿(𝜇 ,Σ) =^𝐿(𝜇⁰^,Σ)

𝐿( 𝑋 ,Σ) =^(2𝜋)

−𝑛𝑝/2|Σ|^−𝑛/2𝑒𝑥𝑝{−¹₂[(𝑛−1)İ𝑧(Σ⁻¹𝑆)+𝑛(𝑋−𝜇 0)^′Σ⁻¹(𝑋−𝜇 0)]}

(2𝜋)^{−𝑛𝑝/2}|Σ|^−𝑛/2𝑒𝑥𝑝{−¹₂[(𝑛−1)İ𝑧(Σ⁻¹𝑆)]}

= 𝑒𝑥𝑝 {−¹

2(𝑛 − 1)İ𝑧(Σ⁻¹𝑆) −^𝑛

2(𝑋 − 𝜇₀)^′Σ⁻¹(𝑋 − 𝜇₀) +¹

2(𝑛 − 1)İ𝑧(Σ⁻¹𝑆)}

= 𝑒𝑥𝑝 {−¹

2𝑛 (𝑋 − 𝜇₀)^′Σ⁻¹(𝑋 − 𝜇₀)} (4.15) olur. Örnek hacmi 𝑛 yeterince büyükken Λ istatistiğinin örnekleme dağılımı için −2𝑙𝑛 Λ dönüşümü uygulanarak, Eşitlik(4.5) gereğince yaklaşık bir dağılım elde edilir.

−2𝑙𝑛 Λ = 𝑛(𝑋 − 𝜇

0)^′Σ⁻¹(𝑋 − 𝜇

0) (4.16) olup, bu değer 𝐻₀ hipotezi doğru iken test istatistiğinin alabileceği değerdir. Bu durumda Eşitlik(4.7) ile verilen hipotezler için test istatistiği, örnek ortalamasına dayalı karesel formun dağılımı gereğince;

𝜒² = 𝑛 (𝑋 − 𝜇)^′Σ⁻¹(𝑋 − 𝜇) ~𝜒_(𝑝)² (4.17) olarak elde edilir.

Karar: 𝐻₀ hipotezi doğru iken test istatistiğinin alabileceği değer 𝜒_ℎ² = 𝑛 (𝑋 − 𝜇₀)^′Σ⁻¹(𝑋 − 𝜇₀) olsun. 𝛼 önem seviyesinde 𝐻₀ hipotezine göre test istatistiğinin örnekleme dağılımından elde edilecek olan kritik değer; 𝜒_𝑡² = 𝜒_𝑝:𝛼² olmak üzere; eğer 𝜒_ℎ² ≤ 𝜒_𝑡² ise 𝐻₀ hipotezi kabul edilir, 𝜒_ℎ² > 𝜒_𝑡² ise 𝐻₀ hipotezi ret edilir.

i.b) Bileşim Kesişim Testi ile:

𝑋~𝑁_𝑝(𝜇 , Σ) dağılımına sahip bir çok değişkenli kitle verilsin. 𝑎 ∶ 1 × 𝑝 boyutlu bilinen bir vektör olmak üzere, 𝑌 = 𝑎 𝑋 = 𝑎₁𝑋₁+ 𝑎₂𝑋₂+ ⋯ + 𝑎_𝑝𝑋_𝑝 doğrusal dönüşümü ile çok değişkenli kitleyi tek değişkenli kitleye dönüştürelim. 𝑋~𝑁_𝑝(𝜇 , Σ) olduğundan dönüşüm kitlesinin dağılımı için 𝑌 = 𝑎 𝑋~𝑁 (𝑎 𝜇 , 𝜎_𝑌² = 𝑎Σ𝑎^′) olur. Burada çok değişkenli kitlenin varyans kovaryans matrisi Σ bilindiğinden, dönüşüm kitlesinin varyansı 𝜎_𝑌² = 𝑎Σ𝑎^′‘da biliniyordur. Bu durumda Eşitlik (4.7)’de verilen hipotezler yerine dönüşüm kitlesinin ortalamasına ait olan;

(7)

70 𝐻₀: 𝑎 𝜇 = 𝑎 𝜇₀

𝐻₁: 𝑎 𝜇 ≠ 𝑎 𝜇₀ (4.18) hipotezleri test edilir. Bu durumda problem tek değişkenli normal dağılıma sahip kitlede kitle varyansı biliniyorken kitle ortalamasına ait hipotez testi problemine dönüşür. Bu problemin çözümü için gerekli olan test istatistiğinin elde edebilmek amacıyla dönüşüm kitlesinden çekilen 𝑛 birimlik bir rastgele örneklem 𝑌₁ = 𝑎 𝑋₁, 𝑌₂ = 𝑎 𝑋₂, … , 𝑌_𝑛 = 𝑎 𝑋_𝑛 olsun. Bu örnek, gerçekte çok değişkenli kitleden rastgele çekilen 𝑛 birimlik örneklemde her bir örnek birimine aynı doğrusal dönüşümü uygulayarak elde edilen örnekten başka bir şey değildir. Bu örneklemin örnek ortalama istatistiği;

𝑌 = ¹

𝑛∑^𝑛_𝑖=1𝑌_𝑖 = ¹

𝑛∑^𝑛_𝑖=1(𝑎 𝑋_𝑖)= 𝑎 [¹

𝑛∑^𝑛_𝑖=1𝑋_𝑖] = 𝑎 𝑋 (4.19) olup, bu istatistik 𝑎 𝜇 parametresi için bir yansız tahmin edicidir. Burada 𝑋~𝑁_𝑝(𝜇 ,¹

𝑛Σ) olduğundan 𝑌 = 𝑎 𝑋~N(𝑎 𝜇 ,^{𝑎 Σ 𝑎}^′

𝑛 ) dağılımlıdır. Buna göre 𝐸(𝑌) = 𝑎 𝜇 ve 𝜎_𝑌² =^{𝑎 Σ 𝑎}^′

𝑛 dir.

Böylece test istatistiği, örnek ortalama istatistiğinin standartlaştırılması ile elde edilecek olan 𝑍 istatistiği olup;

𝑍(𝑎) =

^{𝑌−𝐸(𝑌)}

𝜎_𝑌

=

^{𝑎 𝑋−𝑎 𝜇}

(^{𝑎 Σ 𝑎′}

𝑛 )

1/2

=

^𝑎⁽^𝑋−𝜇⁾

(^{𝑎 Σ 𝑎′}

𝑛 )

1/2

~𝑁(0 , 1)

(4.20) şeklinde tanımlıdır. 𝛼 önem seviyesinde, eğer;

|𝑍(𝑎)| ≤ 𝑍^𝛼

2 ise 𝐻₀ kabul edilir veya buna eşdeğer olarak

𝑍²(𝑎) ≤ 𝑍_𝛼/2² ise 𝐻₀ kabul edilir (4.21) Öyle ki Eşitlik (4.20)’de her iki tarafın karesi alınırsa;

𝑍²(𝑎) =𝑛𝑎(𝑋−𝜇)(𝑋−𝜇)^′𝑎^′

𝑎 Σ 𝑎^′ (4.22) elde edilir. Eğer Eşitlik (4.22)’yi maksimum yapan 𝑎 vektörü için (4.21) ile verilen eşitsizlik sağlanıyor ise, diğer tüm 𝑎 vektörleri için de sağlanacağından, amaç; Eşitlik (4.22)’yi maksimum yapan 𝑎 vektörünü bulmaktır.

Amaç fonksiyonu:

𝐿(𝑎) = 𝑛𝑎 (𝑋 − 𝜇) (𝑋 − 𝜇)^′𝑎^′ (4.23) ve yan şart;

𝑎 Σ 𝑎^′= 1 (4.24)

(8)

71

olmak üzere, Lagrange çarpanları yöntemi ile 𝑍²(𝑎)’yı maksimum yapan 𝑎 vektörü bulunabilir. 𝜆 > 0 Lagrange çarpanı olmak üzere Lagrange fonksiyonu;

𝐿(𝑎 , 𝜆) = 𝑛𝑎 (𝑋 − 𝜇) (𝑋 − 𝜇)^′𝑎^′− 𝜆(𝑎 Σ 𝑎^′− 1) (4.25) şeklinde yazılır. Eşitlik (4.25)’de 𝑎 vektörüne göre türev alınır ve sıfıra eşitlenirse;

𝜕𝐿(𝑎 ,𝜆)

𝜕𝑎 = 2𝑛 (𝑋 − 𝜇) (𝑋 − 𝜇)^′𝑎^′− 2𝜆Σ 𝑎^′ = 0 , Her iki taraf 2 ile bölünürse

𝑛 (𝑋 − 𝜇) (𝑋 − 𝜇)^′𝑎^′− 𝜆Σ 𝑎^′= 0 (4.26) elde edilir. Bu eşitliğin her iki tarafını solda Σ ⁻¹ matrisi ile çarpalım ve sol tarafı 𝑎^′ vektörünün parantezine alalım:

[𝑛Σ ⁻¹(𝑋 − 𝜇) (𝑋 − 𝜇)^′− 𝜆𝐼_𝑝] 𝑎^′= 0 (4.27) Elde edilen Eşitlik (4.27)’ye göre 𝑛Σ ⁻¹(𝑋 − 𝜇) (𝑋 − 𝜇)^′: 𝑝 × 𝑝 matrisinin özdeğerleri ve her bir özdeğerine karşılık gelen özvektörleri bulunabilir. Bu eşitliğe göre 𝜆 > 0 Lagrange çarpanı 𝑛Σ ⁻¹(𝑋 − 𝜇) (𝑋 − 𝜇)^′matrisinin özdeğeri olup, 𝑎 vektörü ise bu özdeğere karşılık gelen özvektör olmalıdır. İlgili matrisin öz değerleri 𝜆₁ > 𝜆₂ > … > 𝜆_𝑝 > 0 ve 𝜆_𝑗’ye karşılık gelen özvektör 𝑎_𝑗 olsun. Şimdi Eşitlik (4.26)’nın her iki tarafını soldan 𝑎 vektörü ile çarpalım.

𝑛𝑎 (𝑋 − 𝜇) (𝑋 − 𝜇)^′𝑎^′− 𝜆𝑎 Σ 𝑎^′= 0 ⇒ 𝜆𝑎 Σ 𝑎^′= 𝑛𝑎 (𝑋 − 𝜇) (𝑋 − 𝜇)^′𝑎^′ ⇒

𝜆 =𝑛𝑎(𝑋−𝜇)(𝑋−𝜇)^′𝑎^′

𝑎 Σ 𝑎^′ = 𝑍²(𝑎) (4.28) olup, eğer 𝜆 = 𝑚𝑎𝑥{𝜆₁, 𝜆₂ , … , 𝜆_𝑝} alındığında, 𝑍²(𝑎) maksimum olacaktır. Buna göre 𝑍²(𝑎)’yı maksimum yapan 𝑎 vektörü en büyük özdeğere karşılık gelen öz vektördür. Diğer taraftan bir matrisin izi özdeğerlerin toplamına eşit olduğundan 𝜆 = 𝑚𝑎𝑥{𝜆₁, 𝜆₂ , … , 𝜆_𝑝} dışında kalan diğer özdeğerler sıfıra eşit kabul edilirse, test istatistiği;

𝜆 = 𝑍²(𝑎) = İ𝑧 [𝑛Σ ⁻¹(𝑋 − 𝜇) (𝑋 − 𝜇)^′] = 𝑛İ𝑧 [Σ ⁻¹(𝑋 − 𝜇) (𝑋 − 𝜇)^′]

= 𝑛İ𝑧 [(𝑋 − 𝜇)^′Σ ⁻¹(𝑋 − 𝜇)] = 𝑛 (𝑋 − 𝜇)^′Σ ⁻¹(𝑋 − 𝜇)

şeklinde elde edilir. Bu istatistik Eşitlik (4.17) ile verilen test istatistiği ile aynı olup, örnekleme dağılımı;

𝜒² = 𝑛 (𝑋 − 𝜇)^′Σ⁻¹(𝑋 − 𝜇) ~𝜒_(𝑝)² olacaktır.

Karar: Olabilirlik oran testinde verilen karar ile aynıdır.

(9)

72

Yorum: 𝐻₀ hipotezi kabul edilsin. Bu durumda 𝑛 birimlik örneklemin ortalama vektörü 𝜇₀ olan bir çok değişkenli normal kitleden çekilmiş olma olasılığı (1 − 𝛼)’dır.

𝐻₀ hipotezi ret edilsin. Bu durumda 𝑛 birimlik örneklemin ortalama vektörü 𝜇₀ olan bir çok değişkenli normal kitleden çekilmiş olma olasılığı 𝛼’ dır, ya da örneklem ortalama vektörü 𝜇₀ olan çok değişkenli kitleden çekilmemiştir.

𝐻₀ hipotezi ret edildiği zaman bu kararın ortaya çıkmasında 𝑗 = 1, 2, … , 𝑝 için 𝑋_𝑗 değişkenlerinden hangisinin ya da hangilerinin etkili olduğu incelenebilir. Bu inceleme olabilirlik oran testi ile yapılamazken, bileşim-kesişim testinde yapılabilmektedir. Bu inceleme yapılırken 𝑎 vektörü için uygun seçimler yapılarak 𝑎 𝜇 parametresi ile ilgili oluşturulacak olan alt hipotezler test edilmelidir.

Örneğin; 𝑎 = [0, … … … , 0 , 1 , 0, … ,0] ∶ 1 × 𝑝 seçilsin (𝑗-nci bileşen “1” ve diğer bileşenlerin hepsi “0” seçiliyor). Bu seçilişe göre parametre; 𝑎 𝜇 = 𝜇_𝑗 , (𝑗 = 1, 2, … , 𝑝) olup, alt hipotezler;

𝐻₀: 𝜇_𝑗 = 𝜇_𝑗0 , (𝜇_𝑗0 = 𝑎 𝜇₀)

𝐻₁: 𝜇_𝑗 ≠ 𝜇_𝑗0 , ( 𝑗 = 1, 2, … , 𝑝) (4.29) olup, 𝑝- tanedir. Bu alt hipotezler 𝑎 𝜇 parametresi ile ilgili (1 − 𝛼) güven katsayılı güven aralıkları (Bonferroni güven aralığı) ile test edilir. Söz konusu güven aralığı;

𝑃 [𝑎 𝑋 − √𝜒𝑝;𝛼2 √^{𝑎 Σ 𝑎}^′

𝑛 ≤ 𝑎 𝜇 ≤ 𝑎 𝑋 + √𝜒𝑝;𝛼2 √^{𝑎 Σ 𝑎}^′

𝑛 ] = 1 − 𝛼 (4.30) şeklinde verilir.

Eğer güven aralığı 𝜇_𝑗0 , ( 𝑗 = 1, 2, … , 𝑝)değerini kapsıyor ise 𝐻₀: 𝜇_𝑗 = 𝜇_𝑗0 hipotezi kabul edilir ve 𝑋_𝑗, ( 𝑗 = 1, 2, … , 𝑝) değişkeni 𝐻₀: 𝜇 = 𝜇₀ hipotezinin ret edilmesinde etkili olmamıştır.

Eğer güven aralığı 𝜇_𝑗0 , ( 𝑗 = 1, 2, … , 𝑝)değerini kapsamıyor ise 𝐻₀: 𝜇_𝑗 = 𝜇_𝑗0 hipotezi retedilir ve bu durumda 𝑋_𝑗, ( 𝑗 = 1, 2, … , 𝑝) değişkeni 𝐻₀: 𝜇 = 𝜇₀ hipotezinin ret edilmesinde etkili olmuştur denir.