65
T.C.
ONDOKUZ MAYIS ÜNİVERSİTESİ
FEN EDEBİYAT FAKÜLTESİ iSTATİSTİK BÖLÜMÜ
ÇOK DEĞİŞKENLİ İSTATİSTİK I DERSİ
DOÇ. DR. YÜKSEL ÖNER
9. Hafta
[email protected] www.omu.edu.
65 BÖLÜM 4
ÇOK DEĞİŞKENLİ HİPOTEZ TESTLERİ
Çok değişkenli kitleler için parametrelere ilişkin hipotezlerin test edilmesinde kullanılan test istatistikleri iki yaklaşıma göre türetilmektedir.
i) Olabilirlik Oran Testi (O.O.T) ii) Bileşim Kesişim Testi (BKT) 4.1 Olabilirlik Oran Testi
Bu yaklaşım kitle parametrelerinin en çok olabilirlik tahmin edicilerine dayalı bir yöntemdir.
Öncelikle 𝐻0 ve 𝐻1 hipotezleri altında parametrelerin en çok olabilirlik tahmin edicileri belirlenir ve bu hipotezler altında örnekleme ait olabilirlik fonksiyonu maksimize edilir. Elde edilen iki fonksiyon birbirine oranlanarak test istatistiği kurulmaya çalışılır.
𝜃 : Kitleye ait tüm parametreleri kapsayan parametre vektörü Ω : Parametre vektörü için parametre uzayı
𝜃0 : Elemanları bilinen bir vektör
Ω0 : Parametre uzayının ve 𝜃 0 vektörünün tanımlı olduğu alt uzay olmak üzere (Ω0 ⊂ Ω) hipotezler;
𝐻0: 𝜃 = 𝜃0 veya 𝐻0: 𝜃 ∈ Ω0
𝐻1: 𝜃 ≠ 𝜃0 veya 𝐻0: 𝜃 ∉ Ω0 (𝑦𝑎 𝑑𝑎 𝜃 ∈ Ω) (4.1) olur. Eğer boy(Ω) = 𝑣 ve boy(Ω0) = 𝑣0 ise 𝑣0 < 𝑣 dir.
𝐿(𝜃) örneklemin olabilirlik fonksiyonu ve max
𝜃∈Ω0
𝐿(𝜃): 𝐿(𝜃)’nın 𝐻0 hipotezi altındaki maksimum değeri ve max
𝜃∈Ω𝐿(𝜃): 𝐿(𝜃)’nın 𝐻1 hipotezi altındaki maksimum değeri olmak üzere, test istatistiği;
Λ =
𝜃∈Ω0max𝐿(𝜃)
max 𝜃∈Ω𝐿(𝜃) , 0 ≤ Λ ≤ 1 (4.2) şeklinde ifade edilir ve Wilks’in Olabilirlik Oran İstatistiği olarak bilinir.
Örneğin; 𝑋~𝑁𝑝(𝜇 , Σ) dağılımı verilsin. Bu durumda parametre vektörü;
𝜃′= [𝜇1 𝜇2… 𝜇𝑝; 𝜎11 𝜎12 … 𝜎1𝑝 𝜎22 𝜎23… 𝜎2𝑝 … 𝜎𝑝𝑝 ] olur. Böylece Ω-parametre uzayı için boy(Ω) = 𝑣 = 𝑝 +𝑝(𝑝+1)
2 dir. 𝜇0′ = [𝜇10 𝜇20 … 𝜇𝑝0]: 𝑝 × 1 bilinen bir vektör olmak üzere 𝜃 0′ = [𝜇10 𝜇20… 𝜇𝑝0; 𝜎11 𝜎12 … 𝜎1𝑝 𝜎22 𝜎23… 𝜎2𝑝 … 𝜎𝑝𝑝 ] olsun. Bu 𝜃0
66
vektörünün tanımlı olduğu uzay Ω0 ise Ω0 ⊂ Ω ve boy(Ω0) = 𝑣0 =𝑝(𝑝+1)
2 , (𝑣 > 𝑣0) olur.
Buna göre test edilecek hipotezler;
𝐻0: 𝜇 = 𝜇 0
𝐻1: 𝜇 ≠ 𝜇 0 (4.3) iken, test istatistiği Eşitlik (4.2) gereğince;
Λ =
𝜇∈Ω0max𝐿(𝜃)
max 𝜇∈Ω𝐿(𝜃) , 0 ≤ Λ ≤ 1 (4.4) şeklinde yazılabilir. 𝑐 > 0 bir sabit olmak üzere, eğer Λ < c ise 𝐻0 hipotezi ret edilir. Karar verme kriteri olan 𝑐 noktası Λ istatistiğinin örnekleme dağılımı üzerinde 𝛼 önem seviyesinde belirlenecek olan kritik değer olarak alınabilir. Λ istatistiğinin örnekleme dağılımı için;
i) İstatistiğin alabileceği değerlere karşılık bu değerleri alma olasılıkları belirlenerek kesin bir olasılık dağılımı kurulabilir.
ii) Örnek hacminin yeterince büyük olması durumunda dönüşümler uygulayarak bilinen olasılık dağılımlarına dönüştürülmek suretiyle yaklaşık bir olasılık dağılımı kullanılabilir. Uygulanacak dönüşüm sonrasında;
−2𝑙𝑛Λ = −2ln [
𝜇∈Ω0max𝐿(𝜃)
max 𝜇∈Ω𝐿(𝜃)] ~𝜒𝑣−𝑣2 0 (4.5) istatistiği elde edilmektedir. Buna göre Λ < c iken −2𝑙𝑛Λ > −2lnc = 𝜒𝑣−𝑣2 0∶𝛼 ise 𝐻0 hipotezi ret edilir.
4.2 Bileşim Kesişim Testi
Bu test için amaç çok değişkenli kitleyi uygun bir dönüşümle, çok değişkenli kitledeki değişkenlerin doğrusal fonksiyonundan oluşan tek değişkenli kitleye dönüştürmektir. Böylece Eşitlik (4.1) veya (4.3) ile verilen hipotezler yerine dönüşüm kitlesinin parametreleri üzerine kurulacak olan hipotezler test edilir. Bu yeni hipotezleri test etmek için gerekli olan test istatistikleri tek değişkenli istatistiksel analizde verilen test istatistiklerinin genelleştirilmiş şekli olacaktır. Eğer çok değişkenli kitle 𝑋 ∶ 𝑝 × 1 ve parametreleri; ortalama vektörü 𝜇: 𝑝 × 1 ve varyans kovaryans matrisi Σ ∶ 𝑝 × 𝑝 olmak üzere test edilecek hipotezler Eşitlik (4.3)’deki gibi olsun. 𝑎 ∶ 1 × 𝑝 boyutlu bilinen bir vektör olsun. 𝑌 = 𝑎 𝑋 = 𝑎1𝑋1+ 𝑎2𝑋2+ ⋯ + 𝑎𝑝𝑋𝑝 dönüşümü çok değişkenli kitleyi tek değişkenli kitleye dönüştüren doğrusal dönüşümdür. Bu dönüşüm kitlesi için parametreler; kitle ortalaması 𝐸(𝑌) = 𝑎 𝜇 ve kitle varyansı 𝜎𝑌2 = 𝑎Σ𝑎′ olur. Bu kitle parametresi ile ilgili hipotezler Eşitlik (4.3)’de verilen hipotezlerde her iki taraf 𝑎 vektörü ile soldan çarpılarak oluşturulur.
67 𝐻0: 𝑎 𝜇 = 𝑎 𝜇 0
𝐻1: 𝑎 𝜇 ≠ 𝑎 𝜇 0 (4.6) Bileşim kesişim testinin amacı yeni oluşturulan bu hipotezleri test etmek için ihtiyaç duyulan test istatistiğini tek değişkenli istatistiğin kavramlarından yararlanarak türetmektir. Verilen karar çok değişkenli kitle üzerinde değerlendirilir.
4.3 Çok Değişkenli Normal Kitlede Kitle Ortalama Vektörüne Ait Hipotez Testi
𝑋~𝑁𝑝(𝜇 , Σ) dağılımına sahip bir çok değişkenli kitle verilsin ve 𝜇: 𝑝 × 1 kitle ortalama vektörü bilinmiyor olsun. Bu parametre ile ilgili hipotez testinde test istatistiğinin belirlenmesi, Σ matrisinin bilinip bilinmemesine bağlıdır.
i) 𝚺 biliniyor kabul edelim.
𝜇 0 ∈ 𝐼𝑅𝑝 bilinen bir kolon vektörü iken test edilecek hipotezler 𝐻0: 𝜇 = 𝜇 0
𝐻1: 𝜇 ≠ 𝜇 0 (4.7) şeklindedir. Bu hipotezleri test etmek için gerekli olan test istatistiği Bölüm 4.1 ve 4.2’de bahsedilen yöntemlerin her ikisi ile de türetilebilir.
i.a) Olabilirlik Oran Testi ile:
Verilen çok değişkenli kitleden rastgele çekilen 𝑛 birimlik ir örnek 𝑋 1, 𝑋 2, … , 𝑋 𝑛 olsun.
𝑖 = 1, 2, … , 𝑛 için 𝑋 𝑖~𝑁𝑝(𝜇 , Σ) ve 𝑋 𝑖’ler bağımsızdır. Bu durumda örneğin olabilirlik fonksiyonu;
𝐿 (𝜇 , Σ) = 𝑓(𝑥 1, 𝑥 2, … , 𝑥 𝑛) = ∏𝑛𝑖=1𝑓𝑋 𝑖( 𝑥 𝑖)
= ∏ 1
(2𝜋)𝑝/2|Σ|1/2𝑒𝑥𝑝 {−1
2( 𝑥 𝑖− 𝜇)′Σ−1( 𝑥 𝑖 − 𝜇)}
𝑛𝑖=1
= (2𝜋)−𝑛𝑝/2|Σ|−𝑛/2𝑒𝑥𝑝 {−1
2∑𝑛𝑖=1( 𝑥 𝑖− 𝜇)′Σ−1( 𝑥 𝑖 − 𝜇)} (4.8) olur. Bu fonksiyonun 𝐻0 hipotezi altında maksimum değeri;
max𝜇∈Ω0𝐿 (𝜇 , Σ) = 𝐿 (𝜇 0 , Σ)
= (2𝜋)−𝑛𝑝/2|Σ|−𝑛/2𝑒𝑥𝑝 {−1
2∑𝑛𝑖=1( 𝑥 𝑖− 𝜇 0)′Σ−1( 𝑥 𝑖− 𝜇 0)} (4.9) olacaktır. Şimdi ∑𝑛𝑖=1( 𝑥 𝑖 − 𝜇 0)′Σ−1( 𝑥 𝑖 − 𝜇 0) ifadesini ele alalım ve bu terim içerisinde 𝑆 = 1
𝑛−1∑𝑛𝑖=1(𝑥 𝑖 − 𝑋)(𝑥 𝑖 − 𝑋)′⇒ (𝑛 − 1)𝑆 = ∑𝑛𝑖=1(𝑥 𝑖 − 𝑋)(𝑥 𝑖− 𝑋)′terimini türetmeye çalışalım. Toplam altındaki ifade 1 × 1 tipinde bir skaler ifade olduğundan, İz’i kendisine eşit
68
olacaktır, bu sebeple İz’i alınabilir. Bunu uygulamaktaki amaç İz operatörünün özelliklerinden yararlanarak vektör veya matris çarpımlarına yer değiştirebilme imkânı sağlamaktır. Bu durumda;
∑𝑛𝑖=1( 𝑥 𝑖− 𝜇 0)′Σ−1( 𝑥 𝑖− 𝜇 0)= ∑𝑛𝑖=1İ𝑧 [( 𝑥 𝑖 − 𝜇 0)′Σ−1( 𝑥 𝑖 − 𝜇 0)]
= ∑𝑛𝑖=1İ𝑧 [Σ−1( 𝑥 𝑖 − 𝜇 0) ( 𝑥 𝑖 − 𝜇 0)′] ; ( İçerideki her iki parantez içerisine 𝑋 ekle çıkart)
= ∑𝑛𝑖=1İ𝑧 [Σ−1( 𝑥 𝑖 − 𝑋 + 𝑋 − 𝜇 0) ( 𝑥 𝑖 − 𝑋 + 𝑋 − 𝜇 0)′]
= ∑𝑛𝑖=1İ𝑧 {Σ−1[(𝑥 𝑖 − 𝑋 )(𝑥 𝑖− 𝑋 )′+ 2(𝑥 𝑖 − 𝑋 ) (𝑋 − 𝜇 0)′+ (𝑋 − 𝜇 0) (𝑋 − 𝜇 0)′]}
= İ𝑧 {Σ−1∑𝑛𝑖=1(𝑥 𝑖− 𝑋 )(𝑥 𝑖 − 𝑋 )′+ 2Σ−1∑𝑛𝑖=1(𝑥 𝑖− 𝑋 ) (𝑋 − 𝜇 0)′+ 𝑛(𝑋 − 𝜇 0) (𝑋 − 𝜇 0)′}, [∑ (𝑥
𝑖− 𝑋 ) (𝑋 − 𝜇
0)′ =[∑ 𝑥
𝑖− 𝑛𝑋
𝑛𝑖=1 ] (𝑋 − 𝜇
0)′= (𝑛𝑋 − 𝑛𝑋 )
𝑛𝑖=1 (𝑋 − 𝜇
0)′ = 0 olduğundan son ifadenin ikinci terimi sıfırdır.]
= İ𝑧 {Σ−1(𝑛 − 1)𝑆 +∑ (𝑥 𝑖− 𝑋 ) (𝑋 − 𝜇
0)′+ 𝑛
𝑛𝑖=1 (𝑋 − 𝜇
0) (𝑋 − 𝜇
0)′}
= (𝑛 − 1)İ𝑧(Σ−1𝑆) + 𝑛İ𝑧 [Σ−1(𝑋 − 𝜇
0) (𝑋 − 𝜇
0)′]
= (𝑛 − 1)İ𝑧(Σ−1𝑆) + 𝑛İ𝑧 [(𝑋 − 𝜇
0)′Σ−1(𝑋 − 𝜇
0)] , ( ikinci terimdeki köşeli parantez içerisi 1 × 1 olduğundan bu ifadenin İz’i kendisine eşit olacaktır. Böylece;
= (𝑛 − 1)İ𝑧(Σ−1𝑆)+ 𝑛(𝑋 − 𝜇 0)′Σ−1(𝑋 − 𝜇 0) (4.10) elde edilir. Bu sonuç Eşitlik (4.9)’da yerine yazılırsa;
𝐿 (𝜇 0 , Σ) = (2𝜋)−𝑛𝑝/2|Σ|−𝑛/2𝑒𝑥𝑝 {−1
2[(𝑛 − 1)İ𝑧(Σ−1𝑆)+ 𝑛(𝑋 − 𝜇 0)′Σ−1(𝑋 − 𝜇 0)]}
(4.11) elde edilir. Olabilirlik fonksiyonunun 𝐻1 hipotezi altında maksimum değeri;
max 𝜇∈Ω𝐿 (𝜇 , Σ) = 𝐿(𝑋 , Σ) = (2𝜋)−𝑛𝑝/2|Σ|−𝑛/2𝑒𝑥𝑝 {−1
2∑𝑛𝑖=1( 𝑥 𝑖 − 𝑋 )′Σ−1( 𝑥 𝑖− 𝑋 )} (4.12) Burada da toplam altındaki ifade 1 × 1 tipinde bir skaler ifade olduğundan, İz’i kendisine eşit olacaktır, bu sebeple İz’i alınabilir. Bu durumda:
∑𝑛𝑖=1( 𝑥 𝑖− 𝑋 )′Σ−1( 𝑥 𝑖− 𝑋 )= ∑𝑛𝑖=1İ𝑧 [( 𝑥 𝑖 − 𝑋 )′Σ−1( 𝑥 𝑖− 𝑋 )]
= ∑𝑛𝑖=1İ𝑧 [Σ−1( 𝑥 𝑖− 𝑋 )( 𝑥 𝑖 − 𝑋 )′] = İ𝑧 [Σ−1∑𝑛𝑖=1( 𝑥 𝑖 − 𝑋 )( 𝑥 𝑖 − 𝑋 )′]
= (𝑛 − 1)İ𝑧(Σ−1𝑆) (4.13)
69 bulunur. Bu sonuç Eşitlik (4.12)’de yerine yazılırsa;
max 𝜇∈Ω𝐿 (𝜇 , Σ) = 𝐿( 𝑋 , Σ) = (2𝜋)−𝑛𝑝/2|Σ|−𝑛/2𝑒𝑥𝑝 {−1
2[(𝑛 − 1)İ𝑧(Σ−1𝑆)]} (4.14) elde edilir. Böylece Eşitlik (4.4) gereğince Wilks’in olabilirlik oran istatistiği;
Λ =
𝜇∈Ω0max𝐿(𝜇 ,Σ)
max 𝜇∈Ω𝐿(𝜇 ,Σ) =𝐿(𝜇 0 ,Σ)
𝐿( 𝑋 ,Σ) =(2𝜋)
−𝑛𝑝/2|Σ|−𝑛/2𝑒𝑥𝑝{−12[(𝑛−1)İ𝑧(Σ−1𝑆)+𝑛(𝑋−𝜇 0)′Σ−1(𝑋−𝜇 0)]}
(2𝜋)−𝑛𝑝/2|Σ|−𝑛/2𝑒𝑥𝑝{−12[(𝑛−1)İ𝑧(Σ−1𝑆)]}
= 𝑒𝑥𝑝 {−1
2(𝑛 − 1)İ𝑧(Σ−1𝑆) −𝑛
2(𝑋 − 𝜇 0)′Σ−1(𝑋 − 𝜇 0) +1
2(𝑛 − 1)İ𝑧(Σ−1𝑆)}
= 𝑒𝑥𝑝 {−1
2𝑛 (𝑋 − 𝜇 0)′Σ−1(𝑋 − 𝜇 0)} (4.15) olur. Örnek hacmi 𝑛 yeterince büyükken Λ istatistiğinin örnekleme dağılımı için −2𝑙𝑛 Λ dönüşümü uygulanarak, Eşitlik(4.5) gereğince yaklaşık bir dağılım elde edilir.
−2𝑙𝑛 Λ = 𝑛(𝑋 − 𝜇
0)′Σ−1(𝑋 − 𝜇
0) (4.16) olup, bu değer 𝐻0 hipotezi doğru iken test istatistiğinin alabileceği değerdir. Bu durumda Eşitlik(4.7) ile verilen hipotezler için test istatistiği, örnek ortalamasına dayalı karesel formun dağılımı gereğince;
𝜒2 = 𝑛 (𝑋 − 𝜇)′Σ−1(𝑋 − 𝜇) ~𝜒(𝑝)2 (4.17) olarak elde edilir.
Karar: 𝐻0 hipotezi doğru iken test istatistiğinin alabileceği değer 𝜒ℎ2 = 𝑛 (𝑋 − 𝜇 0)′Σ−1(𝑋 − 𝜇 0) olsun. 𝛼 önem seviyesinde 𝐻0 hipotezine göre test istatistiğinin örnekleme dağılımından elde edilecek olan kritik değer; 𝜒𝑡2 = 𝜒𝑝:𝛼2 olmak üzere; eğer 𝜒ℎ2 ≤ 𝜒𝑡2 ise 𝐻0 hipotezi kabul edilir, 𝜒ℎ2 > 𝜒𝑡2 ise 𝐻0 hipotezi ret edilir.
i.b) Bileşim Kesişim Testi ile:
𝑋~𝑁𝑝(𝜇 , Σ) dağılımına sahip bir çok değişkenli kitle verilsin. 𝑎 ∶ 1 × 𝑝 boyutlu bilinen bir vektör olmak üzere, 𝑌 = 𝑎 𝑋 = 𝑎1𝑋1+ 𝑎2𝑋2+ ⋯ + 𝑎𝑝𝑋𝑝 doğrusal dönüşümü ile çok değişkenli kitleyi tek değişkenli kitleye dönüştürelim. 𝑋~𝑁𝑝(𝜇 , Σ) olduğundan dönüşüm kitlesinin dağılımı için 𝑌 = 𝑎 𝑋~𝑁 (𝑎 𝜇 , 𝜎𝑌2 = 𝑎Σ𝑎′) olur. Burada çok değişkenli kitlenin varyans kovaryans matrisi Σ bilindiğinden, dönüşüm kitlesinin varyansı 𝜎𝑌2 = 𝑎Σ𝑎′‘da biliniyordur. Bu durumda Eşitlik (4.7)’de verilen hipotezler yerine dönüşüm kitlesinin ortalamasına ait olan;
70 𝐻0: 𝑎 𝜇 = 𝑎 𝜇 0
𝐻1: 𝑎 𝜇 ≠ 𝑎 𝜇 0 (4.18) hipotezleri test edilir. Bu durumda problem tek değişkenli normal dağılıma sahip kitlede kitle varyansı biliniyorken kitle ortalamasına ait hipotez testi problemine dönüşür. Bu problemin çözümü için gerekli olan test istatistiğinin elde edebilmek amacıyla dönüşüm kitlesinden çekilen 𝑛 birimlik bir rastgele örneklem 𝑌1 = 𝑎 𝑋 1, 𝑌2 = 𝑎 𝑋 2, … , 𝑌𝑛 = 𝑎 𝑋 𝑛 olsun. Bu örnek, gerçekte çok değişkenli kitleden rastgele çekilen 𝑛 birimlik örneklemde her bir örnek birimine aynı doğrusal dönüşümü uygulayarak elde edilen örnekten başka bir şey değildir. Bu örneklemin örnek ortalama istatistiği;
𝑌 = 1
𝑛∑𝑛𝑖=1𝑌𝑖 = 1
𝑛∑𝑛𝑖=1(𝑎 𝑋 𝑖)= 𝑎 [1
𝑛∑𝑛𝑖=1𝑋 𝑖] = 𝑎 𝑋 (4.19) olup, bu istatistik 𝑎 𝜇 parametresi için bir yansız tahmin edicidir. Burada 𝑋~𝑁𝑝(𝜇 ,1
𝑛Σ) olduğundan 𝑌 = 𝑎 𝑋~N(𝑎 𝜇 ,𝑎 Σ 𝑎′
𝑛 ) dağılımlıdır. Buna göre 𝐸(𝑌) = 𝑎 𝜇 ve 𝜎𝑌2 =𝑎 Σ 𝑎′
𝑛 dir.
Böylece test istatistiği, örnek ortalama istatistiğinin standartlaştırılması ile elde edilecek olan 𝑍 istatistiği olup;
𝑍(𝑎) =
𝑌−𝐸(𝑌)𝜎𝑌
=
𝑎 𝑋−𝑎 𝜇(𝑎 Σ 𝑎′
𝑛 )
1/2
=
𝑎(𝑋−𝜇)(𝑎 Σ 𝑎′
𝑛 )
1/2
~𝑁(0 , 1)
(4.20) şeklinde tanımlıdır. 𝛼 önem seviyesinde, eğer;|𝑍(𝑎)| ≤ 𝑍𝛼
2 ise 𝐻0 kabul edilir veya buna eşdeğer olarak
𝑍2(𝑎) ≤ 𝑍𝛼/22 ise 𝐻0 kabul edilir (4.21) Öyle ki Eşitlik (4.20)’de her iki tarafın karesi alınırsa;
𝑍2(𝑎) =𝑛𝑎(𝑋−𝜇)(𝑋−𝜇)′𝑎′
𝑎 Σ 𝑎′ (4.22) elde edilir. Eğer Eşitlik (4.22)’yi maksimum yapan 𝑎 vektörü için (4.21) ile verilen eşitsizlik sağlanıyor ise, diğer tüm 𝑎 vektörleri için de sağlanacağından, amaç; Eşitlik (4.22)’yi maksimum yapan 𝑎 vektörünü bulmaktır.
Amaç fonksiyonu:
𝐿(𝑎) = 𝑛𝑎 (𝑋 − 𝜇) (𝑋 − 𝜇)′𝑎′ (4.23) ve yan şart;
𝑎 Σ 𝑎′= 1 (4.24)
71
olmak üzere, Lagrange çarpanları yöntemi ile 𝑍2(𝑎)’yı maksimum yapan 𝑎 vektörü bulunabilir. 𝜆 > 0 Lagrange çarpanı olmak üzere Lagrange fonksiyonu;
𝐿(𝑎 , 𝜆) = 𝑛𝑎 (𝑋 − 𝜇) (𝑋 − 𝜇)′𝑎′− 𝜆(𝑎 Σ 𝑎′− 1) (4.25) şeklinde yazılır. Eşitlik (4.25)’de 𝑎 vektörüne göre türev alınır ve sıfıra eşitlenirse;
𝜕𝐿(𝑎 ,𝜆)
𝜕𝑎 = 2𝑛 (𝑋 − 𝜇) (𝑋 − 𝜇)′𝑎′− 2𝜆Σ 𝑎′ = 0 , Her iki taraf 2 ile bölünürse
𝑛 (𝑋 − 𝜇) (𝑋 − 𝜇)′𝑎′− 𝜆Σ 𝑎′= 0 (4.26) elde edilir. Bu eşitliğin her iki tarafını solda Σ −1 matrisi ile çarpalım ve sol tarafı 𝑎′ vektörünün parantezine alalım:
[𝑛Σ −1(𝑋 − 𝜇) (𝑋 − 𝜇)′− 𝜆𝐼𝑝] 𝑎′= 0 (4.27) Elde edilen Eşitlik (4.27)’ye göre 𝑛Σ −1(𝑋 − 𝜇) (𝑋 − 𝜇)′: 𝑝 × 𝑝 matrisinin özdeğerleri ve her bir özdeğerine karşılık gelen özvektörleri bulunabilir. Bu eşitliğe göre 𝜆 > 0 Lagrange çarpanı 𝑛Σ −1(𝑋 − 𝜇) (𝑋 − 𝜇)′matrisinin özdeğeri olup, 𝑎 vektörü ise bu özdeğere karşılık gelen özvektör olmalıdır. İlgili matrisin öz değerleri 𝜆1 > 𝜆2 > … > 𝜆𝑝 > 0 ve 𝜆𝑗’ye karşılık gelen özvektör 𝑎 𝑗 olsun. Şimdi Eşitlik (4.26)’nın her iki tarafını soldan 𝑎 vektörü ile çarpalım.
𝑛𝑎 (𝑋 − 𝜇) (𝑋 − 𝜇)′𝑎′− 𝜆𝑎 Σ 𝑎′= 0 ⇒ 𝜆𝑎 Σ 𝑎′= 𝑛𝑎 (𝑋 − 𝜇) (𝑋 − 𝜇)′𝑎′ ⇒
𝜆 =𝑛𝑎(𝑋−𝜇)(𝑋−𝜇)′𝑎′
𝑎 Σ 𝑎′ = 𝑍2(𝑎) (4.28) olup, eğer 𝜆 = 𝑚𝑎𝑥{𝜆1, 𝜆2 , … , 𝜆𝑝} alındığında, 𝑍2(𝑎) maksimum olacaktır. Buna göre 𝑍2(𝑎)’yı maksimum yapan 𝑎 vektörü en büyük özdeğere karşılık gelen öz vektördür. Diğer taraftan bir matrisin izi özdeğerlerin toplamına eşit olduğundan 𝜆 = 𝑚𝑎𝑥{𝜆1, 𝜆2 , … , 𝜆𝑝} dışında kalan diğer özdeğerler sıfıra eşit kabul edilirse, test istatistiği;
𝜆 = 𝑍2(𝑎) = İ𝑧 [𝑛Σ −1(𝑋 − 𝜇) (𝑋 − 𝜇)′] = 𝑛İ𝑧 [Σ −1(𝑋 − 𝜇) (𝑋 − 𝜇)′]
= 𝑛İ𝑧 [(𝑋 − 𝜇)′Σ −1(𝑋 − 𝜇)] = 𝑛 (𝑋 − 𝜇)′Σ −1(𝑋 − 𝜇)
şeklinde elde edilir. Bu istatistik Eşitlik (4.17) ile verilen test istatistiği ile aynı olup, örnekleme dağılımı;
𝜒2 = 𝑛 (𝑋 − 𝜇)′Σ−1(𝑋 − 𝜇) ~𝜒(𝑝)2 olacaktır.
Karar: Olabilirlik oran testinde verilen karar ile aynıdır.
72
Yorum: 𝐻0 hipotezi kabul edilsin. Bu durumda 𝑛 birimlik örneklemin ortalama vektörü 𝜇 0 olan bir çok değişkenli normal kitleden çekilmiş olma olasılığı (1 − 𝛼)’dır.
𝐻0 hipotezi ret edilsin. Bu durumda 𝑛 birimlik örneklemin ortalama vektörü 𝜇 0 olan bir çok değişkenli normal kitleden çekilmiş olma olasılığı 𝛼’ dır, ya da örneklem ortalama vektörü 𝜇 0 olan çok değişkenli kitleden çekilmemiştir.
𝐻0 hipotezi ret edildiği zaman bu kararın ortaya çıkmasında 𝑗 = 1, 2, … , 𝑝 için 𝑋𝑗 değişkenlerinden hangisinin ya da hangilerinin etkili olduğu incelenebilir. Bu inceleme olabilirlik oran testi ile yapılamazken, bileşim-kesişim testinde yapılabilmektedir. Bu inceleme yapılırken 𝑎 vektörü için uygun seçimler yapılarak 𝑎 𝜇 parametresi ile ilgili oluşturulacak olan alt hipotezler test edilmelidir.
Örneğin; 𝑎 = [0, … … … , 0 , 1 , 0, … ,0] ∶ 1 × 𝑝 seçilsin (𝑗-nci bileşen “1” ve diğer bileşenlerin hepsi “0” seçiliyor). Bu seçilişe göre parametre; 𝑎 𝜇 = 𝜇𝑗 , (𝑗 = 1, 2, … , 𝑝) olup, alt hipotezler;
𝐻0: 𝜇𝑗 = 𝜇𝑗0 , (𝜇𝑗0 = 𝑎 𝜇 0)
𝐻1: 𝜇𝑗 ≠ 𝜇𝑗0 , ( 𝑗 = 1, 2, … , 𝑝) (4.29) olup, 𝑝- tanedir. Bu alt hipotezler 𝑎 𝜇 parametresi ile ilgili (1 − 𝛼) güven katsayılı güven aralıkları (Bonferroni güven aralığı) ile test edilir. Söz konusu güven aralığı;
𝑃 [𝑎 𝑋 − √𝜒𝑝;𝛼2 √𝑎 Σ 𝑎′
𝑛 ≤ 𝑎 𝜇 ≤ 𝑎 𝑋 + √𝜒𝑝;𝛼2 √𝑎 Σ 𝑎′
𝑛 ] = 1 − 𝛼 (4.30) şeklinde verilir.
Eğer güven aralığı 𝜇𝑗0 , ( 𝑗 = 1, 2, … , 𝑝)değerini kapsıyor ise 𝐻0: 𝜇𝑗 = 𝜇𝑗0 hipotezi kabul edilir ve 𝑋𝑗, ( 𝑗 = 1, 2, … , 𝑝) değişkeni 𝐻0: 𝜇 = 𝜇 0 hipotezinin ret edilmesinde etkili olmamıştır.
Eğer güven aralığı 𝜇𝑗0 , ( 𝑗 = 1, 2, … , 𝑝)değerini kapsamıyor ise 𝐻0: 𝜇𝑗 = 𝜇𝑗0 hipotezi retedilir ve bu durumda 𝑋𝑗, ( 𝑗 = 1, 2, … , 𝑝) değişkeni 𝐻0: 𝜇 = 𝜇 0 hipotezinin ret edilmesinde etkili olmuştur denir.