BÖLÜM 3
1.1 Değişen Varyans (Heteroscedasticity)
Regresyon çözümlemesinin varsayımlarından biri olan sabit varyans varsayımının bozulması durumunda ortaya çıkan problemin adı “değişen varyans” olarak adlandırılır. Basit doğrusal regresyon modeli için standart varsayımları hatırlayalım.
𝑌𝑡 = 𝛽0+ 𝛽1𝑋𝑡+ 𝑢𝑡
Modelinde hata terimi 𝑢𝑡 aşağıdaki özelliklere sahip olduğu varsayılır.
𝐸(𝑢𝑡) = 0 𝑉𝑎𝑟(𝑢𝑡) = 𝜎2
𝐾𝑜𝑣(𝑢𝑡, 𝑢𝑘) = 0 𝑡 ≠ 𝑘 için Değişen varyans probleminin varlığında ise
𝑉𝑎𝑟(𝑢𝑡) = 𝜎𝑡2
olmaktadır. Yani her hata terimi farklı varyansa sahip olmaktadır.
Problemin tanımı yapıldıktan sonra bu bölümde üç farklı soru üzerinde durulmaktadır;
1. Veri içerisinde bu sorun varken en küçük kareler yöntemi kullanılarak elde edilmiş tahminler üzerinde ne gibi sonuçlar doğurur?
2. Veri içerisinde değişen varyans probleminin olup olmadığı nasıl tespit edilir?
3. Veri içerisinde var olduğu tespit edilen değişen varyans probleminin çözümü için neler yapılabilir?
Bu sorulara cevap vermeden önce aşağıdaki örneğe bir göz atalım. Aşağıdaki tabloda 20 aileye ait tüketim harcaması Y ile ailenin geliri X ölçümleri sunulmaktadır.
y x
19,9 22,3 31,2 32,3 31,8 36,6 12,1 12,1 40,7 42,3
6,1 6,2
38,6 44,7 25,5 26,1 10,3 10,3 38,8 40,2
8,0 8,1
33,1 34,5 33,5 38,0 13,1 14,1
14,8 16,4 21,6 24,1 29,3 30,1 25,0 28,3 17,9 18,2 19,8 20,1
Ekonomik teoriye bağlı kalarak gelir arttıkça tüketimin de artacağı beklendiğinden basit doğrusal regresyon çözümlemesinin bu iki değişken arasındaki ilişkiyi açıklaması düşünülür.
Ayrıca Y nin X e karşı serpilme grafiği de bilgi sağlayacaktır.
Buradan hareketle yapılan analiz sonuçları aşağıdaki gibi elde edilmiştir.
𝑌̂𝑡 = 0,847 + 0,8993𝑋𝑡 (0,703) (0,0253)
Olarak ilişki tahmin edilmiştir. 𝑅2 = 0,9859 ve hata varyansının tahmin edicisi Artık kareler ortalaması (AKO) 1.73 bulunmuştur. Yani X in Y deki değişimi açıklama yüzdesi %98,59 dur.
Oldukça iyi bir uyum ölçüsüdür. Hata varyansı da oldukça küçük bulunmuştur. Elde edilen tahmin ve artık değerleri aşağıdaki tabloda sunulmaktadır.
𝒀̂𝒕 𝒖̂𝒕= 𝒀𝒕− 𝒀̂𝒕 20,9020 -1,00199 29,8952 1,30476 33,7623 -1,96234 11,7289 0,37112 38,8885 1,81151 6,4229 -0,32286 41,0469 -2,44687 24,3194 1,18057 10,1101 0,18990 36,9999 1,80010 8,1316 -0,13158 31,8738 1,22625 35,0214 -1,52139 13,5275 -0,42753 15,5960 -0,79598 22,5208 -0,92078 27,9167 1,38328
50 40
30 20
1 0 45 40 35 30 25 20 1 5 1 0 5
x
y
26,2979 -1,29794 17,2148 0,68524 18,9235 0,87652
Veri içerisinde değişen varyans problemi olup olmadığının tespitinde ilk akla gelen grafiksel yaklaşım tahmin değerlerinin artık değerlere karşı serpilme grafiği oldukça bilgi sağlayıcıdır.
Bu grafikte noktaların rastgele bir dağılışı yerine giderek aralarındaki uzaklığın artışı gözlenmektedir. Yani X’in değeri arttıkça noktaların değişimi artmaktadır. Bu değişen varyans probleminin göstergesidir.
1. Veri içerisinde bu sorun varken en küçük kareler yöntemi kullanılarak elde edilmiş tahminler üzerinde ne gibi sonuçlar doğurur?
Bu sorunun en önemli sonucu tahmin edicilerin varyanslarının artık en küçük varyanslı olma özelliğinin yitirilmesidir. Şöyle ki; Basit doğrusal regresyonu ele alarak bu durum incelendiğinde sabit varyans varsayımı altında eğim parametresinin varyansı
𝑉𝑎𝑟(𝛽̂1) = 𝜎2
𝑆𝑋𝑋 = 𝜎2
∑𝑛𝑡=1(𝑋𝑡− 𝑋̅)2 Değişen varyans problemi olduğunda bu varyans
𝑉𝑎𝑟(𝛽̂1) = 𝜎2𝑡 (𝑆𝑋𝑋)2
Şeklinde elde edilir ki artık en küçük varyanslı olmayı garanti edemez.
2. Veri içerisinde değişen varyans probleminin olup olmadığı nasıl tespit edilir?
Bu sorunu tespit etmenin grafiksel yaklaşımlarının yanında istatistiksel testler mevcuttur.
İstatistiksel testlerden en yaygın olarak kullanılanlar;
a. Goldfeld-Quandt Testi
45 40 35 30 25 20 15 10 5 2
1
0
-1
-2
-3
Y şapka
artıklar
b. Park Testi
c. Spearman Sıra Korelasyon Testi d. Glejser Testi
a. Goldfeld-Quandt Testi
Y X Y X
55 80 115 180
65 100 140 225
70 85 120 200
80 110 145 240
79 120 130 185
84 115 152 220
98 130 144 210
95 140 175 245
90 125 180 260
75 90 135 190
74 105 140 205
110 160 178 265
113 150 191 270
125 165 137 230
108 145 189 250
Yukarıdaki veride değişen varyans sorunu olup olmadığı Goldfelt-Quandt testi ile araştırılacaktır. Veride değişen varyans sorunu olup olmadığını araştırmanın en basit ve ilk akla gelen yolu, verilerin grafiğini çizmektir. Bu grafik, Şekil 1’de verilmektedir.
Y nin X değişkenine göre çizilen bu grafiğinde çok bariz olmamakla birlikte noktalar arasındaki değişim X değişkeni arttıkça çok az artmakta olduğu gözlenebilir. İkinci olarak veride sorun olup olmadığı göz ardı edilip regresyon analizi uygulanır. Sonuçlar;
Regresyon Denklemi Y = 9,29 + 0,6378 X
250 200
1 50 1 00
200 1 75 1 50 1 25 1 00 75
50
Xt
Yt
Şekil 1 . Y nin X'e göre Dağılımı
Katsayı Değer S.h. T P Sabit 9,29 5,23 1,78 0,087 Eğim(Xt) 0,6378 0,0286 22,29 0,000
=9,18297 R2 =94,66%
Değişen varyans probleminin varlığını tespit etmek için en yaygın olarak kullanılan grafik türleri artıkların Y şapkalara karşı grafiği ve yine artıkların değişen varyansa sebep olduğunu düşündüğümüz X açıklayıcı değişkenine göre grafiğini çizmek olacaktır. Şekil 2’de bu iki grafik sergilenmektedir. Nitekim bu grafikler incelendiğinde noktalar arasındaki değişimin giderek az da olsa arttığı gözlenmektedir.
Bu durumu tespit etmek için ilk olarak parametrik test olan Goldfeld-Quandt testi uygulanacaktır. Bu uygulamada ilk olarak orijinal veri değişen varyansa neden olan açıklayıcı değişken X’e göre soldaki tablodaki gibi küçükten büyüğe sıralanır. Sıralama yapıldıktan sonra ortaya düşen 4 gözlem analizden çıkartılır. Bu gözlemler tabloda koyu renge boyanmış olarak verilir. Gözlem çıkarımı işleminden sonra grup 1 ve grup 2 verileri takip eden tabloda verilmektedir.
Xe göre sıralı Y Sıralı X
55 80
70 85
75 90
65 100
74 105
80 110
84 115
79 120
90 125
98 130
95 140
108 145
113 150
110 160
125 165
115 180
ˆ
175 150 125 100 75 50 20
10
0
-10
-20
Y şapka
artıklar
Scatterplot of artıklar vs Y şapka
250 200
1 50 1 00
20
1 0
0
-1 0
-20
Xt
Artık
Şekil 2. Artık ların Xt ye göre dağılımı
130 185
135 190
120 200
140 205
144 210
152 220
140 225
137 230
145 240
175 245
189 250
180 260
178 265
191 270
Grup 1 Y Grup 1 X Grup 2 Y Grup 2 X
55 80 135 190
70 85 120 200
75 90 140 205
65 100 144 210
74 105 152 220
80 110 140 225
84 115 137 230
79 120 145 240
90 125 175 245
98 130 189 250
95 140 180 260
108 145 178 265
113 150 191 270
Bu testin uygulamasında araştırılan hipotez
𝐻0: 𝜎12 = 𝜎22 𝐻1: 𝜎12 ≠ 𝜎22
Şeklinde kurulur. Orijinal veride bu şekilde bölme işlemi gerçekleştirildikten sonra iki gruba ayrı ayrı regresyon analizi uygulanır. Bu uygulamada elde edilen sonuçlar aşağıdaki gibidir.
Grup 1 için Regresyon Analizi:
Regresyon denklemi
Grup 1 Y = 3,41 + 0,697 Grup 1 X
Katsayılar Değer Standart Hataları T P Sabit 3,409 8,705 0,39 0,703 Eğim 0,69677 0,07437 9,37 0,000
= 5,856 R2= 88,9% R2 düzeltilmiş = 87,9%
VAT
Kaynak s.d. KT KO F P Regr. 1 3010,1 3010,1 87,79 0,000 Artık 11 377,2 34,3
Genel 12 3387,2
Grup 2 için Regresyon Analizi:
Regresyon Denklemi
Grup 2 Y =- 28,0 + 0,794 Grup 2 X
Katsayılar Değer Standart hata T P Sabit -28,03 30,64 -0,91 0,380 Eğim(X) 0,7941 0,1316 6,04 0,000
ˆ= 11,82 R2= 76,8% R2 düzeltilmiş = 74,7%
VAT
Kaynak s.d. KT KO F P Regr. 1 5088,9 5088,9 36,42 0,000 Artık 11 1536,8 139,7
Genel 12 6625,7
Bu sonuçlardan faydalanılarak F test istatistiği ikinci grubun artık kareler ortalamasının birinci grubun artık kareler ortalamasına oranı olarak hesaplanır. Şöyle ki,
𝐹 = 𝐴𝐾𝑇2
⁄𝑠𝑑 𝐴𝐾𝑇1
⁄𝑠𝑑
= 𝐴𝐾𝑂2
𝐴𝐾𝑂1 = 139.7
34.3 = 4.073
dir. F in kritik değeri F11,11,0.05=2.82 olarak tablodan bulunur. Hesaplanan test istatistiğinin değeri tablo değerinden büyük olduğu için gruplara ait gerçek varyanslar arasında farklılık vardır, hatta ikinci grubun varyansı birinci grubunkinden daha büyüktür denilebilir.
b. Park Testi Uygulaması
Aynı veriye Park testi uygulayarak verideki değişen varyans sorununu ortaya çıkaralım. Bu uygulamayı yapmak için ilk olarak değişen varyansa aldırmaksızın orijinal veriye regresyon analizi uygulanır. Bu uygulama sonuçları;
Regresyon denklemi Y = 9,29 + 0,638 X
Katsayı Değerleri Standart Hataları T P Sabit 9,290 5,231 1,78 0,087 Eğim(X) 0,63778 0,02862 22,29 0,000
ˆ
= 9,183 R2= 94,7% R2 düzeltilmiş= 94,5%
VAT
Kaynak s.d. KT KO F P
Regr 1 41887 41887 496,72 0,000 Artık 28 2361 84
Genel 29 44248
ve hesaplanan artıklar aşağıdaki tablonun üçüncü sütununda verilmektedir. Park testine göre artıkların karelerinin e tabanına göre logaritması alınarak yeni bağımlı değişken oluşturulacak ve bu yeni bağımlı değişken ile Ln(X) regresyon analizine tabi tutulacak.
Y X Y şapka artıklar Ln ut kare=Yt* Ln Xt=Xt*
55 80 60,313 -5,3131 3,34034 4,38203
65 100 73,069 -8,0688 4,17600 4,60517
70 85 63,502 6,4980 3,74299 4,44265
80 110 79,447 0,5534 -1,18338 4,70048
79 120 85,824 -6,8245 3,84102 4,78749
84 115 82,636 1,3645 0,62153 4,74493
98 130 92,202 5,7977 3,51492 4,86753
95 140 98,580 -3,5801 2,55081 4,94164
90 125 89,013 0,9866 -0,02693 4,82831
75 90 66,691 8,3091 4,23470 4,49981
74 105 76,258 -2,2577 1,62868 4,65396
110 160 111,336 -1,3358 0,57912 5,07517
113 150 104,958 8,0420 4,16936 5,01064
125 165 114,525 10,4752 4,69803 5,10595
108 145 101,769 6,2309 3,65905 4,97673
115 180 124,092 -9,0915 4,41469 5,19296
140 225 152,792 -12,7918 5,09761 5,41610
120 200 136,847 -16,8472 5,64837 5,29832
145 240 162,359 -17,3586 5,70818 5,48064
130 185 127,280 2,7195 2,00093 5,22036
152 220 149,603 2,3971 1,74851 5,39363
144 210 143,225 0,7749 -0,50995 5,34711
175 245 165,548 9,4525 4,49255 5,50126
180 260 175,114 4,8857 3,17263 5,56068
135 190 130,469 4,5306 3,02172 5,24702
140 205 140,036 -0,0361 -6,64061 5,32301
178 265 178,303 -0,3032 -2,38662 5,57973
191 270 181,492 9,5079 4,50424 5,59842
137 230 155,981 -18,9808 5,88685 5,43808
189 250 168,736 20,2636 6,01765 5,52146
Oluşturulan yeni değişkenler yukarıdaki tabloda verilmektedir. Artıkların karelerinin ve X in e tabanına göre logaritması regresyona sokulduğunda aşağıdaki sonuçlar elde edilmiştir.
Regresyon Analizi: Yt* ın Xt* ile regresyonu
ˆ
Regresyon Denklemi Ln u kare = 1,01 + 0,34 Ln X
Katsayı Değer Standart hata T P Sabit 1,014 7,275 0,14 0,890 Eğim 0,336 1,425 0,24 0,815
𝜎̂ = 2,843 R2= 0,2% R2 düzeltilmiş = 0,0%
VAT
Kaynak s.d. KT KO F P Regr 1 0,449 0,449 0,06 0,815 Artık 28 226,315 8,083
Genel 29 226,764
P değeri α/ 2 (α=0,05) anlam düzeyinden oldukça büyük olduğundan eğim katsayısı olan beta1 in istatistiksel olarak anlamsız olduğu sonucuna varılır. Eğim katsayısı istatistik bakımdan önemli olmadığından hata ile X arasında varsayılan ilişki anlamlı değildir. Öyleyse
“veri içerisinde incelenen ilişkiye dayalı değişen varyans problemine sahip değildir” diyebiliriz.
c. Spearman Sıra Korelasyon Katsayısı Testi
1 2 3 4 5 6 7 8 9 10
Y Xt Y şapka Ut artıklar Ln Ut kare Ln Xt Mutlak Ut Sıra No
Mutlak Ut
Sıra no Xt
Dt=8-9
55 80 60,313 -5,3131 3,34034 4,38203 5,3131 14 1 13
65 100 73,069 -8,0688 4,17600 4,60517 8,0688 20 4 16
70 85 63,502 6,4980 3,74299 4,44265 6,4980 17 2 15
80 110 79,447 0,5534 -1,18338 4,70048 0,5534 3 6 -3
79 120 85,824 -6,8245 3,84102 4,78749 6,8245 18 8 10
84 115 82,636 1,3645 0,62153 4,74493 1,3645 7 7 0
98 130 92,202 5,7977 3,51492 4,86753 5,7977 15 10 5
95 140 98,580 -3,5801 2,55081 4,94164 3,5801 11 11 0
90 125 89,013 0,9866 -0,02693 4,82831 0,9866 5 9 -4
75 90 66,691 8,3091 4,23470 4,49981 8,3091 21 3 18
74 105 76,258 -2,2577 1,62868 4,65396 2,2577 8 5 3
110 160 111,336 -1,3358 0,57912 5,07517 1,3358 6 14 -8
113 150 104,958 8,0420 4,16936 5,01064 8,0420 19 13 6
125 165 114,525 10,4752 4,69803 5,10595 10,4752 25 15 10
108 145 101,769 6,2309 3,65905 4,97673 6,2309 16 12 4
115 180 124,092 -9,0915 4,41469 5,19296 9,0915 22 16 6
140 225 152,792 -12,7918 5,09761 5,41610 12,7918 26 23 3
120 200 136,847 -16,8472 5,64837 5,29832 16,8472 27 19 8
145 240 162,359 -17,3586 5,70818 5,48064 17,3586 28 25 3
130 185 127,280 2,7195 2,00093 5,22036 2,7195 10 17 -7
152 220 149,603 2,3971 1,74851 5,39363 2,3971 9 22 -13
144 210 143,225 0,7749 -0,50995 5,34711 0,7749 4 21 -17
Eğim katsayısı beta1 e ait istatistiksel sonuçlar
175 245 165,548 9,4525 4,49255 5,50126 9,4525 23 26 -3
180 260 175,114 4,8857 3,17263 5,56068 4,8857 13 28 -15
135 190 130,469 4,5306 3,02172 5,24702 4,5306 12 18 -6
140 205 140,036 -0,0361 -6,64061 5,32301 0,0361 1 20 -19
178 265 178,303 -0,3032 -2,38662 5,57973 0,3032 2 29 -27
191 270 181,492 9,5079 4,50424 5,59842 9,5079 24 30 -6
137 230 155,981 -18,9808 5,88685 5,43808 18,9808 29 24 5
189 250 168,736 20,2636 6,01765 5,52146 20,2636 30 27 3
Bu test için kurulan hipotez testi 𝐻0: 𝜌𝑠 = 0 karşılık 𝐻1: 𝜌𝑠 ≠ 0 şeklindedir. Sperman Sıra korelasyon katsayısı
𝑟𝑠 = 1 − 6 ∑ 𝐷𝑡2 𝑛(𝑛2− 1) 𝑟𝑠 = 1 − 6 3404
30(302 − 1)= 0,2427 Test istatistiği;
𝑡 = 𝑟𝑠(√𝑛 − 2)
(1 − 𝑟𝑠2) = 0,2427√30 − 2
(1 − 0,24272) = 1,2842
0,9701= 1,32
Hesaplanır. Hesaplanan t değeri tablodan bulunacak t değeri ile karşılaştırılacaktır. Tablo değeri 𝑡0,025,28 = 2,048 bulunur. 𝑡 > 𝑡0,025,28 ise 𝐻0 hipotezi ret edilir. Örnek verimizden hesaplanan değerleri yerine koyduğumuzda
𝑡 = 1,32 < 2,048 = 𝑡0,025,28
olduğundan 𝐻0 hipotezi kabul edilir. Yani örnekleme dayalı olarak hesaplanan sıra korelasyon katsayısı 0,2427 değeri istatistik bakımdan anlamlı değildir. Yani değişkenler arasında doğrusal ilişki yoktur. Bu ilişki yok ise değişen varyans problemi de yoktur sonucuna varılır.
d. Glejser Testi
Aynı veri üzerinde Glejser testi uygulaması yapılacaktır. Bu teste geçmeden önce veride yapılması gereken dönüşümleri yapılarak aşağıdaki tabloda sunulmuştur.
Yt Xt FITS1 RESI1 Mutlak
artıklar
1/Xt karakök Xt 1/karakök Xt
55 80 60,313 -5,3131 5,3131 0,0125000 8,9443 0,111803
65 100 73,069 -8,0688 8,0688 0,0100000 10,0000 0,100000
70 85 63,502 6,4980 6,4980 0,0117647 9,2195 0,108465
80 110 79,447 0,5534 0,5534 0,0090909 10,4881 0,095346
79 120 85,824 -6,8245 6,8245 0,0083333 10,9545 0,091287
84 115 82,636 1,3645 1,3645 0,0086957 10,7238 0,093250
98 130 92,202 5,7977 5,7977 0,0076923 11,4018 0,087706
95 140 98,580 -3,5801 3,5801 0,0071429 11,8322 0,084515
90 125 89,013 0,9866 0,9866 0,0080000 11,1803 0,089443
75 90 66,691 8,3091 8,3091 0,0111111 9,4868 0,105409
74 105 76,258 -2,2577 2,2577 0,0095238 10,2470 0,097590
110 160 111,336 -1,3358 1,3358 0,0062500 12,6491 0,079057 113 150 104,958 8,0420 8,0420 0,0066667 12,2474 0,081650 125 165 114,525 10,4752 10,4752 0,0060606 12,8452 0,077850 108 145 101,769 6,2309 6,2309 0,0068966 12,0416 0,083045 115 180 124,092 -9,0915 9,0915 0,0055556 13,4164 0,074536 140 225 152,792 -12,7918 12,7918 0,0044444 15,0000 0,066667 120 200 136,847 -16,8472 16,8472 0,0050000 14,1421 0,070711 145 240 162,359 -17,3586 17,3586 0,0041667 15,4919 0,064550 130 185 127,280 2,7195 2,7195 0,0054054 13,6015 0,073521 152 220 149,603 2,3971 2,3971 0,0045455 14,8324 0,067420 144 210 143,225 0,7749 0,7749 0,0047619 14,4914 0,069007 175 245 165,548 9,4525 9,4525 0,0040816 15,6525 0,063888 180 260 175,114 4,8857 4,8857 0,0038462 16,1245 0,062017 135 190 130,469 4,5306 4,5306 0,0052632 13,7840 0,072548 140 205 140,036 -0,0361 0,0361 0,0048780 14,3178 0,069843 178 265 178,303 -0,3032 0,3032 0,0037736 16,2788 0,061430 191 270 181,492 9,5079 9,5079 0,0037037 16,4317 0,060858 137 230 155,981 -18,9808 18,9808 0,0043478 15,1658 0,065938 189 250 168,736 20,2636 20,2636 0,0040000 15,8114 0,063246
İlk olarak |𝑢̂𝑡| = 𝛽0+ 𝛽1𝑋𝑡+ 𝑣𝑡 modeli araştırılacaktır. İlk uygulamanın sonuçları MINITAB programından alınır. Çıktı aşağıdaki gibidir.
Regression Analysis: Mutlak artıklar versus Xt
Katsayılar Değer Standart Hata T P Eğim(Xt) 0,0331 0,0171 1,94 0,062
Sabit 1,11 3,12 0,36 0,724
Model Summary
𝜎̂=5,47481 R2 =11,88 % VAT
Kaynak DF KT KO F-Değeri P-Değeri Regresyon 1 113,1 113,14 3,77 0,062 Artık 28 839,3 29,97
Genel 29 952,4 Regresyon Denklemi
Mutlak artıklar = 1,11 + 0,0331 Xt
Sarı ile boyanan satırda bu analiz için elde edilen katsayının istatistik bakımdan anlamlılığını test edebiliriz. t değeri 1.94 bulunmuştur. Bu değere karşılık gelen p değeri (olasılık=0,062)
0.025 den büyük olduğu için beta 1 katsayısı için bulunan 0.0331 tahmini değeri istatistik bakımdan anlamlı değildir. O halde orijinal veri içerisinde bu yapıya bağlı olan değişen varyans problemi yoktur.
İkinci olarak |𝑢̂𝑡| = 𝛽0+ 𝛽1√𝑋𝑡+ 𝑣𝑡
Regression Analysis: Mutlak artıklar versus karakök Xt Regresyon Denklemi
Mutlak artıklar = -3,89 + 0,829 karakök Xt
Katsayılar Değer Stan. Hata T P Sabit -3,89 5,79 -0,67 0,507 Eğim(karakök Xt) 0,829 0,440 1,88 0,070 VAT
Kaynak s.d. KT KO F-Değeri P-Değeri Regresyon 1 107,2 107,21 3,55 0,070
Artık 28 845,2 30,19 Genel 29 952,4 Model Summary
𝜎̂ =5,49413 R2= 11,26%
Sarı ile boyanan satırda bu analiz için elde edilen katsayının istatistik bakımdan anlamlılığını test edebiliriz. t değeri 1.88 bulunmuştur. Bu değere karşılık gelen p değeri (olasılık) 0.025 den büyük olduğu için beta 1 katsayısı için bulunan 0.829 tahmini değeri istatistik bakımdan anlamlı değildir. O halde orijinal veri içerisinde bu yapıya bağlı olan değişen varyans problemi yoktur.
Üçüncü olarak Değişen Varyans probleminin |𝑢̂𝑡| = 𝛽0+ 𝛽1 1
𝑋𝑡+ 𝑣𝑡 modeline uygun olarak var olup olmadığı aşağıda araştırılmıştır.
Regression Analysis: Mutlak artıklar versus 1/Xt Regresyon Denklemi
Mutlak artıklar = 11,06 - 639 1/Xt Katsayı Değer S.h. T P Constant 11,06 2,86 3,87 0,001 Eğim(1/Xt) -639 406 -1,58 0,126 Model Summary
𝜎̂ =5,58980 R2=8,14%
VAT
Kaynak s.d. KT KO F P
Regresyon 1 77,52 77,52 2,48 0,126 Artık 28 874,88 31,25
Genel 29 952,40
Sarı ile boyanan satırda bu analiz için elde edilen katsayının istatistik bakımdan anlamlılığını test edebiliriz. t değeri -1,58 bulunmuştur. Bu değere karşılık gelen p değeri (olasılık) 0.025 den büyük olduğu için beta 1 katsayısı için bulunan -639 tahmini değeri istatistik bakımdan anlamlı değildir. O halde orijinal veri içerisinde bu yapıya bağlı olan değişen varyans problemi yoktur.
Dördüncü uygulama olarak |𝑢̂𝑡| = 𝛽0+ 𝛽1 1
√𝑋𝑡+ 𝑣𝑡 modeline uygun olarak değişen varyans probleminin olup olmadığını araştıralım.
Regression Analysis: Mutlak artıklar versus 1/karakök Xt Regresyon Denklemi
Mutlak artıklar = 16,04 - 115,2 1/karakök Xt Coefficients
Katsayı Değer S.h. T P Constant 16,04 5,51 2,91 0,007 Eğim(1/karakök Xt) -115,2 67,9 -1,70 0,101 Model Summary
𝜎̂ = 5,55367 R2= 9,32%
VAT
Kaynak s.d KT KO F P Regresyon 1 88,79 88,79 2,88 0,101
Artık 28 863,61 30,84
Genel 29 952,40
Sarı ile boyanan satırda bu analiz için elde edilen katsayının istatistik bakımdan anlamlılığını test edebiliriz. t değeri -1,70 bulunmuştur. Bu değere karşılık gelen p değeri (olasılık=0,101) 0.025’ten büyük olduğu için beta 1 katsayısı için bulunan -115,2 tahmini değeri istatistik bakımdan anlamlı değildir. O halde orijinal veri içerisinde bu yapıya bağlı olan değişen varyans problemi yoktur.
Değişen varyans problemini düzeltici önlemler 𝜎𝑡2 nin bilindiği durumda
𝜎𝑡2 biliniyorsa değişen varyansı düzeltmenin en kestirme yolu ağırlıklı en küçük kareler yöntemini kullanmaktır. Bu yöntemde gözlemlere en küçük kareler tekniğinde olduğunun tam tersine gözlemlere farklı ağırlıklar atanmaktadır. Basit doğrusal regresyon modelini ele alalım.
𝑌𝑡 = 𝛽0+ 𝛽1𝑋𝑡+ 𝑢𝑡
𝑉𝑎𝑟(𝑢𝑡) = 𝜎𝑡2 bilindiği kabul edildiğinden aşağıdaki çözüm yöntemi değişen varyansı ortadan kaldırabilir. Bu çözüm yöntemi aslında veriyi dönüştürme yöntemidir ve her bir gözleme farklı ağırlıklar atamayı mümkün kılar.
𝑌𝑡
𝜎𝑡 = 𝛽0∗(1
𝜎𝑡) + 𝛽1∗(𝑋𝑡 𝜎𝑡) +𝑢𝑡
𝜎𝑡 𝑉𝑎𝑟 (𝑢𝑡
𝜎𝑡) = 𝑉𝑎𝑟(𝑢𝑡) 𝜎𝑡2 = 𝜎𝑡2
𝜎𝑡2 = 1 𝜎𝑡2 nin bilinmediği durumda
Düzeltici yöntemler mevcut problemin şekline bağlı olarak değişim göstermektedir.
1.Yaklaşım: Eğer hata varyansı modelde kullanılan açıklayıcı değişken ile aşağıdaki gibi orantılı ise;
𝑉𝑎𝑟(𝑢𝑡) = 𝜎𝑡2 = 𝜎2𝑋𝑡2 Önerilen dönüşüm
𝑌𝑡
𝑋𝑡 = 𝛽0∗(1
𝑋𝑡) + 𝛽1∗(𝑋𝑡 𝑋𝑡) +𝑢𝑡
𝑋𝑡 𝑌𝑡∗ = 𝛽0∗𝑋0∗+ 𝛽1∗𝑋1∗+ 𝑢𝑡∗ Olacaktır. 𝑉𝑎𝑟(𝑢𝑡∗) = 𝑉𝑎𝑟 (𝑢𝑋𝑡
𝑡) = 1
𝑋𝑡2𝑉𝑎𝑟(𝑢𝑡) =𝜎𝑋2𝑋𝑡2
𝑡2 = 𝜎2. Bu modelin uygulaması sonucu elde edilen tahmin değerleri dönüştürülmüş modelin tahmin değerleri olacaktır. Orijinal cinsten Y tahmin değerleri elde edilmek istendiğinde
(𝑌𝑡 𝑋𝑡)
̂
= 𝑌̂𝑡∗ İlişkisinden kaynaklı 𝑌̂ = 𝑋𝑡 𝑡𝑌̂𝑡∗ dönüşümü kullanılacaktır.
2.Yaklaşım: Hata varyansı modeldeki açıklayıcı değişken ile doğru orantılı ise;
𝑉𝑎𝑟(𝑢𝑡) = 𝜎𝑡2 = 𝜎2𝑋𝑡 Yapılacak olan dönüşüm aşağıdaki gibi olur.
𝑌𝑡
√𝑋𝑡= 𝛽0∗( 1
√𝑋𝑡) + 𝛽1∗( 𝑋𝑡
√𝑋𝑡) + 𝑢𝑡
√𝑋𝑡 Yeni modelin hata varyansını incelediğimizde
𝑉𝑎𝑟 ( 𝑢𝑡
√𝑋𝑡) = 1
𝑋𝑡𝑉𝑎𝑟(𝑢𝑡) =𝜎2𝑋𝑡 𝑋𝑡 = 𝜎2
Sabitlenmiş olduğu görülecektir. Burada 1.yaklaşımda olduğu gibi dikkat edilecek husus dönüştürülmüş model sabit terimi olmayan 2 açıklayıcı değişkenli bir regresyon modelidir.
Regresyon analizi sonucunda elde edilen tahmin değerlerini orijinal birim cinsinden elde etmek için ise tahmin değerleri √𝑋𝑡 ile çarpılmalıdır.
3.Yaklaşım: Hata varyansı Y’nin ortalama değerinin karesi ile doğru orantılı ise;
𝑉𝑎𝑟(𝑢𝑡) = 𝐸(𝑢𝑡− 𝑢̅̅̅)𝑡 2 = 𝐸(𝑢𝑡2) = 𝜎2[𝐸(𝑌𝑡)]2 Bu durumda yapılacak olan dönüşüm aşağıdaki gibi olur.
𝑌𝑡
𝐸(𝑌𝑡) = 𝛽0∗( 1
𝐸(𝑌𝑡)) + 𝛽1∗( 𝑋𝑡
𝐸(𝑌𝑡)) + 𝑢𝑡 𝐸(𝑌𝑡) Yeni modelin varyansı
𝑉𝑎𝑟 ( 𝑢𝑡
𝐸(𝑌𝑡)) = 1
[𝐸(𝑌𝑡)]2𝑉𝑎𝑟(𝑢𝑡) =𝜎2[𝐸(𝑌𝑡)]2 [𝐸(𝑌𝑡)]2 = 𝜎2
Şeklinde sabitlenmiş olmaktadır. Buradaki tek sorun 𝐸(𝑌𝑡) = 𝐸(𝛽0+ 𝛽1𝑋𝑡+ 𝑢𝑡) = 𝛽0+ 𝛽1𝑋𝑡 beklenen değerin bilinmeyen sabitlere bağlı olmasıdır. O halde bunları elde etmek için ilk önce veri içerisinde değişen varyans problemi göz ardı edilip 𝑌𝑡 = 𝛽0+ 𝛽1𝑋𝑡+ 𝑢𝑡 modeli uygulanır ve tahminler
𝐸(𝑌̂ = 𝑌̂𝑡) 𝑡= 𝛽̂0+ 𝛽̂1𝑋𝑡 Elde edilir. O zaman dönüşüm
𝑌𝑡
𝐸(𝑌̂𝑡) = 𝛽0∗( 1
𝐸(𝑌̂𝑡)) + 𝛽1∗( 𝑋𝑡
𝐸(𝑌̂𝑡)) + 𝑢𝑡 𝐸(𝑌̂𝑡) 𝑌𝑡
𝑌̂𝑡 = 𝛽0∗(1
𝑌̂𝑡) + 𝛽1∗(𝑋𝑡 𝑌̂𝑡) +𝑢𝑡
𝑌̂𝑡 İle gerçekleşecektir.
4.Yaklaşım: Değişen varyans problemi her ne şekilde var ise verinin logaritmik dönüşümü çözüm olabilmektedir.
𝑙𝑜𝑔𝑌𝑡 = 𝛽0+ 𝛽1𝑙𝑜𝑔𝑋𝑡+ 𝑢𝑡
Bu dönüşüm ilk akla gelen ve en kısa çözüm yolu olabilmekte ve birçok veri seti için değişen varyans problemini ortadan kaldıran yaklaşım olabilmektedir.