olmaktadır. Yani her hata terimi farklı varyansa sahip olmaktadır.

(1)

BÖLÜM 3

1.1 Değişen Varyans (Heteroscedasticity)

Regresyon çözümlemesinin varsayımlarından biri olan sabit varyans varsayımının bozulması durumunda ortaya çıkan problemin adı “değişen varyans” olarak adlandırılır. Basit doğrusal regresyon modeli için standart varsayımları hatırlayalım.

𝑌_𝑡 = 𝛽₀+ 𝛽₁𝑋_𝑡+ 𝑢_𝑡

Modelinde hata terimi 𝑢_𝑡 aşağıdaki özelliklere sahip olduğu varsayılır.

𝐸(𝑢_𝑡) = 0 𝑉𝑎𝑟(𝑢_𝑡) = 𝜎²

𝐾𝑜𝑣(𝑢_𝑡, 𝑢_𝑘) = 0 𝑡 ≠ 𝑘 için Değişen varyans probleminin varlığında ise

𝑉𝑎𝑟(𝑢_𝑡) = 𝜎_𝑡²

olmaktadır. Yani her hata terimi farklı varyansa sahip olmaktadır.

Problemin tanımı yapıldıktan sonra bu bölümde üç farklı soru üzerinde durulmaktadır;

1. Veri içerisinde bu sorun varken en küçük kareler yöntemi kullanılarak elde edilmiş tahminler üzerinde ne gibi sonuçlar doğurur?

2. Veri içerisinde değişen varyans probleminin olup olmadığı nasıl tespit edilir?

3. Veri içerisinde var olduğu tespit edilen değişen varyans probleminin çözümü için neler yapılabilir?

Bu sorulara cevap vermeden önce aşağıdaki örneğe bir göz atalım. Aşağıdaki tabloda 20 aileye ait tüketim harcaması Y ile ailenin geliri X ölçümleri sunulmaktadır.

y x

19,9 22,3 31,2 32,3 31,8 36,6 12,1 12,1 40,7 42,3

6,1 6,2

38,6 44,7 25,5 26,1 10,3 10,3 38,8 40,2

8,0 8,1

33,1 34,5 33,5 38,0 13,1 14,1

(2)

14,8 16,4 21,6 24,1 29,3 30,1 25,0 28,3 17,9 18,2 19,8 20,1

Ekonomik teoriye bağlı kalarak gelir arttıkça tüketimin de artacağı beklendiğinden basit doğrusal regresyon çözümlemesinin bu iki değişken arasındaki ilişkiyi açıklaması düşünülür.

Ayrıca Y nin X e karşı serpilme grafiği de bilgi sağlayacaktır.

Buradan hareketle yapılan analiz sonuçları aşağıdaki gibi elde edilmiştir.

𝑌̂_𝑡 = 0,847 + 0,8993𝑋_𝑡 (0,703) (0,0253)

Olarak ilişki tahmin edilmiştir. 𝑅² = 0,9859 ve hata varyansının tahmin edicisi Artık kareler ortalaması (AKO) 1.73 bulunmuştur. Yani X in Y deki değişimi açıklama yüzdesi %98,59 dur.

Oldukça iyi bir uyum ölçüsüdür. Hata varyansı da oldukça küçük bulunmuştur. Elde edilen tahmin ve artık değerleri aşağıdaki tabloda sunulmaktadır.

𝒀̂_𝒕 𝒖̂_𝒕= 𝒀_𝒕− 𝒀̂_𝒕 20,9020 -1,00199 29,8952 1,30476 33,7623 -1,96234 11,7289 0,37112 38,8885 1,81151 6,4229 -0,32286 41,0469 -2,44687 24,3194 1,18057 10,1101 0,18990 36,9999 1,80010 8,1316 -0,13158 31,8738 1,22625 35,0214 -1,52139 13,5275 -0,42753 15,5960 -0,79598 22,5208 -0,92078 27,9167 1,38328

50 40

30 20

1 0 45 40 35 30 25 20 1 5 1 0 5

x

y

(3)

26,2979 -1,29794 17,2148 0,68524 18,9235 0,87652

Veri içerisinde değişen varyans problemi olup olmadığının tespitinde ilk akla gelen grafiksel yaklaşım tahmin değerlerinin artık değerlere karşı serpilme grafiği oldukça bilgi sağlayıcıdır.

Bu grafikte noktaların rastgele bir dağılışı yerine giderek aralarındaki uzaklığın artışı gözlenmektedir. Yani X’in değeri arttıkça noktaların değişimi artmaktadır. Bu değişen varyans probleminin göstergesidir.

1. Veri içerisinde bu sorun varken en küçük kareler yöntemi kullanılarak elde edilmiş tahminler üzerinde ne gibi sonuçlar doğurur?

Bu sorunun en önemli sonucu tahmin edicilerin varyanslarının artık en küçük varyanslı olma özelliğinin yitirilmesidir. Şöyle ki; Basit doğrusal regresyonu ele alarak bu durum incelendiğinde sabit varyans varsayımı altında eğim parametresinin varyansı

𝑉𝑎𝑟(𝛽̂₁) = 𝜎²

𝑆_𝑋𝑋 = 𝜎²

∑^𝑛_𝑡=1(𝑋_𝑡− 𝑋̅)² Değişen varyans problemi olduğunda bu varyans

𝑉𝑎𝑟(𝛽̂₁) = 𝜎²_𝑡 (𝑆_𝑋𝑋)²

Şeklinde elde edilir ki artık en küçük varyanslı olmayı garanti edemez.

2. Veri içerisinde değişen varyans probleminin olup olmadığı nasıl tespit edilir?

Bu sorunu tespit etmenin grafiksel yaklaşımlarının yanında istatistiksel testler mevcuttur.

İstatistiksel testlerden en yaygın olarak kullanılanlar;

a. Goldfeld-Quandt Testi

45 40 35 30 25 20 15 10 5 2

1

0

-1

-2

-3

Y şapka

artıklar

(4)

b. Park Testi

c. Spearman Sıra Korelasyon Testi d. Glejser Testi

a. Goldfeld-Quandt Testi

Y X Y X

55 80 115 180

65 100 140 225

70 85 120 200

80 110 145 240

79 120 130 185

84 115 152 220

98 130 144 210

95 140 175 245

90 125 180 260

75 90 135 190

74 105 140 205

110 160 178 265

113 150 191 270

125 165 137 230

108 145 189 250

Yukarıdaki veride değişen varyans sorunu olup olmadığı Goldfelt-Quandt testi ile araştırılacaktır. Veride değişen varyans sorunu olup olmadığını araştırmanın en basit ve ilk akla gelen yolu, verilerin grafiğini çizmektir. Bu grafik, Şekil 1’de verilmektedir.

Y nin X değişkenine göre çizilen bu grafiğinde çok bariz olmamakla birlikte noktalar arasındaki değişim X değişkeni arttıkça çok az artmakta olduğu gözlenebilir. İkinci olarak veride sorun olup olmadığı göz ardı edilip regresyon analizi uygulanır. Sonuçlar;

Regresyon Denklemi Y = 9,29 + 0,6378 X

250 200

1 50 1 00

200 1 75 1 50 1 25 1 00 75

50

Xt

Yt

Şekil 1 . Y nin X'e göre Dağılımı

(5)

Katsayı Değer S.h. T P Sabit 9,29 5,23 1,78 0,087 Eğim(Xt) 0,6378 0,0286 22,29 0,000

=9,18297 R² =94,66%

Değişen varyans probleminin varlığını tespit etmek için en yaygın olarak kullanılan grafik türleri artıkların Y şapkalara karşı grafiği ve yine artıkların değişen varyansa sebep olduğunu düşündüğümüz X açıklayıcı değişkenine göre grafiğini çizmek olacaktır. Şekil 2’de bu iki grafik sergilenmektedir. Nitekim bu grafikler incelendiğinde noktalar arasındaki değişimin giderek az da olsa arttığı gözlenmektedir.

Bu durumu tespit etmek için ilk olarak parametrik test olan Goldfeld-Quandt testi uygulanacaktır. Bu uygulamada ilk olarak orijinal veri değişen varyansa neden olan açıklayıcı değişken X’e göre soldaki tablodaki gibi küçükten büyüğe sıralanır. Sıralama yapıldıktan sonra ortaya düşen 4 gözlem analizden çıkartılır. Bu gözlemler tabloda koyu renge boyanmış olarak verilir. Gözlem çıkarımı işleminden sonra grup 1 ve grup 2 verileri takip eden tabloda verilmektedir.

Xe göre sıralı Y Sıralı X

55 80

70 85

75 90

65 100

74 105

80 110

84 115

79 120

90 125

98 130

95 140

108 145

113 150

110 160

125 165

115 180

ˆ

175 150 125 100 75 50 20

10

0

-10

-20

Y şapka

artıklar

Scatterplot of artıklar vs Y şapka

250 200

1 50 1 00

20

1 0

0

-1 0

-20

Xt

Artık

Şekil 2. Artık ların Xt ye göre dağılımı

(6)

130 185

135 190

120 200

140 205

144 210

152 220

140 225

137 230

145 240

175 245

189 250

180 260

178 265

191 270

Grup 1 Y Grup 1 X Grup 2 Y Grup 2 X

55 80 135 190

70 85 120 200

75 90 140 205

65 100 144 210

74 105 152 220

80 110 140 225

84 115 137 230

79 120 145 240

90 125 175 245

98 130 189 250

95 140 180 260

108 145 178 265

113 150 191 270

Bu testin uygulamasında araştırılan hipotez

𝐻₀: 𝜎₁² = 𝜎₂² 𝐻₁: 𝜎₁² ≠ 𝜎₂²

Şeklinde kurulur. Orijinal veride bu şekilde bölme işlemi gerçekleştirildikten sonra iki gruba ayrı ayrı regresyon analizi uygulanır. Bu uygulamada elde edilen sonuçlar aşağıdaki gibidir.

Grup 1 için Regresyon Analizi:

Regresyon denklemi

Grup 1 Y = 3,41 + 0,697 Grup 1 X

Katsayılar Değer Standart Hataları T P Sabit 3,409 8,705 0,39 0,703 Eğim 0,69677 0,07437 9,37 0,000

(7)

= 5,856 R²= 88,9% R² düzeltilmiş = 87,9%

VAT

Kaynak s.d. KT KO F P Regr. 1 3010,1 3010,1 87,79 0,000 Artık 11 377,2 34,3

Genel 12 3387,2

Grup 2 için Regresyon Analizi:

Regresyon Denklemi

Grup 2 Y =- 28,0 + 0,794 Grup 2 X

Katsayılar Değer Standart hata T P Sabit -28,03 30,64 -0,91 0,380 Eğim(X) 0,7941 0,1316 6,04 0,000

^ˆ= 11,82 R²= 76,8% R² düzeltilmiş = 74,7%

VAT

Kaynak s.d. KT KO F P Regr. 1 5088,9 5088,9 36,42 0,000 Artık 11 1536,8 139,7

Genel 12 6625,7

Bu sonuçlardan faydalanılarak F test istatistiği ikinci grubun artık kareler ortalamasının birinci grubun artık kareler ortalamasına oranı olarak hesaplanır. Şöyle ki,

𝐹 = 𝐴𝐾𝑇₂

⁄𝑠𝑑 𝐴𝐾𝑇₁

⁄𝑠𝑑

= 𝐴𝐾𝑂₂

𝐴𝐾𝑂₁ = 139.7

34.3 = 4.073

dir. F in kritik değeri F11,11,0.05=2.82 olarak tablodan bulunur. Hesaplanan test istatistiğinin değeri tablo değerinden büyük olduğu için gruplara ait gerçek varyanslar arasında farklılık vardır, hatta ikinci grubun varyansı birinci grubunkinden daha büyüktür denilebilir.

b. Park Testi Uygulaması

Aynı veriye Park testi uygulayarak verideki değişen varyans sorununu ortaya çıkaralım. Bu uygulamayı yapmak için ilk olarak değişen varyansa aldırmaksızın orijinal veriye regresyon analizi uygulanır. Bu uygulama sonuçları;

Regresyon denklemi Y = 9,29 + 0,638 X

Katsayı Değerleri Standart Hataları T P Sabit 9,290 5,231 1,78 0,087 Eğim(X) 0,63778 0,02862 22,29 0,000

ˆ

(8)

= 9,183 R²= 94,7% R² düzeltilmiş= 94,5%

VAT

Kaynak s.d. KT KO F P

Regr 1 41887 41887 496,72 0,000 Artık 28 2361 84

Genel 29 44248

ve hesaplanan artıklar aşağıdaki tablonun üçüncü sütununda verilmektedir. Park testine göre artıkların karelerinin e tabanına göre logaritması alınarak yeni bağımlı değişken oluşturulacak ve bu yeni bağımlı değişken ile Ln(X) regresyon analizine tabi tutulacak.

Y X Y şapka artıklar Ln ut kare=Yt* Ln Xt=Xt*

55 80 60,313 -5,3131 3,34034 4,38203

65 100 73,069 -8,0688 4,17600 4,60517

70 85 63,502 6,4980 3,74299 4,44265

80 110 79,447 0,5534 -1,18338 4,70048

79 120 85,824 -6,8245 3,84102 4,78749

84 115 82,636 1,3645 0,62153 4,74493

98 130 92,202 5,7977 3,51492 4,86753

95 140 98,580 -3,5801 2,55081 4,94164

90 125 89,013 0,9866 -0,02693 4,82831

75 90 66,691 8,3091 4,23470 4,49981

74 105 76,258 -2,2577 1,62868 4,65396

110 160 111,336 -1,3358 0,57912 5,07517

113 150 104,958 8,0420 4,16936 5,01064

125 165 114,525 10,4752 4,69803 5,10595

108 145 101,769 6,2309 3,65905 4,97673

115 180 124,092 -9,0915 4,41469 5,19296

140 225 152,792 -12,7918 5,09761 5,41610

120 200 136,847 -16,8472 5,64837 5,29832

145 240 162,359 -17,3586 5,70818 5,48064

130 185 127,280 2,7195 2,00093 5,22036

152 220 149,603 2,3971 1,74851 5,39363

144 210 143,225 0,7749 -0,50995 5,34711

175 245 165,548 9,4525 4,49255 5,50126

180 260 175,114 4,8857 3,17263 5,56068

135 190 130,469 4,5306 3,02172 5,24702

140 205 140,036 -0,0361 -6,64061 5,32301

178 265 178,303 -0,3032 -2,38662 5,57973

191 270 181,492 9,5079 4,50424 5,59842

137 230 155,981 -18,9808 5,88685 5,43808

189 250 168,736 20,2636 6,01765 5,52146

Oluşturulan yeni değişkenler yukarıdaki tabloda verilmektedir. Artıkların karelerinin ve X in e tabanına göre logaritması regresyona sokulduğunda aşağıdaki sonuçlar elde edilmiştir.

Regresyon Analizi: Yt* ın Xt* ile regresyonu

ˆ

(9)

Regresyon Denklemi Ln u kare = 1,01 + 0,34 Ln X

Katsayı Değer Standart hata T P Sabit 1,014 7,275 0,14 0,890 Eğim 0,336 1,425 0,24 0,815

𝜎̂ = 2,843 R²= 0,2% R² düzeltilmiş = 0,0%

VAT

Kaynak s.d. KT KO F P Regr 1 0,449 0,449 0,06 0,815 Artık 28 226,315 8,083

Genel 29 226,764

P değeri α/ 2 (α=0,05) anlam düzeyinden oldukça büyük olduğundan eğim katsayısı olan beta1 in istatistiksel olarak anlamsız olduğu sonucuna varılır. Eğim katsayısı istatistik bakımdan önemli olmadığından hata ile X arasında varsayılan ilişki anlamlı değildir. Öyleyse

“veri içerisinde incelenen ilişkiye dayalı değişen varyans problemine sahip değildir” diyebiliriz.

c. Spearman Sıra Korelasyon Katsayısı Testi

1 2 3 4 5 6 7 8 9 10

Y Xt Y şapka Ut artıklar Ln Ut kare Ln Xt Mutlak Ut Sıra No

Mutlak Ut

Sıra no Xt

Dt=8-9

55 80 60,313 -5,3131 3,34034 4,38203 5,3131 14 1 13

65 100 73,069 -8,0688 4,17600 4,60517 8,0688 20 4 16

70 85 63,502 6,4980 3,74299 4,44265 6,4980 17 2 15

80 110 79,447 0,5534 -1,18338 4,70048 0,5534 3 6 -3

79 120 85,824 -6,8245 3,84102 4,78749 6,8245 18 8 10

84 115 82,636 1,3645 0,62153 4,74493 1,3645 7 7 0

98 130 92,202 5,7977 3,51492 4,86753 5,7977 15 10 5

95 140 98,580 -3,5801 2,55081 4,94164 3,5801 11 11 0

90 125 89,013 0,9866 -0,02693 4,82831 0,9866 5 9 -4

75 90 66,691 8,3091 4,23470 4,49981 8,3091 21 3 18

74 105 76,258 -2,2577 1,62868 4,65396 2,2577 8 5 3

110 160 111,336 -1,3358 0,57912 5,07517 1,3358 6 14 -8

113 150 104,958 8,0420 4,16936 5,01064 8,0420 19 13 6

125 165 114,525 10,4752 4,69803 5,10595 10,4752 25 15 10

108 145 101,769 6,2309 3,65905 4,97673 6,2309 16 12 4

115 180 124,092 -9,0915 4,41469 5,19296 9,0915 22 16 6

140 225 152,792 -12,7918 5,09761 5,41610 12,7918 26 23 3

120 200 136,847 -16,8472 5,64837 5,29832 16,8472 27 19 8

145 240 162,359 -17,3586 5,70818 5,48064 17,3586 28 25 3

130 185 127,280 2,7195 2,00093 5,22036 2,7195 10 17 -7

152 220 149,603 2,3971 1,74851 5,39363 2,3971 9 22 -13

144 210 143,225 0,7749 -0,50995 5,34711 0,7749 4 21 -17

Eğim katsayısı beta1 e ait istatistiksel sonuçlar

(10)

175 245 165,548 9,4525 4,49255 5,50126 9,4525 23 26 -3

180 260 175,114 4,8857 3,17263 5,56068 4,8857 13 28 -15

135 190 130,469 4,5306 3,02172 5,24702 4,5306 12 18 -6

140 205 140,036 -0,0361 -6,64061 5,32301 0,0361 1 20 -19

178 265 178,303 -0,3032 -2,38662 5,57973 0,3032 2 29 -27

191 270 181,492 9,5079 4,50424 5,59842 9,5079 24 30 -6

137 230 155,981 -18,9808 5,88685 5,43808 18,9808 29 24 5

189 250 168,736 20,2636 6,01765 5,52146 20,2636 30 27 3

Bu test için kurulan hipotez testi 𝐻₀: 𝜌_𝑠 = 0 karşılık 𝐻₁: 𝜌_𝑠 ≠ 0 şeklindedir. Sperman Sıra korelasyon katsayısı

𝑟_𝑠 = 1 − 6 ∑ 𝐷_𝑡² 𝑛(𝑛²− 1) 𝑟_𝑠 = 1 − 6 3404

30(30² − 1)= 0,2427 Test istatistiği;

𝑡 = 𝑟_𝑠(√𝑛 − 2)

(1 − 𝑟_𝑠²) = 0,2427√30 − 2

(1 − 0,2427²) = 1,2842

0,9701= 1,32

Hesaplanır. Hesaplanan t değeri tablodan bulunacak t değeri ile karşılaştırılacaktır. Tablo değeri 𝑡_0,025,28 = 2,048 bulunur. 𝑡 > 𝑡_0,025,28 ise 𝐻₀ hipotezi ret edilir. Örnek verimizden hesaplanan değerleri yerine koyduğumuzda

𝑡 = 1,32 < 2,048 = 𝑡_0,025,28

olduğundan 𝐻₀ hipotezi kabul edilir. Yani örnekleme dayalı olarak hesaplanan sıra korelasyon katsayısı 0,2427 değeri istatistik bakımdan anlamlı değildir. Yani değişkenler arasında doğrusal ilişki yoktur. Bu ilişki yok ise değişen varyans problemi de yoktur sonucuna varılır.

d. Glejser Testi

Aynı veri üzerinde Glejser testi uygulaması yapılacaktır. Bu teste geçmeden önce veride yapılması gereken dönüşümleri yapılarak aşağıdaki tabloda sunulmuştur.

Yt Xt FITS1 RESI1 Mutlak

artıklar

1/Xt karakök Xt 1/karakök Xt

55 80 60,313 -5,3131 5,3131 0,0125000 8,9443 0,111803

65 100 73,069 -8,0688 8,0688 0,0100000 10,0000 0,100000

70 85 63,502 6,4980 6,4980 0,0117647 9,2195 0,108465

80 110 79,447 0,5534 0,5534 0,0090909 10,4881 0,095346

79 120 85,824 -6,8245 6,8245 0,0083333 10,9545 0,091287

(11)

84 115 82,636 1,3645 1,3645 0,0086957 10,7238 0,093250

98 130 92,202 5,7977 5,7977 0,0076923 11,4018 0,087706

95 140 98,580 -3,5801 3,5801 0,0071429 11,8322 0,084515

90 125 89,013 0,9866 0,9866 0,0080000 11,1803 0,089443

75 90 66,691 8,3091 8,3091 0,0111111 9,4868 0,105409

74 105 76,258 -2,2577 2,2577 0,0095238 10,2470 0,097590

110 160 111,336 -1,3358 1,3358 0,0062500 12,6491 0,079057 113 150 104,958 8,0420 8,0420 0,0066667 12,2474 0,081650 125 165 114,525 10,4752 10,4752 0,0060606 12,8452 0,077850 108 145 101,769 6,2309 6,2309 0,0068966 12,0416 0,083045 115 180 124,092 -9,0915 9,0915 0,0055556 13,4164 0,074536 140 225 152,792 -12,7918 12,7918 0,0044444 15,0000 0,066667 120 200 136,847 -16,8472 16,8472 0,0050000 14,1421 0,070711 145 240 162,359 -17,3586 17,3586 0,0041667 15,4919 0,064550 130 185 127,280 2,7195 2,7195 0,0054054 13,6015 0,073521 152 220 149,603 2,3971 2,3971 0,0045455 14,8324 0,067420 144 210 143,225 0,7749 0,7749 0,0047619 14,4914 0,069007 175 245 165,548 9,4525 9,4525 0,0040816 15,6525 0,063888 180 260 175,114 4,8857 4,8857 0,0038462 16,1245 0,062017 135 190 130,469 4,5306 4,5306 0,0052632 13,7840 0,072548 140 205 140,036 -0,0361 0,0361 0,0048780 14,3178 0,069843 178 265 178,303 -0,3032 0,3032 0,0037736 16,2788 0,061430 191 270 181,492 9,5079 9,5079 0,0037037 16,4317 0,060858 137 230 155,981 -18,9808 18,9808 0,0043478 15,1658 0,065938 189 250 168,736 20,2636 20,2636 0,0040000 15,8114 0,063246

İlk olarak |𝑢̂_𝑡| = 𝛽₀+ 𝛽₁𝑋_𝑡+ 𝑣_𝑡 modeli araştırılacaktır. İlk uygulamanın sonuçları MINITAB programından alınır. Çıktı aşağıdaki gibidir.

Regression Analysis: Mutlak artıklar versus Xt

Katsayılar Değer Standart Hata T P Eğim(Xt) 0,0331 0,0171 1,94 0,062

Sabit 1,11 3,12 0,36 0,724

Model Summary

𝜎̂=5,47481 R² =11,88 % VAT

Kaynak DF KT KO F-Değeri P-Değeri Regresyon 1 113,1 113,14 3,77 0,062 Artık 28 839,3 29,97

Genel 29 952,4 Regresyon Denklemi

Mutlak artıklar = 1,11 + 0,0331 Xt

Sarı ile boyanan satırda bu analiz için elde edilen katsayının istatistik bakımdan anlamlılığını test edebiliriz. t değeri 1.94 bulunmuştur. Bu değere karşılık gelen p değeri (olasılık=0,062)

(12)

0.025 den büyük olduğu için beta 1 katsayısı için bulunan 0.0331 tahmini değeri istatistik bakımdan anlamlı değildir. O halde orijinal veri içerisinde bu yapıya bağlı olan değişen varyans problemi yoktur.

İkinci olarak |𝑢̂_𝑡| = 𝛽₀+ 𝛽₁√𝑋_𝑡+ 𝑣_𝑡

Regression Analysis: Mutlak artıklar versus karakök Xt Regresyon Denklemi

Mutlak artıklar = -3,89 + 0,829 karakök Xt

Katsayılar Değer Stan. Hata T P Sabit -3,89 5,79 -0,67 0,507 Eğim(karakök Xt) 0,829 0,440 1,88 0,070 VAT

Kaynak s.d. KT KO F-Değeri P-Değeri Regresyon 1 107,2 107,21 3,55 0,070

Artık 28 845,2 30,19 Genel 29 952,4 Model Summary

𝜎̂ =5,49413 R²= 11,26%

Sarı ile boyanan satırda bu analiz için elde edilen katsayının istatistik bakımdan anlamlılığını test edebiliriz. t değeri 1.88 bulunmuştur. Bu değere karşılık gelen p değeri (olasılık) 0.025 den büyük olduğu için beta 1 katsayısı için bulunan 0.829 tahmini değeri istatistik bakımdan anlamlı değildir. O halde orijinal veri içerisinde bu yapıya bağlı olan değişen varyans problemi yoktur.

Üçüncü olarak Değişen Varyans probleminin |𝑢̂_𝑡| = 𝛽₀+ 𝛽₁ ¹

𝑋𝑡+ 𝑣_𝑡 modeline uygun olarak var olup olmadığı aşağıda araştırılmıştır.

Regression Analysis: Mutlak artıklar versus 1/Xt Regresyon Denklemi

Mutlak artıklar = 11,06 - 639 1/Xt Katsayı Değer S.h. T P Constant 11,06 2,86 3,87 0,001 Eğim(1/Xt) -639 406 -1,58 0,126 Model Summary

𝜎̂ =5,58980 R²=8,14%

VAT

Kaynak s.d. KT KO F P

Regresyon 1 77,52 77,52 2,48 0,126 Artık 28 874,88 31,25

Genel 29 952,40

(13)

Sarı ile boyanan satırda bu analiz için elde edilen katsayının istatistik bakımdan anlamlılığını test edebiliriz. t değeri -1,58 bulunmuştur. Bu değere karşılık gelen p değeri (olasılık) 0.025 den büyük olduğu için beta 1 katsayısı için bulunan -639 tahmini değeri istatistik bakımdan anlamlı değildir. O halde orijinal veri içerisinde bu yapıya bağlı olan değişen varyans problemi yoktur.

Dördüncü uygulama olarak |𝑢̂_𝑡| = 𝛽₀+ 𝛽₁ ¹

√𝑋𝑡+ 𝑣_𝑡 modeline uygun olarak değişen varyans probleminin olup olmadığını araştıralım.

Regression Analysis: Mutlak artıklar versus 1/karakök Xt Regresyon Denklemi

Mutlak artıklar = 16,04 - 115,2 1/karakök Xt Coefficients

Katsayı Değer S.h. T P Constant 16,04 5,51 2,91 0,007 Eğim(1/karakök Xt) -115,2 67,9 -1,70 0,101 Model Summary

𝜎̂ = 5,55367 R²= 9,32%

VAT

Kaynak s.d KT KO F P Regresyon 1 88,79 88,79 2,88 0,101

Artık 28 863,61 30,84

Genel 29 952,40

Sarı ile boyanan satırda bu analiz için elde edilen katsayının istatistik bakımdan anlamlılığını test edebiliriz. t değeri -1,70 bulunmuştur. Bu değere karşılık gelen p değeri (olasılık=0,101) 0.025’ten büyük olduğu için beta 1 katsayısı için bulunan -115,2 tahmini değeri istatistik bakımdan anlamlı değildir. O halde orijinal veri içerisinde bu yapıya bağlı olan değişen varyans problemi yoktur.

Değişen varyans problemini düzeltici önlemler 𝜎_𝑡² nin bilindiği durumda

𝜎_𝑡² biliniyorsa değişen varyansı düzeltmenin en kestirme yolu ağırlıklı en küçük kareler yöntemini kullanmaktır. Bu yöntemde gözlemlere en küçük kareler tekniğinde olduğunun tam tersine gözlemlere farklı ağırlıklar atanmaktadır. Basit doğrusal regresyon modelini ele alalım.

𝑌_𝑡 = 𝛽₀+ 𝛽₁𝑋_𝑡+ 𝑢_𝑡

(14)

𝑉𝑎𝑟(𝑢_𝑡) = 𝜎_𝑡² bilindiği kabul edildiğinden aşağıdaki çözüm yöntemi değişen varyansı ortadan kaldırabilir. Bu çözüm yöntemi aslında veriyi dönüştürme yöntemidir ve her bir gözleme farklı ağırlıklar atamayı mümkün kılar.

𝑌_𝑡

𝜎_𝑡 = 𝛽₀^∗(1

𝜎_𝑡) + 𝛽₁^∗(𝑋_𝑡 𝜎_𝑡) +𝑢_𝑡

𝜎_𝑡 𝑉𝑎𝑟 (𝑢_𝑡

𝜎_𝑡) = 𝑉𝑎𝑟(𝑢_𝑡) 𝜎_𝑡² = 𝜎_𝑡²

𝜎_𝑡² = 1 𝜎_𝑡² nin bilinmediği durumda

Düzeltici yöntemler mevcut problemin şekline bağlı olarak değişim göstermektedir.

1.Yaklaşım: Eğer hata varyansı modelde kullanılan açıklayıcı değişken ile aşağıdaki gibi orantılı ise;

𝑉𝑎𝑟(𝑢_𝑡) = 𝜎_𝑡² = 𝜎²𝑋_𝑡² Önerilen dönüşüm

𝑌_𝑡

𝑋_𝑡 = 𝛽₀^∗(1

𝑋_𝑡) + 𝛽₁^∗(𝑋_𝑡 𝑋_𝑡) +𝑢_𝑡

𝑋_𝑡 𝑌_𝑡^∗ = 𝛽₀^∗𝑋₀^∗+ 𝛽₁^∗𝑋₁^∗+ 𝑢_𝑡^∗ Olacaktır. 𝑉𝑎𝑟(𝑢_𝑡^∗) = 𝑉𝑎𝑟 (^𝑢_𝑋^𝑡

𝑡) = ¹

𝑋_𝑡²𝑉𝑎𝑟(𝑢_𝑡) =^𝜎_𝑋²^𝑋^𝑡²

𝑡2 = 𝜎². Bu modelin uygulaması sonucu elde edilen tahmin değerleri dönüştürülmüş modelin tahmin değerleri olacaktır. Orijinal cinsten Y tahmin değerleri elde edilmek istendiğinde

(𝑌_𝑡 𝑋_𝑡)

̂

= 𝑌̂_𝑡^∗ İlişkisinden kaynaklı 𝑌̂ = 𝑋_𝑡 _𝑡𝑌̂_𝑡^∗ dönüşümü kullanılacaktır.

2.Yaklaşım: Hata varyansı modeldeki açıklayıcı değişken ile doğru orantılı ise;

𝑉𝑎𝑟(𝑢_𝑡) = 𝜎_𝑡² = 𝜎²𝑋_𝑡 Yapılacak olan dönüşüm aşağıdaki gibi olur.

𝑌_𝑡

√𝑋_𝑡= 𝛽₀^∗( 1

√𝑋_𝑡) + 𝛽₁^∗( 𝑋_𝑡

√𝑋_𝑡) + 𝑢_𝑡

√𝑋_𝑡 Yeni modelin hata varyansını incelediğimizde

(15)

𝑉𝑎𝑟 ( 𝑢_𝑡

√𝑋_𝑡) = 1

𝑋_𝑡𝑉𝑎𝑟(𝑢_𝑡) =𝜎²𝑋_𝑡 𝑋_𝑡 = 𝜎²

Sabitlenmiş olduğu görülecektir. Burada 1.yaklaşımda olduğu gibi dikkat edilecek husus dönüştürülmüş model sabit terimi olmayan 2 açıklayıcı değişkenli bir regresyon modelidir.

Regresyon analizi sonucunda elde edilen tahmin değerlerini orijinal birim cinsinden elde etmek için ise tahmin değerleri √𝑋𝑡 ile çarpılmalıdır.

3.Yaklaşım: Hata varyansı Y’nin ortalama değerinin karesi ile doğru orantılı ise;

𝑉𝑎𝑟(𝑢_𝑡) = 𝐸(𝑢_𝑡− 𝑢̅̅̅)_𝑡 ² = 𝐸(𝑢_𝑡²) = 𝜎²[𝐸(𝑌_𝑡)]² Bu durumda yapılacak olan dönüşüm aşağıdaki gibi olur.

𝑌_𝑡

𝐸(𝑌_𝑡) = 𝛽₀^∗( 1

𝐸(𝑌_𝑡)) + 𝛽₁^∗( 𝑋_𝑡

𝐸(𝑌_𝑡)) + 𝑢_𝑡 𝐸(𝑌_𝑡) Yeni modelin varyansı

𝑉𝑎𝑟 ( 𝑢_𝑡

𝐸(𝑌_𝑡)) = 1

[𝐸(𝑌_𝑡)]²𝑉𝑎𝑟(𝑢_𝑡) =𝜎²[𝐸(𝑌_𝑡)]² [𝐸(𝑌_𝑡)]² = 𝜎²

Şeklinde sabitlenmiş olmaktadır. Buradaki tek sorun 𝐸(𝑌_𝑡) = 𝐸(𝛽₀+ 𝛽₁𝑋_𝑡+ 𝑢_𝑡) = 𝛽₀+ 𝛽₁𝑋_𝑡 beklenen değerin bilinmeyen sabitlere bağlı olmasıdır. O halde bunları elde etmek için ilk önce veri içerisinde değişen varyans problemi göz ardı edilip 𝑌_𝑡 = 𝛽₀+ 𝛽₁𝑋_𝑡+ 𝑢_𝑡 modeli uygulanır ve tahminler

𝐸(𝑌̂ = 𝑌̂_𝑡) _𝑡= 𝛽̂₀+ 𝛽̂₁𝑋_𝑡 Elde edilir. O zaman dönüşüm

𝑌_𝑡

𝐸(𝑌̂_𝑡) = 𝛽₀^∗( 1

𝐸(𝑌̂_𝑡)) + 𝛽₁^∗( 𝑋_𝑡

𝐸(𝑌̂_𝑡)) + 𝑢_𝑡 𝐸(𝑌̂_𝑡) 𝑌_𝑡

𝑌̂_𝑡 = 𝛽₀^∗(1

𝑌̂_𝑡) + 𝛽₁^∗(𝑋_𝑡 𝑌̂_𝑡) +𝑢_𝑡

𝑌̂_𝑡 İle gerçekleşecektir.

4.Yaklaşım: Değişen varyans problemi her ne şekilde var ise verinin logaritmik dönüşümü çözüm olabilmektedir.

𝑙𝑜𝑔𝑌_𝑡 = 𝛽₀+ 𝛽₁𝑙𝑜𝑔𝑋_𝑡+ 𝑢_𝑡

Bu dönüşüm ilk akla gelen ve en kısa çözüm yolu olabilmekte ve birçok veri seti için değişen varyans problemini ortadan kaldıran yaklaşım olabilmektedir.

(16)