• Sonuç bulunamadı

olmaktadır. Yani her hata terimi farklı varyansa sahip olmaktadır.

N/A
N/A
Protected

Academic year: 2022

Share "olmaktadır. Yani her hata terimi farklı varyansa sahip olmaktadır."

Copied!
16
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

BÖLÜM 3

1.1 Değişen Varyans (Heteroscedasticity)

Regresyon çözümlemesinin varsayımlarından biri olan sabit varyans varsayımının bozulması durumunda ortaya çıkan problemin adı “değişen varyans” olarak adlandırılır. Basit doğrusal regresyon modeli için standart varsayımları hatırlayalım.

𝑌𝑡 = 𝛽0+ 𝛽1𝑋𝑡+ 𝑢𝑡

Modelinde hata terimi 𝑢𝑡 aşağıdaki özelliklere sahip olduğu varsayılır.

𝐸(𝑢𝑡) = 0 𝑉𝑎𝑟(𝑢𝑡) = 𝜎2

𝐾𝑜𝑣(𝑢𝑡, 𝑢𝑘) = 0 𝑡 ≠ 𝑘 için Değişen varyans probleminin varlığında ise

𝑉𝑎𝑟(𝑢𝑡) = 𝜎𝑡2

olmaktadır. Yani her hata terimi farklı varyansa sahip olmaktadır.

Problemin tanımı yapıldıktan sonra bu bölümde üç farklı soru üzerinde durulmaktadır;

1. Veri içerisinde bu sorun varken en küçük kareler yöntemi kullanılarak elde edilmiş tahminler üzerinde ne gibi sonuçlar doğurur?

2. Veri içerisinde değişen varyans probleminin olup olmadığı nasıl tespit edilir?

3. Veri içerisinde var olduğu tespit edilen değişen varyans probleminin çözümü için neler yapılabilir?

Bu sorulara cevap vermeden önce aşağıdaki örneğe bir göz atalım. Aşağıdaki tabloda 20 aileye ait tüketim harcaması Y ile ailenin geliri X ölçümleri sunulmaktadır.

y x

19,9 22,3 31,2 32,3 31,8 36,6 12,1 12,1 40,7 42,3

6,1 6,2

38,6 44,7 25,5 26,1 10,3 10,3 38,8 40,2

8,0 8,1

33,1 34,5 33,5 38,0 13,1 14,1

(2)

14,8 16,4 21,6 24,1 29,3 30,1 25,0 28,3 17,9 18,2 19,8 20,1

Ekonomik teoriye bağlı kalarak gelir arttıkça tüketimin de artacağı beklendiğinden basit doğrusal regresyon çözümlemesinin bu iki değişken arasındaki ilişkiyi açıklaması düşünülür.

Ayrıca Y nin X e karşı serpilme grafiği de bilgi sağlayacaktır.

Buradan hareketle yapılan analiz sonuçları aşağıdaki gibi elde edilmiştir.

𝑌̂𝑡 = 0,847 + 0,8993𝑋𝑡 (0,703) (0,0253)

Olarak ilişki tahmin edilmiştir. 𝑅2 = 0,9859 ve hata varyansının tahmin edicisi Artık kareler ortalaması (AKO) 1.73 bulunmuştur. Yani X in Y deki değişimi açıklama yüzdesi %98,59 dur.

Oldukça iyi bir uyum ölçüsüdür. Hata varyansı da oldukça küçük bulunmuştur. Elde edilen tahmin ve artık değerleri aşağıdaki tabloda sunulmaktadır.

𝒀̂𝒕 𝒖̂𝒕= 𝒀𝒕− 𝒀̂𝒕 20,9020 -1,00199 29,8952 1,30476 33,7623 -1,96234 11,7289 0,37112 38,8885 1,81151 6,4229 -0,32286 41,0469 -2,44687 24,3194 1,18057 10,1101 0,18990 36,9999 1,80010 8,1316 -0,13158 31,8738 1,22625 35,0214 -1,52139 13,5275 -0,42753 15,5960 -0,79598 22,5208 -0,92078 27,9167 1,38328

50 40

30 20

1 0 45 40 35 30 25 20 1 5 1 0 5

x

y

(3)

26,2979 -1,29794 17,2148 0,68524 18,9235 0,87652

Veri içerisinde değişen varyans problemi olup olmadığının tespitinde ilk akla gelen grafiksel yaklaşım tahmin değerlerinin artık değerlere karşı serpilme grafiği oldukça bilgi sağlayıcıdır.

Bu grafikte noktaların rastgele bir dağılışı yerine giderek aralarındaki uzaklığın artışı gözlenmektedir. Yani X’in değeri arttıkça noktaların değişimi artmaktadır. Bu değişen varyans probleminin göstergesidir.

1. Veri içerisinde bu sorun varken en küçük kareler yöntemi kullanılarak elde edilmiş tahminler üzerinde ne gibi sonuçlar doğurur?

Bu sorunun en önemli sonucu tahmin edicilerin varyanslarının artık en küçük varyanslı olma özelliğinin yitirilmesidir. Şöyle ki; Basit doğrusal regresyonu ele alarak bu durum incelendiğinde sabit varyans varsayımı altında eğim parametresinin varyansı

𝑉𝑎𝑟(𝛽̂1) = 𝜎2

𝑆𝑋𝑋 = 𝜎2

𝑛𝑡=1(𝑋𝑡− 𝑋̅)2 Değişen varyans problemi olduğunda bu varyans

𝑉𝑎𝑟(𝛽̂1) = 𝜎2𝑡 (𝑆𝑋𝑋)2

Şeklinde elde edilir ki artık en küçük varyanslı olmayı garanti edemez.

2. Veri içerisinde değişen varyans probleminin olup olmadığı nasıl tespit edilir?

Bu sorunu tespit etmenin grafiksel yaklaşımlarının yanında istatistiksel testler mevcuttur.

İstatistiksel testlerden en yaygın olarak kullanılanlar;

a. Goldfeld-Quandt Testi

45 40 35 30 25 20 15 10 5 2

1

0

-1

-2

-3

Y şapka

artıklar

(4)

b. Park Testi

c. Spearman Sıra Korelasyon Testi d. Glejser Testi

a. Goldfeld-Quandt Testi

Y X Y X

55 80 115 180

65 100 140 225

70 85 120 200

80 110 145 240

79 120 130 185

84 115 152 220

98 130 144 210

95 140 175 245

90 125 180 260

75 90 135 190

74 105 140 205

110 160 178 265

113 150 191 270

125 165 137 230

108 145 189 250

Yukarıdaki veride değişen varyans sorunu olup olmadığı Goldfelt-Quandt testi ile araştırılacaktır. Veride değişen varyans sorunu olup olmadığını araştırmanın en basit ve ilk akla gelen yolu, verilerin grafiğini çizmektir. Bu grafik, Şekil 1’de verilmektedir.

Y nin X değişkenine göre çizilen bu grafiğinde çok bariz olmamakla birlikte noktalar arasındaki değişim X değişkeni arttıkça çok az artmakta olduğu gözlenebilir. İkinci olarak veride sorun olup olmadığı göz ardı edilip regresyon analizi uygulanır. Sonuçlar;

Regresyon Denklemi Y = 9,29 + 0,6378 X

250 200

1 50 1 00

200 1 75 1 50 1 25 1 00 75

50

Xt

Yt

Şekil 1 . Y nin X'e göre Dağılımı

(5)

Katsayı Değer S.h. T P Sabit 9,29 5,23 1,78 0,087 Eğim(Xt) 0,6378 0,0286 22,29 0,000

=9,18297 R2 =94,66%

Değişen varyans probleminin varlığını tespit etmek için en yaygın olarak kullanılan grafik türleri artıkların Y şapkalara karşı grafiği ve yine artıkların değişen varyansa sebep olduğunu düşündüğümüz X açıklayıcı değişkenine göre grafiğini çizmek olacaktır. Şekil 2’de bu iki grafik sergilenmektedir. Nitekim bu grafikler incelendiğinde noktalar arasındaki değişimin giderek az da olsa arttığı gözlenmektedir.

Bu durumu tespit etmek için ilk olarak parametrik test olan Goldfeld-Quandt testi uygulanacaktır. Bu uygulamada ilk olarak orijinal veri değişen varyansa neden olan açıklayıcı değişken X’e göre soldaki tablodaki gibi küçükten büyüğe sıralanır. Sıralama yapıldıktan sonra ortaya düşen 4 gözlem analizden çıkartılır. Bu gözlemler tabloda koyu renge boyanmış olarak verilir. Gözlem çıkarımı işleminden sonra grup 1 ve grup 2 verileri takip eden tabloda verilmektedir.

Xe göre sıralı Y Sıralı X

55 80

70 85

75 90

65 100

74 105

80 110

84 115

79 120

90 125

98 130

95 140

108 145

113 150

110 160

125 165

115 180

ˆ

175 150 125 100 75 50 20

10

0

-10

-20

Y şapka

artıklar

Scatterplot of artıklar vs Y şapka

250 200

1 50 1 00

20

1 0

0

-1 0

-20

Xt

Artık

Şekil 2. Artık ların Xt ye göre dağılımı

(6)

130 185

135 190

120 200

140 205

144 210

152 220

140 225

137 230

145 240

175 245

189 250

180 260

178 265

191 270

Grup 1 Y Grup 1 X Grup 2 Y Grup 2 X

55 80 135 190

70 85 120 200

75 90 140 205

65 100 144 210

74 105 152 220

80 110 140 225

84 115 137 230

79 120 145 240

90 125 175 245

98 130 189 250

95 140 180 260

108 145 178 265

113 150 191 270

Bu testin uygulamasında araştırılan hipotez

𝐻0: 𝜎12 = 𝜎22 𝐻1: 𝜎12 ≠ 𝜎22

Şeklinde kurulur. Orijinal veride bu şekilde bölme işlemi gerçekleştirildikten sonra iki gruba ayrı ayrı regresyon analizi uygulanır. Bu uygulamada elde edilen sonuçlar aşağıdaki gibidir.

Grup 1 için Regresyon Analizi:

Regresyon denklemi

Grup 1 Y = 3,41 + 0,697 Grup 1 X

Katsayılar Değer Standart Hataları T P Sabit 3,409 8,705 0,39 0,703 Eğim 0,69677 0,07437 9,37 0,000

(7)

= 5,856 R2= 88,9% R2 düzeltilmiş = 87,9%

VAT

Kaynak s.d. KT KO F P Regr. 1 3010,1 3010,1 87,79 0,000 Artık 11 377,2 34,3

Genel 12 3387,2

Grup 2 için Regresyon Analizi:

Regresyon Denklemi

Grup 2 Y =- 28,0 + 0,794 Grup 2 X

Katsayılar Değer Standart hata T P Sabit -28,03 30,64 -0,91 0,380 Eğim(X) 0,7941 0,1316 6,04 0,000

ˆ= 11,82 R2= 76,8% R2 düzeltilmiş = 74,7%

VAT

Kaynak s.d. KT KO F P Regr. 1 5088,9 5088,9 36,42 0,000 Artık 11 1536,8 139,7

Genel 12 6625,7

Bu sonuçlardan faydalanılarak F test istatistiği ikinci grubun artık kareler ortalamasının birinci grubun artık kareler ortalamasına oranı olarak hesaplanır. Şöyle ki,

𝐹 = 𝐴𝐾𝑇2

⁄𝑠𝑑 𝐴𝐾𝑇1

⁄𝑠𝑑

= 𝐴𝐾𝑂2

𝐴𝐾𝑂1 = 139.7

34.3 = 4.073

dir. F in kritik değeri F11,11,0.05=2.82 olarak tablodan bulunur. Hesaplanan test istatistiğinin değeri tablo değerinden büyük olduğu için gruplara ait gerçek varyanslar arasında farklılık vardır, hatta ikinci grubun varyansı birinci grubunkinden daha büyüktür denilebilir.

b. Park Testi Uygulaması

Aynı veriye Park testi uygulayarak verideki değişen varyans sorununu ortaya çıkaralım. Bu uygulamayı yapmak için ilk olarak değişen varyansa aldırmaksızın orijinal veriye regresyon analizi uygulanır. Bu uygulama sonuçları;

Regresyon denklemi Y = 9,29 + 0,638 X

Katsayı Değerleri Standart Hataları T P Sabit 9,290 5,231 1,78 0,087 Eğim(X) 0,63778 0,02862 22,29 0,000

ˆ

(8)

= 9,183 R2= 94,7% R2 düzeltilmiş= 94,5%

VAT

Kaynak s.d. KT KO F P

Regr 1 41887 41887 496,72 0,000 Artık 28 2361 84

Genel 29 44248

ve hesaplanan artıklar aşağıdaki tablonun üçüncü sütununda verilmektedir. Park testine göre artıkların karelerinin e tabanına göre logaritması alınarak yeni bağımlı değişken oluşturulacak ve bu yeni bağımlı değişken ile Ln(X) regresyon analizine tabi tutulacak.

Y X Y şapka artıklar Ln ut kare=Yt* Ln Xt=Xt*

55 80 60,313 -5,3131 3,34034 4,38203

65 100 73,069 -8,0688 4,17600 4,60517

70 85 63,502 6,4980 3,74299 4,44265

80 110 79,447 0,5534 -1,18338 4,70048

79 120 85,824 -6,8245 3,84102 4,78749

84 115 82,636 1,3645 0,62153 4,74493

98 130 92,202 5,7977 3,51492 4,86753

95 140 98,580 -3,5801 2,55081 4,94164

90 125 89,013 0,9866 -0,02693 4,82831

75 90 66,691 8,3091 4,23470 4,49981

74 105 76,258 -2,2577 1,62868 4,65396

110 160 111,336 -1,3358 0,57912 5,07517

113 150 104,958 8,0420 4,16936 5,01064

125 165 114,525 10,4752 4,69803 5,10595

108 145 101,769 6,2309 3,65905 4,97673

115 180 124,092 -9,0915 4,41469 5,19296

140 225 152,792 -12,7918 5,09761 5,41610

120 200 136,847 -16,8472 5,64837 5,29832

145 240 162,359 -17,3586 5,70818 5,48064

130 185 127,280 2,7195 2,00093 5,22036

152 220 149,603 2,3971 1,74851 5,39363

144 210 143,225 0,7749 -0,50995 5,34711

175 245 165,548 9,4525 4,49255 5,50126

180 260 175,114 4,8857 3,17263 5,56068

135 190 130,469 4,5306 3,02172 5,24702

140 205 140,036 -0,0361 -6,64061 5,32301

178 265 178,303 -0,3032 -2,38662 5,57973

191 270 181,492 9,5079 4,50424 5,59842

137 230 155,981 -18,9808 5,88685 5,43808

189 250 168,736 20,2636 6,01765 5,52146

Oluşturulan yeni değişkenler yukarıdaki tabloda verilmektedir. Artıkların karelerinin ve X in e tabanına göre logaritması regresyona sokulduğunda aşağıdaki sonuçlar elde edilmiştir.

Regresyon Analizi: Yt* ın Xt* ile regresyonu

ˆ

(9)

Regresyon Denklemi Ln u kare = 1,01 + 0,34 Ln X

Katsayı Değer Standart hata T P Sabit 1,014 7,275 0,14 0,890 Eğim 0,336 1,425 0,24 0,815

𝜎̂ = 2,843 R2= 0,2% R2 düzeltilmiş = 0,0%

VAT

Kaynak s.d. KT KO F P Regr 1 0,449 0,449 0,06 0,815 Artık 28 226,315 8,083

Genel 29 226,764

P değeri α/ 2 (α=0,05) anlam düzeyinden oldukça büyük olduğundan eğim katsayısı olan beta1 in istatistiksel olarak anlamsız olduğu sonucuna varılır. Eğim katsayısı istatistik bakımdan önemli olmadığından hata ile X arasında varsayılan ilişki anlamlı değildir. Öyleyse

“veri içerisinde incelenen ilişkiye dayalı değişen varyans problemine sahip değildir” diyebiliriz.

c. Spearman Sıra Korelasyon Katsayısı Testi

1 2 3 4 5 6 7 8 9 10

Y Xt Y şapka Ut artıklar Ln Ut kare Ln Xt Mutlak Ut Sıra No

Mutlak Ut

Sıra no Xt

Dt=8-9

55 80 60,313 -5,3131 3,34034 4,38203 5,3131 14 1 13

65 100 73,069 -8,0688 4,17600 4,60517 8,0688 20 4 16

70 85 63,502 6,4980 3,74299 4,44265 6,4980 17 2 15

80 110 79,447 0,5534 -1,18338 4,70048 0,5534 3 6 -3

79 120 85,824 -6,8245 3,84102 4,78749 6,8245 18 8 10

84 115 82,636 1,3645 0,62153 4,74493 1,3645 7 7 0

98 130 92,202 5,7977 3,51492 4,86753 5,7977 15 10 5

95 140 98,580 -3,5801 2,55081 4,94164 3,5801 11 11 0

90 125 89,013 0,9866 -0,02693 4,82831 0,9866 5 9 -4

75 90 66,691 8,3091 4,23470 4,49981 8,3091 21 3 18

74 105 76,258 -2,2577 1,62868 4,65396 2,2577 8 5 3

110 160 111,336 -1,3358 0,57912 5,07517 1,3358 6 14 -8

113 150 104,958 8,0420 4,16936 5,01064 8,0420 19 13 6

125 165 114,525 10,4752 4,69803 5,10595 10,4752 25 15 10

108 145 101,769 6,2309 3,65905 4,97673 6,2309 16 12 4

115 180 124,092 -9,0915 4,41469 5,19296 9,0915 22 16 6

140 225 152,792 -12,7918 5,09761 5,41610 12,7918 26 23 3

120 200 136,847 -16,8472 5,64837 5,29832 16,8472 27 19 8

145 240 162,359 -17,3586 5,70818 5,48064 17,3586 28 25 3

130 185 127,280 2,7195 2,00093 5,22036 2,7195 10 17 -7

152 220 149,603 2,3971 1,74851 5,39363 2,3971 9 22 -13

144 210 143,225 0,7749 -0,50995 5,34711 0,7749 4 21 -17

Eğim katsayısı beta1 e ait istatistiksel sonuçlar

(10)

175 245 165,548 9,4525 4,49255 5,50126 9,4525 23 26 -3

180 260 175,114 4,8857 3,17263 5,56068 4,8857 13 28 -15

135 190 130,469 4,5306 3,02172 5,24702 4,5306 12 18 -6

140 205 140,036 -0,0361 -6,64061 5,32301 0,0361 1 20 -19

178 265 178,303 -0,3032 -2,38662 5,57973 0,3032 2 29 -27

191 270 181,492 9,5079 4,50424 5,59842 9,5079 24 30 -6

137 230 155,981 -18,9808 5,88685 5,43808 18,9808 29 24 5

189 250 168,736 20,2636 6,01765 5,52146 20,2636 30 27 3

Bu test için kurulan hipotez testi 𝐻0: 𝜌𝑠 = 0 karşılık 𝐻1: 𝜌𝑠 ≠ 0 şeklindedir. Sperman Sıra korelasyon katsayısı

𝑟𝑠 = 1 − 6 ∑ 𝐷𝑡2 𝑛(𝑛2− 1) 𝑟𝑠 = 1 − 6 3404

30(302 − 1)= 0,2427 Test istatistiği;

𝑡 = 𝑟𝑠(√𝑛 − 2)

(1 − 𝑟𝑠2) = 0,2427√30 − 2

(1 − 0,24272) = 1,2842

0,9701= 1,32

Hesaplanır. Hesaplanan t değeri tablodan bulunacak t değeri ile karşılaştırılacaktır. Tablo değeri 𝑡0,025,28 = 2,048 bulunur. 𝑡 > 𝑡0,025,28 ise 𝐻0 hipotezi ret edilir. Örnek verimizden hesaplanan değerleri yerine koyduğumuzda

𝑡 = 1,32 < 2,048 = 𝑡0,025,28

olduğundan 𝐻0 hipotezi kabul edilir. Yani örnekleme dayalı olarak hesaplanan sıra korelasyon katsayısı 0,2427 değeri istatistik bakımdan anlamlı değildir. Yani değişkenler arasında doğrusal ilişki yoktur. Bu ilişki yok ise değişen varyans problemi de yoktur sonucuna varılır.

d. Glejser Testi

Aynı veri üzerinde Glejser testi uygulaması yapılacaktır. Bu teste geçmeden önce veride yapılması gereken dönüşümleri yapılarak aşağıdaki tabloda sunulmuştur.

Yt Xt FITS1 RESI1 Mutlak

artıklar

1/Xt karakök Xt 1/karakök Xt

55 80 60,313 -5,3131 5,3131 0,0125000 8,9443 0,111803

65 100 73,069 -8,0688 8,0688 0,0100000 10,0000 0,100000

70 85 63,502 6,4980 6,4980 0,0117647 9,2195 0,108465

80 110 79,447 0,5534 0,5534 0,0090909 10,4881 0,095346

79 120 85,824 -6,8245 6,8245 0,0083333 10,9545 0,091287

(11)

84 115 82,636 1,3645 1,3645 0,0086957 10,7238 0,093250

98 130 92,202 5,7977 5,7977 0,0076923 11,4018 0,087706

95 140 98,580 -3,5801 3,5801 0,0071429 11,8322 0,084515

90 125 89,013 0,9866 0,9866 0,0080000 11,1803 0,089443

75 90 66,691 8,3091 8,3091 0,0111111 9,4868 0,105409

74 105 76,258 -2,2577 2,2577 0,0095238 10,2470 0,097590

110 160 111,336 -1,3358 1,3358 0,0062500 12,6491 0,079057 113 150 104,958 8,0420 8,0420 0,0066667 12,2474 0,081650 125 165 114,525 10,4752 10,4752 0,0060606 12,8452 0,077850 108 145 101,769 6,2309 6,2309 0,0068966 12,0416 0,083045 115 180 124,092 -9,0915 9,0915 0,0055556 13,4164 0,074536 140 225 152,792 -12,7918 12,7918 0,0044444 15,0000 0,066667 120 200 136,847 -16,8472 16,8472 0,0050000 14,1421 0,070711 145 240 162,359 -17,3586 17,3586 0,0041667 15,4919 0,064550 130 185 127,280 2,7195 2,7195 0,0054054 13,6015 0,073521 152 220 149,603 2,3971 2,3971 0,0045455 14,8324 0,067420 144 210 143,225 0,7749 0,7749 0,0047619 14,4914 0,069007 175 245 165,548 9,4525 9,4525 0,0040816 15,6525 0,063888 180 260 175,114 4,8857 4,8857 0,0038462 16,1245 0,062017 135 190 130,469 4,5306 4,5306 0,0052632 13,7840 0,072548 140 205 140,036 -0,0361 0,0361 0,0048780 14,3178 0,069843 178 265 178,303 -0,3032 0,3032 0,0037736 16,2788 0,061430 191 270 181,492 9,5079 9,5079 0,0037037 16,4317 0,060858 137 230 155,981 -18,9808 18,9808 0,0043478 15,1658 0,065938 189 250 168,736 20,2636 20,2636 0,0040000 15,8114 0,063246

İlk olarak |𝑢̂𝑡| = 𝛽0+ 𝛽1𝑋𝑡+ 𝑣𝑡 modeli araştırılacaktır. İlk uygulamanın sonuçları MINITAB programından alınır. Çıktı aşağıdaki gibidir.

Regression Analysis: Mutlak artıklar versus Xt

Katsayılar Değer Standart Hata T P Eğim(Xt) 0,0331 0,0171 1,94 0,062

Sabit 1,11 3,12 0,36 0,724

Model Summary

𝜎̂=5,47481 R2 =11,88 % VAT

Kaynak DF KT KO F-Değeri P-Değeri Regresyon 1 113,1 113,14 3,77 0,062 Artık 28 839,3 29,97

Genel 29 952,4 Regresyon Denklemi

Mutlak artıklar = 1,11 + 0,0331 Xt

Sarı ile boyanan satırda bu analiz için elde edilen katsayının istatistik bakımdan anlamlılığını test edebiliriz. t değeri 1.94 bulunmuştur. Bu değere karşılık gelen p değeri (olasılık=0,062)

(12)

0.025 den büyük olduğu için beta 1 katsayısı için bulunan 0.0331 tahmini değeri istatistik bakımdan anlamlı değildir. O halde orijinal veri içerisinde bu yapıya bağlı olan değişen varyans problemi yoktur.

İkinci olarak |𝑢̂𝑡| = 𝛽0+ 𝛽1√𝑋𝑡+ 𝑣𝑡

Regression Analysis: Mutlak artıklar versus karakök Xt Regresyon Denklemi

Mutlak artıklar = -3,89 + 0,829 karakök Xt

Katsayılar Değer Stan. Hata T P Sabit -3,89 5,79 -0,67 0,507 Eğim(karakök Xt) 0,829 0,440 1,88 0,070 VAT

Kaynak s.d. KT KO F-Değeri P-Değeri Regresyon 1 107,2 107,21 3,55 0,070

Artık 28 845,2 30,19 Genel 29 952,4 Model Summary

𝜎̂ =5,49413 R2= 11,26%

Sarı ile boyanan satırda bu analiz için elde edilen katsayının istatistik bakımdan anlamlılığını test edebiliriz. t değeri 1.88 bulunmuştur. Bu değere karşılık gelen p değeri (olasılık) 0.025 den büyük olduğu için beta 1 katsayısı için bulunan 0.829 tahmini değeri istatistik bakımdan anlamlı değildir. O halde orijinal veri içerisinde bu yapıya bağlı olan değişen varyans problemi yoktur.

Üçüncü olarak Değişen Varyans probleminin |𝑢̂𝑡| = 𝛽0+ 𝛽1 1

𝑋𝑡+ 𝑣𝑡 modeline uygun olarak var olup olmadığı aşağıda araştırılmıştır.

Regression Analysis: Mutlak artıklar versus 1/Xt Regresyon Denklemi

Mutlak artıklar = 11,06 - 639 1/Xt Katsayı Değer S.h. T P Constant 11,06 2,86 3,87 0,001 Eğim(1/Xt) -639 406 -1,58 0,126 Model Summary

𝜎̂ =5,58980 R2=8,14%

VAT

Kaynak s.d. KT KO F P

Regresyon 1 77,52 77,52 2,48 0,126 Artık 28 874,88 31,25

Genel 29 952,40

(13)

Sarı ile boyanan satırda bu analiz için elde edilen katsayının istatistik bakımdan anlamlılığını test edebiliriz. t değeri -1,58 bulunmuştur. Bu değere karşılık gelen p değeri (olasılık) 0.025 den büyük olduğu için beta 1 katsayısı için bulunan -639 tahmini değeri istatistik bakımdan anlamlı değildir. O halde orijinal veri içerisinde bu yapıya bağlı olan değişen varyans problemi yoktur.

Dördüncü uygulama olarak |𝑢̂𝑡| = 𝛽0+ 𝛽1 1

√𝑋𝑡+ 𝑣𝑡 modeline uygun olarak değişen varyans probleminin olup olmadığını araştıralım.

Regression Analysis: Mutlak artıklar versus 1/karakök Xt Regresyon Denklemi

Mutlak artıklar = 16,04 - 115,2 1/karakök Xt Coefficients

Katsayı Değer S.h. T P Constant 16,04 5,51 2,91 0,007 Eğim(1/karakök Xt) -115,2 67,9 -1,70 0,101 Model Summary

𝜎̂ = 5,55367 R2= 9,32%

VAT

Kaynak s.d KT KO F P Regresyon 1 88,79 88,79 2,88 0,101

Artık 28 863,61 30,84

Genel 29 952,40

Sarı ile boyanan satırda bu analiz için elde edilen katsayının istatistik bakımdan anlamlılığını test edebiliriz. t değeri -1,70 bulunmuştur. Bu değere karşılık gelen p değeri (olasılık=0,101) 0.025’ten büyük olduğu için beta 1 katsayısı için bulunan -115,2 tahmini değeri istatistik bakımdan anlamlı değildir. O halde orijinal veri içerisinde bu yapıya bağlı olan değişen varyans problemi yoktur.

Değişen varyans problemini düzeltici önlemler 𝜎𝑡2 nin bilindiği durumda

𝜎𝑡2 biliniyorsa değişen varyansı düzeltmenin en kestirme yolu ağırlıklı en küçük kareler yöntemini kullanmaktır. Bu yöntemde gözlemlere en küçük kareler tekniğinde olduğunun tam tersine gözlemlere farklı ağırlıklar atanmaktadır. Basit doğrusal regresyon modelini ele alalım.

𝑌𝑡 = 𝛽0+ 𝛽1𝑋𝑡+ 𝑢𝑡

(14)

𝑉𝑎𝑟(𝑢𝑡) = 𝜎𝑡2 bilindiği kabul edildiğinden aşağıdaki çözüm yöntemi değişen varyansı ortadan kaldırabilir. Bu çözüm yöntemi aslında veriyi dönüştürme yöntemidir ve her bir gözleme farklı ağırlıklar atamayı mümkün kılar.

𝑌𝑡

𝜎𝑡 = 𝛽0(1

𝜎𝑡) + 𝛽1(𝑋𝑡 𝜎𝑡) +𝑢𝑡

𝜎𝑡 𝑉𝑎𝑟 (𝑢𝑡

𝜎𝑡) = 𝑉𝑎𝑟(𝑢𝑡) 𝜎𝑡2 = 𝜎𝑡2

𝜎𝑡2 = 1 𝜎𝑡2 nin bilinmediği durumda

Düzeltici yöntemler mevcut problemin şekline bağlı olarak değişim göstermektedir.

1.Yaklaşım: Eğer hata varyansı modelde kullanılan açıklayıcı değişken ile aşağıdaki gibi orantılı ise;

𝑉𝑎𝑟(𝑢𝑡) = 𝜎𝑡2 = 𝜎2𝑋𝑡2 Önerilen dönüşüm

𝑌𝑡

𝑋𝑡 = 𝛽0(1

𝑋𝑡) + 𝛽1(𝑋𝑡 𝑋𝑡) +𝑢𝑡

𝑋𝑡 𝑌𝑡 = 𝛽0𝑋0+ 𝛽1𝑋1+ 𝑢𝑡 Olacaktır. 𝑉𝑎𝑟(𝑢𝑡) = 𝑉𝑎𝑟 (𝑢𝑋𝑡

𝑡) = 1

𝑋𝑡2𝑉𝑎𝑟(𝑢𝑡) =𝜎𝑋2𝑋𝑡2

𝑡2 = 𝜎2. Bu modelin uygulaması sonucu elde edilen tahmin değerleri dönüştürülmüş modelin tahmin değerleri olacaktır. Orijinal cinsten Y tahmin değerleri elde edilmek istendiğinde

(𝑌𝑡 𝑋𝑡)

̂

= 𝑌̂𝑡 İlişkisinden kaynaklı 𝑌̂ = 𝑋𝑡 𝑡𝑌̂𝑡 dönüşümü kullanılacaktır.

2.Yaklaşım: Hata varyansı modeldeki açıklayıcı değişken ile doğru orantılı ise;

𝑉𝑎𝑟(𝑢𝑡) = 𝜎𝑡2 = 𝜎2𝑋𝑡 Yapılacak olan dönüşüm aşağıdaki gibi olur.

𝑌𝑡

√𝑋𝑡= 𝛽0( 1

√𝑋𝑡) + 𝛽1( 𝑋𝑡

√𝑋𝑡) + 𝑢𝑡

√𝑋𝑡 Yeni modelin hata varyansını incelediğimizde

(15)

𝑉𝑎𝑟 ( 𝑢𝑡

√𝑋𝑡) = 1

𝑋𝑡𝑉𝑎𝑟(𝑢𝑡) =𝜎2𝑋𝑡 𝑋𝑡 = 𝜎2

Sabitlenmiş olduğu görülecektir. Burada 1.yaklaşımda olduğu gibi dikkat edilecek husus dönüştürülmüş model sabit terimi olmayan 2 açıklayıcı değişkenli bir regresyon modelidir.

Regresyon analizi sonucunda elde edilen tahmin değerlerini orijinal birim cinsinden elde etmek için ise tahmin değerleri √𝑋𝑡 ile çarpılmalıdır.

3.Yaklaşım: Hata varyansı Y’nin ortalama değerinin karesi ile doğru orantılı ise;

𝑉𝑎𝑟(𝑢𝑡) = 𝐸(𝑢𝑡− 𝑢̅̅̅)𝑡 2 = 𝐸(𝑢𝑡2) = 𝜎2[𝐸(𝑌𝑡)]2 Bu durumda yapılacak olan dönüşüm aşağıdaki gibi olur.

𝑌𝑡

𝐸(𝑌𝑡) = 𝛽0( 1

𝐸(𝑌𝑡)) + 𝛽1( 𝑋𝑡

𝐸(𝑌𝑡)) + 𝑢𝑡 𝐸(𝑌𝑡) Yeni modelin varyansı

𝑉𝑎𝑟 ( 𝑢𝑡

𝐸(𝑌𝑡)) = 1

[𝐸(𝑌𝑡)]2𝑉𝑎𝑟(𝑢𝑡) =𝜎2[𝐸(𝑌𝑡)]2 [𝐸(𝑌𝑡)]2 = 𝜎2

Şeklinde sabitlenmiş olmaktadır. Buradaki tek sorun 𝐸(𝑌𝑡) = 𝐸(𝛽0+ 𝛽1𝑋𝑡+ 𝑢𝑡) = 𝛽0+ 𝛽1𝑋𝑡 beklenen değerin bilinmeyen sabitlere bağlı olmasıdır. O halde bunları elde etmek için ilk önce veri içerisinde değişen varyans problemi göz ardı edilip 𝑌𝑡 = 𝛽0+ 𝛽1𝑋𝑡+ 𝑢𝑡 modeli uygulanır ve tahminler

𝐸(𝑌̂ = 𝑌̂𝑡) 𝑡= 𝛽̂0+ 𝛽̂1𝑋𝑡 Elde edilir. O zaman dönüşüm

𝑌𝑡

𝐸(𝑌̂𝑡) = 𝛽0( 1

𝐸(𝑌̂𝑡)) + 𝛽1( 𝑋𝑡

𝐸(𝑌̂𝑡)) + 𝑢𝑡 𝐸(𝑌̂𝑡) 𝑌𝑡

𝑌̂𝑡 = 𝛽0(1

𝑌̂𝑡) + 𝛽1(𝑋𝑡 𝑌̂𝑡) +𝑢𝑡

𝑌̂𝑡 İle gerçekleşecektir.

4.Yaklaşım: Değişen varyans problemi her ne şekilde var ise verinin logaritmik dönüşümü çözüm olabilmektedir.

𝑙𝑜𝑔𝑌𝑡 = 𝛽0+ 𝛽1𝑙𝑜𝑔𝑋𝑡+ 𝑢𝑡

Bu dönüşüm ilk akla gelen ve en kısa çözüm yolu olabilmekte ve birçok veri seti için değişen varyans problemini ortadan kaldıran yaklaşım olabilmektedir.

(16)

Referanslar

Benzer Belgeler

Aşağıdaki şekilde gösterildiği gibi Dönem Sonu Taksitlerin Bugünkü Değeri hesaplanırken 0 zamanında yapılan bir anapara ödemesi ve 1 ila d zamanlarında yapılacak d

˙Istanbul Ticaret ¨ Universitesi M¨ uhendislik Fak¨ ultesi MAT121-Matematiksel Analiz I. 2019 G¨ uz D¨ onemi Alı¸ stırma Soruları 3: T¨

f fonksiyonunun ve te˘ get do˘ grusunun grafi˘ gini ¸

Ortada bulunan çok köşeli (kübik) hücrelerin üstünde yer alan yassı epitel hücreleri keratinsiz çok tabakalı epitelde (örneğin: özofagus) 8-10 sıra iken,

Bunun için, birinci yere herhangi bir rakam (5 tanesinden biri) yazılır. Yani, birinci yer 5 farklı şekilde doldurulur... İkinci yer geri kalan 4 tanesinden biri ile, üçüncü

Örnek: Olasılık yoğunluk fonksiyonunun grafiği aşağıdaki gibi olan bir dağılımda, olasılık sıfır etrafında yoğunlaşmış olup, ( 3, 3) aralığının

Bu özel çözüm para- metrelerin de¼ gi¸ simi yöntemi yard¬m¬yla

Bu yönteme göre (1) denkleminin (2) biçiminde bir çözüme sahip oldu¼ gu kabul edilerek kuvvet serisi yöntemindekine benzer as¬mlar izlerinir.Daha sonra sabiti ve a n (n