TahminSorunuYrd.Doç.Dr.A.TalhaYALTA ÇokluBa˘glanımÇözümlemesi

(1)

Çoklu Ba ˘glanım Çözümlemesi

Tahmin Sorunu

Yrd. Doç. Dr. A. Talha YALTA Ekonometri 1 Ders Notları

Sürüm 2,0 (Ekim 2011)

(2)

Açık Lisans Bilgisi

˙I¸sbu belge, “Creative Commons Attribution-Non-Commercial ShareAlike 3.0 Unported” (CC BY-NC-SA 3.0) lisansı altında bir açık ders malzemesi olarak genel kullanıma sunulmu¸stur.

Eserin ilk sahibinin belirtilmesi ve geçerli lisansın korunması ko¸sulu ile özgürce kullanılabilir, ço ˘galtılabilir ve de ˘gi¸stirilebilir.

Creative Commons örgütü ve “CC-BY-NC-SA” lisansı ile ilgili ayrıntılı bilgi “http://creativecommons.org” adresinde bulunmaktadır. Ekonometri ders notlarımın güncel sürümüne

“http://yalta.etu.edu.tr” adresinden ula¸sabilirsiniz.

A. Talha Yalta

TOBB Ekonomi ve Teknoloji Üniversitesi Ekim 2011

(3)

Ders Planı

1 Üç De ˘gi¸skenli Model Gösterim ve Varsayımlar

Kısmi Ba ˘glanım Katsayılarının Tahmini

2 Çoklu Ba ˘glanımda Yakı¸smanın ˙Iyili ˘gi Çoklu Belirleme ve ˙Ilinti Katsayıları Kısmi ˙Ilinti Katsayıları

Çoklu Ba ˘glanım Açıklayıcı Örnek

3 Çokterimli Ba ˘glanım Modelleri

(4)

Ders Planı

(5)

Üç De ˘gi¸skenli Model

Önceki bölümlerde ba ˘gımlı de ˘gi¸sken Y ’nin yalnızca bir açıklayıcı de ˘gi¸sken X tarafından etkilendi ˘gi varsayılmı¸stı.

Ancak iktisat kuramı bu denli basit de ˘gildir.

Örnek:Bir mala olan talep yalnızca o malın fiyatına de ˘gil;

ikame ya da tamamlayıcı malların fiyatına, gelir düzeyine, nüfusa ve di ˘ger de ˘gi¸skenlere de ba ˘glı olabilir.

Örnek:Tüketim harcamaları yalnızca gelir ile de ˘gil; ki¸sinin ya¸sı, e ˘gitim düzeyi, cinsiyeti, toplam serveti ve benzer de ˘gi¸skenler ile de ili¸skili olabilir.

Modele ba¸ska de ˘gi¸skenler eklemek bizi çoklu ba ˘glanım çözümlemesine götürür.

(6)

Üç De ˘gi¸skenli Model

En basit çoklu ba ˘glanım modeli, bir ba ˘gımlı ve iki açıklayıcı de ˘gi¸skenden olu¸san üç de ˘gi¸skenli ba ˘glanımdır:

Y_i = β₁+ β₂X_2i + β₃X_3i +u_i Burada Y ba ˘gımlı de ˘gi¸sken, X₂ve X₃açıklayıcı

de ˘gi¸skenler, u olasılıksal hata terimi, i gözlem no’sudur.

β₁, modelde bulunmayan tüm de ˘gi¸skenlerin Y üzerindeki ortalama etkisini gösteren sabit terimdir.

β₂ve β₃’e de“kısmi ba ˘glanım katsayısı”(partial regression coefficient) adı verilir.

(7)

Kısmi Ba ˘glanım Katsayıları

Üç de ˘gi¸skenli modeldeki kısmi ba ˘glanım katsayılarının anlamı

¸sudur:

β₂, X₃sabit tutulurken X₂’deki bir birimlik de ˘gi¸smeye kar¸sı Y ’nin beklenen de ˘geri E (Y |X₂,X₃)’teki de ˘gi¸smeyi ölçer.

Bir ba¸ska deyi¸sle β₂, X₃sabitken E (Y |X₂,X₃)’ün X₂’ye göre e ˘gimini verir.

Di ˘ger bir deyi¸sle β₂, X₂’deki bir birimlik de ˘gi¸smenin Y üzerindeki X₃’ten ayrı, net etkisini gösterir.

β₃’ün yorumu da benzer ¸sekildedir.

(8)

Üç De ˘gi¸skenli Model Varsayımları

Daha önce KDBM çerçevesinde yapılmı¸s olan varsayımlar, k de ˘gi¸skenli çoklu ba ˘glanım modeli için de geçerlidir:

1 Çoklu ba ˘glanım modeli de ˘gi¸stirgelerde do ˘grusaldır.

2 Açıklayıcı de ˘gi¸skenler tekrarlı örneklemlerde de ˘gi¸smez.

3 Açıklayıcı de ˘gi¸skenlerde yeterli de ˘gi¸skenlik bulunur.

4 Hata teriminin ortalaması sıfırdır: E (u_i|X_2i,X_3i, . . . ,X_ki) =0

5 Hata teriminin varyansı sabittir: var(u_i) = σ²

6 u_i ve X ’ler birbirlerinden ba ˘gımsız da ˘gılmaktadır:

cov(u_i,X_2i) =cov(u_i,X_3i) = . . . =cov(u_i,X_ki) =0

7 “Serisel ilinti”(serial correlation) bulunmamaktadır:

cov(u_i,u_j) =0 (i 6= j)

8 “Model belirtim hatası”(model specification error) yoktur.

9 X₂ile X₃arasında“tam e¸sdo ˘grusallık”(exact collinearity) bulunmamaktadır.

(9)

E¸sdo ˘grusallık Kavramı

X₂ile X₃arasında tam do ˘grusal ili¸ski olmadı ˘gı yönündeki SEK varsayımını anımsayalım.

“e¸sdo ˘grusal-dı¸sılık”(non-collinearity) varsayımına göre, a¸sa ˘gıdaki gibi tanımlanan iki de ˘gi¸sken do ˘grusal ba ˘gımlıdır:

X_2i =aX_3i ya da X_2i− aX_3i =0, a ∈ R Dolayısıyla, X₂ve X₃e ˘ger aynı modelde yer alırlarsa tam e¸sdo ˘grusal ili¸ski ortaya çıkar.

Tam e¸sdo ˘grusallık çoklu ba ˘glanımda önemli bir konudur çünkü bu durumda açıklayıcı de ˘gi¸skenlerin ba ˘gımlı de ˘gi¸sken üzerindeki tekil etkilerini bulmanın yolu yoktur.

(10)

E¸sdo ˘grusallık Kavramı

Tam e¸sdo ˘grusallık olması durumunda kısaca elde iki de ˘gil bir ba ˘gımsız de ˘gi¸sken var demektir.

Örnek:4X_2i =X_3i olsun. Bu durumda üç de ˘gi¸skenli model ikili modele indirgenir:

Y_i = β₁+ β₂X_2i + β₃(4X_2i) +u_i

= β₁+ (β₂+4β₃)X_2i +u_i

= β1+ αX_2i +u_i

Di ˘ger yandan, e ˘ger X_3i =X_2i² ise iki de ˘gi¸sken arasındaki ili¸ski do ˘grusal de ˘gildir. Bu durumda da e¸sdo ˘grusal-dı¸sılık varsayımı çi ˘gnenmi¸s olmaz.

(11)

SEK Tahmincileri

Üç de ˘gi¸skenli modelin SEK tahmincilerini bulmak için önce örneklem ba ˘glanım i¸slevini a¸sa ˘gıdaki gibi yazalım:

Y_i = ˆβ₁+ ˆβ₂X_2i + ˆβ₃X_3i + ˆu_i

SEK yöntemi, anakütle tahmincilerini kalıntı kareleri toplamı (P ˆu_i²)en küçük olacak biçimde hesaplar:

minP ˆu_i²=minP(Y_i− ˆβ₁− ˆβ₂X_2i − ˆβ₃X_3i)²

Yukarıdaki e¸sitli ˘gi enazlayacak en do ˘grudan süreç e¸sitli ˘gin β’lara göre türevini almak, bunları sıfıra e¸sitlemek ve dahaˆ sonra e¸sanlı olarak çözmektir.

(12)

SEK Tahmincileri

Üç de ˘gi¸skenli model için SEK yöntemi ¸su tahmincileri verir:

βˆ₁ = Y − ˆˆ β₂X¯₂− ˆβ₃X¯₃

βˆ₂ = (P yix2i)(P x_3i²) − (P yix3i)(P x2ix3i) (P x_2i²)(P x_3i²) − (P x_2ix_3i)²

βˆ₃ = (P y_ix_3i)(P x_2i²) − (P y_ix_2i)(P x_2ix_3i) (P x_2i²)(P x_3i²) − (P x_2ix3i)²

βˆ₂ve ˆβ₃tahmincileri bakı¸sımlıdır ve paydaları aynıdır.

Demek ki X₂ile X₃’ün yerleri de ˘gi¸stirilirse ˆβ2ile ˆβ3’ün de yeri de ˘gi¸sir ama bu ba ˘glanım sonuçlarını etkilemez.

(13)

Varyans ve Ölçünlü Hatalar

SEK tahmincilerinin varyansları ise a¸sa ˘gıdaki gibi bulunur:

var( ˆβ₁) = (1 n +

X¯₂²P x_3i²+ ¯X₃²P x_2i² − 2 ¯X2X¯3P x_2ix3i

(P x_2i²)(P x_3i²) − (P x_2ix_3i)² )σ²

var( ˆβ₂) = P x_3i²

(P x_2i²)(P x_3i²) − (P x2ix3i)²σ² = σ² P x_2i²(1 − r₂₃²)

var( ˆβ₃) = P x_2i²

(P x_2i²)(P x_3i²) − (P x_2ix_3i)²σ² = σ² P x_3i²(1 − r₂₃²) var( ˆβ₂)ve var( ˆβ₃)formüllerinde yer alan r₂₃, X₂ve X₃ arasındaki örneklem ilinti katsayısı r ’dir.

Ölçünlü hatalar ise varyansların artı de ˘gerli karekökleridir:

öh( ˆβ) = q

var( ˆβ).

(14)

Varyans ve Ölçünlü Hatalar

Varyans ve ölçünlü hata formüllerindeki σ²’nin anakütle hata terimi u_i’nin sabit varyansı oldu ˘gunu biliyoruz.

Bu anakütle katsayısının yansız tahmincisi ¸söyledir:

ˆ

σ²= P ˆu_i² n − 3

σ²’nin bu tahmincisi ile iki de ˘gi¸skenli modeldeki tahmincisi (P ˆu_i²/n − 2) benzerdir. Aralarındaki tek fark üç de ˘gi¸skenli model için serbestlik derecesinin artık (n − 3) olmasıdır.

Kalıntılar bulunduktan sonra ˆσ²kolayca hesaplanabilir.

Kalıntı kareleri toplamı ise ¸su e¸sitlik ile kolayca bulunabilir:

P ˆu_i²=P y_i²− ˆβ₂P y_ix_2i − ˆβ₃P y_ix_3i

(15)

SEK Tahmincilerinin Özellikleri

Üç de ˘gi¸skenli model için SEK tahmincilerinin özellikleri iki de ˘gi¸skenli model ile aynıdır:

1 Üç de ˘gi¸skenli ba ˘glanım do ˘grusu (düzlemi) ¯Y , ¯X₂, ¯X₃ ortalamalarından geçer: ¯Y = ˆβ1+ ˆβ2X¯₂+ ˆβ3X¯₃

2 Yˆ_i’nın ortalaması gözlenen Y_i ortalamasına e¸sittir:Y¯ˆ_i = ¯Y_i

3 Kalıntılar toplamı sıfıra e¸sittir:P ˆu_i =n ¯uˆ_i = ¯uˆ_i =0

4 Kalıntılar X_2i ve X_3i ile ili¸skisizdir:P ˆu_iX_2i =P ˆu_iX_3i =0

5 uˆ_i kalıntıları ˆY_i ile de ili¸skisizdir:P ˆu_iYˆ_i =0

6 Varyans formüllerinden görüldü ˘gü gibi, X₂ile X₃arasındaki ilinti katsayısı r₂₃ artarken ˆβ₂ve ˆβ₃’nın varyansları yükselir.

7 Gözlem sayısı n artarken ˆβ₂ve ˆβ₃’nın varyansları da azalır.

8 βˆ₂ve ˆβ₃tahmincileri, en iyi do ˘grusal yansız tahminci ya da kısaca EDYT’dirler.

(16)

ÖB˙I’nin Sapmalar Biçimi Gösterimi

Çok de ˘gi¸skenli modelde ÖB˙I’nin sapmalar biçiminde gösterimi a¸sa ˘gıda gösterilen ¸sekilde elde edilir:

1 Üçlü ba ˘glanım modelini ele alalım:

Yˆ_i = ˆβ₁+ ˆβ₂X_2i + ˆβ₃X_3i

2 Ba ˘glanım yüzeyi ¯Y , ¯X₂, ¯X₃ortalamalarından geçti ˘gi için:

Y¯ = βˆ₁+ ˆβ₂X¯₂+ ˆβ₃X¯₃

3 ˙Ikinci denklemi birinciden çıkartırsak ¸sunu buluruz:

Yˆ_i = βˆ₁ + βˆ₂X_2i + βˆ₃X_3i _ Y =¯ βˆ₁ + βˆ₂X¯₂ + βˆ₃X¯₃

Yˆ_i− ¯Y = ˆβ₁− ˆβ₁+ ˆβ₂(X_2i − ¯X₂) + ˆβ₃(X_3i − ¯X₃) yˆ_i = ˆβ₂x_2i+ ˆβ₃x_3i

(17)

Ençok Olabilirlik Tahmincileri

˙Iki de˘gi¸skenli modelde oldu˘gu gibi çoklu modeller için de ba ˘glanım katsayılarının SEK ve EO tahmincileri aynıdır.

Ancak üçlü modelde σ²’nin SEK tahmincisiP ˆu_i²/(n − 3) iken EO tahmincisi modelde kaç de ˘gi¸sken olursa olsun P ˆu_i²/n olarak bulunur.

Di ˘ger bir deyi¸sle SEK tahmincisi serbestlik derecesini hesaba katarken yanlı EO tahmincisi bunu dikkate almaz.

E ˘ger n çok büyükse ku¸skusuz EO ve SEK tahmincileri birbirlerine yakla¸sırlar.

(18)

Ders Planı

(19)

Çoklu Belirleme Katsayısı

˙Iki de˘gi¸skenli durum için geli¸stirmi¸s oldu˘gumuz r², ikiden çok de ˘gi¸skenli ba ˘glanım modellerine de geni¸sletilebilir.

Çoklu modelde bu istatisti ˘ge R²ya da“çoklu belirleme katsayısı”(multiple coefficient of determination) denir.

R², ba ˘gımlı de ˘gi¸sken Y ’deki de ˘gi¸simin X₂,X₃, . . . ,X_nile topluca açıklanabilme oranını gösterir.

Çoklu Belirleme Katsayısı R²= BKT

TKT = βˆ₂P y_ix_2i + ˆβ₃P y_ix_3i+ · · · + ˆβnP y_ix_ni P y_i²

R²de r²gibi 0 ile 1 arasındadır.

R²1’e ne kadar yakınsa modelin verilere yakı¸sması da o kadar iyidir. E ˘ger R²=1 ise, yakı¸stırılan ba ˘glanım Y ’deki de ˘gi¸simin tamamını açıklıyor demektir.

(20)

Çoklu ˙Ilinti Katsayısı

˙Iki de˘gi¸sken arasındaki do˘grusal ili¸skinin derecesini ölçen r ’nin çoklu ba ˘glanımdaki kar¸sılı ˘gı da“çoklu ilinti katsayısı”

(coefficient of multiple correlation) olup, R ile gösterilir:

Çoklu ˙Ilinti Katsayısı

R = ±

√ R²

R de ˘geri, ba ˘gımlı de ˘gi¸sken Y ile tüm açıklayıcı de ˘gi¸skenler arasındaki ortak ili¸skinin derecesini ölçer.

Di ˘ger taraftan uygulamada R’nin önemi azdır. Ba ˘glanım çözümlemesi çerçevesinde asıl anlamlı büyüklük R²’dir.

(21)

Ayarlamalı Belirleme Katsayısı

R²’nin önemli bir özelli ˘gi, modelde bulunan açıklayıcı de ˘gi¸sken sayısının azalmayan bir i¸slevi olmasıdır.

Di ˘ger bir deyi¸sle açıklayıcı de ˘gi¸sken sayısı arttıkça R² hemen hemen her zaman artar, asla azalmaz.

Bunu görebilmek için belirleme katsayısının tanımını anımsayalım:

R²=1 − KKT

TKT =1 − P ˆu_i² P y_i²

Burada TKT, X ’lerin sayısından ba ˘gımsızdır. KKT ise açıklayıcı de ˘gi¸sken sayısı arttıkça azalma e ˘gilimine girer.

Bu nedenle, ba ˘gımlı de ˘gi¸skeni aynı olan ama farklı sayıda açıklayıcı de ˘gi¸sken içeren iki ayrı ba ˘glanım modeline ait R² de ˘gerleri kar¸sıla¸stırırken dikkatli olunmalıdır.

(22)

R

²

De ˘gerlerinin Kar¸sıla¸stırılması

˙Iki R²de ˘gerini kar¸sıla¸stırırken modelde var olan açıklayıcı de ˘gi¸sken sayısını da dikkate alma gereksinimi“ayarlamalı”

(adjusted) belirleme katsayısı ¯R²tanımına yol açmı¸stır:

Ayarlamalı Belirleme Katsayısı R¯²=1 − P ˆu_i²/(n − k )

P y_i²/(n − 1) ya da R¯²=1 − σˆ² s²_Y Burada k , sabit terimle birlikte modeldeki katsayı sayısıdır.

s_Y² ise Y ’nin örneklem varyansıdır.

Ayarlamalı sözcü ˘gü, giren kareler toplamının serbestlik derecesine göre ayarlanmı¸s oldu ˘gu anlamına gelir.

Dikkat:Üç de ˘gi¸skenli ba ˘glanım içinP ˆu_i²sd’sinin (n − 3) oldu ˘gunu anımsayınız.

(23)

R

²

De ˘gerlerinin Kar¸sıla¸stırılması

R¯²’nin R²ile ili¸skisini a¸sa ˘gıdaki e¸sitlikle gösterebiliriz:

R¯²=1 − (1 − R²)n − 1 n − k

Buradan da görülüyor ki k > 1 oldu ˘gunda ¯R²<R²’dir.

Di ˘ger bir deyi¸sle, X ’lerin sayısı arttıkça ayarlamalı R²

“ayarlamasız”(unadjusted) R²’ye göre daha az artar.

Ayrıca ¯R²’nin eksi de ˘gerler de alabildi ˘gi görülmektedir.

E ˘ger ¯R²eksi bulunursa uygulamada sıfır kabul edilir.

Tüm modern ekonometri yazılımları alı¸sıldık R²’nin yanısıra ayarlamalı R²istatisti ˘gini de verir.

(24)

R

²

De ˘gerlerinin Kar¸sıla¸stırılması

˙Iki farklı modeli ayarlamalı ya da ayarlamasız R²temelinde kar¸sıla¸stırabilmek için iki noktaya daha dikkat edilmelidir:

1 Örneklem büyüklü ˘gü n her iki model için aynı olmalıdır.

Dikkat:Modele gözlem eklendi ˘ginde ya da çıkartıldı ˘gında, hesaplanan R²’nin de de ˘gi¸sece ˘gini unutmayınız.

2 Ba ˘gımlı de ˘gi¸sken Y de her iki model için aynı olmalıdır.

Dikkat:R²de ˘gerinin, X açıklayıcı de ˘gi¸skenlerinin Y ’deki de ˘gi¸simi açıklama oranını gösterdi ˘gini anımsayınız. E ˘ger Y ’ler farklıysa, hesaplanan R²’ler de farklı ¸seylerin de ˘gi¸sim oranını gösterece ˘gi için kar¸sıla¸stırılamaz.

(25)

R

²

De ˘gerlerinin Kar¸sıla¸stırılması

Ba ˘gımlı de ˘gi¸skenleri aynı olmayan iki model dü¸sünelim:

Yˆ_i = β₁ + β₂X_1i + β₃X_2i ln Yd_i = α₁ + α₂ln X_1i + α₃ln X_2i Burada R²de ˘gerlerini kar¸sıla¸stırmak için 2 yol izlenebilir:

1. Yol

˙Ikinci modelden tahmin edilen ln Yd_i’ların anti-logaritmaları alınır. Bulunan de ˘gerler ile Y_i arasında hesaplanan r²de ˘geri birinci modeldeki R²ile

kar¸sıla¸stırılabilir.

2. Yol

Birinci modelden tahmin edilen Yˆ_i’ların logaritmaları alınır.

Bulunan de ˘gerler ile ln Y_i arasında hesaplanan r²de ˘geri ikinci modeldeki R²ile

kar¸sıla¸stırılabilir.

(. . . devam)

(26)

R

²

De ˘gerlerinin Kar¸sıla¸stırılması

Ba ˘gımlı de ˘gi¸skenleri farklı modelleri kar¸sıla¸stırmak için, iki de ˘gi¸sken arasındaki ilinti formülünün karesine dayanan ¸su r²formülü kullanılabilir:

r²= P(y_iyˆ_i)² (P y_i²)(P ˆy_i²)

Son olarak, R²’nin yakı¸smanın iyili ˘gini ölçmede kullanılan istatistiklerden yalnızca biri oldu ˘gu unutulmamalıdır.

Model seçimi için ba¸ska ölçütler de bulunmaktadır:

“Akaike bilgi ölçütü”(Akaike information criterion)

“Schwarz Bayesçi ölçüt”(Schwarz Bayesian criterion)

“Hannan-Quinn ölçütü”(Hannan-Quinn criterion) Ara¸stırmacının asıl ilgisi, açıklayıcı de ˘gi¸skenlerin ba ˘gımlı de ˘gi¸sken ile olan mantıksal ya da kuramsal ili¸skilerine ve bunların istatistiksel anlamlılıklarına yönelik olmalıdır.

(27)

Basit ˙Ilinti Katsayıları

˙Iki de˘gi¸sken arasındaki do˘grudan ili¸skinin bir ölçüsü olarak tanımlanan ilinti katsayısı r kavramını anımsayalım.

Üç de ˘gi¸skenli model için böyle üç ayrı“basit ilinti katsayısı”

(simple correlation coefficient) de ˘gerinden söz edilebilir:

Basit ˙Ilinti Katsayıları

Y ile X₂ arasındaki ilinti katsayısı: r₁₂ Y ile X₃ arasındaki ilinti katsayısı: r₁₃ X₂ile X₃arasındaki ilinti katsayısı: r₂₃

Bunlara aynı zamanda“sıfırıncı dereceden ilinti katsayısı”

(correlation coefficient of zero order) da denmektedir.

(28)

Kısmi ˙Ilinti Katsayıları

E ˘ger bir X₃de ˘gi¸skeni hem Y hem de X₂ile ili¸skiliyse, bu durumda Y ve X₂arasındaki basit ilinti r₁₂yanıltıcıdır.

˙Iki de˘gi¸sken arasında, üçüncü bir de˘gi¸skenin etkisinden ba ˘gımsız olarak bulunan“kısmi ilinti katsayısı”(partial correlation coefficient) ise ¸söyle tanımlanır:

Kısmi ˙Ilinti Katsayıları

X₃sabitken Y ile X₂arasındaki kısmi ilinti: r_12.3 X₂sabitken Y ile X₃arasındaki kısmi ilinti: r_13.2 Y sabitken X₂ile X₃arasındaki kısmi ilinti: r_23.1 Bunlara“birinci dereceden”(first order) ilinti katsayıları denir. Buradaki derece ikincil alt imlerin sayısıdır.

Buna göre, X₃ve ikinci bir X₄sabit tutulurken bulunan r_12.34de ˘gerine de ikinci dereceden bir ilinti katsayısı denir.

(29)

Kısmi ˙Ilinti Katsayıları

Birinci dereceden kısmi ilinti katsayılarını hesaplamak için a¸sa ˘gıdaki e¸sitlikler kullanılabilir:

r_12.3= r₁₂− r13r₂₃ q

(1 − r₁₃² )(1 − r₂₃²) r_13.2= r₁₃− r12r₂₃

q

(1 − r₁₂² )(1 − r₂₃²) r_23.1= r₂₃− r₁₂r₁₃

q

(1 − r₁₂² )(1 − r₁₃²)

(30)

Kısmi ˙Ilinti Katsayıları

Çok de ˘gi¸skenli modellerde basit ilinti katsayılarını yorumlarken

¸su noktalara dikkat etmek gereklidir:

r₁₂=0 olsa bile, aynı anda r₁₃ ya da r₂₃de sıfır olmazsa r_12.3=0 olmaz.

r_12.3ile r₁₂aynı i¸sareti ta¸sımak zorunda de ˘gildir.

r₁₃=r₂₃ =0 olması r₁₂=0 anlamına gelmez.

˙Ikili ba˘glanımdaki 0 ≤ r²≤ 1 tanımını anımsayalım. Kısmi ilinti katsayıları kareleri için de geçerli olan bu durumdan yararlanılarak, üç sıfırıncı dereceden ilinti katsayısı arasındaki ili¸ski ¸söyle gösterilebilir:

0 ≤ r₁₂² +r₁₃² +r₂₃² − 2r₁₂r₁₃r₂₃ ≤ 1

Yukarıdaki e¸sitsizlikten de anla¸sılabilece ˘gi gibi, Y ile X₂’nin ve X₂ile de X₃’ün ilintisiz olması Y ile X₃’ün ilintisiz olaca ˘gı anlamına gelmemektedir.

(31)

Çoklu Ba ˘glanım Açıklayıcı Örnek

Çoklu ba ˘glanıma örnek olarak 2005-2009 aylık verilerini alalım ve Türkiye için bir“beklentilerle-geni¸sletmeli Phillips e ˘grisi”(expectations-augmented Phillips curve) modeli belirtelim:

ln Yt = β₁+ β₂ln X_2t + β₃ln X_3t+ut

Burada

Yt TÜFE de ˘gerini (2005 Ocak=100),

X_2t i¸ssiz sayısını (bin ki¸si, mevsimsel ayarlamalı), X_3t ise beklenen TÜFE de ˘gerini

göstermektedir.

˙Iktisat kuramına göre β₂eksi, β₃ise artı de ˘gerli olmalıdır.

Aslında kurama göre β₃=1 beklentisi vardır.

(32)

Çoklu Ba ˘glanım Açıklayıcı Örnek

SEK yöntemi ile elde edilen ba ˘glanım bulguları ¸söyledir:

ln ˆY_t= −0,1879 − 0,0364 ln X_2t + 1,1012 ln X_3t öh (0,1072) (0,0166) (0,0120)

t (−1,7535) (−2,1960) (91,8156) R²=0,9963 βˆ₂ve ˆβ₃önsel beklentilerle uyumlu i¸saret ta¸sımaktadır.

βˆ₁’ya göre, X₂ve X₃dı¸sındaki di ˘ger tüm etmenler TÜFE üzerinde ortalama e^−0,1879≈ 0,83 etkiye yol açmaktadır.

βˆ₂kısmi ba ˘glanım katsayısı ise X₃sabit tutuldu ˘gunda i¸ssizlikteki %1’lik bir artı¸sa kar¸sılık TÜFE’nin de yakla¸sık

%0,036 dü¸sece ˘gi anlamına gelir.

Bulunan bu dü¸sük de ˘ger, Türkiye’de enflasyon ve i¸ssizlik arasındaki ili¸skinin zayıf oldu ˘gu önsel bilgisi ile uyumludur.

R²de ˘geri, enflasyon oranındaki de ˘gi¸simin %99’unun bu iki açıklayıcı de ˘gi¸skenle açıklanabildi ˘gini öne sürer. Bu kadar yüksek bir R²ba ˘glanıma ku¸skuyla yakla¸smayı gerektirir.

(33)

Model Belirtim Yanlılı ˘gı Sorunu

Klasik do ˘grusal ba ˘glanım modeli varsayımlarına göre ba ˘glanım modeli do ˘gru kurulmu¸s olmalıdır.

E ˘ger çözümlemede kullanılacak ba ˘glanım modeli yanlı¸s kurulursa“model belirtim yanlılı ˘gı”(model specification bias) ortaya çıkar.

Bu varsayımın önemini vurgulayabilmek için elimizdeki Phillips e ˘grisi modeli yardımcı olabilir.

(. . . devam)

(34)

Model Belirtim Yanlılı ˘gı Sorunu

Az önce ele almı¸s oldu ˘gumuz a¸sa ˘gıdaki üçlü ba ˘glanım modelinin “do ˘gru” model oldu ˘gunu varsayalım:

ln Y_t = β₁+ β₂ln X_2t+ β₃ln X_3t +u_1t Elimizdeki Türkiye verilerini ¸su iki de ˘gi¸skenli modele yakı¸stırmakta diretiyor olalım:

ln Y_t = α₁+ α₂ln X_2t+u_2t

Y_t burada t dönemindeki TÜFE de ˘gerini, X_2t ise toplam i¸ssiz sayısını göstermektedir.

Birinci model “do ˘gru” oldu ˘guna göre ikinci model bir model belirtim hatası içermektedir.

Buradaki hata, X_3t beklenen TÜFE de ˘gi¸skenini modelden dı¸slamı¸s olmaktır.

(35)

Model Belirtim Yanlılı ˘gı Sorunu

Birinci modeldeki ˆβ2’nın gerçek β₂’nin yansız bir tahmincisi oldu ˘gunu biliyoruz.

Di ˘ger yandan ikinci modeldeki ˆα2de ˘gi¸stirgesi β₂’nin yansız tahmincisi de ˘gildir.

α2’nin aslında X₃’ün X₂’ye göre ba ˘glanımından ortaya çıkan e ˘gim de ˘gi¸stirgesi α₃ile ili¸skili oldu ˘gu gösterilebilir:

α₂= β₂+ β₃α₃+hata terimi

Buna göre E (α₂)beklenen de ˘geri β₂de ˘gil de β₂+ β₃α₃ olarak kar¸sımıza çıkmaktadır.

Sonuç olarak, ilk modeldeki β₂de ˘gi¸stirgesi X₂’nin Y üzerindeki do ˘grudan ya da tekil etkisini ölçmektedir.

Hatalı modeldeki α₂de ˘gi¸stirgesi ise X₂’nin Y üzerindeki hem do ˘grudan hem de X₃üzerinden dolaylı etkisini verir.

(36)

Model Belirtim Yanlılı ˘gı Sorunu

Hatalı modelin SEK tahmini a¸sa ˘gıdaki bulguları vermektedir:

ln ˆYt = −1,7203 + 0,8327 ln X2t

öh (1,4369) (0,1845)

t (−1,1972) (4,5142) r²=0,3070 Kuramsal beklentinin aksine α₂burada artı de ˘gerlidir ve 0,83 gibi yüksek, gerçek dı¸sı bir büyüklüktedir.

Demek ki belli bir model “do ˘gru” olarak kabul ediliyorsa bir ya da birkaç de ˘gi¸skeni çıkartarak modeli de ˘gi¸stirmek yanlı tahminlere yol açmaktadır.

Yanlı¸s belirtilen bir model anakütle katsayı tahminlerinin yanlı olması gibi ciddi bir soruna neden olabilmektedir.

(37)

Ders Planı

(38)

Çokterimli Ba ˘glanım Modelleri

Çoklu ba ˘glanımın bir ¸sekli de“çokterimli”(polynomial) ba ˘glanım modelleridir.

¸

Simdiye kadar ele aldı ˘gımız tüm örneklerde ba ˘glanım i¸slevinin de ˘gi¸skenlerde do ˘grusal oldu ˘gunu varsamı¸stık.

Gerçek hayatta bu varsayımın geçerli olmadı ˘gı pek çok durum dü¸sünülebilir.

Örnek olarak, gelir düzeyi yükseldikçe do ˘gurganlı ˘gın da dü¸stü ˘gü bilinen bir olgudur.

Dü¸sük gelir düzeylerinde çocuk bir tür sosyal güvence olarak dü¸sünülebildi ˘gi için do ˘gurganlık hızı yüksektir.

Gelir arttıkça ortalama çocuk sayısı da azalır ancak ili¸ski do ˘grusal de ˘gildir. Belli bir gelirden sonra çocuk sayısının sıfır ya da eksi de ˘gerlere ula¸saca ˘gını beklemeyiz.

(39)

Çokterimli Ba ˘glanım Modelleri

˙Iki de˘gi¸sken arasındaki do˘grusal olmayan bir ili¸skiyi incelemenin bir yolu çokterimli SEK modelidir.

Genel olarak, r ’inci dereceden çokterimli ba ˘glanım modeli

¸söyle gösterilir:

Y = β₀+ β1X + β₂X²+ · · · + βrX^r

Buradaki tek açıklayıcı de ˘gi¸sken olan X , farklı kuvvetlerle gösterildi ˘gi için bu model bir çoklu ba ˘glanım modelidir.

Çokterimli modeller β katsayılarında do ˘grusal oldukları için SEK yöntemi ile tahmin edilebilirler.

Bu modelde X ve X ’in kuvvetleri arasındaki ili¸ski güçlü olmakla birlikte do ˘grusal olmadı ˘gı için, KDBM’nin

“çoklue¸sdo ˘grusallık yoktur” varsayımı çi ˘gnenmemi¸s olur.

(40)

Çokterimli Ba ˘glanım Modelleri

Do ˘grusal modellerde β terimlerinin Y ’nin farklı X ’lere göre sabit e ˘gimini verdi ˘gini anımsayalım.

De ˘gi¸skenlerde do ˘grusal-dı¸sı olan çokterimli modellerde ise katsayıların yorumlanması biraz daha karma¸sıktır.

Bu modellerde ele alınan ili¸ski e ˘grisel oldu ˘gu için, e ˘gim de X ’in düzeyinine göre de ˘gi¸sir.

Bu nedenle, X ’deki bir birimlik artı¸sın Y üzerindeki etkisini bulmak için, önce bir ba¸slangıç X düzeyi seçilir ve buna kar¸sılık gelen ˆY de ˘geri hesaplanır.

Daha sonra X bir birim artırılır ve ˆY yeniden hesaplanır.

Aradaki fark, seçili X düzeyindeki ortalama e ˘gimi verir.

(41)

Çokterimli Ba ˘glanım Açıklayıcı Örnek

Çokterimli ba ˘glanım modeline bir örnek olarak, Türkiye’de illerdeki gelir ve do ˘gurganlık ili¸skisini“kareli”(quadratic) bir i¸slev çerçevesinde ele alalım.

Y_i = β₀+ β₁X_i+ β₂X_i²+u_i

Burada Y ortalama çocuk sayısını, X ise ki¸si ba¸sına dü¸sen gayri safi yurtiçi hasılayı göstermektedir.

Görüldü ˘gü gibi bu modelde Y ve X de ˘gi¸skenleri arasındaki ili¸skiyi tanımlayan iki ayrı β₁ve β₂bulunmaktadır.

Kabaca, β₁ili¸skinin yönünü gösterirken β₂’nin ise e ˘griselli ˘gi anlattı ˘gını söyleyebiliriz.

Önsel beklentimiz, X artarken Y ’nin de azalaca ˘gı ancak bu azalmanın giderek yava¸slayaca ˘gı yönündedir. Buna göre β1eksi, β₂ise artı de ˘ger almalıdır.

(42)

Çokterimli Ba ˘glanım Açıklayıcı Örnek

Modeli 2000 yılı Türkiye verilerine yakı¸stırdı ˘gımızda a¸sa ˘gıdaki bulguları elde ediyoruz:

Yˆi = 5,9486 − 0,0030 X_i +4,978e-07 X_i²

öh (0,3835) (0,0004) (9,727e-08) R²=0,5196 t (15,5094) (−7,2485) (5,1179) R¯²=0,5073 Katsayıların i¸saretleri beklentilerimiz ile örtü¸smektedir.

˙Ili¸ski do˘grusal olsaydı, ˆβ₂anlamlı çıkmayacaktı. ˆβ₂’nın anlamlı olması do ˘grusal-dı¸sılı ˘gı onaylayıcı niteliktedir.

Gelir 1000 TL oldu ˘gunda ortalama çocuk sayısı ¸sudur:

Y = 5,9486 − (0,0030 × 1000) + (4,978e-07 × 1000ˆ ²) =3,44 Gelir 1100 TL oldu ˘gunda çocuk sayısı ise ¸söyledir:

Y = 5,9486 − (0,0030 × 1100) + (4,978e-07 × 1100ˆ ²) =3,24 Demek ki X = 1000 oldu ˘gunda, gelir düzeyindeki 100 TL kadar bir artı¸s ortalama çocuk sayısını 0,2 dü¸sürmektedir.

(43)

Çokterimli Ba ˘glanım Açıklayıcı Örnek

1 2 3 4 5 6 7 8

500 1000 1500 2000 2500 3000 3500

Ortalama çocuk sayısı

Kişi başına düşen gayri safi yurtiçi hasıla (2000 yılı cari milyon TL)

TÜRKİYE'DE İLLERE GÖRE KİŞİ BAŞINA GELİR VE ORTALAMA ÇOCUK SAYISI İLİŞKİSİ Y = 5,95 - 0,00301X + 4,98e-007X^2

Y = 4,33 - 0,000990X

(44)

Uygulamaya ˙Ili¸skin ˙Iki Nokta

Son olarak, çokterimli modeller kullanılırken özellikle iki noktaya dikkat etmek önemlidir:

1 Öncelikle do ˘grusal-dı¸sı ili¸ski tanımlanmalıdır.

Ara¸stımacı, X ve Y arasındaki ili¸skinin neden do ˘grusal olmayabilece ˘gini sorgulamalıdır. Daha sonra, uygun bir i¸slev biçimi seçmek için iktisat kuramı temel alınmalıdır.

2 ˙Ikinci olarak, uygun bir çokterimli model belirtilip tahmin edildikten sonra bunun ili¸skiyi iyi anlattı ˘gı ve do ˘grusal modelden üstün oldu ˘gu do ˘grulanmalıdır.

Bunun için tahmin edilen ba ˘glanım i¸slevinin çizdirmek ve ba ˘glanımın verilere iyi yakı¸sıp yakı¸smadı ˘gına bakılabilir.

Ayrıca, anakütle ba ˘glanım i¸slevinin do ˘grusal oldu ˘gu sıfır önsavı istatistiksel yöntemler kullanılarak sınanmalıdır.

Bu çıkarsama yöntemleri ise bir sonraki konuda ele alınacaktır.

(45)

Önümüzdeki Dersin Konusu ve Ödev

Ödev

KitaptanBölüm 7“Multiple Regression Analysis: The Problem of Estimation” okunacak.

Önümüzdeki Ders

Çoklu Ba ˘glanım Çözümlemesi: Çıkarsama Sorunu