Nitel Değişkenli Ekonometrik Modeller
l Ekonometrik modellerde yer alması düşünülen ve niteliksel değişmeleri yansıtan bazı değişkenler için genellikle sayısal değerler bulunamamaktadır.
l Niteliksel değişkenlere kukla – gölge – dummy değişken adı verilmektedir.
Nitel Değişkenli Ekonometrik Modeller
Dummy değişkenlerle temsil edilen nitel değişkenler “evet”
yada “hayır” türü bağımlı değişkenleri regresyon modellerine katma aracıdır.
Cinsiyet Meslek
Din
Eğitim Seviyesi
Bilgisayar, ev, araba…sahipliği
Sendika, meslek komitesi, parti…örgütüne üyelik Farklı siyasi dönemler, farklı mevsimler, farklı coğrafi
bölgeler, farklı gelir grupları …vb.
Dummy Değişkenlerin Yapısı
Cinsiyet
Erkek(1) Kadın(2) Din
Musevilik(1) Hıristiyanlık(2) Müslümanlık(3) Ev Sahipliği
Ev Sahibi Olma Durumu(1) Ev Sahibi Olmama Durumu(0) Kriz
Krizin Etkili Olduğu Dönem(1) Krizin Etkili Olmadığı Dönem(0)
Tek Dummy Bağımsız Değişkenli Modeller
Tekstil ve Gıda sektörlerinde faaliyet gösteren 18 işletmenin 2019 yılı karları verilmiştir.
Tekstil işletmelerini 1, gıda işletmelerini 0 ile ifade ederek dummy değişkenli modeli tahmin edelim.
(1=1 Milyon TL)
Tek Dummy Bağımsız Değişkenli Modeller
Tek Dummy Bağımsız Değişkenli Modeller
Gıda İşletmelerinin Tekstil İşletmelerinin 2019 yılı ortalama karı 2019 yılı ortalama karı
D
iKar = 16 , 125 + 9 , 175
125 ,
ˆ 16 0 ® =
=
ii
Y
D D
i= 1 ® Y ˆ
i= 25 , 3
Dummy ve Dummy Olmayan Bağımsız Değişkenli Modeller
Tekstil ve Gıda sektörlerinde faaliyet gösteren 18 işletmenin 2019 yılı karları ve satışları verilmiştir. Tekstil işletmelerini 1, gıda işletmelerini 0 ile ifade ederek dummy değişkenli modeli tahmin edelim.
D
iSat
Kar = 4 , 602 + 0 , 204 . + 3 , 651
İki Dummy Bağımsız Değişkenli Modeller
“Serbest meslek – Memur – İşçi” meslek çalışanlarının aylık ortalama net ücretleri verildiğinde 1 dummy değişken ile regresyon modelinin tahminini gerçekleştirelim.
Yi =Ücret
D1i=0; işçi, D1i=1; memur, D1i=2; serbest meslek
Ücret = 16,68 “İşçi” için aylık net ücret
Ücret = 22,36 (16,68+5,68*1) “Memur” için aylık net ücret
Ücret = 28,04 (16,68+5,68*2) “Serbest Meslek” için aylık net ücret
i i
i
D
Y = a
0+ a
1 1+ e
Yi =16,68+5,68D1iİki Dummy Bağımsız Değişkenli Modeller
“Serbest meslek – Memur – İşçi” meslek çalışanlarının aylık ortalama net ücretleri verildiğinde 2 dummy değişken ile regresyon modelinin tahminini gerçekleştirelim.
Yi=Ücret
D1i=1; memur - D1i=0; diğer durumlar D2i=1; serbest meslek - D2i=0; diğer durumlar D1i=0; - D2i=0; işçi
Ücret= 18,22 “İşçi” için aylık ortalama net ücret
Ücret= 19,27 (18,22+1,05) “Memur” için aylık ortalama net ücret Ücret= 25,22(18,22+7) “Serbest Meslek” için aylık ortalama ücret
i i
i
i D D
Y =a0 +a1 1 +a2 2 +e Yi =18,22+1,05D1i +7,00D2i
Dummy Değişken ile Mevsimsellik İncelemesi
Klima satışları için yapılan araştırmada mevsimsellik durumunun
incelenmesi gerekmektedir. Bu durumda tahmin etmek istediğimiz model aşağıdaki gibidir.
Yi=Klima Satışları
D1i=1; yaz - D1i=0; diğer durumlar D2i=1; sonbahar - D2i=0; diğer durumlar D3i=1; kış - D3i=0; diğer durumlar D1i=0; - D2i=0; D3i=0 - ilkbahar
Dummy Değişken ile Mevsimsellik İncelemesi
İlkbahar ayında gerçekleşen klima satışları = 4939,14
Yaz ayında gerçekleşen klima satışları = 12020,18 (4939,14+7081,04)
Sonbahar ayında gerçekleşen klima satışları = 4928,76 (4939,14-10,38) Kış ayında gerçekleşen klima satışları = 2462,82 (4939,14-2476,82)
i i
i i
i
D D D
Y = a
0+ a
1 1+ a
2 2+ a
3 3+ e
i i
i
i
D D D
Y = 4939 , 14 + 7081 , 04
1- 10 , 38
2- 2476 , 32
3Dummy Değişken ile Regresyon Analizi
Bağımlı Nitel Değişkenler 1- Doğrusal Olasılık Modeli
→ 1 ilk seçeneğin tercih edilmesi
l !"
→ 0 ikinci seçeneğin tercih edilmesi
l Doğrusal olasılık modellerinde hata terimi de bağımlı değişken gibi iki değer almaktadır. Bu nedenle normallik varsayımı geçerli değildir.
!" = 1 %&'(ğ(*'+ 1 = ,- + ,/0/ + 1" ⇒ 1" = 1 − ,- − ,/0/
!" = 0 %&'(ğ(*'+ 0 = ,- + ,/0/ + 1" ⇒ 1" = ,- − ,/0/
l Doğrusal olasılık modellerinde normallik varsayımı geçerli
olmadığından parametre tahminleri sapmasız ancak minimum varyanslı yani etkin olmayacaktır.
1- Doğrusal Olasılık Modeli
l Doğrusal olasılık modelini en küçük kareler yöntemi le tahmin etmek mümkündür. Fakat bu tahminler temel varsayımları
taşımadıklarından kullanılmaları uygun olmamaktadır.
Doğrusal olasılık modellerinde karşılaşılan sorunlar:
1- Hata terimleri dağılımı binom dağılımdır.
2- Hata terimleri sabit varyanslı değildir. Tartılı en küçük kareler yöntemi uygulanarak sabit varyanslı yapılabilir.
3- !" her zaman 0-1 değerlerini almamaktadır. O’dan küçük çıkanlara 0, 1’den büyük çıkanlara 1 verilir.
4- Bu durum Y’nin tahmini değerlerini yorumlarken soruna neden olur. Çünkü ‘doğrusal olasılık modellerinde’ Y’nin tahmini olasılık olarak yorumlanmaktadır.
5- Belirlilik katsayısı en iyi modelin belirlenmesinde güvenilmez sonuçlar verir.
2-Lojistik-Logit Model
l Bu model 0 ≤ #(%&'() ≤ 1 şartını sağlamak için geliştirilmiştir.
l Model birikimli olasılık dağılımından türetilmiş logistik dağılım fonksiyonudur.
l +& = - .& = - /0 + /2(& = 2
234567 = 2
2345(89:8;<7)
l +&, bağımsız değişken ((&) hakkında bilgi verir.
l Bu durum i’inci bireyin belirli bir seçimi yapma olasılığıdır.
2-Lojistik-Logit Model
l Logit modelde hata terimleri binom dağılıma sahiptir. Bu durum değişen varyansa neden olur. Değişen varyans sorununu halletmek için;
→Tekrarlı gözlemler için: Genelleştirilmiş En Küçük Kareler Minimum ki-kare
(Aynı gözlemlere tekrar tekrar bakmak)
→Tekrarsız gözlemler için: Maksimum likelihood Yöntemi
l Bağımlı değişken, iki sonucu olan bir değişken olduğunda
“Lojistik Regresyon” ile çözüme ulaşılmaktadır.
Başarılı – Başarısız Evet – Hayır
Var – Yok …
2-Lojistik-Logit Model
Laptop sahibi olup olmadığını ifade eden 50 üniversite öğrencisine yapılan anket yaş ve aylık ortalama gelirleri ile açıklanmıştır.
Yi = Laptop kullanılıp kullanılmaması X1i = Aylık ortalama gelir
X2i = Yaş
2-Lojistik-Logit Model
2-Lojistik-Logit Model
Dependent Variable: LS
Method: ML - Binary Logit (Quadratic hill clim bing) Date: 05/12/14 Tim e: 11:46
Sam ple: 1 50
Included obs ervations : 50
Convergence achieved after 5 iterations
Covariance m atrix com puted us ing s econd derivatives
Variable Coefficient Std. Error z-Statis tic Prob.
C -14.43274 5.231079 -2.759037 0.0058
YAS 0.651212 0.235069 2.770299 0.0056
GELIR 0.003849 0.001997 1.927786 0.0539
McFadden R-s quared 0.248610 Mean dependent var 0.700000 S.D. dependent var 0.462910 S.E. of regres s ion 0.372270 Akaike info criterion 1.037995 Sum s quared res id 6.513493 Schwarz criterion 1.152716 Log likelihood -22.94987 Hannan-Quinn criter. 1.081681 Deviance 45.89974 Res tr. deviance 61.08643 Res tr. log likelihood -30.54322 LR s tatis tic 15.18669 Avg. log likelihood -0.458997 Prob(LR s tatis tic) 0.000504
Obs with Dep=0 15 Total obs 50
Obs with Dep=1 35
Yas Gelir
Laptop = - 14 , 43 + 0 , 004 + 0 , 651
2-Lojistik-Logit Model
Geliri 320 yaşı 18 olan bir üniversite öğrencisinin laptop sahibi olma olasılığını hesaplayalım.
Geliri 320 yaşı 18 olan bir üniversite öğrencisinin laptop sahibi olma olasılığı %19’dur.
19 , 718 0
, 2 1
1 1
1
432 ,
1
18
* 651 ,
0 320
* 004 ,
0 43
, 14
) 432 , 1
(
=
= + +
-
=
+ +
-
=
- - -laptop
e
Laptop
2-Lojistik-Logit Model
Probit Model
l Probit Model normal birikimli dağılım fonksiyonundan türetilmiştir. Bu fonksiyon doğrusal değildir ve tahmin yapılabilmesi için doğrusallaştırılması gerekmektedir.
Doğrusallaştırmak için ise normal birikimli dağılım fonksiyonunun tersini almak gerekmektedir.
Probit Model
v
Logit ve Probit Modeller Arasındaki Farklar
1 – Logit ve Probit Modelleri birbirine oldukça benzemektedir.
Aralarındaki en önemli fark, logit eğrinin daha kalın kuyruklu olmasıdır.
Probit Model
v
Logit ve Probit Modeller Arasındaki Farklar
2- Logit ve Probit Modelde küçük örnek tahmincileri sapmasız, etkin olmayan ve normal dağılmayan tahmincilerken büyük
örnek özellikler tutarlı, asimtotik etkin ve asimtotik sapmasızdır.
Probit Model
v
Logit ve Probit Modeller Arasındaki Farklar
3- Logit ve Probit Modellerin katsayıları çok farklı olmamakla beraber doğrudan karşılaştırılamaz. Çünkü standart normal dağılımın ortalaması 0 ve varyansı 1 iken logistik dağılımın ortalaması 0 fakat varyansı !"/3’tür. Dolayısı ile 2 modeli
karşılaştırmak için logit modelden elde edilen β tahmincileri 3/!
ile çarpılır.
(1981 yılında Amemiya yaklaşık 0,625 ile çarpılmasını önermiştir.)
l
Multinomial: İkiden fazla değer alan tek bir bağımlı değişken
Sıralı (Ordered) Sıralı Olmayan(Unordered) Ardışık(sequential)
Örnek: Bireylerin gelirlerine göre Örnek: Meslek gruplarına göre Örnek: Eğitim durumuna göre
Y=1 (0-1000TL) Y=1 (Doktor) Y=1 (İlkokul mezunu)
Y=2(1001TL-2000TL) Y=2 (Mühendis) Y=2 (Lise mezunu)
Y=3(2001TL-3000TL) Y=3 (Avukat) Y=3 (Üniversite mezunu)
l
Multivariate: İki değer alan birden fazla bağımlı
değişken (Çok değişkenli analiz teknikleri)
l
Multinomial Probit Model: Tesadüfi fayda modelindeki hata terimlerinin çok değişkenli normal dağılıma sahip olduğu modeldir. İlk kez psikolojik tercih verilerine uygulanmıştır.
l
Multinomial Logit Model: Tesadüfi fayda modelindeki hata terimlerinin çok değişkenli lojistik dağılımına sahip olduğu modellerdir.
l
Not: 2 seçenekten biri seçilirken, bunlardan her birinin bağımsız olduğu varsayılmaktadır. Bu durum ilgisiz seçeneklerin bağımsızlığıdır.
Uygulamada bu durumdan şüphe ediliyor ise
multinomial probit modeli tercih edilmektedir.
Tobit Model
l
Bağımsız değişkenin bilinen değerlerine karşılık, bağımlı değişkenin bazı değerlerinin gözlemlenememesidir.
l
Örnek: Bir konserin biletlerine olan talebi
modellemede sahip olunan veri satılan bilet
sayısı kadardır, eğer konser kapalı gişe oynarsa
talep mevcut maksimum bilet sayısı ile
sansürlenir. Bu durumda Tobit model kullanılır.
n=117 2005 2006 2007 2008 2009 2010 2011 c -0.0677** -0.1260*** -0.0832* -0.1159*** -0.0755*** -0.0993*** -0.0908***
-0.029 -0.033 -0.043 -0.037 -0.023 -0.026 -0.029
CAB -0.5416*** -0.7735*** -0.7226*** -0.3609** -0.4552*** -0.3081** -0.3763**
-0.112 -0.120 -0.162 -0.176 -0.151 -0.147 -0.164
-0.0130 -0.0138 -0.024 -0.0438 -0.0231 -0.0239 -0.0260
RES 0.2354*** 0.39164*** 0.2676*** 0.2608*** 0.1491** 0.2413***
-0.0600 -0.0610 -0.0920 -0.0990 -0.0670 -0.0740
0.1690 0.1900 0.2060 0.1840 0.2300 0.2290
GDPG -0.0113*** 0.0144*** 0.0141*** 0.0094**
-0.0030 -0.0010 -0.0040 -0.0030
5.3730 6.2900 6.1540 4.3460
IMF -0.0979*** -0.1126*** -0.1756***
-0.0249 -0.0250 -0.0400
0.6920 0.6920 0.6920
Left Censored Obs. 73 74 74 77 76 76 76
Non-Censored Obs. 44 43 43 40 41 41 41
Log likelihood 4.56 7.40 -12.98 -16.09 -0.68 -5.06 -2.67
Dhyrme's R2 63.14% 61.83% 54.85% 33.26% 47.21% 54.02% 63.70%