• Sonuç bulunamadı

Çoklu Regresyon Katsayılarının Yorumlanması

Belgede Do˘grusal Regresyon (sayfa 31-76)

Çizelgedeki katsayıları de ˘gi¸skenlerin birimine göre yorumlarız. Bu veri setinde harcamalar 1000 dolar, satı¸slar 1000 adet ¸seklindedir.

Dolayısıyla TV reklamına ait ˆβ1=0,046 katsayısının yorumu ¸sudur:

Radyo ve gazete reklamısabitken, TV reklamındaki 1 birim (1000

dolar) artı¸s sonucunda satı¸slar 0,046 (×1000) adet artmaktadır. Di ˘ger bir deyi¸sle TV reklamlarındaki her 1000 dolarlık harcama satı¸sları yakla¸sık 46 adet artırmaktadır.

Radyo ve gazete katsayılarının yorumu da benzer ¸sekildedir.

Sabit terim ˆβ0=2,939 katsayısının yorumu ise ¸söyledir: E ˘ger TV,

radyo ve gazete reklam harcamalarının hepsi birden sıfır olursa yakla¸sık 2,939 × 1000 = 2939 adet satı¸s beklenmektedir.

Çoklu regresyondaki ˆβ1, ˆβ2, ˆβ3 katsayıları ikili regresyondakilere benzerdir. Öte yandan sabit terimin farklı oldu ˘guna dikkat ediniz. Ayrıca burada gazete katsayısının p-de ˘geri 0,8599’a yükselmi¸stir. Sonuç olarak, ikili ve çoklu regresyon birbirinden oldukça farklı sonuçlar verebilmektedir.

Çoklu Do ˘grusal Regresyon Katsayıların tahmini ve yorumu

Karı¸stırıcı De ˘gi¸sken Etkisi

Çoklu regresyonda gazete reklamı p-de ˘gerinin 0,8599 oldu ˘guna dikkat ediniz.

Bu, H0 : β3 = 0 önsav sınamasının sonuç istatisti ˘gidir.

Dolayı-sıyla, β3’ün sıfırdan anlamlı derecede uzak olmadı ˘gını gösterir.

Bunun nedeni ise bu örnekte radyo ve gazete reklamlarının yük-sek korelasyona sahip olmasıdır. ˙Ikili regresyon bu ili¸skiyi dikkate almadı ˘gı için daha önce gazete reklamları anlamlı çıkmı¸stı. Buna benzer durumlar uygulamada sıkça kar¸sımıza çıkar.

Tipik bir örnek olarak, yazın kumsalda dondurma satı¸sları ile kö-pekbalı ˘gı saldırıları arasında güçlü ve anlamlı bir ili¸ski bulabiliriz. Bu hatalı sonucun nedeni hava sıcaklı ˘gının dikkate alınmamı¸s

olmasıdır. Burada hava sıcaklı ˘gınakarı¸stırıcı de ˘gi¸sken

(confoun-ding variable) denir. Bunu dikkate alınca sonuçlar düzelir.

Karı¸stırıcı de ˘gi¸skenler modellemede son derece önemlidir. Yapay zeka bu konuda zorlanır.

Çoklu Do ˘grusal Regresyon Katsayıların ve modelin kesinli ˘gi

Ders Planı

1 Basit Do ˘grusal Regresyon

Katsayıların tahmini ve yorumu Katsayıların ve modelin kesinli ˘gi

2 Çoklu Do ˘grusal Regresyon

Katsayıların tahmini ve yorumu

Katsayıların ve modelin kesinli ˘gi

Nitel de ˘gi¸skenler

Çoklu regresyonun uzantıları

3 Uygulamada Kar¸sıla¸sılan Sorunlar

Modelleme sorunu

Hata teriminde korelasyon Hata teriminde farklıserpilimsellik Dı¸sadü¸senler

Çoklue¸sdo ˘grusallık

4 K-Enyakın Kom¸su Regresyonu

Çoklu Do ˘grusal Regresyon Katsayıların ve modelin kesinli ˘gi

Çoklu Regresyonda Çıkarsama

Bir regresyon modelini tahmin edip katsayıları yorumlamak kolay i¸stir. Asıl önemli olan, elde yorumlamaya de ˘ger bir sonuç olup ol-madı ˘gını bilebilmektir.

Bu do ˘grultuda a¸sa ˘gıdaki dört temel soruya yanıt ararız:

1 Veriler modele ne kadar iyi yakı¸smı¸stır?

2 Model bir bütün olarak olarak anlamlı mıdır?

3 Y ’yi açıklayan önemli X de ˘gi¸skenleri neleridir?

4 Elde etti ˘gimiz kestirimler ne kadar güvenilirdir?

Çoklu Do ˘grusal Regresyon Katsayıların ve modelin kesinli ˘gi

Çoklu Regresyonda Yakı¸smanın ˙Iyili ˘gi

En temel yakı¸smanın iyili ˘gi ölçütleri olan R2ve kalıntı ölçünlü

ha-tasından ba¸sta söz etmi¸stik.

Bunların hesaplanı¸sı ve yorumu ikili regresyondaki gibidir. Çoklu regresyon örne ˘gimiz için a¸sa ˘gıdaki çizelgeye bakalım:

˙Istatistik De ˘ger Kalıntı ölçünlü hatası 1,690

R2 0,897

F -istatisti ˘gi 570,000

Çizelge 4:Satı¸s ve reklamlar çoklu regresyonu, özet istatistikler

˙Ilk olarak, KÖH de ˘gerinin 1,690 çıktı ˘gını görüyoruz. Buna göre modelin tahmin etti ˘gi satı¸slar ortalama olarak, gözlenen satı¸slar-dan 1,690 birim (1690 adet) sapmaktadır.

TV ikili regresyonunda bu 3,260 idi. Burada yakı¸sma iyile¸smi¸stir. Ancak katsayısı anlamlı çıkmayan gazeteyi modelden atarsak KÖH, 1,681 olmaktadır. Buna göre gazetenin yakı¸smaya katkısı yoktur.

Çoklu Do ˘grusal Regresyon Katsayıların ve modelin kesinli ˘gi

Ayarlamalı R-Kare

R2’ye de bakalım. Çoklu regresyonda R2=0,897 bulunmu¸stur.

Buna göre TV, radyo ve gazete reklam harcamalarını içeren mo-del satı¸slardaki de ˘gi¸simi yüzde 89,7 düzeyinde açıklamaktadır.

Ba¸staki ikili regresyonunda R2=0,612 idi. Dolayısıyla, daha fazla

de ˘gi¸skeni dikkate alan çoklu regresyonda yakı¸sma artmı¸stır.

Öte yandan R2, modeldeki de ˘gi¸sken sayısına kar¸sı hassastır. Yeni

de ˘gi¸sken eklendikçe bunların açıklama gücü yoksa bile R2artar.

Bu nedenle, tek açıklayıcı de ˘gi¸skeni olan ba¸staki model ile üç açıklayıcı de ˘gi¸skeni olan yeni modeldeki R2’leri kar¸sıla¸stıramayız.

Böyle durumlarda kar¸sıla¸stırılabilir olan istatistikayarlamalı R-kare

(adjusted R-squared) ya da kısaca ¯R2de ˘geridir.

Ayarlamalı R-kare modeldeki de ˘gi¸sken sayısını dikkate aldı ˘gı için normal R-kareden dü¸sük çıkar.

Örnek olarak, çoklu regresyon örne ˘gimizde ¯R2 = 0,88’dir. Bunu

Çoklu Do ˘grusal Regresyon Katsayıların ve modelin kesinli ˘gi

˙Iki De˘gi¸skenli Kalıntı Çizimi

Yakı¸smanın iyili ˘gini ¸sekil üzerinde incelemek de yararlıdır. Burada, yalnızca TV ya da radyo reklamı yapıldı ˘gı zaman modelin satı¸sları yüksek tahmin etti ˘gi görülüyor. Do ˘grusal-dı¸sı bir ili¸ski söz konusu.

Satışlar

TV

Radyo

¸

Sekil 4:Çoklu regresyonda iki de ˘gi¸skenli kalıntı çizimi

Çoklu Do ˘grusal Regresyon Katsayıların ve modelin kesinli ˘gi

Çoklu Regresyonda Bütünün Anlamlılı ˘gı

Regresyonda e ˘ger yakı¸sma düzeyi dü¸sükse bütünün anlamlılı ˘gı

(overall significance) durumuna özellikle bakmak isteriz. Bu, a¸sa ˘gıdaki önsav sınamasını yapmak demektir:

H0: β1= β2= . . . = βp=0 ve H1:En az bir βj 6= 0

Görüldü ˘gü gibi burada tüm katsayıların aynı anda sıfır olup olama-yaca ˘gı sorgulanmaktadır. Bunun için ¸su F -istatisti ˘gi hesaplanır:

F = (TKT − KKT)/p

KKT/(n − p − 1)

E ˘ger regresyon kalıntıları normal da ˘gılımlıysa ve H0do ˘gru ise yu-karıdaki sınama istatisti ˘gi F da ˘gılımına uyar. Bilgisayar bunu ve buna ait p-de ˘gerini kolayca hesaplar ve çıktı olarak verir.

Bu aslında H0:R2=0 sınamasıdır. Yakı¸smanın yoklu ˘gunu ölçer.

Çizelge 4’e dönersek örne ˘gimizde F = 570 oldu ˘gu görülüyor. ˙Ilgili F da ˘gılımında bu de ˘geri bulma p-de ˘geri < 0,0001’tir. Dolayısıyla modelin bütün olarak anlamlı olmadı ˘gı sıfır önsavını reddederiz.

Çoklu Do ˘grusal Regresyon Katsayıların ve modelin kesinli ˘gi

Genel F Sınaması

Yukarıdaki standart F sınaması dı¸sında iste ˘ge göre kendi özel F sınamalarımızı da tasarlayabiliriz. Örnek olarak, ¸sunu sınayalım:

H0: β1=7, β2= β3 ve H1:H0geçerli de ˘gil.

Bu sıfır önsavının geçerli olması durumunda ba¸staki reklam har-camaları modelimiz de ˘gi¸sir ve a¸sa ˘gıdaki gibi olur:

Y − 7X1= β0+ β2(X2+X3) + 

Yukarıdaki β0, β2ve  de ˘gerleri artık ilk modeldekilerden farklıdır. Sınırladı ˘gımız modeli kullanarak ¸su F istatisti ˘gini hesaplarız:

F = (KKTs− KKTsz)/m

KKTsz/(n − p)

Burada s harfi “sınırlamalı”, sz ise “sınırlamasız” demektir. Ayrıca m harfi sınırlama sayısıdır ve H0’daki = i¸sareti sayısı ile aynıdır. Görüldü ˘gü gibi, genel F sınaması için ba¸staki (sınırlamasız)

mo-del ile H0uygulanmı¸s (sınırlamalı) modeli tahmin edip her ikisinin

KKT de ˘gerlerini kullanırız. Tüm bunlar yine bilgisayarda yapılır.

Çoklu Do ˘grusal Regresyon Katsayıların ve modelin kesinli ˘gi

Önemli Açıklayıcı De ˘gi¸skenler

Çe¸sitli t ve F sınamalarına bakınca bazı X ’lerin anlamlı olma-dı ˘gını bulabiliyoruz. Bu durumda do ˘gal olarak, Y ’yi açıklamada önemli olan de ˘gi¸skenlere karar vermek isteriz.

Bunun için çok fazla sayıda modeli tek tek denemek gerekir. Ancak bunu yapmak zordur. De ˘gi¸sken sayısı p olan bir modelde

2padet farklı alt-model kombinasyonu söz konusudur.

Seçim i¸sini hızlı ve otomatik yapmak için üç klasik yakla¸sım vardır:

˙Ileri seçim(forward selection): Yalnızca sabit terim içeren en basit

modelle ba¸slanır ve KÖH de ˘gerini en çok dü¸süren de ˘gi¸skenler sırayla eklenir. KÖH’ün fazla dü¸smedi ˘gi belli bir noktada durulur.

Geri seçim(backward selection): Ba¸sta tüm de ˘gi¸skenler modele

eklenir ve p-de ˘geri en yüksek olan de ˘gi¸skenler sırayla çıkartılır.

Karma seçim(mixed selection): De ˘gi¸skenler modele tek tek

ekle-nir. Ancak i¸slem sırasında önceki bir de ˘gi¸skenin p-de ˘geri belli bir e¸sikten fazla yükselirse bu de ˘gi¸sken çıkartılır.

Çoklu Do ˘grusal Regresyon Katsayıların ve modelin kesinli ˘gi

Kestirimlerin Güvenilirli ˘gi

Bir model tahmin ederken önemli bir amacımız çe¸sitli X1,X2, . . .Xp

de ˘gerlerine kar¸sılık gelen Y de ˘gerini kestirmektir.

Ancak bu kestirimle ilgili 3 farklı belirsizlik söz konusudur:

1 βˆ0, ˆβ1, . . . , ˆβpkatsayı tahminlerindeki belirsizlik. Bunlar 2. Bö-lümde söz etti ˘gimiz azaltılabilir hatalar ile ilgilidir. Bu belirsizlik

ne-deniyle katsayıgüven aralıklarıhesaplarız.

2 f (X ) fonksiyonundaki belirsizlik. Bu,model yanlılı ˘gıdedi ˘gimiz azaltılabilir hata ile ilgilidir. Burada ¸simdilik bunu yok sayalım.

3 Hata terimi ’dan kaynaklı azaltılamayan hata. Bununla ilgili

olarak Y ile ˆY ’nın farkına yönelikkestirim aralıklarıhesaplarız.

Katsayı güven aralıkları, veri setindeki tüm Y de ˘gerlerine ili¸skin ortalama belirsizli ˘ge ili¸skindir. Kestirim güven aralı ˘gı ise tek bir Y kestirim de ˘gerine ait belirsizli ˘gi gösterir.

Bu yüzden kestirim aralıkları, güven aralıklarından daha geni¸stir. Örneklem ortalamasından uzakla¸stıkça kestirim aralı ˘gı geni¸sler.

Çoklu Do ˘grusal Regresyon Nitel de ˘gi¸skenler

Ders Planı

1 Basit Do ˘grusal Regresyon

Katsayıların tahmini ve yorumu Katsayıların ve modelin kesinli ˘gi

2 Çoklu Do ˘grusal Regresyon

Katsayıların tahmini ve yorumu Katsayıların ve modelin kesinli ˘gi

Nitel de ˘gi¸skenler

Çoklu regresyonun uzantıları

3 Uygulamada Kar¸sıla¸sılan Sorunlar

Modelleme sorunu

Hata teriminde korelasyon Hata teriminde farklıserpilimsellik Dı¸sadü¸senler

Çoklue¸sdo ˘grusallık

Çoklu Do ˘grusal Regresyon Nitel de ˘gi¸skenler

Nitel De ˘gi¸skenler

Bir nicelik yerine sınıflandırma gösteren nitel (qualitative) de

˘gi¸s-kenlerden önceki bölümde söz etmi¸stik.

Regresyon çözümlemesi uygulamalarında X de ˘gi¸skenleri yalnızca nicel de ˘gil, nitel de olabilir.

Örnek olarak, kredi kartı veri setini ele alalım. Bu veri setinde cin-siyet, ırk, medeni durum ve e ˘gitim düzeyi ¸seklinde dört farklı nitel de ˘gi¸sken bulunmaktadır.

Bunların birbirleriyle ve di ˘ger nicel de ˘gi¸skenlerle olan ili¸skisi ¸Sekil

5’teserpilim çizimi matriksi(scatter plot matrix) olarak verilmi¸stir.

Çoklu Do ˘grusal Regresyon Nitel de ˘gi¸skenler

Kredi Kartı Verileri

Borç 20406080100 5 10 15 20 2000 8000 14000 0 500 1500 20 40 60 80 100 Yaş Kart sayısı 2 4 6 8 5 10 15 20 Eğ�t�m Gel�r 50 100 150 2000 8000 14000 L�m�t 0500 1500 24 6 8 50100 150 200 600 1000 200 600 1000 Derece ¸

Çoklu Do ˘grusal Regresyon Nitel de ˘gi¸skenler

˙Iki Düzeyden Olu¸san X De˘gi¸skeni

Basit bir örnek olarak, erkek ve kadınlar arasındaki kredi kartı borcu farkını incelemek istedi ˘gimizi dü¸sünelim.

Bunun için yalnızca iki de ˘ger alabilen basit birgösterge(indicator)

de ˘gi¸skeni ya dakukla(dummy) de ˘gi¸sken olu¸stururuz:

xi = (

1 e ˘ger i’inci ki¸si kadınsa 0 e ˘ger i’inci ki¸si erkekse Daha sonra bu de ˘gi¸skeni regresyonumuzda kullanırız:

yi = β0+ β1xi+ i = (

β0+ β1+ i e ˘ger i’inci ki¸si kadınsa

β0+ i e ˘ger i’inci ki¸si erkekse

Bu modelde β0 de ˘geri erkeklerdeki ortalama kredi kartı borcunu

gösterir. β0+ β1ise kadınlar için ortalama borçtur.

Dolayısıyla β1burada kadınların erkeklere göre borçfarkıolur.

Kime 0 ya da 1 de ˘geri verdi ˘gimiz sonucu de ˘gi¸stirmez. E ˘ger

erkek-lere 1 dersek bu sefer β1erkeklerin kadınlara göre farkını verir.

Çoklu Do ˘grusal Regresyon Nitel de ˘gi¸skenler

Kukla De ˘gi¸skende −1, 1 Kodlaması

Kukla de ˘gi¸skenlere 0 ve 1 de ˘gerleri vermek yerine −1 ve 1 de ˘ger-lerini de kullanabiliriz:

xi = (

1 e ˘ger i’inci ki¸si kadınsa

−1 e ˘ger i’inci ki¸si erkekse

Yeni durumda model belirtimi a¸sa ˘gıdaki gibi olur: yi = β0+ β1xi+ i =

(

β0+ β1+ i e ˘ger i’inci ki¸si kadınsa β0− β1+ i e ˘ger i’inci ki¸si erkekse

Burada β0parametresi kadın/erkek ayrımı yapılmaksızın ortalama

kart borcudur. β1ise kadınların bu ortalamanın ne kadar üstünde

ve erkeklerin de ortalamanın ne kadar altında oldu ˘gunu verir. Bu modelin sonuçları önceki model ile aynı çıkar. Aradaki tek fark yorumdadır.

Öte yandan, uygulamada kukla de ˘gi¸skenleri 0 ve 1 ¸seklinde kod-lamak daha yaygındır.

Çoklu Do ˘grusal Regresyon Nitel de ˘gi¸skenler

˙Ikiden Fazla Sınıftan Olu¸san X De˘gi¸skeni

Sınıf sayısı ikiden çoksa daha fazla kukla de ˘gi¸sken kullanırız: xi1 =

(

1 e ˘ger i’inci ki¸si Asyalıysa 0 e ˘ger i’inci ki¸si Asyalı de ˘gilse xi2=

(

1 e ˘ger i’inci ki¸si beyazsa

0 e ˘ger i’inci ki¸si beyaz de ˘gilse Böylece, model a¸sa ˘gıdaki gibi olur:

yi = β0+ β1xi1+ β2xi2+ i =     

β0+ β1+ i i’inci ki¸si Asyalıysa β0+ β2+ i i’inci ki¸si beyazsa

β0+ i i’inci ki¸si zenciyse

Her zaman sınıf sayısından bir eksik kukla de ˘gi¸sken olmalıdır.

Kuklası olmayan sınıfatemelya dakar¸sıla¸stırmasınıfı denir.

Bu modelde β1, Asyalıların zencilere göre borç farkını, β2 ise

be-yazların yine zencilere göre borç farkını gösterir.

Çoklu Do ˘grusal Regresyon Nitel de ˘gi¸skenler

Kukla De ˘gi¸skenlerin Yorumlanması

Kredi kartı borçlarını etnik kökene göre inceleyen regresyon tah-minleri a¸sa ˘gıdaki gibidir:

De ˘gi ¸sken Katsayı Ölçünlü hata t-istatisti ˘gi p-de ˘geri Sabit terim 531,00 46,32 11,464 <0,0001

Asyalı −18,69 65,02 −0,287 0,7740

Beyaz −12,50 56,68 −0,221 0,8260

Çizelge 5:Kredi kartı borcu ile etnik köken çoklu regresyonu

Çizelgede taban sınıf olan zenciler için ortalama kredi kartı borcu 531 dolardır. Bu miktar Asyalılar için 18,69 dolar, beyazlar için ise 12,50 dolar daha dü¸sük bulunmu¸stur.

Ancak Asyalılar ve beyazlara ait katsayılerın p-de ˘gerleri yüksektir. Bu durumda üç grup arasında anlamlı bir fark yoktur diyebiliriz. Öte yandan katsayılar ve p-de ˘gerleri kuklaların nasıl

belirlendi-˘gine de ba ˘glıdır. Dolayısıyla, bu konuda kesin karar vermek için

Çoklu Do ˘grusal Regresyon Çoklu regresyonun uzantıları

Ders Planı

1 Basit Do ˘grusal Regresyon

Katsayıların tahmini ve yorumu Katsayıların ve modelin kesinli ˘gi

2 Çoklu Do ˘grusal Regresyon

Katsayıların tahmini ve yorumu Katsayıların ve modelin kesinli ˘gi Nitel de ˘gi¸skenler

Çoklu regresyonun uzantıları

3 Uygulamada Kar¸sıla¸sılan Sorunlar

Modelleme sorunu

Hata teriminde korelasyon Hata teriminde farklıserpilimsellik Dı¸sadü¸senler

Çoklue¸sdo ˘grusallık

4 K-Enyakın Kom¸su Regresyonu

Çoklu Do ˘grusal Regresyon Çoklu regresyonun uzantıları

Toplanırlık ve Do ˘grusallık Varsayımları

Do ˘grusal regresyon modeli yorumlaması oldukça kolay ve çıkar-sama için de yararlı sonuçlar üretir.

Ancak bunu genellikle uygulamada geçerli olmayan iki kısıtlayıcı varsayım pahasına yapar:

1 Y ve X ’ler arasındatoplanır(additive) bir ili¸ski vardır.

2 Y ve X ’ler arasındado ˘grusal(linear) bir ili¸ski vardır. Toplanır ili¸ski, belli bir Xj’nin Y üzerindeki etkisinin di ˘ger X ’lerden ba ˘gımsız olması anlamına gelir.

Do ˘grusal ili¸ski ise Xj’deki bir birim de ˘gi¸sikli ˘gin Y ’ye etkisinin hep

sabit olması, Xj’nin büyüklü ˘günden etkilenmemesi demektir.

¸

Çoklu Do ˘grusal Regresyon Çoklu regresyonun uzantıları

Etkile¸sim Terimi

˙Ilk olarak, toplanırlık varsayımını ele alalım. A¸sa˘gıdaki üç de˘gi¸s-kenli modeli inceleyelim:

Y = β0+ β1X1+ β2X2+ 

Burada X1e ˘ger 1 birim artarsa Y de ortalama β1birim

artmakta-dır. Öte yandan bu etki X2’den ba ˘gımsızdır. X2 sıfır da olsa,

yük-sek bir de ˘ger de alsa etki sabittir.

Bu durum gerçek ya¸samda geçerli olmayabilir. Örnek olarak, TV reklamının etkisi radyo reklamının varlı ˘gıyla güçlenebilir.

Pazarla-mada bunasinerji(synergy) etkisi denilmektedir.

Bu etkiyi dikkate almanın bir yolu yeni bir de ˘gi¸sken eklemektir: Y = β0+ β1X1+ β2X2+ β3X1X2+ 

Burada β3’eetkile¸sim terimi (interaction term) denir. Adından da

anla¸sıldı ˘gın gibi bu terim X1ve X2arasındaki etkile¸simi ölçer. Yeni de ˘gi¸skeni X1ile X2’yi çarparak bizim olu¸sturdu ˘gumuza dikkat ediniz.

Çoklu Do ˘grusal Regresyon Çoklu regresyonun uzantıları

Etkile¸sim Teriminin Yorumu (1)

Etkile¸sim terimini anlamak için reklam örne ˘gimize geri dönelim:

Satı¸s = β0+ β1TV + β2Radyo + β3(TV × Radyo) + 

Yukarıdaki modeli yorumlamayı kolayla¸stırmak amacıyla iki farklı ¸sekilde yeniden yazabiliriz:

Satı¸s = β0+ (β1+ β3× Radyo)TV + β2Radyo + 

Satı¸s = β0+ (β2+ β3× TV) Radyo + β1TV + 

Görüldü ˘gü gibi, etkile¸sim terimi içeren modelde TV reklamının

sa-tı¸slara etkisi artık β1+ β3× Radyo harcaması kadardır.

Benzer ¸sekilde radyo reklamının etkisi de β2 + β3 × TV reklam

Çoklu Do ˘grusal Regresyon Çoklu regresyonun uzantıları

Etkile¸sim Teriminin Yorumu (2)

Modele ait regresyon tahmin sonuçları a¸sa ˘gıda verilmi¸stir:

De ˘gi ¸sken Katsayı Ölçünlü hata t-istatisti ˘gi p-de ˘geri Sabit terim 6,7502 0,248 27,23 <0,0001

TV 0,0191 0,002 12,70 <0,0001

Radyo 0,0289 0,009 3,24 0,0014

TV×Radyo 0,0011 0,000 20,73 <0,0001

Çizelge 6:Satı¸slar ile TV ve radyo reklamları etkile¸simli regresyonu

Yukarıda etkile¸sim teriminin anlamlı oldu ˘gu görülmektedir. Ayrıca

etkile¸simin eklenmesiyle R2de 0,897’den 0,968’e yükselmi¸stir.

Burada artık bir reklam türünün etkisi di ˘gerinin miktarına ba ˘glıdır. Örnek olarak, radyo reklam harcaması 1000 dolar iken 1000 do-larlık TV reklamının satı¸slara etkisi 19,1 + 1,1 × 1 = 20,2 adettir. Radyo reklamı 5000 dolar oldu ˘gunda ise aynı 1000 dolarlık TV reklamının etkisi artarak 19,1 + 1,1 × 5 = 24,6’ya yükselir. Radyo reklamlarının etkisi de buna benzer ¸sekilde hesaplanır.

Çoklu Do ˘grusal Regresyon Çoklu regresyonun uzantıları

Kukla Etkile¸sim Terimi (1)

Etkile¸sim terimlerini kukla de ˘gi¸skenlerle de kolayca kullanabiliriz. Örnek olarak, kredi kartı borcunun gelire ve ö ˘grenci olma

niteli-˘gine göre regresyonu etkile¸sim terimiyle birlikte ¸söyle modellenir: Borç = β0+ β1Gelir + β2Ö ˘grenci + β3(Gelir × Ö ˘grenci) +  Bu durumda a¸sa ˘gıdaki regresyon tahmin edilmi¸s olur:

Borç = (

0+ β2) + (β1+ β3)Gelir e ˘ger ö ˘grenci ise

β0+ β1Gelir e ˘ger ö ˘grenci de ˘gilse

Yukarıda β2, ikinci do ˘grunun (ö ˘grenci olmanın) sabit terim farkı

olarak yorumlanır. β3ise ikinci do ˘grunune ˘gim farkıolur.

Dolayısıyla aslında iki ayrı regresyon do ˘grusu tahmin etti ˘gimize dikkat ediniz. Bunlar ¸Sekil 6’da gösterilmi¸stir.

Çoklu Do ˘grusal Regresyon Çoklu regresyonun uzantıları

Kukla Etkile¸sim Terimi (2)

0 50 100 150 200 600 1000 1400 Gelir Bor ç öğrenci öğrenci değil ¸

Sekil 6:Kredi borcunun gelire ve ö ˘grenci olma niteli ˘gine göre regresyonları

Çoklu Do ˘grusal Regresyon Çoklu regresyonun uzantıları

Polinom Regresyonu (1)

Do ˘grusallık varsayımının uygulamada regresyon modelleri için bir kısıtlama olu¸sturdu ˘gunu yukarıda söylemi¸stik.

Do ˘grusal-dı¸sı ili¸skileri dikkate almanın basit bir yolupolinom

reg-resyon(polynomial regression) modelidir.

Örnek olarak, yakıt tüketimi ile motor gücünü a¸sa ˘gıdaki gibi ikinci derece bir polinom regresyonuna yakı¸stırabiliriz:

Yakıt tüketimi = β0+ β1Güç + β2Güç2+ 

Daha yüksek derece polinom regresyonları da buna benzerdir:

Yakıt tüketimi = β0+ β1Güç + β2Güç2+ · · · + βp Güçp+ 

Bu modellerde regresyon çizgisi bir do ˘gru de ˘gil, e ˘gri ¸seklindedir. Dolayısıyla X ’in Y ’ye etkisi X ’in büyüklü ˘güne göre de ˘gi¸sir.

Otomobil veri seti kullanılarak tahmin edilmi¸s do ˘grusal model ile

Çoklu Do ˘grusal Regresyon Çoklu regresyonun uzantıları

Polinom Regresyonu (2)

¸

Sekilde 2. derece polinom regresyonunun verilere iyi yakı¸stı ˘gı, 5. derece polinomun ise gereksiz derecede kıvrımlı oldu ˘gu görül-mektedir. Dolayısıyla esneklik seçimi burada da önemlidir.

50 100 150 200 10 20 30 40 50 Beygir gücü Galon ba şı na mil Doğrusal 2. derece 5. derece ¸

Sekil 7:Yakıt tüketimi ile motor gücüne ili¸skin polinom regresyonlar

Uygulamada Kar¸sıla¸sılan Sorunlar Modelleme sorunu

Ders Planı

1 Basit Do ˘grusal Regresyon

Katsayıların tahmini ve yorumu Katsayıların ve modelin kesinli ˘gi

2 Çoklu Do ˘grusal Regresyon

Katsayıların tahmini ve yorumu Katsayıların ve modelin kesinli ˘gi Nitel de ˘gi¸skenler

Çoklu regresyonun uzantıları

3 Uygulamada Kar¸sıla¸sılan Sorunlar

Modelleme sorunu

Hata teriminde korelasyon Hata teriminde farklıserpilimsellik Dı¸sadü¸senler

Çoklue¸sdo ˘grusallık

Uygulamada Kar¸sıla¸sılan Sorunlar Modelleme sorunu

Uygulamada Kar¸sıla¸sılan Sorunlar

Bir veri setine regresyon modeli yakı¸stırdı ˘gımız zaman çe¸sitli so-runlarla kar¸sıla¸sabiliriz. Bunların ba¸slıcaları ¸sunlardır:

1 Modelleme hatası

2 Hata teriminde korelasyon

3 Hata teriminde farklıserpilimsellik

4 Dı¸sadü¸senler

5 E¸sdo ˘grusallık

Yukarıdaki hataları saptamak ve düzeltmek oldukça ayrıntılı ba¸s-lıklardır. Bu konularda yazılmı¸s birçok kitap bulunmaktadır. Burada biz uygulamada kar¸sıla¸sılan olası sorunları kısa ve öz bir

Belgede Do˘grusal Regresyon (sayfa 31-76)

Benzer Belgeler