Çizelgedeki katsayıları de ˘gi¸skenlerin birimine göre yorumlarız. Bu veri setinde harcamalar 1000 dolar, satı¸slar 1000 adet ¸seklindedir.
Dolayısıyla TV reklamına ait ˆβ1=0,046 katsayısının yorumu ¸sudur:
Radyo ve gazete reklamısabitken, TV reklamındaki 1 birim (1000
dolar) artı¸s sonucunda satı¸slar 0,046 (×1000) adet artmaktadır. Di ˘ger bir deyi¸sle TV reklamlarındaki her 1000 dolarlık harcama satı¸sları yakla¸sık 46 adet artırmaktadır.
Radyo ve gazete katsayılarının yorumu da benzer ¸sekildedir.
Sabit terim ˆβ0=2,939 katsayısının yorumu ise ¸söyledir: E ˘ger TV,
radyo ve gazete reklam harcamalarının hepsi birden sıfır olursa yakla¸sık 2,939 × 1000 = 2939 adet satı¸s beklenmektedir.
Çoklu regresyondaki ˆβ1, ˆβ2, ˆβ3 katsayıları ikili regresyondakilere benzerdir. Öte yandan sabit terimin farklı oldu ˘guna dikkat ediniz. Ayrıca burada gazete katsayısının p-de ˘geri 0,8599’a yükselmi¸stir. Sonuç olarak, ikili ve çoklu regresyon birbirinden oldukça farklı sonuçlar verebilmektedir.
Çoklu Do ˘grusal Regresyon Katsayıların tahmini ve yorumu
Karı¸stırıcı De ˘gi¸sken Etkisi
Çoklu regresyonda gazete reklamı p-de ˘gerinin 0,8599 oldu ˘guna dikkat ediniz.
Bu, H0 : β3 = 0 önsav sınamasının sonuç istatisti ˘gidir.
Dolayı-sıyla, β3’ün sıfırdan anlamlı derecede uzak olmadı ˘gını gösterir.
Bunun nedeni ise bu örnekte radyo ve gazete reklamlarının yük-sek korelasyona sahip olmasıdır. ˙Ikili regresyon bu ili¸skiyi dikkate almadı ˘gı için daha önce gazete reklamları anlamlı çıkmı¸stı. Buna benzer durumlar uygulamada sıkça kar¸sımıza çıkar.
Tipik bir örnek olarak, yazın kumsalda dondurma satı¸sları ile kö-pekbalı ˘gı saldırıları arasında güçlü ve anlamlı bir ili¸ski bulabiliriz. Bu hatalı sonucun nedeni hava sıcaklı ˘gının dikkate alınmamı¸s
olmasıdır. Burada hava sıcaklı ˘gınakarı¸stırıcı de ˘gi¸sken
(confoun-ding variable) denir. Bunu dikkate alınca sonuçlar düzelir.
Karı¸stırıcı de ˘gi¸skenler modellemede son derece önemlidir. Yapay zeka bu konuda zorlanır.
Çoklu Do ˘grusal Regresyon Katsayıların ve modelin kesinli ˘gi
Ders Planı
1 Basit Do ˘grusal Regresyon
Katsayıların tahmini ve yorumu Katsayıların ve modelin kesinli ˘gi
2 Çoklu Do ˘grusal Regresyon
Katsayıların tahmini ve yorumu
Katsayıların ve modelin kesinli ˘gi
Nitel de ˘gi¸skenler
Çoklu regresyonun uzantıları
3 Uygulamada Kar¸sıla¸sılan Sorunlar
Modelleme sorunu
Hata teriminde korelasyon Hata teriminde farklıserpilimsellik Dı¸sadü¸senler
Çoklue¸sdo ˘grusallık
4 K-Enyakın Kom¸su Regresyonu
Çoklu Do ˘grusal Regresyon Katsayıların ve modelin kesinli ˘gi
Çoklu Regresyonda Çıkarsama
Bir regresyon modelini tahmin edip katsayıları yorumlamak kolay i¸stir. Asıl önemli olan, elde yorumlamaya de ˘ger bir sonuç olup ol-madı ˘gını bilebilmektir.
Bu do ˘grultuda a¸sa ˘gıdaki dört temel soruya yanıt ararız:
1 Veriler modele ne kadar iyi yakı¸smı¸stır?
2 Model bir bütün olarak olarak anlamlı mıdır?
3 Y ’yi açıklayan önemli X de ˘gi¸skenleri neleridir?
4 Elde etti ˘gimiz kestirimler ne kadar güvenilirdir?
Çoklu Do ˘grusal Regresyon Katsayıların ve modelin kesinli ˘gi
Çoklu Regresyonda Yakı¸smanın ˙Iyili ˘gi
En temel yakı¸smanın iyili ˘gi ölçütleri olan R2ve kalıntı ölçünlü
ha-tasından ba¸sta söz etmi¸stik.
Bunların hesaplanı¸sı ve yorumu ikili regresyondaki gibidir. Çoklu regresyon örne ˘gimiz için a¸sa ˘gıdaki çizelgeye bakalım:
˙Istatistik De ˘ger Kalıntı ölçünlü hatası 1,690
R2 0,897
F -istatisti ˘gi 570,000
Çizelge 4:Satı¸s ve reklamlar çoklu regresyonu, özet istatistikler
˙Ilk olarak, KÖH de ˘gerinin 1,690 çıktı ˘gını görüyoruz. Buna göre modelin tahmin etti ˘gi satı¸slar ortalama olarak, gözlenen satı¸slar-dan 1,690 birim (1690 adet) sapmaktadır.
TV ikili regresyonunda bu 3,260 idi. Burada yakı¸sma iyile¸smi¸stir. Ancak katsayısı anlamlı çıkmayan gazeteyi modelden atarsak KÖH, 1,681 olmaktadır. Buna göre gazetenin yakı¸smaya katkısı yoktur.
Çoklu Do ˘grusal Regresyon Katsayıların ve modelin kesinli ˘gi
Ayarlamalı R-Kare
R2’ye de bakalım. Çoklu regresyonda R2=0,897 bulunmu¸stur.
Buna göre TV, radyo ve gazete reklam harcamalarını içeren mo-del satı¸slardaki de ˘gi¸simi yüzde 89,7 düzeyinde açıklamaktadır.
Ba¸staki ikili regresyonunda R2=0,612 idi. Dolayısıyla, daha fazla
de ˘gi¸skeni dikkate alan çoklu regresyonda yakı¸sma artmı¸stır.
Öte yandan R2, modeldeki de ˘gi¸sken sayısına kar¸sı hassastır. Yeni
de ˘gi¸sken eklendikçe bunların açıklama gücü yoksa bile R2artar.
Bu nedenle, tek açıklayıcı de ˘gi¸skeni olan ba¸staki model ile üç açıklayıcı de ˘gi¸skeni olan yeni modeldeki R2’leri kar¸sıla¸stıramayız.
Böyle durumlarda kar¸sıla¸stırılabilir olan istatistikayarlamalı R-kare
(adjusted R-squared) ya da kısaca ¯R2de ˘geridir.
Ayarlamalı R-kare modeldeki de ˘gi¸sken sayısını dikkate aldı ˘gı için normal R-kareden dü¸sük çıkar.
Örnek olarak, çoklu regresyon örne ˘gimizde ¯R2 = 0,88’dir. Bunu
Çoklu Do ˘grusal Regresyon Katsayıların ve modelin kesinli ˘gi
˙Iki De˘gi¸skenli Kalıntı Çizimi
Yakı¸smanın iyili ˘gini ¸sekil üzerinde incelemek de yararlıdır. Burada, yalnızca TV ya da radyo reklamı yapıldı ˘gı zaman modelin satı¸sları yüksek tahmin etti ˘gi görülüyor. Do ˘grusal-dı¸sı bir ili¸ski söz konusu.
Satışlar
TV
Radyo
¸
Sekil 4:Çoklu regresyonda iki de ˘gi¸skenli kalıntı çizimi
Çoklu Do ˘grusal Regresyon Katsayıların ve modelin kesinli ˘gi
Çoklu Regresyonda Bütünün Anlamlılı ˘gı
Regresyonda e ˘ger yakı¸sma düzeyi dü¸sükse bütünün anlamlılı ˘gı
(overall significance) durumuna özellikle bakmak isteriz. Bu, a¸sa ˘gıdaki önsav sınamasını yapmak demektir:
H0: β1= β2= . . . = βp=0 ve H1:En az bir βj 6= 0
Görüldü ˘gü gibi burada tüm katsayıların aynı anda sıfır olup olama-yaca ˘gı sorgulanmaktadır. Bunun için ¸su F -istatisti ˘gi hesaplanır:
F = (TKT − KKT)/p
KKT/(n − p − 1)
E ˘ger regresyon kalıntıları normal da ˘gılımlıysa ve H0do ˘gru ise yu-karıdaki sınama istatisti ˘gi F da ˘gılımına uyar. Bilgisayar bunu ve buna ait p-de ˘gerini kolayca hesaplar ve çıktı olarak verir.
Bu aslında H0:R2=0 sınamasıdır. Yakı¸smanın yoklu ˘gunu ölçer.
Çizelge 4’e dönersek örne ˘gimizde F = 570 oldu ˘gu görülüyor. ˙Ilgili F da ˘gılımında bu de ˘geri bulma p-de ˘geri < 0,0001’tir. Dolayısıyla modelin bütün olarak anlamlı olmadı ˘gı sıfır önsavını reddederiz.
Çoklu Do ˘grusal Regresyon Katsayıların ve modelin kesinli ˘gi
Genel F Sınaması
Yukarıdaki standart F sınaması dı¸sında iste ˘ge göre kendi özel F sınamalarımızı da tasarlayabiliriz. Örnek olarak, ¸sunu sınayalım:
H0: β1=7, β2= β3 ve H1:H0geçerli de ˘gil.
Bu sıfır önsavının geçerli olması durumunda ba¸staki reklam har-camaları modelimiz de ˘gi¸sir ve a¸sa ˘gıdaki gibi olur:
Y − 7X1= β0+ β2(X2+X3) +
Yukarıdaki β0, β2ve de ˘gerleri artık ilk modeldekilerden farklıdır. Sınırladı ˘gımız modeli kullanarak ¸su F istatisti ˘gini hesaplarız:
F = (KKTs− KKTsz)/m
KKTsz/(n − p)
Burada s harfi “sınırlamalı”, sz ise “sınırlamasız” demektir. Ayrıca m harfi sınırlama sayısıdır ve H0’daki = i¸sareti sayısı ile aynıdır. Görüldü ˘gü gibi, genel F sınaması için ba¸staki (sınırlamasız)
mo-del ile H0uygulanmı¸s (sınırlamalı) modeli tahmin edip her ikisinin
KKT de ˘gerlerini kullanırız. Tüm bunlar yine bilgisayarda yapılır.
Çoklu Do ˘grusal Regresyon Katsayıların ve modelin kesinli ˘gi
Önemli Açıklayıcı De ˘gi¸skenler
Çe¸sitli t ve F sınamalarına bakınca bazı X ’lerin anlamlı olma-dı ˘gını bulabiliyoruz. Bu durumda do ˘gal olarak, Y ’yi açıklamada önemli olan de ˘gi¸skenlere karar vermek isteriz.
Bunun için çok fazla sayıda modeli tek tek denemek gerekir. Ancak bunu yapmak zordur. De ˘gi¸sken sayısı p olan bir modelde
2padet farklı alt-model kombinasyonu söz konusudur.
Seçim i¸sini hızlı ve otomatik yapmak için üç klasik yakla¸sım vardır:
˙Ileri seçim(forward selection): Yalnızca sabit terim içeren en basit
modelle ba¸slanır ve KÖH de ˘gerini en çok dü¸süren de ˘gi¸skenler sırayla eklenir. KÖH’ün fazla dü¸smedi ˘gi belli bir noktada durulur.
Geri seçim(backward selection): Ba¸sta tüm de ˘gi¸skenler modele
eklenir ve p-de ˘geri en yüksek olan de ˘gi¸skenler sırayla çıkartılır.
Karma seçim(mixed selection): De ˘gi¸skenler modele tek tek
ekle-nir. Ancak i¸slem sırasında önceki bir de ˘gi¸skenin p-de ˘geri belli bir e¸sikten fazla yükselirse bu de ˘gi¸sken çıkartılır.
Çoklu Do ˘grusal Regresyon Katsayıların ve modelin kesinli ˘gi
Kestirimlerin Güvenilirli ˘gi
Bir model tahmin ederken önemli bir amacımız çe¸sitli X1,X2, . . .Xp
de ˘gerlerine kar¸sılık gelen Y de ˘gerini kestirmektir.
Ancak bu kestirimle ilgili 3 farklı belirsizlik söz konusudur:
1 βˆ0, ˆβ1, . . . , ˆβpkatsayı tahminlerindeki belirsizlik. Bunlar 2. Bö-lümde söz etti ˘gimiz azaltılabilir hatalar ile ilgilidir. Bu belirsizlik
ne-deniyle katsayıgüven aralıklarıhesaplarız.
2 f (X ) fonksiyonundaki belirsizlik. Bu,model yanlılı ˘gıdedi ˘gimiz azaltılabilir hata ile ilgilidir. Burada ¸simdilik bunu yok sayalım.
3 Hata terimi ’dan kaynaklı azaltılamayan hata. Bununla ilgili
olarak Y ile ˆY ’nın farkına yönelikkestirim aralıklarıhesaplarız.
Katsayı güven aralıkları, veri setindeki tüm Y de ˘gerlerine ili¸skin ortalama belirsizli ˘ge ili¸skindir. Kestirim güven aralı ˘gı ise tek bir Y kestirim de ˘gerine ait belirsizli ˘gi gösterir.
Bu yüzden kestirim aralıkları, güven aralıklarından daha geni¸stir. Örneklem ortalamasından uzakla¸stıkça kestirim aralı ˘gı geni¸sler.
Çoklu Do ˘grusal Regresyon Nitel de ˘gi¸skenler
Ders Planı
1 Basit Do ˘grusal Regresyon
Katsayıların tahmini ve yorumu Katsayıların ve modelin kesinli ˘gi
2 Çoklu Do ˘grusal Regresyon
Katsayıların tahmini ve yorumu Katsayıların ve modelin kesinli ˘gi
Nitel de ˘gi¸skenler
Çoklu regresyonun uzantıları
3 Uygulamada Kar¸sıla¸sılan Sorunlar
Modelleme sorunu
Hata teriminde korelasyon Hata teriminde farklıserpilimsellik Dı¸sadü¸senler
Çoklue¸sdo ˘grusallık
Çoklu Do ˘grusal Regresyon Nitel de ˘gi¸skenler
Nitel De ˘gi¸skenler
Bir nicelik yerine sınıflandırma gösteren nitel (qualitative) de
˘gi¸s-kenlerden önceki bölümde söz etmi¸stik.
Regresyon çözümlemesi uygulamalarında X de ˘gi¸skenleri yalnızca nicel de ˘gil, nitel de olabilir.
Örnek olarak, kredi kartı veri setini ele alalım. Bu veri setinde cin-siyet, ırk, medeni durum ve e ˘gitim düzeyi ¸seklinde dört farklı nitel de ˘gi¸sken bulunmaktadır.
Bunların birbirleriyle ve di ˘ger nicel de ˘gi¸skenlerle olan ili¸skisi ¸Sekil
5’teserpilim çizimi matriksi(scatter plot matrix) olarak verilmi¸stir.
Çoklu Do ˘grusal Regresyon Nitel de ˘gi¸skenler
Kredi Kartı Verileri
Borç 20406080100 5 10 15 20 2000 8000 14000 0 500 1500 20 40 60 80 100 Yaş Kart sayısı 2 4 6 8 5 10 15 20 Eğ�t�m Gel�r 50 100 150 2000 8000 14000 L�m�t 0500 1500 24 6 8 50100 150 200 600 1000 200 600 1000 Derece ¸
Çoklu Do ˘grusal Regresyon Nitel de ˘gi¸skenler
˙Iki Düzeyden Olu¸san X De˘gi¸skeni
Basit bir örnek olarak, erkek ve kadınlar arasındaki kredi kartı borcu farkını incelemek istedi ˘gimizi dü¸sünelim.
Bunun için yalnızca iki de ˘ger alabilen basit birgösterge(indicator)
de ˘gi¸skeni ya dakukla(dummy) de ˘gi¸sken olu¸stururuz:
xi = (
1 e ˘ger i’inci ki¸si kadınsa 0 e ˘ger i’inci ki¸si erkekse Daha sonra bu de ˘gi¸skeni regresyonumuzda kullanırız:
yi = β0+ β1xi+ i = (
β0+ β1+ i e ˘ger i’inci ki¸si kadınsa
β0+ i e ˘ger i’inci ki¸si erkekse
Bu modelde β0 de ˘geri erkeklerdeki ortalama kredi kartı borcunu
gösterir. β0+ β1ise kadınlar için ortalama borçtur.
Dolayısıyla β1burada kadınların erkeklere göre borçfarkıolur.
Kime 0 ya da 1 de ˘geri verdi ˘gimiz sonucu de ˘gi¸stirmez. E ˘ger
erkek-lere 1 dersek bu sefer β1erkeklerin kadınlara göre farkını verir.
Çoklu Do ˘grusal Regresyon Nitel de ˘gi¸skenler
Kukla De ˘gi¸skende −1, 1 Kodlaması
Kukla de ˘gi¸skenlere 0 ve 1 de ˘gerleri vermek yerine −1 ve 1 de ˘ger-lerini de kullanabiliriz:
xi = (
1 e ˘ger i’inci ki¸si kadınsa
−1 e ˘ger i’inci ki¸si erkekse
Yeni durumda model belirtimi a¸sa ˘gıdaki gibi olur: yi = β0+ β1xi+ i =
(
β0+ β1+ i e ˘ger i’inci ki¸si kadınsa β0− β1+ i e ˘ger i’inci ki¸si erkekse
Burada β0parametresi kadın/erkek ayrımı yapılmaksızın ortalama
kart borcudur. β1ise kadınların bu ortalamanın ne kadar üstünde
ve erkeklerin de ortalamanın ne kadar altında oldu ˘gunu verir. Bu modelin sonuçları önceki model ile aynı çıkar. Aradaki tek fark yorumdadır.
Öte yandan, uygulamada kukla de ˘gi¸skenleri 0 ve 1 ¸seklinde kod-lamak daha yaygındır.
Çoklu Do ˘grusal Regresyon Nitel de ˘gi¸skenler
˙Ikiden Fazla Sınıftan Olu¸san X De˘gi¸skeni
Sınıf sayısı ikiden çoksa daha fazla kukla de ˘gi¸sken kullanırız: xi1 =
(
1 e ˘ger i’inci ki¸si Asyalıysa 0 e ˘ger i’inci ki¸si Asyalı de ˘gilse xi2=
(
1 e ˘ger i’inci ki¸si beyazsa
0 e ˘ger i’inci ki¸si beyaz de ˘gilse Böylece, model a¸sa ˘gıdaki gibi olur:
yi = β0+ β1xi1+ β2xi2+ i =
β0+ β1+ i i’inci ki¸si Asyalıysa β0+ β2+ i i’inci ki¸si beyazsa
β0+ i i’inci ki¸si zenciyse
Her zaman sınıf sayısından bir eksik kukla de ˘gi¸sken olmalıdır.
Kuklası olmayan sınıfatemelya dakar¸sıla¸stırmasınıfı denir.
Bu modelde β1, Asyalıların zencilere göre borç farkını, β2 ise
be-yazların yine zencilere göre borç farkını gösterir.
Çoklu Do ˘grusal Regresyon Nitel de ˘gi¸skenler
Kukla De ˘gi¸skenlerin Yorumlanması
Kredi kartı borçlarını etnik kökene göre inceleyen regresyon tah-minleri a¸sa ˘gıdaki gibidir:
De ˘gi ¸sken Katsayı Ölçünlü hata t-istatisti ˘gi p-de ˘geri Sabit terim 531,00 46,32 11,464 <0,0001
Asyalı −18,69 65,02 −0,287 0,7740
Beyaz −12,50 56,68 −0,221 0,8260
Çizelge 5:Kredi kartı borcu ile etnik köken çoklu regresyonu
Çizelgede taban sınıf olan zenciler için ortalama kredi kartı borcu 531 dolardır. Bu miktar Asyalılar için 18,69 dolar, beyazlar için ise 12,50 dolar daha dü¸sük bulunmu¸stur.
Ancak Asyalılar ve beyazlara ait katsayılerın p-de ˘gerleri yüksektir. Bu durumda üç grup arasında anlamlı bir fark yoktur diyebiliriz. Öte yandan katsayılar ve p-de ˘gerleri kuklaların nasıl
belirlendi-˘gine de ba ˘glıdır. Dolayısıyla, bu konuda kesin karar vermek için
Çoklu Do ˘grusal Regresyon Çoklu regresyonun uzantıları
Ders Planı
1 Basit Do ˘grusal Regresyon
Katsayıların tahmini ve yorumu Katsayıların ve modelin kesinli ˘gi
2 Çoklu Do ˘grusal Regresyon
Katsayıların tahmini ve yorumu Katsayıların ve modelin kesinli ˘gi Nitel de ˘gi¸skenler
Çoklu regresyonun uzantıları
3 Uygulamada Kar¸sıla¸sılan Sorunlar
Modelleme sorunu
Hata teriminde korelasyon Hata teriminde farklıserpilimsellik Dı¸sadü¸senler
Çoklue¸sdo ˘grusallık
4 K-Enyakın Kom¸su Regresyonu
Çoklu Do ˘grusal Regresyon Çoklu regresyonun uzantıları
Toplanırlık ve Do ˘grusallık Varsayımları
Do ˘grusal regresyon modeli yorumlaması oldukça kolay ve çıkar-sama için de yararlı sonuçlar üretir.
Ancak bunu genellikle uygulamada geçerli olmayan iki kısıtlayıcı varsayım pahasına yapar:
1 Y ve X ’ler arasındatoplanır(additive) bir ili¸ski vardır.
2 Y ve X ’ler arasındado ˘grusal(linear) bir ili¸ski vardır. Toplanır ili¸ski, belli bir Xj’nin Y üzerindeki etkisinin di ˘ger X ’lerden ba ˘gımsız olması anlamına gelir.
Do ˘grusal ili¸ski ise Xj’deki bir birim de ˘gi¸sikli ˘gin Y ’ye etkisinin hep
sabit olması, Xj’nin büyüklü ˘günden etkilenmemesi demektir.
¸
Çoklu Do ˘grusal Regresyon Çoklu regresyonun uzantıları
Etkile¸sim Terimi
˙Ilk olarak, toplanırlık varsayımını ele alalım. A¸sa˘gıdaki üç de˘gi¸s-kenli modeli inceleyelim:
Y = β0+ β1X1+ β2X2+
Burada X1e ˘ger 1 birim artarsa Y de ortalama β1birim
artmakta-dır. Öte yandan bu etki X2’den ba ˘gımsızdır. X2 sıfır da olsa,
yük-sek bir de ˘ger de alsa etki sabittir.
Bu durum gerçek ya¸samda geçerli olmayabilir. Örnek olarak, TV reklamının etkisi radyo reklamının varlı ˘gıyla güçlenebilir.
Pazarla-mada bunasinerji(synergy) etkisi denilmektedir.
Bu etkiyi dikkate almanın bir yolu yeni bir de ˘gi¸sken eklemektir: Y = β0+ β1X1+ β2X2+ β3X1X2+
Burada β3’eetkile¸sim terimi (interaction term) denir. Adından da
anla¸sıldı ˘gın gibi bu terim X1ve X2arasındaki etkile¸simi ölçer. Yeni de ˘gi¸skeni X1ile X2’yi çarparak bizim olu¸sturdu ˘gumuza dikkat ediniz.
Çoklu Do ˘grusal Regresyon Çoklu regresyonun uzantıları
Etkile¸sim Teriminin Yorumu (1)
Etkile¸sim terimini anlamak için reklam örne ˘gimize geri dönelim:
Satı¸s = β0+ β1TV + β2Radyo + β3(TV × Radyo) +
Yukarıdaki modeli yorumlamayı kolayla¸stırmak amacıyla iki farklı ¸sekilde yeniden yazabiliriz:
Satı¸s = β0+ (β1+ β3× Radyo)TV + β2Radyo +
Satı¸s = β0+ (β2+ β3× TV) Radyo + β1TV +
Görüldü ˘gü gibi, etkile¸sim terimi içeren modelde TV reklamının
sa-tı¸slara etkisi artık β1+ β3× Radyo harcaması kadardır.
Benzer ¸sekilde radyo reklamının etkisi de β2 + β3 × TV reklam
Çoklu Do ˘grusal Regresyon Çoklu regresyonun uzantıları
Etkile¸sim Teriminin Yorumu (2)
Modele ait regresyon tahmin sonuçları a¸sa ˘gıda verilmi¸stir:
De ˘gi ¸sken Katsayı Ölçünlü hata t-istatisti ˘gi p-de ˘geri Sabit terim 6,7502 0,248 27,23 <0,0001
TV 0,0191 0,002 12,70 <0,0001
Radyo 0,0289 0,009 3,24 0,0014
TV×Radyo 0,0011 0,000 20,73 <0,0001
Çizelge 6:Satı¸slar ile TV ve radyo reklamları etkile¸simli regresyonu
Yukarıda etkile¸sim teriminin anlamlı oldu ˘gu görülmektedir. Ayrıca
etkile¸simin eklenmesiyle R2de 0,897’den 0,968’e yükselmi¸stir.
Burada artık bir reklam türünün etkisi di ˘gerinin miktarına ba ˘glıdır. Örnek olarak, radyo reklam harcaması 1000 dolar iken 1000 do-larlık TV reklamının satı¸slara etkisi 19,1 + 1,1 × 1 = 20,2 adettir. Radyo reklamı 5000 dolar oldu ˘gunda ise aynı 1000 dolarlık TV reklamının etkisi artarak 19,1 + 1,1 × 5 = 24,6’ya yükselir. Radyo reklamlarının etkisi de buna benzer ¸sekilde hesaplanır.
Çoklu Do ˘grusal Regresyon Çoklu regresyonun uzantıları
Kukla Etkile¸sim Terimi (1)
Etkile¸sim terimlerini kukla de ˘gi¸skenlerle de kolayca kullanabiliriz. Örnek olarak, kredi kartı borcunun gelire ve ö ˘grenci olma
niteli-˘gine göre regresyonu etkile¸sim terimiyle birlikte ¸söyle modellenir: Borç = β0+ β1Gelir + β2Ö ˘grenci + β3(Gelir × Ö ˘grenci) + Bu durumda a¸sa ˘gıdaki regresyon tahmin edilmi¸s olur:
Borç = (
(β0+ β2) + (β1+ β3)Gelir e ˘ger ö ˘grenci ise
β0+ β1Gelir e ˘ger ö ˘grenci de ˘gilse
Yukarıda β2, ikinci do ˘grunun (ö ˘grenci olmanın) sabit terim farkı
olarak yorumlanır. β3ise ikinci do ˘grunune ˘gim farkıolur.
Dolayısıyla aslında iki ayrı regresyon do ˘grusu tahmin etti ˘gimize dikkat ediniz. Bunlar ¸Sekil 6’da gösterilmi¸stir.
Çoklu Do ˘grusal Regresyon Çoklu regresyonun uzantıları
Kukla Etkile¸sim Terimi (2)
0 50 100 150 200 600 1000 1400 Gelir Bor ç öğrenci öğrenci değil ¸
Sekil 6:Kredi borcunun gelire ve ö ˘grenci olma niteli ˘gine göre regresyonları
Çoklu Do ˘grusal Regresyon Çoklu regresyonun uzantıları
Polinom Regresyonu (1)
Do ˘grusallık varsayımının uygulamada regresyon modelleri için bir kısıtlama olu¸sturdu ˘gunu yukarıda söylemi¸stik.
Do ˘grusal-dı¸sı ili¸skileri dikkate almanın basit bir yolupolinom
reg-resyon(polynomial regression) modelidir.
Örnek olarak, yakıt tüketimi ile motor gücünü a¸sa ˘gıdaki gibi ikinci derece bir polinom regresyonuna yakı¸stırabiliriz:
Yakıt tüketimi = β0+ β1Güç + β2Güç2+
Daha yüksek derece polinom regresyonları da buna benzerdir:
Yakıt tüketimi = β0+ β1Güç + β2Güç2+ · · · + βp Güçp+
Bu modellerde regresyon çizgisi bir do ˘gru de ˘gil, e ˘gri ¸seklindedir. Dolayısıyla X ’in Y ’ye etkisi X ’in büyüklü ˘güne göre de ˘gi¸sir.
Otomobil veri seti kullanılarak tahmin edilmi¸s do ˘grusal model ile
Çoklu Do ˘grusal Regresyon Çoklu regresyonun uzantıları
Polinom Regresyonu (2)
¸
Sekilde 2. derece polinom regresyonunun verilere iyi yakı¸stı ˘gı, 5. derece polinomun ise gereksiz derecede kıvrımlı oldu ˘gu görül-mektedir. Dolayısıyla esneklik seçimi burada da önemlidir.
50 100 150 200 10 20 30 40 50 Beygir gücü Galon ba şı na mil Doğrusal 2. derece 5. derece ¸
Sekil 7:Yakıt tüketimi ile motor gücüne ili¸skin polinom regresyonlar
Uygulamada Kar¸sıla¸sılan Sorunlar Modelleme sorunu
Ders Planı
1 Basit Do ˘grusal Regresyon
Katsayıların tahmini ve yorumu Katsayıların ve modelin kesinli ˘gi
2 Çoklu Do ˘grusal Regresyon
Katsayıların tahmini ve yorumu Katsayıların ve modelin kesinli ˘gi Nitel de ˘gi¸skenler
Çoklu regresyonun uzantıları
3 Uygulamada Kar¸sıla¸sılan Sorunlar
Modelleme sorunu
Hata teriminde korelasyon Hata teriminde farklıserpilimsellik Dı¸sadü¸senler
Çoklue¸sdo ˘grusallık
Uygulamada Kar¸sıla¸sılan Sorunlar Modelleme sorunu
Uygulamada Kar¸sıla¸sılan Sorunlar
Bir veri setine regresyon modeli yakı¸stırdı ˘gımız zaman çe¸sitli so-runlarla kar¸sıla¸sabiliriz. Bunların ba¸slıcaları ¸sunlardır:
1 Modelleme hatası
2 Hata teriminde korelasyon
3 Hata teriminde farklıserpilimsellik
4 Dı¸sadü¸senler
5 E¸sdo ˘grusallık
Yukarıdaki hataları saptamak ve düzeltmek oldukça ayrıntılı ba¸s-lıklardır. Bu konularda yazılmı¸s birçok kitap bulunmaktadır. Burada biz uygulamada kar¸sıla¸sılan olası sorunları kısa ve öz bir