• Sonuç bulunamadı

3.5. Parametrik Olmayan Mekânsal Regresyon Modelleri

3.5.1. Yerel Polinomiyal Regresyon Modelleri

İlk kez Cleveland (1979) tarafından önerilen Yerel Polinomiyal Regresyon Modelleri, yerel ortalama (Local Averaging) prensibine dayalıdır. Yerel ortalamanın temel mantığı ise, regresyon fonksiyonunun düzgün olmasını sağlamaktır (Fox, 2005: 25).

Diğer Parametrik Olmayan Regresyon Modelleri’nden farklı olarak Yerel Polinomiyal Regresyon Modelleri, doğrudan basit regresyondan çoklu regresyona genişletilebilir. Ayrıca, Yerel Polinomiyal Regresyon Modelleri’nin de uygulanması oldukça kolay olup normal dağılmayan veri setlerine de uygulanabilir. Son olarak, Yerel Polinomiyal Regresyon Modelleri en çok kullanılan Parametrik Olmayan Regresyon Modelleri’nden olup kısaca LOWESS ya da LOESS olarak adlandırılır 7 (Fox, 2000a: 8). LOWESS ile LOESS arasında pratikte küçük bir farklılık vardır; LOWESS için Yerel Regresyon tahmin sürecinde ağırlıklar kullanılırken, LOESS’te ağırlık kullanılmamaktadır (Keele, 2008: 28).

Yerel Polinomiyal Regresyon Modeli’nin amacı keyfi olarak belirlenen herhangi bir gözlem değeri için, xx0, regresyon fonksiyonunu tahmin etmektir. Bu amaçla

x

0’a

yakın olan x’lerden oluşan veri seti için bağımlı değişken y’nin, açıklayıcı değişken x’ler üzerine regresyonu oluşturularak regresyon modeli ağırlıklandırılmış en küçük kareler yöntemiyle tahmin edilir. Ağırlıklandırma için kernel fonksiyonları, K(xx0), kullanılır. Buna göre, x0’a yakın olan gözlemlere en büyük ağırlık verilirken, x’ler

x

0’dan

uzaklaştıkça daha küçük ağırlıklar alırlar. Ayrıca, x’ler ile x0 arasındaki mutlak uzaklık

arttıkça regresyon fonksiyonunun düzgünlüğü bozulur. Bu özellikler verili olduğunda, kernel fonksiyonunun seçimi kritik değildir. x0’ın yakınındaki gözlemler için ağırlıkların

belirlenmesinde tricube kernel fonksiyonu daha önemlidir (Fox ve Weisberg, 2010: 3). Buna göre

i (xix0)/h, x0 ile i. gözlem değeri arasındaki ölçeklendirilmiş uzaklık

olsun, tricube kernel fonksiyonu (3.54)’te olduğu gibi ifade edilir.

     0 ) | | 1 ( ) ( 3 3   T K (3.54)

7 LOWESS, Yerel Olarak Ağırlıklandırılmış Dağılım Grafiği Düzgünleştiricisi ve LOESS, Yerel Dağılım Grafiği Düzgünleştiricisi ifadelerinin İngilizce kısaltmalarıdır.

|z|<1 için, |z|≥1 için

Tricube kernel fonksiyonuna göre,

x

0’a h’den daha uzak olan gözlemler için 0 ağırlığı verilir, böylece Yerel Regresyon’dan bu gözlemler dışlanmış olur. Burada h değeri, yerel regresyon düzgünleştiricisi ya da düzgünleştirme parametresi olarak adlandırılır. Yerel düzgünleştirme parametresi sabit de olabilir, x0’a en yakın komşu gözlemlerin sabit bir oranı da olabilir. Bu oran, aralık (Span) adını alır ve s ile ifade edilir. Yerel tahminde yer alan gözlem sayısı, m=[n*s]’dir ve bu sayı en yakın tam sayıya yuvarlanan tam sayıyı ifade eder.

p. dereceden Yerel Polinomiyal Regresyonu, kernel ağırlıkları kullanılarak

Ağırlıklandırılmış En Küçük Kareler Yöntemi ile

m i i i w 1 2 2

ifadesini minimize edecek

şekilde tahmin edilir.

i p i p i i i x x x x x x Y  1(  0)2(  0)2 ... (  0)  (3.55)

Yerel regresyon süreci en uygun regresyon doğrusu belirleninceye kadar devam eder ve uygulamada her bir gözlem değeri (xi’ler)

x

0 olarak alınır.

Yerel Polinomiyal Regresyon’da iki önemli seçim vardır; birincisi, Yerel Polinomiyal Model’in mertebesini (p) belirlemek ve ikincisi, yerel düzgünleştirme parametresini/aralığı belirlemektir. Yerel Polinomiyal Regresyon Modeli’nde aralık seçimi oldukça önemlidir; çünkü aralık seçimleri tahmin sonuçlarını etkileyecektir. Buna göre aralık çok geniş seçilirse tahmin sonuçları sapmalı olacaktır; aralık çok küçük seçilirse sapma azalacak ancak varyans büyüyecektir, bu ise güven aralıklarını etkileyecektir. Dolayısıyla aralık seçiminde eksik düzgünleştirmeyle aşırı düzgünleştirme arasında bir seçim yapılması gerekir. Aşırı düzgünleştirme gerçek regresyon fonksiyonunun biçimini bozarken, eksik düzgünleştirme güven aralıklarının tahminini etkileyecektir. Aralık seçiminde amaç, veri setinin sahip olduğu özellikleri yok etmeden mümkün olduğu kadar düzgün tahminler verecek bir aralık belirlemektir. Bunun için ideal aralık hem sapma hem de varyansı minimize eden aralıktır. Bu aralık seçimi ise

x

0 için elde edilen ortalama hata kare ifadesinin minimizasyonuna dayanır.

) | ˆ ( ) | ˆ ( ] )) | | ˆ [( ) | ˆ (y x0 E y x0 y x0 2 Varyans y x0 sapma2 y x0 OHK     (3.56)

Yerel Polinomiyal Regresyon’da aralık/düzgünleştirme parametresinin seçimi subjektif bir yaklaşımla ya da daha formal bir yaklaşım olan çapraz geçerlilik fonksiyonunun minimizasyonu ile yapılır (Fox, 2000a: 10-11).

Subjektif yaklaşımda en uygun regresyon eğrisini veren en küçük h ya da s değeri seçilir. Çapraz geçerlilik yaklaşımında ise çapraz geçerlilik fonksiyonunu,

n y s y s ÇG n i i i

    1 2 ) ( ˆ )

( ,minimize eden aralık(s) seçilir. Buradayˆi(s) yˆ|xi,

dışlanan i. gözlem için elde edilen tahmini değerdir.

Eşitlik (4.7)’de ifade edilen Yerel Polinomiyal Regresyon Modeli’nde p=3 olması durumunda “Yerel Kübik Polinomiyal Modeli”; p=2 olması durumunda “Yerel Kuadratik Regresyon Modeli” ve p=1 olması durumunda “Yerel Doğrusal Regresyon Modeli” ve p=0 olması durumunda ise, “Yerel Sabit ya da Kernel Regresyon Modeli” elde edilir.

Yerel Polinomiyal Regresyonun derecesi arttıkça esneklik daha da artar; esnekliğin artması ise sapmanın azalmasını sağlar, ancak esnekliğin artması ile birlikte katsayıların artmasından dolayı tahmin sonuçlarındaki değişkenlik de artacağından varyans da giderek artacaktır (Fox, 2005: 40). Dolayısıyla, Yerel Polinomiyal Regresyon Modeli’nde derece seçimi tahmin sonuçları üzerinde, aralık seçimine göre daha küçük bir etkiye sahip olmasına rağmen Yerel Polinomiyal Regresyon tahminlerinde dikkat edilmesi gereken noktalardan biridir. Aslında, polinomiyalin derecesi ile aralık seçiminin parametrik olmayan tahmin sonuçları üzerinde çelişen etkileri vardır. Eğer aralığı sabit tutup Yerel Doğrusal Regresyon Modeli’ni Yerel Kuadratik Regresyon Modeli ile karşılaştırırsak kuadratik tahminler daha değişken olacaktır, ancak artan bu değişkenlik aralığın uyarlanmasıyla kompanse edilebilir. Loader (1999), düşük dereceden bir polinomiyal seçip uyarlama için aralığı kullanmayı önermiştir. Cleveland (1993) ise, ikiden fazla dereceye sahip Yerel Polinomiyal Regresyon Modelleri için bu yaklaşımın tahmin üzerinde bir etkisinin olmayacağını ileri sürmüştür. Pratikte ise, polinomiyalin derecesi genellikle kuadratik olarak belirlenir ve aralık seçimiyle uyarlanmaz.

Son olarak lowess için farklı ağırlık fonksiyonları seçilebilir ve bu seçimlerin sapma-varyans ilişkisi üzerinde çok küçük etkileri vardır. Cleveland (1993)’in de önerdiği üzere LOWESS için en çok kullanılan ağırlık fonksiyonu “tricube” ağırlık fonksiyonudur, ancak diğer ağırlık fonksiyonlarını kullanmamak için de herhangi bir sebep yoktur (Keele, 2008: 26-36).