• Sonuç bulunamadı

Genel Yanlı Kestiriciler İçin Tanılama Ölçüleri

4. GENEL YANLI KESTİRİCİLER İÇİN TANILAMA ÖLÇÜLERİ

4.1. Genel Yanlı Kestiriciler İçin Tanılama Ölçüleri

Genel yanlı sınıf kestiricileri; = şeklinde yazılabilen kestiricilerdir ( ≠ ). Yanlılık matrisi nin farklı seçimleri ile ridge, genelleştirilmiş ridge modified ridge, temel bileşenler, ondalık rank, Stein, Liu, genelleştirilmiş Liu ve modified Liu kestiricileri elde edilebilmektedir. EKK kestiricisinde olduğu gibi, bu kestiriciler içinde tanılama ölçüleri verilebilir. Yanlı sınıf kestiricileri için tanılama ölçüleri genel olarak, yanlılık matrisi ve yanlılık parametrelerinin bir fonksiyonu olarak yazılabilmektedir. Böylece bu sınıf içerisinde yer alan herhangi bir kestirici için ve lerin özel seçimleriyle tanılama ölçüleri verilebilir.

4.1.1. Genel Yanlı Sınıf Kestiriciler İçin Rezidü ve Leverage Ölçüleri

Bölüm 2 de EKK için verilen etki ölçüleri, leverage ve rezidülerin bir fonksiyonu olarak yazılabilmekteydi, Genel yanlı kestiriciler için de rezidü ve leverage değerleri, etki ölçülerinin oluşturulmasında önemli rol oynamaktadır. Genel yanlı sınıf kestiriciler için uydurulmuş değer vektörü , = tekil değer

ayrışımı (Mandel, 1982) (burada ; matrisinin özdeğerlerinin pozitif kareköklerinden oluşan × tipinde köşegen matris, ; kolonları matrisinin özdeğerlerine karşılık gelen özvektörlerden oluşan × tipinde ortogonal matris ve ; kolonları matrisinin sıfırdan farklı özdeğerine karşılık gelen özvektörler olan × tipinde ortogonal matristir) ve buradan = ⋀ ( ) = olmak üzere;

= = = = ( ) = (4.1)

ifadesi elde edilir. (4.1) ifadesi kullanılarak i-inci uydurulmuş değer = 1,2, … , için;

= = ∑

şeklinde ifade edilir. matrisi tam olarak şapka matris değildir; fakat şapka

matrisine benzer özelliklere sahiptir. matrisi simetrik bir matristir; fakat ( ) = olup = olması durumu dışında idempotent bir matris değildir.

matrisi ile şapka matrisi arasında;

= ( ) = [ − ( − )] = − ( − )

şeklinde bir ilişki vardır. Bu durumda matrisinin elemanları, ℎ = ∑

ve ℎ = ∑ olmak üzere;

= ℎ − ∑ (1 − ) (4.2)

= ℎ − ∑ (1 − ) = ∑ (4.3)

şeklinde elde edilir. (4.3) ifadesinde (1 − ) ≥ 0 olduğundan; = 1,2, … , için ℎ ≥ ℎ olacaktır. Ayrıca her için ℎ değerindeki azalma aynı değildir ve

yanlılık parametrelerine bağlı olarak değişebilir. matrisinin izi (trace) olarak adlandırılır ve bu değer ye yaklaştıkça matrisi şapka matrisi gibi davranır. ℎ değerleri ℎ ile aynı rolü oynamaktadır ve bu nedenden dolayı ℎ ( = 1,2, … , ) genel yanlı kestiriciler için leverage değeri olarak adlandırılır.

, yanıt vektörünün de uydurulmuş değerlere yakın olması, başka bir ifade ile rezidünün küçük olması beklenir. Genel yanlı kestiriciler için alışılmış rezidü vektörü;

= − = − = ( − ) (4.4)

şeklinde ifade edilir. (4.4) de ( − ) ifadesinin yerine − + − yazarsak

= ( − ) + ( − )

= + ( − ) (4.5)

ifadesi elde edilir. (4.5) ifadesinde ( − ) matrisi gerek matrisi gerekse üzerinde yanlılık parametrelerinin etkisini göstermektedir. Özel olarak −inci alışılmış rezidü;

= + ∑ (1 − ) (4.6)

şeklinde elde edilir. ve için; ℎ ≥ ℎ gibi benzer bir karşılaştırma söz konusu değildir. Çünkü (4.6) ifadesinde toplamdaki ikinci terim matrisinin elemanlarına bağlı olarak pozitif ya da negatif olabilir. Dolayısıyla bu terime bağlı olarak , EKK kestiricisi rezidüsünden daha büyük ya da daha küçük olabilir.

Genel yanlı sınıf için elde edilen ve ℎ değerleri, bu sınıf için özelleştirilebiliriz. Bu sınıfta yer alan yanlı kestiriciler için, Bölüm 3 de verilen yanlılık parametreleri yerine yazılırsa özel olarak bu kestiriciler için rezidü ve leverage değerlerini tanımlayabiliriz. Örneğin Liu kestirici için leverage değeri;

= ∑ (4.7)

şeklinde elde edilir. (4.7) ifadesini kullanarak önemli sonuçlar elde edilebiliriz. İlk olarak daha önce de belirtildiği gibi Liu kestiricisi için leverage değerleri EKK kestiricisi leverage değerinden daha küçüktür. İkinci olarak değeri arttıkça leverage değeri artmaktadır ve bu artmanın oranı −inci satırın özvektörlerle olan konumuna göre değişir. Liu kestiricisi için −inci alışılmış rezidü ise;

= + (1 − ) ∑ (4.8)

şeklinde elde edilir. (4.8) ifadesinin toplamdaki ikinci terim pozitif ya da negatif olabileceğinden, Liu kestiricisi için rezidü değerinin genel olarak EKK kestiricisi rezidüsünden daha büyük veya daha küçük olduğu söylenemez.

4.1.2. Genel Yanlı Sınıf Kestiricileri İçin Etki Ölçüleri

Bölüm 2.1.4. de tek gözlem için etki ölçüleri verilmişti. Walker (1990) bu ölçülerden, Cook Uzaklığını ( ) ve Welsch- Kuh ( İ ) Uzaklığı ölçülerini genel yanlı sınıf içerisinde yer alan kestiriciler için tanımlamıştır. Genel yanlı sınıf için Welsch- Kuh Uzaklığı;

İ = = ( )

şeklinde tanımlanır. Herhangi yanlılık matrisi için;

( ) = ( ) = ( ) = ( )

şeklinde ve -inci gözlem için ( ) = ( ) = ∑ ℎ olmak üzere;

= ( ) =

ile verilir. Bu durumda genel yanlı sınıf kestiricileri için Welsch- Kuh Uzaklığı;

İ = = ( )

( ) = 1,2, … , (4.9)

şeklinde ifade edilir. Genel yanlı sınıf kestiriciler için Cook Uzaklığı;

= ( ) ( ) = 1,2, … , (4.10)

şeklinde tanımlanır. uydurulmuş değerlerin ve yanıt değişkenlerinin fonksiyonu olup, matrisinin özdeğerlerine bağlı değildir. Dolayısıyla çoklu iç ilişki probleminden etkilenmez (Walker ve Birch, 1988). Bu nedenden dolayı parametresinin kestiricisi olarak EKK yönteminden elde edilen kullanılmıştır.

(4.9) ve (4.10) ölçüleri elde edilirken, her bir gözlem çıkartıldıktan sonra uydurulmuş değerler ve parametre kestirimleri tekrar hesaplanmalıdır. Genel yanlı sınıfta yer alan kestiriciler ölçeklemeye bağımlı olduğundan; her bir gözlem çıkartıldıktan sonra açıklayıcı değişkenler matrisinin, ( ) ( ) korelasyon formunda olacak şekilde yeniden merkezleştirilip, ölçeklendirilmesi gerekmektedir. EKK kestiricisi için verilen tanılama ölçülerini, tam model için elde edilen leverage ve rezidünün bir fonksiyonu olarak yazılabiliyorduk. Ancak genel yanlı sınıf kestiricileri için tanılama ölçüleri, bu şekilde tam olarak elde edilemezler, sadece yaklaşık formüller verilebilir. Dolayısıyla eğer yanlı kestiriciler için tanılama ölçüleri tam olarak elde edilmek isteniyorsa, ilgili gözlem çıkartıldıktan sonra tüm kestiriciler yeniden hesaplanmalıdır. Diğer taraftan tanılama ölçülerinin leverage ve rezidü cinsinden yazılması uygulamada oldukça kullanışlıdır. Bu nedenden dolayı ( )

değerinin, ve tam model rezidü ve leverage değerleri kullanılarak elde edilmesi konusunda çeşitli yaklaşımlar önerilmiştir.

Özel olarak ridge kestiricisi kullanılarak önerilen yöntemler verilebilir.

( ) = ( ) ( )+ ( ) ( ) olmak üzere ( ) değerini tam olarak hesaplamak için, ( ) birim kolon uzunlukta olacak şekilde yeniden ölçeklendirilmelidir. Aksi takdirde ( ) ( ) korelasyon matrisi formunda olmayacaktır. -inci gözlem çıkartıldıktan sonra matrisinin merkezileştirilmiş formu ( )∗∗, merkezileştirilip ölçeklendirilmiş formu ise ( ) ile gösterilmek üzere;

( ) = ( )∗∗ ( ) = ( )∗∗ 1 − = 1,2, … , , = 1,2, … ,

şeklinde ifade edilir. Böylece,

( )

( ) = ( ) ( ) =

olarak elde edilir. Eğer korelasyon matrisinin köşegen elemanlarına sabiti eklenirse;

= + − olmak üzere;

= + = ( ) ( )

ifadesi elde edilir. Böylece -inci gözlem çıkartıldıktan sonra elde edilen gerçek ridge kestiricisi;

( ) = ( ) +

şeklinde ifade edilir. Yukarıda görüldüğü gibi ridge kestiricisi oldukça karmaşık işlemler sonucu elde edilmektedir. Bu işlem karmaşıklığını önlemek amacıyla ( ) için çeşitli yaklaşımlar önerilmiştir.

i) Birinci yaklaşım: Walker ve Birch (1988) tarafından;

( )

(4.11) şeklinde önerilmiştir. (4.11) ile verilen bu yaklaşık değer yüksek leverage noktaları iyi sonuç vermemektedir.

ii) İkinci yaklaşım: Billor (1992) tarafından, ≅ (1 √ ⁄ ) varsayımını kullanarak

önerilmiştir. Bu varsayım kullanarak elde edilen yaklaşık ridge kestiricisi = ( + ) olmak üzere;

( ) ( ) +

+ (4.12) şeklinde ifade edilir. (4.12) ifadesi n (gözlem sayısı) arttıkça daha iyi sonuç veren bir yaklaşımdır.

iii) Üçüncü yakalaşım: Billor (1992) tarafından, iteratif bir yöntem kullanılarak önerilmiştir. Başlangıç değeri tam model için ridge kestiricisi, iterasyon sayısı ve = matrisi olmak üzere iteratif kestirici;

( )

= − 1 ( ) + ( ) + + − 1

− − 1

olarak hesaplanır. İşleme bu şekilde iteratif olarak devam edilir. İteresyon sayısı arttıkça gerçek parametre kestirimi ( ) değerine daha çok yaklaşır.

Böylece ridge kestiricisi için -inci gözlem çıkartıldıktan sonra, parametresinin kestirimi için üç farklı yaklaşık değer önerilmiştir. Bu çalışmada işlem kolaylığı açısından, Walker ve Birch tarafından (4.11) ile verilen yaklaşım kullanılacaktır. Ridge kestiricisi için verilen bu yaklaşımı, yanlı sınıf için

genelleştirebiliriz. Genel yanlı sınıf kestiricileri; = ×

× , = 0 × × ve = ( − ) olmak üzere;

= ( ) = ( + ) =

ifadesi elde edilir. Dikkat edilirse matrisi matrisinin tekil değer ayrışımına dayalıdır. Eğer matrisinin bir satırı çıkarılırsa, tekil değer ayrışımı ve dolayısıyla matrisi değişecektir. Ancak matrisinin sabit kaldığı varsayımıyla;

( ) ≅ ( − + ) ( − )

ifadesi elde edilir. Burada Sherman-Morrison-Woodbury teoremi (Belsley ve ark., 1980) kullanılarak = + = olmak üzere;

( ) = + ( − )

ile verilir. Burada = alınıp, bir dizi işlemlerin yapılmasıyla;

( ) =

(4.13) ifadesi elde edilir. (4.13) ifadesi kullanılarak elde edilen ve ölçüleri leverage ve rezidünün fonksiyonu olarak yeniden yaklaşık olarak tanımlanabilir. Bu ölçülerden ölçüsü;

≅ İ ≅

( )

= 1,2, … , (4.14)

şeklinde ifade edilir. Benzer şekilde ölçüsü;

= 1,2, … , (4.15) şeklinde ifade edilir.

Chalton ve Troskie (1992) ridge ve ondalık temel bileşenler kestiricisi için verilen ve ölçüleri için eşik değer konusunda simülasyon çalışması yapmışlardır. Ancak simulasyon çalışması sonucunda önerilen eşik değerlerin, ridge ve ondalık rank kestiricileri için çok fazla kullanışlı olmadıkları sonucuna ulaşılmıştır. Dolayısıyla EKK kestiricisi için tanılama ölçülerinde olduğu gibi, elde edilen sonuçların karşılaştırılıp farklı davranan gözlemlerin belirlenmesi daha sağlıklıdır.

4.1.3. Genel Yanlı Sınıf İçin Tanılama Ölçülerine Farklı Bir Yaklaşım

Bölüm 4.1.2. de verilen etki ölçülerinde parametresinin EKK kestiricisi kullanılmıştı. yerine ile gösterilen;

= = (4.16)

şeklinde ifade edilir. (4.16) ifadesi kullanılarak ve ölçülerini yeniden elde edebiliriz. ( ) için de (4.13) ifadesi ile verilen yaklaşık değer kullanılacaktır.

( ) = − − − ( )( ) ( ) ( )( ) ( ) şeklinde olup, gerekli işlemler yapılırsa;

( ) = − 2 +

ifadesi elde edilir. Burada;

=

= 1,2, … , olarak tanımlanır.

5. UYGULAMA

Bu bölümde iki farklı uygulama yapılacaktır. İlk uygulama 2. Bölümde EKK kestiricisi için verilen uzaklık ölçüleri yardımıyla tek sapan gözlemlerin belirlenmesi, ikinci uygulamada ise 4. Bölümde verilen uzaklık ölçüleri yardımıyla tek sapan gözlemlerin belirlenmesidir.

5.1. Gelişmiş Ülkelerdeki Yaşam Döngü Tasarrrufu Verisi

Arlie Sterling (1977), Franco Modigliane (1975) tarafından geliştirilmiş yaşam döngü tasarrufu hipotezlerini kullanarak gelişmiş 50 ülke üzerinde topladığı verisinde, 1960-1970 yılları arasında bireysel tasarruf oranına ait aşağıdaki değişkenleri kullanarak inceleme yapmıştır (Çizelge 5.1.).

:1960-1970 yılları arasında 15 yaş altı nüfusun ortalama yüzdesi, : 1960-1970 yılları arasında 75 yaş üstü nüfusun ortalama yüzdesi,

: 1960-1970 yılları arasında kişi başına düşen gerçek harcanabilir gelir düzeyinin dolar bazında ortalaması,

: 1960-1970 yılları arasında kişi başına düşen gerçek harcanabilir gelir düzeyinin büyüme oranının ortalama yüzdesi,

: Bireysel tasarruf oranı.

Veri, Matlap 7.0 ve SPSS 15.0 programları yardımıyla incelenmiştir.

Çizelge 5.1. Gelişmiş Ülkelerdeki Yaşam Döngü Tasarrufu

Çizelge 5.2. EKK Kestiricisi İçin Regresyon Sonuçları

5.2. Bir Sapan Gözlemin Regresyon Doğrusu Üzerindeki Etkisinin İncelenmesi

5.2.1. Sapan, Aykırı Değer ve Etkili Gözlem Ölçüleri

Sapan gözlemlerin belirlenmesi sırasında kullanılan ölçüler için kritik değerler ikinci bölümde de belirtildiği gibi olup Çizelge 5.3.’de verilmiştir. Bunun yanında, kritik değerlerin uygun olmadığı durumlarda gözlemler birbiriyle karşılaştırılarak yorumlanmıştır. göre 23., 44. ve 49. gözlemlerin, X- yönünde sapan değer oldukları; değerlerine göre 7., 23., 44., 46. ve 49. gözlemlerin, X ve y – yönünde sapan değer olduğu görülmüştür. Çizelge 5.6. ya bakıldığında, ve ölçülerine göre; 23., 46.

ve 49., ölçüsüne göre; 23. ve 46., ölçüsüne göre; 21., 23., 44., 46. ve 49.

gözlemlerin etkili gözlemler olduğu ve ölçüsüne göre 49. gözlemin etkili gözlem olduğu söylenebilir. Varyans üzerindeki etkiyi gösteren COVRATIO ölçülerine göre

Ölçüler Kritik Değerler

de 6., 7., 37., 44., 46. ve 49. gözlemler etkili gözlemlerdir. Çizelge 5.7.

incelendiğinde; ölçüsüne göre 21., 23. ve 49. gözlemlerin parametresinin üzerinde, 10., 21., 23. ve 49. gözlemlerin üzerinde, 21., 23., 46. ve 49. gözlemlerin üzerinde, 23., 33., 47. ve 49. gözlemlerin üzerinde etkili oldukları söylenebilir.

Çizelge 5.4. Aykırı Değerlerle İlgili İstatistikler

( )

1 0,86358 0,227098 0,235201 0,232716 0,926303 2 0,616386 0,162093 0,172829 0,170955 0,700744 3 2,218958 0,583527 0,610858 0,606552 2,431688 4 -0,69832 -0,18364 -0,19245 -0,19038 -0,76694 5 3,552809 0,934294 0,968588 0,967908 3,818416 6 -0,31689 -0,08333 -0,09084 -0,08983 -0,37654 7 -8,24223 -2,16749 -2,20907 -2,31343 -8,56156 8 2,536036 0,66691 0,694531 0,690482 2,750459 9 -1,45171 -0,38176 -0,39319 -0,38947 -1,53995 10 5,125078 1,347758 1,401687 1,417311 5,543429 11 5,400239 1,420118 1,466862 1,486445 5,761593 12 -2,40563 -0,63262 -0,65379 -0,64958 -2,56937 13 -1,68109 -0,44208 -0,46395 -0,45986 -1,8515 14 2,475472 0,650983 0,700429 0,696409 2,865809 15 -0,1807 -0,04752 -0,04974 -0,04919 -0,198 16 -3,11617 -0,81947 -0,86218 -0,85968 -3,44946 17 -3,35528 -0,88235 -0,91031 -0,90855 -3,57132 18 0,710024 0,186717 0,192593 0,190519 0,75541 19 -6,21058 -1,63322 -1,69402 -1,7312 -6,68161 20 0,508674 0,133768 0,138819 0,137297 0,547817 21 3,391131 0,891777 1,00475 1,004859 4,304756 22 1,926755 0,506685 0,524425 0,520157 2,064038 23 5,281486 1,388889 1,575955 1,603216 6,799991 24 -6,10698 -1,60597 -1,65714 -1,69103 -6,50232 25 -1,67081 -0,43938 -0,45967 -0,45561 -1,82871 26 2,97491 0,782322 0,815362 0,812274 3,2315 27 -0,87179 -0,22926 -0,23496 -0,23247 -0,91568 28 0,425546 0,111907 0,11735 0,116057 0,467948 29 2,285555 0,60104 0,618027 0,613732 2,416576 30 0,646397 0,169985 0,174433 0,172542 0,680669 31 -3,29417 -0,86628 -0,88367 -0,88148 -3,42776 32 -6,12576 -1,61091 -1,66987 -1,70488 -6,58239 33 6,539441 1,719698 1,778516 1,823914 6,99442 34 6,675008 1,755348 1,814615 1,863826 7,133356 35 -0,76844 -0,20208 -0,21267 -0,2104 -0,85113 36 0,483166 0,12706 0,131409 0,129966 0,516812 37 1,291434 0,339613 0,370726 0,367145 1,538904 38 -0,67116 -0,1765 -0,18374 -0,18176 -0,72741 39 -4,26028 -1,12034 -1,197 -1,20293 -4,86328 40 2,486826 0,653969 0,679448 0,675329 2,684381 41 -2,66568 -0,701 -0,71532 -0,71139 -2,77572 42 -2,81792 -0,74104 -0,77031 -0,76678 -3,04498 43 -2,69241 -0,70803 -0,75327 -0,7496 -3,04749 44 -1,11159 -0,29232 -0,35811 -0,35462 -1,66827 45 3,632518 0,955255 0,999341 0,999326 3,975542 46 9,750914 2,564229 2,650915 2,853558 10,42134 47 -3,01853 -0,79379 -0,85635 -0,85376 -3,51303 48 -2,26383 -0,59533 -0,62681 -0,62253 -2,50964 49 -2,82953 -0,74409 -1,08705 -1,0893 -6,03899 50 -2,97087 -0,78126 -0,80806 -0,80489 -3,17819

Çizelge 5.5. X- yönündeki Sapan Değerlerle İlgili İstatistikler

Çizelge 5.6. Etkili Gözlemlerle İlgili İstatistikler

1 0,062718 0,454687 0,000804 0,188153 1,19283 0,93114 2 0,063244 0,472032 0,000818 0,189732 1,26784 0,879032 3 0,187805 1,376213 0,007155 0,563416 1,17619 0,904951 4 -0,059678 0,437787 0,000728 0,179033 1,22382 0,909779 5 0,264648 1,920532 0,014027 0,793943 1,08233 0,911043 6 -0,038973 0,297376 0,000311 0,116918 1,3283 0,841443 7 -0,455358 3,248665 0,037813 1,366074 0,65471 0,858302 8 0,200775 1,463636 0,008157 0,602326 1,14986 0,912157 9 -0,096022 0,692278 0,001879 0,288065 1,16668 0,93946 10 0,404935 2,947962 0,032075 1,214804 0,96814 0,884167 11 0,384511 2,780174 0,028796 1,153534 0,9344 0,892466 12 -0,169469 1,225991 0,005819 0,508407 1,13939 0,92738 13 -0,146417 1,075614 0,004364 0,439251 1,20316 0,903615 14 0,276538 2,082802 0,015472 0,829615 1,22627 0,854378 15 -0,015218 0,111506 4,74E-05 0,045653 1,22569 0,912592 16 -0,281148 2,070606 0,015901 0,843443 1,13962 0,888456 17 -0,23054 1,664921 0,010671 0,691619 1,08527 0,922207 18 0,048168 0,347788 0,000474 0,144505 1,18555 0,939144 19 -0,476764 3,461592 0,043529 1,430292 0,86588 0,870229 20 0,038086 0,276671 0,000297 0,114259 1,20244 0,92815 21 0,521575 4,113552 0,054396 1,564726 1,26804 0,770091 22 0,138845 1,005942 0,003919 0,416534 1,16246 0,927783 23 0,859651 6,828043 0,142816 2,578952 1,0846 0,733823 24 -0,43025 3,107708 0,035554 1,290751 0,86958 0,881886 25 -0,140063 1,025728 0,003994 0,42019 1,19618 0,909362 26 0,238554 1,740401 0,011468 0,715661 1,12826 0,906997 27 -0,052162 0,374212 0,000556 0,156486 1,16806 0,9509 28 0,036635 0,268916 0,000274 0,109904 1,22853 0,909108 29 0,146945 1,057686 0,004379 0,440835 1,1337 0,937754 30 0,03973 0,285386 0,000323 0,119189 1,17427 0,949007 31 -0,177515 1,267549 0,006334 0,532544 1,06673 0,944349 32 -0,465477 3,377596 0,041572 1,39643 0,8732 0,872961 33 0,481094 3,48284 0,044015 1,443282 0,83127 0,869232 34 0,488401 3,53424 0,045221 1,465204 0,81777 0,867274 35 -0,069019 0,50846 0,000973 0,207056 1,2331 0,901943 36 0,034297 0,248295 0,000241 0,10289 1,19454 0,934537 37 0,160717 1,228091 0,005267 0,482152 1,3131 0,836628 38 -0,052619 0,383456 0,000566 0,157856 1,20815 0,921979 39 -0,452563 3,384713 0,04056 1,357688 1,08649 0,848119 40 0,190343 1,384313 0,007335 0,571029 1,14711 0,916902 41 -0,144534 1,032407 0,004224 0,433601 1,10036 0,949438 42 -0,217657 1,58379 0,009562 0,65297 1,13144 0,91323 43 -0,272218 2,027289 0,014966 0,816655 1,18862 0,872346 44 -0,250951 2,152028 0,012845 0,752853 1,65548 0,664413 45 0,30709 2,248837 0,018861 0,92127 1,0946 0,893438 46 0,748235 5,414709 0,096633 2,244705 0,51165 0,789551 47 -0,345558 2,609525 0,024027 1,036673 1,19952 0,845237 48 -0,205137 1,511907 0,008532 0,61541 1,1872 0,894177 49 -1,160133 11,864 0,26807 3,4804 2,09057 0,456239

Çizelge 5.7. Etkili Gözlemlerle İlgili İstatistikler

5.2.2. Tek Sapan Gözlemlerin Grafiklerle İncelenmesi

Bütün bu ölçü incelenmesinden sonra SPSS 15.0 yardımıyla Kestirilmiş Değer- Rezidü Grafiği, Leverage-Studentized Rezidü Grafiği, Cook-Welsch ve Kuh Uzaklığı Grafiği ve Düzeltilmiş Cook ve Welsh Uzaklığı Grafikleri İncelenmiştir.

Şekil 5.1. Kestirilmiş Değer-Rezidü Grafiği

Şekil 5.2. Leverage- Studentized Rezidü Grafiği

Şekil 5.3. Cook – Welsch ve Kuh Uzaklığı Grafiği

Şekil 5.4. Düzeltilmiş Cook -Welsch Uzaklığı

5.3. Tek Sapan Gözlemler İçin Genel Sonuç

Çizelge 5.8. Tek Sapan Gözlemler İçin İnceleme

( ) İ İ

6 +

7 + + + + + +

21 + + +

23 + + + + +

37 +

44 * + + +

46 * * * * * + + + +

49 * * * * * * * *

*: Etkili +:Daha az etkili

Çizelge 5.8.’de tek sapan gözlemlerin belirlenebilmesi için kullanılan istatistikler ve bu istatistiklerin işaret ettiği gözlemler verilmiştir. “+” sembolü, Çizelge 5.3.’de verilen kritik değerlerden çok fazla uzaklaşmayan veya gözlemlerin kendi aralarında karşılaştırmaları sonucu çoğunluktan aşırı biçimde kopmayan

gözlemleri belirtmektedir. “*” sembolü de Çizelge 5.3.’de verilen kritik değerlerden daha fazla uzaklaşan veya gözlemlerin kendi aralarında karşılaştırmaları sonucu çoğunluktan aşırı biçimde kopan gözlemleri belirtmektedir.

Çizelge 5.8.’e göre; 21., 23., 44. ve 49. gözlemler X-yönünde sapan değerler olup bu gözlemlerden, 44. ve 49. gözlemler etkili gözlem olarak saptanmıştır ve 49.

gözlemin diğerlerine oranla daha etkili gözlem olduğu belirlenmiştir. Bununla birlikte 7. ve 46. gözlemler y-yönünde sapan değerler olup 46. gözlem etkili gözlem olduğu söylenebilir. Ayrıca 7., 21., 44., 46. ve 49. gözlemin X ve y-yönünde sapan değer olup, bu gözlemlerden 46. ve 49. gözlemin etkili gözlem olduğu görülmüş ve 49. gözlemin diğerlerine oranla daha etkili olduğu saptanmıştır. Bütün bu gözlemlerin dışında 6. ve 37. gözlemlerin de COVRATİO ölçüsü yardımıyla varyans üzerinde etkili oldukları görülmüştür.

İkinci uygulamada 3. bölümde verilen genel yanlı sınıf kestiriciler içerisinden ridge, modified ridge, Liu ve modified Liu kestiricileri ve bu kestiriciler için 4. Bölümde verilen tanılama ölçüleri ve EKK kestiricisi için rezidü, leverage, Cook ve Welsch-Kuh Uzaklığı ölçüleri "Longley" veri kümesi (Longley, 1967) kullanılarak incelenecektir.

5.4. Longley Verisi

Longley (1967) verisinde, 1947-1962 yılları arasında istihdamın;

: Zımmi fiyat deflatörü,

: Gayri Safi Milli Hasıla (GSMH), : İşsizlik,

: Askeri kuvvetlerin büyüklüğü, : 14 yaş ve üzeri nüfus,

: Yıl,

açıklayıcı değişkenlerine bağlı değişimi incelemiştir (Çizelge 5.9.). Çoklu regresyon modeli;

= 1 + +

olarak ele alınacaktır. Burada matrisi, korelasyon formunda olacak şekilde standartlaştırılmıştır.

Çizelge 5.9. Longley Verisi

60323 83 234289 2356 1590 107608 1947

61122 88,5 259426 2325 1456 108632 1948

60171 88,2 258054 3682 1616 109773 1949

61187 89,5 284599 3351 1650 110929 1950

63221 96,2 328975 2099 3099 112075 1951

63639 98,1 346999 1932 3594 113270 1952

64989 99 365385 1870 3547 115094 1953

63761 100 363112 3578 3350 116219 1954

66019 101,2 397469 2904 3048 117388 1955 67857 104,6 419180 2822 2857 118734 1956 68169 108,4 442769 2936 2798 120445 1957 66513 110,8 444546 4681 2637 121950 1958 68655 112,6 482704 3813 2552 123366 1959 69564 114,2 502601 3931 2514 125368 1960 69331 115,7 518173 4806 2572 127852 1961 70551 116,9 554894 4007 2827 130081 1962

5.4.1. Longley Veri Kümesi İçin Çoklu İç İlişkinin Belirlenmesi

1) Korelasyon matrisinin incelenmesi:

Çoklu iç ilişki probleminin belirlenmesi yöntemlerinden birisi de korelasyon matrisinin incelenmesidir. Çizelge 5.10. incelendiğinde; , , , , ve korelasyon katsayıları bire yakın olduğundan şiddetli çoklu iç ilişki olduğu söylenebilir.

Çizelge 5.10. Longley Verisi İçin Korelasyon Matrisi

1 2 3 4 5 6

1 1,000 0,991589 0,620633 0,464744 0,979163 0,991149 2 0,991589 1,000 0,604261 0,446437 0,99109 0,995273 3 0,620633 0,604261 1,000 -0,17742 0,686552 0,668257 4 0,464744 0,446437 -0,17742 1,000 0,364416 0,417245 5 0,979163 0,99109 0,686552 0,364416 1,000 0,993953 6 0,991149 0,995273 0,668257 0,417245 0,993953 1,000

2) Varyans şişirme faktörü ( ), özdeğerler, koşul sayısı ve koşul indekslerin ( ) incelenmesi:

( ) matrisinin j. köşegen elamanı j.varyans şişirme faktörü olarak adlandırılır ve herhangi bir değeri 10 dan büyükse çoklu iç ilişki problemi vardır diyebiliriz. Bu durumda Çizelge 5.11. incelendiğinde , , , ve değerleri eşik değer olarak 10 dan çok daha büyük olduğundan şiddetli çoklu iç ilişki probleminin var olduğunu söyleyebiliriz. Diğer bir belirleme kriteri ise öz değerlere bağlı olan koşul sayısı ve koşul indeksidir. Koşul sayısı, 11508,5 olup koşul indeksi ise, Çizelge 5.11.’e bakıldığında özellikle ve değerleri çok yüksek olduğundan şiddetli çoklu iç ilişki probleminin olduğunu söyleyebiliriz.

Ayrıca , ve değerlerinin küçük olması çoklu iç ilişki probleminin olduğunu gösterir.

Çizelge 5.11. Longley Verisi İçin Varyans Şişirme Faktörü , Özdeğerler ( ) ve Koşul İndeksi ( ) Değerleri

1 135,5324 4,603377 1

2 1788,513 1,17534 3,916

3 33,61889 0,203425 22,632

4 3,58893 0,014928 308,953

5 399,151 0,002552 1770,538

6 758,9806 0,000377 11508,5

Korelasyon matrisi, değerleri, koşul sayısı, koşul indeksi ve öz değerler göz önüne alındığında şiddetli çoklu iç ilişki probleminin var olduğunu söyleyebiliriz. Bu durumda klasik EKK kestiricileri yerine yanlı tahmin edicilerinin kullanılması bizi daha doğru sonuçlara götürecektir.

5.5. Ridge, Modified Ridge, Liu ve Modified Liu Kestiriciler İçin Regresyon Sonuçları ve Tanılama Ölçüleri

5.5.1. Ridge Kestiricisi İçin Regresyon Sonuçları ve Tanılama Ölçüleri

Ridge kestiricisi için değeri, Mallows (1973) kriterine göre = 0.0002 elde edilir. Bu durumda ridge kestiricisi için , , değerleri ve model;

= −0,00468 − 0,47 − 0,4621 − 0,1889 − 0,2447 + 2,074

= 0,000527, = 0,0047, =0,9953

elde edilir ( sabit terimi çok küçük olduğundan modele dahil edilmemiştir).

Walker ve Birch (1988), Longley (1967) veri kümesinde yaptığı incelemede ridge kestiricisi için Cook uzaklığına göre, 16., 10., 4., 15. ve 1. (bu sıralamaya göre) gözlemlerin etkili gözlem olduğunu saptamıştır. Bu çalışmada Cook uzaklığının

(4.15) ifadesindeki yaklaşım formülü kullanarak sonuçlar elde edilmiştir. Ridge kestiricisi için tanılama ölçüleri Çizelge 5.12.’de verilmiştir (Çizelge 5.12.’deki Welsch-Kuh Uzaklığı ve Cook Uzaklığı için yerine değeri kullanılmıştır).

Çizelge 5.12.’ye bakıldığında; 10., 4., 15., 6., 1., 16. ve 5. gözlemlerin rezidüsünün diğer gözlemlerden yüksek olduğu, 16. gözlemin leverage değeri diğer gözlemlerden yüksek olduğu, ölçüsüne göre 16., 10., 4., 1. ve 15. gözlemlerin yüksek olduğu ölçüsüne göre 16., 10., 4., 15. ve 1. gözlemlerin etkili gözlem oldukları söylenebilir. Sonuç olarak 16. ve 10. gözlemler diğer gözlemlerle karşılaştırıldığında etkili olduğu, 4., 15. ve 1. gözlemlerin diğer gözlemlerle karşılaştırıldığında daha az etkili olduğunu söyleyebiliriz.

15 0,023002 0,366414 0,128843 0,979587

16 -0,01872 0,67325 0,587689 -1,9711

Bu incelemelerden sonra ridge kestiricisi için ölçüsüne ve ölçüsüne göre etkili gözlemlerin değerlerine göre grafikleri şu şekildedir:

Şekil 5.5. Ridge Kestiricisi İçin Değerlerine Göre Cook Uzaklığı

Şekil 5.6. Ridge Kestiricisi İçin Değerlerine Göre Welsch-Kuh Uzaklığı

5.5.2. Modified Ridge Kestiricisi İçin Regresyon Sonuçları ve Tanılama Ölçüleri

Modified ridge kestiricisi için değeri, Mallows (1973) kriterine göre = 0.0002 elde edilir. Bu durumda modified ridge kestiricisi için , , değerleri ve model;

= −0,0176 − 0,8199 − 0,5118 − 0,2002 − 0,1704 + 2,3653

= 0,000505, = 0,00543, =0,9955

elde edilir ( sabit terimi çok küçük olduğundan modele dahil edilmemiştir).

Aboobacker, J. ve Chen, J. (2009) Longley (1967) veri kümesinde yaptığı incelemede modified ridge kestiricisi için Cook uzaklığına göre, 16., 4., 1., 10. ve 15.

gözlemlerin (bu sıralamaya göre) etkili gözlemler olduğunu saptamıştır. Bu çalışmada Cook uzaklığının (4.15) ifadesindeki yaklaşım formülü kullanarak sonuçlar elde edilimiştir. Modified ridge kestiricisi için tanılama ölçüleri Çizelge 5.13.’de verilmiştir (Çizelge 5.13’deki Welsch-Kuh Uzaklığı ve Cook Uzaklığı için yerine değeri kullanılmıştır). Çizelge 5.13’e bakıldığında;

10., 4., 15., 5., 1., 6. ve 16. gözlemlerin rezidüsü diğer gözlemlerden yüksek olduğu, 16. gözlemin leverage değeri diğer gözlemlerden yüksek olduğu, ölçüsüne göre 16., 5., 4., 10. ve 15. gözlemlerin yüksek olduğu ölçüsüne göre 5., 16., 10., 4.

ve 15. gözlemlerin etkili gözlem oldukları söylenebilir. Sonuç olarak 5. ve 16.

gözlemler diğer gözlemlerle karşılaştırıldığında etkili olduğu, 4., 10. ve 15.

gözlemlerin diğer gözlemlerle karşılaştırıldığında daha az etkili olduğunu söyleyebiliriz.

Çizelge 5.13. Modified ridge Kestiricisi İçin Tanılama Ölçüleri

No

1 0,019792 0,424364 0,141934 0,943444

2 -0,00632 0,561388 0,032811 -0,43627

3 0,003701 0,361525 0,003433 0,13507

4 -0,03085 0,367716 0,244979 -1,43869

5 0,020017 0,576353 0,342399 1,785867

6 -0,0192 0,365922 0,09415 -0,81565

7 -0,01016 0,469983 0,046881 -0,5793

8 6,38E-05 0,49872 2,26E-06 0,003765

9 0,000123 0,44814 6,16E-06 0,006297

10 0,034552 0,325391 0,238096 1,527024

11 0,00046 0,344099 4,59E-05 0,017182

12 -0,00242 0,481634 0,002971 -0,13604

13 -0,0128 0,362322 0,04009 -0,50988

14 -0,00599 0,227935 0,003878 -0,1482

15 0,024921 0,37239 0,165976 1,099524

16 -0,01589 0,686393 0,497405 -1,7727

Bu incelemelerden sonra modified ridge kestiricisi için ölçüsüne ve ölçüsüne göre etkili gözlemlerin değerlerine göre grafikleri şu şekildedir:

Şekil 5.7. Modified Ridge Kestiricisi Dçin Değerlerine Göre Cook Uzaklığı

Şekil 5.8. Modified Ridge Kestiricisi için Değerlerine Göre Welsch-Kuh Uzaklığı

5.5.3. Liu Kestiricisi İçin Regresyon Sonuçları Ve Tanılama Ölçüleri

Liu kestiricisi için değeri, Liu (1993) kriterine göre = 0.9724 elde edilir. Bu durumda Liu kestiricisi için , , değerleri ve model;

= 0,0501 − 0,9803 − 0,5223 − 0,1971 − 0,0934 + 2,4163

= 0,000509, = 0,0046, =0,9954

elde edilir ( sabit terimi çok küçük olduğundan modele dahil edilmemiştir). Liu kestiricisi için tanılama ölçüleri Çizelge 5.14.’de verilmiştir (Çizelge 5.14.’deki Welsch-Kuh Uzaklığı ve Cook Uzaklığı için yerine değeri kullanılmıştır).

Çizelge 5.14.’e bakıldığında; 10., 4., 15., 5., 6., 1. ve 16. gözlemlerin rezidülerinin diğer gözlemlerden yüksek olduğu, 16. gözlemin leverage değeri diğer gözlemlerden yüksek olduğu, ölçüsüne göre 5., 16., 10., 4. ve 15. gözlemlerin yüksek olduğu

ölçüsüne göre 5., 10., 4., 16. ve 15. gözlemlerin etkili gözlem oldukları söylenebilir. Sonuç olarak 5. ve 16. gözlemlerin diğer gözlemlerle karşılaştırıldığında etkili olduğu, 4., 10. ve 15. gözlemlerin diğer gözlemlerle karşılaştırıldığında daha az etkili olduğunu söyleyebiliriz.

Çizelge 5.14. Liu Kestiricisi İçin Tanılama Ölçüleri

No

1 0,018184 0,419089 0,113738 0,854137

2 -0,00742 0,555261 0,042659 -0,50318

3 -4,24E-05 0,357887 4,32E-07 -0,00153

4 -0,03162 0,366429 0,252074 -1,46098

5 0,02113 0,602144 0,466181 2,045919

6 -0,01931 0,364503 0,093173 -0,81473

7 -0,01142 0,482857 0,064937 -0,66798

8 -0,00378 0,494308 0,007573 -0,22027

9 0,00195 0,446586 0,00152 0,099412

10 0,036113 0,323579 0,253271 1,582222

11 0,00159 0,352359 0,000583 0,060121

12 -0,0043 0,473894 0,008731 -0,23716

13 -0,00941 0,367112 0,022357 -0,37662

14 -0,00369 0,225952 0,001423 -0,09059

15 0,025116 0,368219 0,161243 1,094379

16 -0,01308 0,675336 0,301509 -1,40087

Bu incelemelerden sonra Liu kestiricisi için ölçüsüne ve ölçüsüne göre etkili gözlemlerin değerlerine göre grafikleri şu şekildedir:

Şekil 5.9. Liu kestiricisi İçin Değerlerine Göre Cook Uzaklığı

Şekil 5.10. Liu Kestiricisi İçin Değerlerine Göre Welsch-Kuh Uzaklığı

5.5.4. Modified Liu Kestiricisi İçin Regresyon Sonuçları Ve Tanılama Ölçüleri

Modified Liu kestiricisi için değeri, Liu (1993) kriterine göre = 0.9724 elde edilir. Bu durumda Modified Liu kestiricisi için , , değerleri ve model;

= 0,0464 − 1,0128 − 0,5372 − 0,2045 − 0,1010 + 2,4779

= 0,000502, = 0,0045, =0,9955

elde edilir( sabit terimi çok küçük olduğundan modele dahil edilmemiştir).

Modified Liu kestiricisi için tanılama ölçüleri Çizelge 5.15.’de verilmiştir (Çizelge 5.15.’deki Welsch-Kuh Uzaklığı ve Cook Uzaklığı için yerine değeri kullanılmıştır). Çizelge 5.15.’e bakıldığında; 10., 4., 15., 5., 1., 6. ve 16.

gözlemlerin rezidüsünün diğer gözlemlerden yüksek olduğu, 16. ve 5. gözlemlerin leverage değerlerinin diğer gözlemlerden yüksek olduğu, ölçüsüne göre 5., 16., 4., 10. ve 15. gözlemlerin yüksek olduğu ölçüsüne göre 5., 16., 10., 4. ve 15.

gözlemlerin etkili gözlem oldukları söylenebilir. Sonuç olarak 5. ve 16. gözlemlerin diğer gözlemler karşılaştırıldığında etkili olduğu, 4., 10. ve 15. gözlemlerin diğer gözlemlerle karşılaştırıldığında daha az etkili olduğunu söyleyebiliriz.

Çizelge 5.15. Modified Liu Kestiricisi için Tanılama Ölçüleri

No

1 0,019659 0,424419 0,140758 0,932022

2 -0,00689 0,564751 0,040254 -0,47738

3 0,003354 0,362005 0,002844 0,121972

4 -0,03016 0,372096 0,243997 -1,40608

5 0,022737 0,615165 0,610345 2,27616

6 -0,01835 0,369479 0,088989 -0,78024

7 -0,01205 0,491335 0,078326 -0,71615

8 -0,00103 0,504415 0,000625 -0,06161

9 0,001073 0,456836 0,000506 0,05573

10 0,03354 0,330431 0,235657 1,484625

11 -0,00121 0,359688 0,000366 -0,04635

12 -0,00292 0,482903 0,004376 -0,16368

13 -0,01141 0,374124 0,035324 -0,46146

14 -0,00626 0,228331 0,004272 -0,15426

15 0,025107 0,372772 0,169815 1,101995

16 -0,01519 0,688279 0,464579 -1,69488

Bu incelemelerden sonra Modified Liu kestiricisi için ölçüsüne ve ölçüsüne göre etkili gözlemlerin değerlerine göre grafikleri şu şekildedir:

Şekil 5.11. Modified Liu Kestiricisi İçin Değerlerine Göre Cook Uzaklığı

Şekil 5.12. Modified Liu Kestiricisi İçin Değerlerine Göre Welsch-Kuh Uzaklığı

5.5.5. EKK Kestiricisi İçin Regresyon Sonuçları ve Tanılama Ölçüleri

EKK kestiricisi için , , değerleri ve model (ham veri için);

= −3482259 + 15,061 − 0,0358 − 2, 02023 − 1,03323 −0,0511 + 1829,51

= 92936,01, = 836424,1 ve =0,9955

elde edilir. EKK kestiricisi için tanılama ölçüleri Çizelge 5.16.’da verilmiştir.

Çizelge 5.12.’ye bakıldığında; 10., 4., 15., 5., 1., 6. ve 16. gözlemlerin rezidülerinin diğer gözlemlerden yüksek olduğu, 16. ve 5. gözlemlerin leverage değerleri diğer gözlemlerden yüksek olduğu, ölçüsüne göre 5., 16., 4., 10. ve 15. gözlemlerin yüksek olduğu ölçüsüne göre 5., 16., 10., 4. ve 15. gözlemlerin etkili gözlem oldukları söylenebilir. Sonuç olarak 16. ve 5. gözlemlerin diğer gözlemlerle

karşılaştırıldığında etkili olduğu, 4., 10. ve 5. gözlemlerin diğer gözlemlerle

10 455,3918 0,330615 0,235223 1,524687

11 -17,2713 0,359882 0,000402 -0,05005

Çizelge 5.17. Ridge, modified ridge, Liu ve Modified Liu Kestiricilerinin Cook Uzaklığı No EKK Ridge Modified gözlemlerin rezidüsü diğer gözlemlerden büyük olduğu fakat etki düzeylerine göre sıralamaları farklı olmuştur. Bununla birlikte leverage ölçüsüne göre 5. ve 16.

gözlemler EKK ve Modified Liu kestiricileri için yüksek leverage gözlemler

olmasına karşın ridge, modified ridge ve Liu kestiricisi için 5. gözlem yüsek leverage

olmasına karşın ridge, modified ridge ve Liu kestiricisi için 5. gözlem yüsek leverage

Benzer Belgeler