M. Ü. İktisadi ve İdari Bilimler Fakültesi Dergisi Yıl:/999, Cilt: XV, Sayı:/, Sayfa:/81-186
KLASİK DOGRUSAL REGRESYON MODELLERİ
İLE
STANDARTLAŞTIRILMIŞ
DOGRUSAL REGRESYON
MODELLERİNİN KARŞILAŞTIRILMASI
Ebru ÇAGLA YAN•
istatistikte ölçüm birimleri farklı olan değişkenler karşılaştırılmak istendiğinde, standartlaştırma işlemine başvurulmaktadır. Standartlaştırma işlemi
farklı ölçüm birimlerindeki serilerin ortalama, varyans gibi ölçülerini ayn'ı standart ölçüye dönüştürdüğünden, hem·farklı serilerin karşılaştırılmasını
sağlamakta, hem de normal dağılım tablosunda olduğu gibi standart tabloların kullanılmasına olanak vermektedir.
Standartlaştırma işlemi serilerin tüm birimlerinden serinin aritmetik ortalamasının çıkartılıp, standart sapmasına bölünmesi ile yapılmaktadır. Bu
şekilde standartlaştırılmış serilerin ortal~maları O ve varyansları 1 olmaktadır. Aslında bu dönüşüm ile yapılan, ekseni sıfırdan aritmetik ortalamaya kaydırıp; ölçeklendirme birimini de standart sapma büyüklüğünde değiştirmektir.
İstatistikte değişken çiftleri arasındaki ilişkiyi belirlemek için kovaryans, korelasyon katsayısı veya regresyon modelleri . kullanılmaktadır. Bu analizler
standartlaştırılmış değişken çiftleri için de yapılabilir. Bilindiği gibi kovaryans standart bir ölçU olmadığından, değişken çiftleri arasındaki ilişkinin yönü ile ilgili bilgi vermektedir. Bu ölçü ilişkinin derecesini belirtmediği gibi farklı
değişken çiftleri arasindaki ilişkilerin karşılaştırılmasına da imkan vermemektedir. Oysa
standartlaştırılmış değişken çiftleri için kovaryansların karşılaştırılması mllmkiin
olmaktadır. Bu durumda standartlaştırılmış değişken çiftleri için kovaryans ile korelasyon katsayıları aritmetik ortalamalar O ve standart sapmalar 1 olduğundan birbirine eşittir. Bu çalışmanın amacı standart ve standart olmayan değişken grupları için oluşturulacak regresyon modelleri arasındaki farkları ve benzerlikleri ortaya koymaktır.
· KLASİK ve STANDARTLAŞTIRILMIŞ BASİT DOGRUSAL
REGRESYON MODELLERİ
X ve Y değişkenleri için basit doğrusal regresyon modelinin,
Y;
=/30
+
/3ıX;
+
E;I
olduğunu varsayalım. Basit doğrusal regresyon modelinin parametre tahminleri gerçek değerlerle;
•Araş. Gör., M.Ü. i.i.B.F. Ekonometri Bölümü.
/
Ebru Çağlayan
A L.XY-nXY
1
/3
1
= IX2
-nxı
olarak tahmin edilir. X ve Y değişkenleri
X
.•
- X; -
-X
1
ve y• -. -Y; -
y
1
I
s
Is
x y
olarak standartlaştırılırsa model,
Y;•
=/3~
+
İ3~
X;
•
+
E;
1
şeklini alır ve katsayılar yukarıda verilen formüllerde X ve Y yerine standaıtlaştırılmış X* ve Y* değerlerinin konulması ile tahmin edilir. Aradaki
i
l
işkiyi
belirlemek için X* ve Y*değerlerini ~
1I
ve~
0
1
formüllerinde yerine koyarsak, L.XY-nXY~
·-
S
X
S
y
ı - uı -nxıS
x
S
x
_S
X
/3A
- 1Sr
olacaktır. Standartlaştırılmış serilerin ortalaması sıfır olduğundan
,
~o
·
ıparametresi sıfır o
l
acaktır.
Standartlaştırma işlemi
hata terimlerini deetkilemektedir. Basit regresyon modelinin hata terimleri;
e;
=
Y;
-Y;
=
Y;
-
~~
-
~
ı
x,I
dir. Hata
.
terimleri standartlaştırıldığında,.
". .... . ·
ıe,
=Y;
-
f3
o -f3
ı X, A A .s
A[3~
=O;f3
1
=Sx
/3
ı;
y X • =x - x
vey
•
= - - -y -
y
1
Sx
Sy
olduğundan,e>
(Y, -
l')
-f3
,
s
.
,.
(X,
-
X)
=ı;
-
l'
-/3,x, -
/3,
X
1
s
y
s
y
s
x
s
y
Y -
·
~
ı
X=
~
01
oldu
ğ
undan
,
e;
·
=
Y;
-
~o
-~;X;
=
.2._
·
ı
s
y
.
s
y
olacaktır. Standartlaştırılmış hata teriminden de yararlanarak parametre varyarıslarını hesaplamak istediğimizde anakütle hata terimleri
varyansının tahmini,
T C. 'nin 75. Kuruluş Yıldönümüne Armağan
sı
= I.ei2I
e
n-k
:~:ğ~n::
:
;t~d~~ş"j'lm>Ş
•::tle
h~•;:d,mleri
varyansının
tahmini,e n -
k
n -k
~
(n -k)S
)~
s
;
olacaktır. · ı
Basit
doğrusal
regresyonda{3
0ive
{3
1 lparametrelerinin varyansları .sırasıyla;
8
2 -8
2[!
+
_xı
J
1
s
~
=s
21
1
A, -
e n I.(Xi - X)2 fJı e I.(Xi - X)2şeklinde hesaplanmaktadır. Standartlaştırılmış regresyon parametrelerinin
va<yans;•; -
s"[_!._
+
_x
·ı
]
-
s
;
[_!._+o]
-
s
;
1
A:
-
e n I.(Xi• -x
·) -
s
;
n - ns; ves
~.
=
s·
ı
1 - ·ı
s
}
s;
_ s
.;
fJ, e I.(Xi• - X ) =s
):
·
r.(xi -
X)2 -s
;
olacaktır. Klasik doğrusal regresyon modeli ile standartlaştırılmış regresyon
modelinin belirlilik katsayıları birbirine eşittir. Klasik regresyon modelinin belirlilik
katsayısı,
R
ı
= 1-r.e;
1
/
I.(Y-Y)
2ve standartlaştırılmış regresyon modeli için belirlilik katsayısı,
I.eiı
R•2 = 1- I.e? = 1-
s
;,
I.e21
I.(Y
• -
Y
.
)
2I.(Y
-Y)2
=l
-
I.(Y
-1
Y)
2sı
y
olacaktır. Doğrusal korelasyon katsayısı R2
'nin kareköküne eşit olduğundan o
da değişmeyecektir.
/
-Ebru Çağlayan
rxy
=
cov(x,y)1
sxsy
r.
·
=cov( x
• ,
y
•)
1
xys· s·
x y. .
1
sx
=
sy
=
1 ·olduğundanr_,y·
=
L(X -
X)(Y - Y)=
rxyl
·
nSxSy
o~acakt~~, Bililndiği
gibi° basitdoğrusal
regresyonda/31
=Sx
r'J,ilişkisi vardır. Aynı ilişki standartlaştırılmış basit doğrusal regresyon için de geçerlidir ve
f3~
=r,~
,
=rxy
1
olacaktır.· Standarlaştırma işleminden sonra sabit katsayı sıfır olduğundan bunun için hesaplanacak t test
istatistiği
desıfır olacaktır
.
iJ
1I
için hesaplanan t testistatistiği
ise
A
1
için hesaplanan tt~st
istatistiğine
eşittir.
s.r
f31
~
_s_.:._._, - =_/3_ı
=tı
s.r s
.
siı,
s
{3, y KLASİK ve STANDARTLAŞTIRILMIŞ REGRESYON MODELLERİ ÇOKLU DOGRUSALÇoklu regresyon modelini genel olarak,
Y;
=f3o
+
/3ıXı;
+
f3
2X2
;
+
...
.
..
+/3kXk;
+
E;
1
ifade edelim. Modelde yer alan ~ katsayıları nonnal denklemler veya
bunların matrislere dönüştürülmüş şekli ile tahmin edilebilir. Çoklu doğrusal regresyon modelinin parametre tahminleri matrislerle,
f3
=
cxxr
1CX'Y)I
T C. 'nin 7 5. Kuruluş Yıl dönümüne Armağan A -1
/3
0
nLX
,
LX
2
LXk
IS
/3,
LXıLX
1 ıLX
1X 2
LX,
X
k
lX
,Y
/3
2
LX
2
LX2XıLX
22
I.X
2
Xk
I.X
2
Y
A:rx;
/3
kLXk
LXkX
I
LXkX
I
LXkY
şeklinde yapılacaktır. Basit -doğrusal regresyonda olduğu gibi çoklu regresyonda da aynı sebeplerden dolayı sabit katsayı sıfır olacaktır. Sabit dışındaki
katsayılar
/J
;I
ile ifade edilirse,A
s
A1
{3
;
= ;';
/3;
y
olacaktır. Alynı şekilde çoklu :e
0 1 aresyonda da
S
21
e
;
·
=
;i
s
;ı
.
=
~;
s
4
=
s~
s4
y y .ı~ •ı 2I
.
1
.
.
1
R=
R t0=O
t;=
t;olacaktır. Bu eşitlikler basit regresyonda olduğu gibi matrislerle gösterilebilirler. Formül 'çıkarımları daha uzun olduğu için bunlara burada
yerverilıneın iştir.
Seriler standaıtlaştırıldığında X ve Y değerleri yerine X*
konarak ve x 1
=X
1;_
xı
olarak tanımlanarak,Lx
2
Lx
1
x
2
Lx
1
xk
-1Lx
,
y
1b
*
ı
s;
,
s.r,sxıs"
.,
s
"'ı
s"
.,
s.Ji
b * 2 lı2X2Lx
2
Lx2.xk
Lx
2
Y
2S, S,
.
s.;ı
SXı SXıs"'ı
sY
·ı · ıb
*
k
LxkxıL.
x
.
k ')-
Lxky
s.\'
1s
.
,
.
,
s;
·2s"'ı
s.v
" • - " . - · "* - . . " * - · ıf3
o
= Y-/3ıXı-,-
f3
2
X
2
-
.
.
...
~{3kXk ve Y* değerleri,olarak tahmin edilecektir. Matrisin köşegeninde yeralan değerler,
~/
Ebru ÇağlayanLx2
I.x21
-
-'
- = --'- =
ns;
r.xi
2 ., -n o~~;:ır1
. Matris köşegeni dışında kalan değerler genel olarakSX;
sx
/
şeklinde ifade edilirse ve bu ifade n/n ile çarpılırsa,
n L.x;x1
1
-. · =nr ..
s
.
s
-',·'ın XI X/
olacaktır. Görüldüğü gibi bu iki değişken için hesaplanacak korelasyon
katsayılarının n katına eşittir. Buna göre matrisler,
~~
n nr,ıxı nr.,ıxı- -1 nr,ıY~;
nr,ıxı n nrxıxk nl~'ıY~:
nr.,kxln
nl~Yı)'olarak elde edilir. Matrisler n'e bölünürse;
~~
rx,xı~;
r XıXı 1~:
r xkxışek
lini
a
lır.
Matrislersırası
ile~·,
Rxx ve r,Y olaraktanımlanırsa
,
/3
~.
-R
- xx-
ı
1x,
y1
olacaktır.
KAYNAKLAR
1. FOX Jolın.( 1997), Applicd Regressioıı Annlysis, Lincar Models. and Relatcd Mctlıods. Sagc Publislıiııg, Landon.
2. FREUND .lolııı E .. ( 1992), Matlıcmntical Statistics, Fiftlı Editioıı. Prcntice-1 lali
lııtcrnalional,Iııc., Ncw .lerscy.
3. GÜRİŞ Selahattin, BÜLBÜL Şahaıııet.( 1995). Olasılık, Yaylını
Matbaası.İstaııbu 1.
4. KMCNT;\ .lan. ( I 971 ),Elcmeııts of Ecoııometrics, McGraw-I !ili.
5. MYERS Rayınoııd 11..( 1990). Classical aııd Modern Regrcssioıı With
Applicatioııs, Secoııd Editioıı, PWS-KENT Publishiııg Company, Bostan.
6. WONNACOTT Ronald J., WONNACOTT Thonıas H .. ( 1979),
Econonıttrics, Second Eclitioıı, Johıı Wiley&Soııs, New York.