DURAĞAN OLMAYAN ZAMAN SERİLERİ: BİRİM KÖKLÜ
SERİLER
Bundan önceki bölümlerde durağan zaman serilerinin bazı özellikleri incelendi. İstatistiki sonuç çıkarımlar için serinin durağan olduğu varsayıldı.
Bilindiği gibi, bir çok iktisadi veri durağan değildir. Bu bölümde, iktisadi veri analizinde çok karşılaşılan birim köklü zaman serilerini incelemeye çalışacağız. MA serilerinin durağan olduğunu biliyoruz. Durağan olmayan zaman serileri AR bileşeni içeren serilerdir (AR, ARMA veya SAR gibi modeller). Daha önce de belirtildiği gibi, serinin AR bileşenine karşılık gelen karekteristik denklemin köklerinden en az biri mutlak değerce 1 ise bu tür seriler birim köklü serilerdir. Zaman serilerinde hemen hemen bütün istatistiki sonuç çıkarımlar, incelenen zaman serisinin durağanlığına bağlıdır.
Seri durağan değil ise, herhangi bir şekilde durağanlık sağlatıldıktan sonra sonuç çıkarımlar yapılmalıdır. İncelenen serinin durağanlığını sınamak için literatürde bir çok yöntem vardır. Bazı paket programlar birim kök test istatistiklerinin değerini doğrudan hesaplamaktadır. Bu bölümde, literatürde çok kullanılan ve paket programlarda doğrudan hesaplanabilen bazı birim kök test yöntemleri ele alınacaktır. Bunlardan, parametrelerin EKK tahmin edicilerinin dağılımına dayalı olarak geliştirilen Dickey-Fuller test yöntemi ile Phillips-Perron birim kök test yöntemi en yaygın kullanılan yöntemledir.
Dickey-Fuller birim kök test yöntemi serinin sadece bir birim kök içermesi varsayımına dayanır. Bazı iktisadi seriler (genellikle para verileri) birden fazla birim kök içerir. Onun için, Dickey ve Pantula (1987) tarafından geliştirilen ardışık birim kök test yöntemi de bu bölümde incelenecektir.
Mevsimsel zaman serisi modelleri de AR bileşeni içerdiğinden, bu seriler de birim köklü olabilir. Ayrıca, mevsimsel zaman serisi modeline karşılık gelen
BÖLÜM 5
karekteristik denklem bir birim kök içeriyorsa, bu birim kökler tekrar eder.
Tekrar eden birim kök sayısı dikkate alınarak durağanlaştırma yapıldığında, istatistiki sonuç çıkarımlar hatalı olabilir. Bu nedenle, mevsimsel birim köklerin ayrıca incelenmesi gerekir. Hylleberg, Engle Granger ve Yoo (1990) tarafından geliştirilen ve literatürde HEGY testi olarak bilinen mevsimsel birim kök testleri üzerinde de kısaca durulacaktır.
5.1. Birim Köklü Seriler, Trend ve Bazı Örnekler
Durağan olmayan seriler trend içeren serilerdir. Bu trend deterministik (genellikle ortalamadan kaynaklanır) veya stokastik (kovaryansın zamana bağlı olması) olabilir. Birim köklü seriler stokastik trend içeren serileridir.
Aşağıdaki üç modeli ele alalım:
Model I : X
t X
t1Model II : X
t X
t1 e
tModel III : X
t X
t1 e
tBurada sabit (rasgele olmayan) olup, genellikle serinin beklenen değeridir. e
t~ WN (0, ve
2) S
t e
1e
2... e
tolmak üzere, bu modeller
Model I : X
t X
0 t Model II : X
t X
0 S
tModel III : X
t X
0 t S
tolarak da yazılabilir. { X
t: t 1 , 2 , 3 ,... } rasgele değişkenler dizisi, ...
) ( ...
) ( ) ( )
(
2 31
w X w X w X w
X
nşeklinde gözleniyorsa artan bir trend,
...
) ( ...
) ( ) ( )
(
2 31
w X w X w X w
X
nolduğunda ise azalan bir trend içerdiği söylenebilir. Buna göre, Model I deki }
,...
2 , 1 ,
{ t t stokastik terim içermediğinden, deterministik trenddir.
Model II deki S
trasgele değişkenlerin toplamı olup stokastik bir trenddir.
Bazı modeller (Model III de olduğu gibi) hem deterministik hem de stokastik trend içerebilir.
X
tzaman serisi Model II de olduğu gibi stokastik bir trend içeriyor
olsun.
E X X(
t|
t1,
Xt2,...
X1) koşullu beklenen değeri, serinin t anındaki
öngörüsüdür. Seri stokastik trende sahip ise, koşullu beklenen değer
1 2 1 1
(
t|
t,
t,... )
tE X X X X
Xolup,
E(
X Xt|
t1,
Xt2,...
X1) 0 dır. Yani,
1
,
2,...,
t 1X X X
kısmi bilgisi ile X
tiçin bir kestirimde bulunulamaz. Seride stokastik trend varsa öngörü yapılamaz.
) , 0 (
~ WN
2e
tolmak üzere, AR(p) modeli t 1, 2,..., n için
1 1 2 2
( X
t ) ( X
t ) ( X
t ) ..
p( X
t p ) e
tşeklinde verilmiş olsun. Burada, serinin beklenen değeri olup modele karşılık gelen karekteristik denklem,
1 p
0
p p i
i i
m m
dır. Daha önce de değinildiği gibi, karekteristik denklemin bütün kökleri ( p tane) mutlak değerce 1 den küçük ise seri durağan, köklerden en az biri mutlak değerce 1 ise durağan değildir. Modelin durağanlığı karekteristik denklemin kökleri ile ilişkilidir. Bu nedenle, durağan olmayan seriler birim köklü seriler olarak anılır. Karekteristik denklemin köklerinin mutlak değerce 1 den büyük olması, uygulamada karşılaşılan bir durum değildir.
Yukarıda verilen AR(p) modeli,
1 1
1
p pt i i t i t
i i
X X
e
olarak da yazılabilir. Buna göre, AR(p) modeli kesim noktası (intercept) içeren
t p t p t
t
t
X X X e
X
0
1 1
2 2 ..
regresyon modeli gibi de yazılabilir. Model birim köklü ise modeldeki kesim noktası (ve dolayısı ile beklenen değeri ) ortadan kaybolur.
Örnek 5.1.1 e
t~ WN ( 0 ,
2) olmak üzereAR(p) modeli,
1 1 2 2
( X
t ) ( X
t ) ( X
t ) ..
p( X
t p ) e
tolarak verilmiş olsun. serinin beklenen değeri olup karekteristik denklemi
1
0
p p p i
i i
m m
dir. Denklemin kökleri m
1, m
2,..., m
polmak üzere denklem, karekteristik
denklemin kökleri türünden
1 2
1 1
( )
p p i p i( )( )...(
p)
p(
i)
i i
f m m m
m m m m m m m m
şeklinde yazılabilir. Diğer taraftan m 1 için,
1 1
(1) 1
p i p(1
i)
i i
f m
olduğu açıktır. Karekteristik denklem parametrelerin bir fonksiyonu olup modelin durağanlığı da model parametrelerine bağlıdır. Model parametrelerinin toplamı 1 ise, denklemin köklerinden en az birinin mutlak değerce 1 olduğu
1 1
(1) 1
p i0 (1) 0
p(1
i) 0 için
i1
i i
f f m i m
bağıntısından açıktır. Buna göre şu sonuçları yazabiliriz:
(i) Herhangi bir AR(p) modeline karşılık gelen karekteristik denklemin köklerinden en az birinin mutlak değerce 1 olması için gerek ve yeter koşul parametrelerin toplamının 1 olmasıdır (yani 1
1
p
i
i).
(ii)
pi
i p
i
i
f m
f
1 1
0 ) 1 ( 0
) 1 ( 0
1 ) 1
(
önermesi dikkate alındığında f (1) 0 olması için |
mi| 1,
i 1, 2,3,...,
polmalıdır. Diğer taraftan, karekteristik denklem kompleks köklere sahip ise, köklerin kompleks eşlenikleri (konjügesi) de denklemin köküdür. Yani,
ib a
m1
denklemin bir kökü ise kompleks eşleniği ( m
*j a i b ) de denklemin köküdür. Buradan,
0 )
1 ( ) 1
( ) 1
( ) 1 ( ) 1
( m*i mi aib aib a 2 b2
yazılır. Bu ifadenin sıfır olması için gerek ve yeter koşul a 1 ve b 0
olmasıdır. Yani, ifadenin sıfır olması (i) için de geçerlidir. (i) deki ifade
köklerin kompleks olması halinde de geçerlidir. (1 m
*i) (1 m
i) ifadesi
biraz düzenlendiğinde,
* 2 2
(1 ) (1 ) (1 ) (1 ) (1 )
0 1, 0 1
i i
i
m m a i b a i b a b
a b m
önermesinin geçerli olduğu görülür. Köklerden bazıları ( r tanesi) reel, geri kalanlar kompleks olabilir. Bu durumda,
* *
1 2 1 1
1
tane reel kök tane kompleks kök
(1 ) (1 )(1 )...(1 ) (1 ) (1 )...(1 )(1 )
p
i r r r s s
i r p r
m m m m m
m
m m
eşitliği yazılır. Yani
i 1 , 2 , , 3 ,...,
piçin 1
|
|
mi ise ( 1 ) 0
1
p
i
m
iolmalıdır. Başka bir ifade ile,
i 1 , 2 , , 3 ,...,
piçin |
mi| 1 olduğunda 0
) 1 ( -
1
1 p
1 i
i
pi
m
i
olur. Buna göre, karekteristik denkleminin bütün kökleri mutlak değerce 1 den küçük ise, model parametrelerinin toplamı 1 den küçüktür. Yani,
bütün
i 1 , 2 , , 3 ,...,
piçin |
mi| 1
1 p
1
i i
dir
Pratikte, zaman serisinin durağanlığı için otokorelasyonların azalma hızına bakılır. Ayrıca, verilen zaman serisi için belirlenen bir modelin, parametre tahmin değerlerine bakarak da durağanlık hakında sezgisel bir karar verilebilir. Parametre tahminleri EKK yöntemi ile (veya başka bir şekilde) tahmin edildikten sonra bulunan tahmin değerleri toplamı 1 civarında ise serinin durağanlığından şüphelenilir. Ancak, parametrelerin toplamının 1 den küçük olması modelin durağanlığını gerektirmez.
Örnek 5.1.2 Aşağıda değişik AR modelleri için rasgele üretilmiş zaman serilerinin grafikleri bulunmaktadır. Her bir seri için otokorelasyon ve kısmi otokorelasyon fonksiyonları göz önüne alınarak uygun modeller belirlenip parametreleri EKK yöntemi ile tahmin edilmiştir.
a) AR(1) Değişik değerlerine göre X
t X
t1 e
tmodeline
uygun rasgele 100 veri üretilmiştir. Üretilen serilerin otokorelasyonlarından,
değerleri 1 e yaklaştıkça, otokorelasyonlardaki azalmanın da yavaşladığı gözlenmektedir. Kısmi otokorelasyonlar, birinci gecikmeden sonra sıfırdır (%95 lik güven sınırları içinde). 1 için model durağan değildir.
Seri ACF PACF
0.80
0 20 4 0 60 80 1 00-3-2-1012
Lag
ACF
0 5 10 1 5 20
-0.20.00.20.40.60.81.0
Series : xrho08
Lag
Partial ACF
0 5 10 15 20
-0.20.00.20.40.6
Series : xrho08
0.90
0 20 40 60 80 100
-4-2024
Lag
ACF
0 5 10 15 20
-0.20.00.20.40.60.81.0
Series : xrho09
Lag
Partial ACF
0 5 10 15 20
-0.20.00.20.40.60.8
Series : xrho09
0.95
0 20 4 0 60 8 0 1 00
-8-6-4-2024
L a g
ACF
0 5 1 0 1 5 2 0
-0.20.00.20.40.60.81.0
S eries : xrho095
L ag
Partial ACF
0 5 10 1 5 2 0
-0.20.00.20.40.60.8
Series : xrho095
1.00
0 20 40 60 80 100
-12-10-8-6-4-202
Lag
ACF
0 5 10 15 20
-0.20.00.20.40.60.81.0
Series : xrho099
Lag
Partial ACF
0 5 10 15 20
-0.20.00.20.40.60.81.0
Series : xrho099
b) AR(2) e
t~ WN (0, 2 ) olmak üzere AR(2) modeli,
t t
t
t
X X e
X ) (
) (
)
(
1 1
2 2
olarak verilmiş olsun.
1ve
2parametrelerinin değerleri değiştirilerek 100 birimlik veriler üretilmiş ve bunların grafikleri de aşağıda verilmiştir.
Seri ACF PACF
0 2 0 4 0 60 8 0 1 00
-25-20-15-10-505
Lag
ACF
0 5 10 15 20
-0.20.00.20.40.60.81.0
Series : ar21
Lag
Partial ACF
0 5 10 15 20
-0.4-0.20.00.20.40.60.81.0
Series : ar21
1 2 1 ise seri durağan değildir. Verilerin AR(2) olarak modellendiği varsayıldığında, birinci serinin otokorelasyonlarındaki azalma yavaş olup
2
1
nin tahmin değerinin yaklaşık 1 olması beklenir.
Seri ACF PACF
0 20 40 60 80 100
-4-2024
Lag
ACF
0 5 10 15 20
-0.20.00.20.40.60.81.0
Series : ar22
Lag
Partial ACF
0 5 10 15 20
-0.4-0.20.00.20.40.60.8
Series : ar22
Her iki serinin kısmi otokorelasyon fonksiyonları ikinci gecikmeden sonra sıfırdır (diğerleri %95 lik güven sınırları içinde). O zaman, her iki seri de AR(2) olarak modellenebilir. X
tnin X
t1ve X
t2üzerine regresyonundan parametre tahminleri (SAS, PROC REG) ile ilgili istatistik değerleri aşağıdadır.
Birinci seri:
0001 . 0 0001
. 0 1323 . 0 degeri
00 . 10 42
. 23 518
. 1
) 071 . 0 ( )
072 . 0 ( ) 145 . 0 ( : .
71 . 0 679
. 1 22
. ˆ 0
2 1
p stat t
e s
X X
Xt t t
Buna göre, ˆ
1 ˆ
2 0 . 969 1 olup parametrelerin tahmin değerleri toplamı yaklaşık 1 dir. Yani bu seri durağan olmayabilir.
İkinci seri:
0001 . 0 0001
. 0 4923
. 0 degeri
289 . 4 982
. 12 689
. 0
) 0935 . 0 ( )
0941 . 0 ( )
0943 . 0 ( : .
40 . 0 221
. 1 065
. ˆ 0
2 1
p stat t
e s
X X
Xt t t
Parametre tahminlerinin toplamı yaklaşık ˆ
1 ˆ
2 0 . 821 olup 1 den küçüktür. Sezgisel olarak bu seri durağandır.
c) AR(3): AR(3) modeline uygun rasgele üretilen 100 birimlik zaman serisine ait grafikler aşağıdadır. Otokorelasyonlar azalma eğiliminde olmasına rağmen, yavaştır. Kısmi otokorelasyonlar üçüncü gecikmeden sonra sıfıra yakındır (%95 lik güven sınırları içinde). Bu verilere AR(3) modeli uygun görünmektedir. Parametreler EKK ile (SAS, PROC REG) tahmin edilerek ilgili istatistiki değerler ile beraber aşağıda verilmiştir.
0001 . 0 0001
. 0 0001
. 0 0255
. 0 degeri
249 . 4 908
. 8 988
. 22 270
. 2
) 096 . 0 ( )
1867 . 0 ( )
0975 . 0 ( )
1862 . 0 ( : .
4081 . 0 6633
. 1 2416
. 2 422
.
ˆ 0
1 2 3
p stat t
e s
X X
X
Xt t t t
Seri ACF PACF
0 20 40 60 80 100
-60-50-40-30-20-100
Lag
ACF
0 5 10 15 20
-0.20.00.20.40.60.81.0
Series : ar3
Lag
Partial ACF
0 5 10 15 20
-0.4-0.20.00.20.40.60.81.0
Series : ar3
Tahmin değerlerinin toplamı yaklaşık ( ˆ
1 ˆ
2 ˆ
3 0.9864 1 ) 1 dir.
O halde, veriler AR(3) olarak modellendiğinde, karekteristik denklemin köklerinden en az biri mutlak değerce 1 dir. Yani seri durağan değildir.
d) SAR
4( 1 ) Aşağıda zaman serisi grafiği ile hesaplanan otokorelasyon ve kısmi otokorelasyon fonksiyonlarının grafikleri bulunan rasgele üretilmiş verileri göz önüne alalım.
Seri ACF PACF
0 20 40 60 80 100
02468
Lag
ACF
0 5 10 15 20
-0.20.00.20.40.60.81.0
Series : sar1
Lag
Partial ACF
0 5 10 15 20
-0.20.00.20.40.60.8
Series : sar1
Otokorelasyonlarda yavaş da olsa periyodik bir azalma gözlenmektedir.
Kısmi otokorelasyonlar, ikinci ve dördüncü gecikmelerde güven sınırlarının dışında diğerleri %95 lik güven sınırlarının içindedir. Bu veriler için
t t
t
t
X X e
X ) (
) (
)
(
2 2
4 4
şeklinde bir modelin uygun olduğunu varsayalım. Parametrelerin EKK tahmin değerleri (SAS, PROC REG) aşağıdaki gibi hesaplanmıştır.
2 4
ˆ 0.250 0.0161 0.9158
. : (0.289) (0.0484) (0.0483) 0.864 0.0332 18.935 degeri 0.3897 0.7405 0.0001
t t t
X X X
s e t stat
p
Tahmin değerlerine göre, ikinci gecikme anlamlı gibi görünmesine rağmen p değeri dikkate alındığında ikinci gecikme anlamlı değildir.
Buna göre verilere
t t
t
X e
X ) (
)
(
4 4
modelinin uygun olabileceğini düşünelim. Bu durmda parametrelerin EKK tahminleri (SAS, PROC REG),
0001 . 0 3613 . 0 degeri
765 . 19 917
. 0
) 0465 . 0 ( ) 195 . 0 ( : .
9199 . 0 179
. ˆ 0
4
p stat t
e s
X
Xt t
olarak gözlenmiştir. Burada, ( X
t )
4( X
t4 ) e
tmodelindeki
4ün EKK tahmin değeri mutlak değerce 1 den küçük olup önerilen modelin durağan olması beklenir. Oysa, otokorelasyonlardaki azalma hızına bakıldığında, önerilen modelin durağan zaman serilerinin özelliklerini sağladığı söylenemez. Bu çelişkili durum değişik nedenlerden olabilir
İkinci bölümde, zaman serisi modellerinin durağanlığından ayrıntılı söz edildi. Özellikle, otoregresif zaman serisi modellerinde durağanlık modelin karekteristik denkleminin köklerine bağlıdır. Karekteristik kökler de model parametrelerine bağlıdır. Durağanlığından şüphelenilen verilerin öncelikle durağanlığı test edilmelidir.
5.2. Birim Kök Testleri
Bu kısımda, herhangi bir zaman serisinin durağanlığını sınamak için önerilen birim kök test yöntemleri üzerinde durulacaktır. Parametrelerin tahmin edicilerinin özelliklerine göre, değişik birim kök testleri olmasına rağmen, bunlar arasında EKK tahmin edicisinin dağılımına bağlı olarak geliştirilen Dickey-Fuller yöntemi ile bu yöntemin bir şekilde modife edilmiş hali olan Phillips-Perron yöntemi en çok kullanılanlar arasındadır.
Bu kısımda, bu iki test üzerinde durulacaktır. Serinin birden fazla birim kök içerip içermediğini sınamak için Dickey ve Pantula (1987) tarafından geliştirilen ardışık birim kök test yöntemi bir sonraki kısımda incelenecektir.
5.2.1. Dickey-Fuller Birim Kök Test Yöntemi
Birim köklü seriler AR bileşeni içeren serilerdir. Herhangi bir zaman
serisinin durağanlığını sınamak için birim kök testlerinden faydalanılır.
Bunlar arasında çok kullanılanlardan biri, parametrelerin EKK tahmin edicisinin, birim kök varsayımı altındaki dağılımına bağlı olarak geliştirilen Dickey-Fuller birim kök test yöntemidir. Bir çok paket program (Eviews ve SAS gibi), Dickey-Fuller test istatistiklerinin değerleri ile dağılımın kritik değerlerini doğrudan verir. e
t~ WN ( 0 ,
2) olmak üzere,
n t
e X
X
t) (
t)
t, 1 , 2 , 3 ,...,
(
1
şeklinde verilen AR(1) modelini ele alalım. H
0: 1 hipotezi altında serinin beklenen değeri modelden düşer. 0 olmak üzere nın EKK tahmin edicisi
n
t
t t n
t t
n
X X X
2
1 1
2 21
ˆ
olup eşitlikte X
tyerine X
t1 e
tyazılırsa,
1 1 1
2 2 2
1 1
2 2
2 2
1 1
2 2
1 ˆ 1
1
n n
t t t t
n n
t t
n t t t n n
t t
t t
t t
e X e X
X e X n
X n X
n
elde edilir. | | 1 ve n iken
n
O X
e
Pn
t
t
t
21
ve ( )
2
21
O n
X
Pn
t
t
yakınsama hızları bulunur. Buna göre,
) 1 1 (
ve ) 1 1 (
2 21 2
1 P
n
t t P
n
t
t
t
X O
O n X
n e
olduğundan n iken
ˆnP
ve n ˆ
n
DN ( 0 , 1
2)
yakınsamaları elde edilir (Bölüm 3 de yakınsamalar incelendi).
Bu istatistiklerin yakınsama hızları 1 olması halinde farklıdır
(Fuller, 1996, s.547). X
0 ve 0 1 için seri X
t ( e
1 e
2 ... e
t)
şeklinde yazılabilir. EKK tahmin edicisinin pay ve paydasının yakınsama
hızlarını hesaplamak için momentler ve yakınsama hızları
) 2 (
) 1
(
2 21
1
2
1 2
21
n n O n
e E
X
E
nt t
i i n
t
t
) 3 (
) 1 (
) 1 (
) )(
1 ( 2 2 ) ( 2
4 4 2
2
1
2 1 2
1
2 2 2
21
n n O
n n n
j j n t
X
Var
nj n
t n
t t
) 2 (
) 1
(
4 21
1 4
2 1
n n O n
t e
X
Var
nt n
t t t
) 3 (
) 2 )(
1
, (
34
2 21 2
1
n n n O n
X e X
Cov
nt t n
t
t
t
şeklinde olup, nın EKK tahmin edicisinin pay ve paydasının yakınsama hızları,
) (
ve )
(
22 21 2
1
O n X O n
X
e
Pn
t t P
n
t
t
t
şeklinde bulunur. Ayrıca,
1 1
1
n t t P(1)
t
e X O
n ve 2 2 1
1
1
n t P(1)
t
X O
n olduğundan ˆ
n 1 O
P(1/ ) n dir. Diğer taraftan,
nt t n
t t t
n
t t n
t t t
n
t t n
t t t
n
n X
X n e
X n n
X n e
X X e
2 21 2
2 1
2 21 2
2 1
2
2 21
2 1
1 1 1 1
1 ˆ 1
olarak yazıldığında n ( ˆ
n 1 ) O
P( 1 ) olduğu görülür. n ( ˆ
n 1 ) nin dağılımı bulunursa, bu istatistik verilen herhangi bir serinin birim köklü olup olmadığını sınamak için kullanılabilir. Bu istatistiğin dağılımı literatürde Dickey-Fuller dağılımı olarak bilinir. Dağılımın kritik değerleri Fuller (1996.
s. 641, Tablo 10.A.1) de verilmiştir.
Diğer taraftan, X
t X
t1 e
tmodeli için, H
0: 1 hipotezi
altında EKK tahmin edicisinin payı
n
t t
n n
t
n
t t
n
t t
t
i i
t n
t
e
tX
te e e e X e
1 2 2
1 1
2 2
1 1
1
1 1
2
1 2
1
şeklinde yazılabilir. Buna göre, e t
t, 1, 2,3,... ler beklenen değeri sıfır, varyansı
2olan bağımsız rasgele değişkenler olduğundan, zayıf büyük sayılar yasası ve merkezi limit teoreminden n iken
n
t t P
n
1e
2
1
2 ve
n
t
n D
t
X N
e n n
12
) , 0 1 (
1
dir. Bu sonuçlar Slutsky teoremi ile birleştirildiğinde n iken,
1
2 1
1 2
1
1
21 2
1 2 2
1
1
n D
t t n
n
t t
t
e
X n X n
n e
şeklinde dağılımda yakınsama elde edilmiş olur. Buradan da
2 21 1 12 2
1 1
ˆ
n1
n t n t t P(1)
t t
n X e X O
n n
olduğu görülür. Bu istatistiğin dağılımı, W (t ) standart Wiener sürecini göstermek üzere, n iken
2 21 1 1 1 122 2 2
0
1 1 1 1
ˆ 1
2 ( )
n n
D
n t t t
t t
n X e X
n n
W t dt
olarak da ifade edilebileceği ileride görülecektir. Bu test istatistiğinin hesaplanan değeri ile kritik değerleri karşılaştırılarak AR(1) modeline uygun olduğu varsayılan bir serinin birim köklü olup olmadığı test edilir.
t t
t
X e
X
1 şeklinde verilen AR(1) modeli, regresyon modeline benzediğinden H
0: 1 hipotezini test etmek için genellikle t testi kullanılır. Ancak, H
0: 1 hipotezi altında t istatistiğinin dağılımı da bilinen t dağılımı değildir. nın EKK tahmin edicisi ˆ
nve
nt
n
t t t
n t
n
e
X n n X
S
2 2
2 1 2
2
ˆ
2 ) 1
( ˆ 2
1
olmak üzere, H
0: 1 hipotezini test etmek için t istatistiği
1 1/ 2
2 2
2 1
ˆ
n n n t( ˆ
n1)
t
S X
şeklindedir. Literatürde bu dağılım da Dickey-Fuller dağılımı olarak bilinir.
Dağılımın kritik değerleri bir çok paket programda (Eviews gibi) doğrudan hesaplanır. Dağılımın diğer yüzdelikleri Fuller (1996, s.642 Tablo 10.A.2) tarafından verilmiştir. Bununla birlikte, S istatistiğini,
n22 2 2
1 1 1
2 2
1 ( ˆ ) 1 ( ˆ )
2 2
n n
n t n t t t n t
t t
S X X X e X
n n
1 2
2
1 ( ˆ )
2
n
t n t
t
e X
n
2 2 2
1 1
2 2 2
1 2( ˆ ) ( ˆ )
2
n n n
t n t t n t
t t t
e e X X
n
şeklinde yazabiliriz. Buradan, 1 ise, )
( 1
ˆ
n O
Pn
1 ,
n
t
P t
t
X O n
e
2
1
( ) ve
n
t
P
t
O n
X
2
2
21
( )
yakınsama hızları kullanıldığında S
n2,
2 2 1
2
1 ( )
2
n
n t P
t
S e O n
n
şeklinde yazılabilir.
Buraya kadar beklenen değeri sıfır ( 0 ) olan AR(1) modeli ele alındı. Şimdi AR(1) modeli,
n t
e X
X
t) (
t)
t, 1 , 2 , 3 ,...,
(
1
şeklinde verilmiş olsun.
0 ( 1 ) denirse model, n
t e X
X
t
0
t1
t, 1 , 2 , 3 ,...,
şeklinde yazılabilir. Bu model de kesim noktası (intercept) bulunan basit doğrusal regresyon modeline benzer. 1 için model durağan değildir.
1
0
:
H hipotezi altında ve dolayısı ile modelden düşer. Bu
0modele göre nın EKK tahmin edicisi,
i 0 , 1 için
( ) 2
1
ni t i
t
X X
n i
olmak üzere,
2 1
, 1 (1) (0) 1 (1)
2 2
ˆ
n n t n(
t)(
t)
t t
X X X X X X
dir. H
0: 1 hipotezini test etmek için t türü, ˆ
n,istatistiğinin değeri kullanılır. Burada,
,
1 1/ 2
, 2 2
, 0 1 ,
ˆ 1
ˆ 1
ˆ ˆ ˆ
ˆ ( ) 1
n
n n
n n t t n
t
S X X
S
olup hesaplanması oldukça kolaydır. Bu değer, nin X
tX
t1üzerine regresyonunda X
t1in katsayısı için hesaplanan t değeridir. Bu istatistiğin dağılımı da bilinen t dağılımı değildir ve literatürde Dickey-Fuller dağılımı olarak bilinir. Dağılımın yüzdelikleri de Fuller (1996) tarafından verilmiştir.
n( ˆ
n, 1 ) ve ˆ
n,istatistiklerinin yakınsama hızları
) 1 ( ) ˆ 1
(
n,O
Pn
ve ˆ
n, O
P( 1 ) şeklindedir (Fuller, 1996). Bu dağılımların yüzdelikleri ile önceki dağılımların yüzdelikleri farklıdır.
Model kesim noktası ile beraber zamana bağlı deterministik trend de içerebilir. Örneğin model,
n t
e t b a X t
b a
X
t) (
t)
t, 1 , 2 , 3 ,...,
(
1
şeklinde verilmiş ise, bu model de
n t
e X t
b a
X
t ( 1 ) ( 1 )
t1
t, 1 , 2 , 3 ,...,
şeklinde regresyon modeli gibi yazılabilir. Bu durumda, nın EKK tahmin edicisi farklıdır. 1 için model yine durağan değildir ve X
t X
t1 e
tşekline dönüşür. Yani, bir önceki modelde de olduğu gibi beklenen değer
)
(
t a b t modelden düşer. nın EKK tahmin edicisi ˆ
n,olmak
üzere n ( ˆ
n, 1 ) O
P( 1 ) dir. Ayrıca, t türü istatistik ˆ
n,olmak
üzere ˆ
n, O
P( 1 ) dir (Fuller 1996). n ( ˆ
n, 1 ) ve ˆ
n,nin
dağılımının yüzdelikleri (kritik değerleri) de yukarıdaki diğer dağılımların yüzdeliklerinden farklıdır. Eğer veride zamana bağlı bir trend olduğundan şüpheleniliyorsa, H
0: 1 hipotezini test etmek için bu dağılımın kritik değerleri kullanılmalıdır.
Son olarak, AR(p) modeli
1
(
t)
p i(
t i)
t, 1, 2,3,...,
i
X X
e t n
olarak verilmiş olsun. Karekteristik denklemin köklerinden biri mutlak değerce 1 ise seri birim köklüdür. O halde, zaman serisi verileri AR(p) olarak modellendiğinde, serinin birim köklü olup olmadığını test etmek için karekteristik denklemin köklerinden birinin (birden fazla birim kök ileride incelenecektir) mutlak değerce 1 olup olmadığının test edilmesi gerekir.
Verilen AR(p) zaman serisi modeli,
pi i 1
1
ve
pi j
j
i
, i 2 , 3 ,..., p
olmak üzere,
pi
t i t i t i t
t
X X X e t n
X
2
1 1
1
( ) , 1 , 2 , 3 ,...,
şeklinde yazılabilir. Karekteristik denkleminin köklerinden en az birinin mutlak değerce 1 olması için gerek ve yeter koşul
1 1 olmasıdır (Örnek 5.1.1a). Onun için, serinin birim köklü olup olmadığının test edilmesi ile
0
:
11
H
hipotezinin test edilmesi aynıdır. Bu modele göre,
1in EKK tahmin edicisi ˆ
1,nve herhangi sabit bir c için
nc( ˆ
1,n 1 )
OP( 1 )
dir. Ayrıca t türü istatistik de ˆ
1,n
OP( 1 ) dir (Fuller, 1996). Burada serinin birim köklü olup olmadığını test etmek için, ve trend durumuna göre yukarıdaki test istatistiklerinin değerleri hesaplanır.
Verilen herhangi bir serinin birim köklü olup olmadığını sınamak için Dickey-Fuller testinin nasıl yapıldığı aşağıda özetlenmiştir:
A) Model: ( X
t ) ( X
t1 ) e
t, t 1 , 2 , 3 ,..., n
i) X
t: t zamanındaki gözlem
ii) e
t: hata terimi (normal olduğu varsayılmaktadır) iii) : beklenen değer
iv) : otoregresif model parametresi
B) Problem: H
0: 1 yokluk hipotezinin test edilmesi
i) 1 için modelden düşer ve öngörüler ortalamaya yaklaşmaz ii) Test istatistiğinin değerini hesaplamak için modelin her iki tarafından
1
X
tçıkartılarak model X
t X
t1 ( 1 ) X
t1 e
tşeklinde yazılır.
Buradan, D
t X
t X
t1ler hesaplanır.
iii) D
tlerin X
t1üzerine regresyonu yapılır. Bu regresyon modeline göre X
t1in katsayısının sıfır olup olmadığını test etmek için n ( ˆ
n 1 ) ,
) ˆ 1
(
n,
n veya n ( ˆ
n, 1 ) test istatistiklerinin değerleri hesaplanır ve kritik değerler ile karşılaştırılır. Genellikle, bu test istatistikleri yerine t
türü istatistikler kullanılır. Bunun için hesaplanan t türü istatistiklerin (
ˆ
n, ˆ
n,veya ˆ
n,) değerleri tablo değerleri ile karşılaştırılır. Hesaplanan değer, tablo değerinden küçük ise H
0: 1 hipotezi red edilir.
iv) Yöntem yüksek dereceden modeller için de geçerlidir.
C) Trendden Arındırma:
i)
Dt
Xt
Xt1değişkenin X
t1üzerine regresyonu yapılır ( yok)
0ii)
Dt
Xt
Xt1değişkenin X
t1üzerine regresyonu yapılır ( dahil)
0iii)
Dt
Xt
Xt1değişkenin X
t1ve t üzerine regresyonu yapılır (
0dahil)
iv) Her üç regresyon için de test istatistiğinin değerleri modelin kesim noktası ve trend olup olmadığı durumlarına göre hesaplanır ve tablo değeri ile karşılaştırılır.
D) Yüksek Dereceden Modeller:
i) Model: X X e
tt n
p
i i t i
t
) ( ) , 1 , 2 , 3 ,...,
(
1
ii)
Dt
Xt
Xt1olmak üzere,
Dt1,
Dt2,...,
Dt pfarkları hesaplanır.
iii) D
tnin
Xt1,
Dt1,
Dt2,...,
Dt püzerine regresyonu yapılır. Bu regresyona göre X
t1in katsayısının ( 1
1
2 ...
p) sıfır olduğunu test etmek için n ( ˆ
n 1 ) , n ( ˆ
n, 1 ) veya n ( ˆ
n, 1 ) istatistiklerinin değerleri hesaplanır ve tablo değeri ile karşılaştırılır. Genellikle bu test istatistikleri yerine t türü istatistikler ( ˆ
n, ˆ
n,veya ˆ
n,) kullanılır.
Örnek 5.2.1 1923-2001 dönemi Türkiye’nin yıllık elektrik enerjisi tüketim miktarları ile ilgili zaman serisi grafikleri bir önceki bölümde (Örnek 4.3.3) verilmişti.
Oradaki grafikler tekrar incelendiğinde, otokorelasyonlarınn yavaş bir şekilde azaldığı, kısmi otokorelasyonların da birinci gecikmeden sonra sıfır (%95 lik güven sınırları içinde) olduğu gözlenmişti. O halde, verilerin AR(1) olarak modellenmesi uygundur. Verilere AR(1) modelin uygunluğunu AIC ve SBC istatistiklerinin değerleri de desteklemektedir.
Buradan verilere,
79 ,..., 3 , 2 , 1 , ) (
)
( X
t X
t1 e
tt
şeklinde AR(1) modelinin uygun olduğunu düşünelim. Bu model dikkate alınarak, parametre tahminleri ve bazı istatistiki sonuçlar aşağıdadır .
Sum of Mean
Source DF Squares Square F Value Prob>F Model 1 415.62285 415.62285 132528.667 0.0001 Error 76 0.23834 0.00314
C Total 77 415.86120
Parameter Estimates
Parameter Standard T for H0:
Variable DF Estimate Error Parameter=0 Prob > |T|
INTERCEPT 1 0.149854 0.02242834 6.681 0.0001 X1 1 0.993614 0.00272937 364.045 0.0001
Model,
79 ,..., 3 , 2 , 1
1
,
0