• Sonuç bulunamadı

Zaman serilerinde en önemli kavramlardan biri, rasgele değişkenin gelecekte alacağı değerin öngörülmesidir. İstatistikte “tahmin (estimation)”, “kestirim (prediction)” ve “öngörü (forecasting)”

N/A
N/A
Protected

Academic year: 2021

Share "Zaman serilerinde en önemli kavramlardan biri, rasgele değişkenin gelecekte alacağı değerin öngörülmesidir. İstatistikte “tahmin (estimation)”, “kestirim (prediction)” ve “öngörü (forecasting)”"

Copied!
13
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

2.6. Öngörü (Forecasting)

Zaman serilerinde en önemli kavramlardan biri, rasgele değişkenin gelecekte alacağı değerin öngörülmesidir. İstatistikte “tahmin (estimation)”, “kestirim (prediction)” ve “öngörü (forecasting)”

kavramları birbirlerine yakın anlamlar içermesine rağmen aslında çok farklıdır. Tahmin kitlenin bir parametresi için önerilen tahmin edicinin değerdir.

Örneğin, X X 1 , 2 ,..., X n beklenen değeri μ varyansı  2 olan normal dağılımdan bir örneklem ise, μ için X n tahmin edicisi önerilir. X n nin değeri de μ için bir tahmindir.

Eğer rasgele değişkenin değerleri

7.7 , 9.1 , 8.0 , 8.6 , 10.1 , 7.8 , 7.4 , 8.9 , 6.9 , 12.0

olarak gözlenmiş ise, μ için bir tahmin x n  8.65 olur.

Kestirim, bir rasgele değişken için seçilen bir modelin parametrelerinin tahmin değerleri yerine konulduğunda elde edilen değerdir. Kestirim için daha genel tanımlar yapılabilir. Örneğin,

0 1

t t t

Y     xe , t  1, 2,...,10 basit doğrusal regresyon modelini ele alalım ve aşağıdaki verilerin bu regresyon modeline uygun olduğunu varsayalım.

X 1 2 3 4 5 6 7 8 9 10

Y 7.7 9.1 8.0 8.6 10.1 7.8 7.4 8.9 6.9 12.0

Bu modelin parametreleri  0 ve 1 olup EKK tahmin değerleri  ˆ 0  7.92 , ˆ 1 0.132727

  olarak hesaplanmıştır. Buna göre kestirim modeli, Y ˆ

t

 7.92 0.132727  x

t

olup

1 7.7

Y  olarak gözlenmiş ancak Y ˆ

1

 8.05273 olarak kestirilmiştir.

Öngörü, tahmin ve kestirim kavramlarından farklıdır. Öngörü bir modele göre, model parametrelerinin tahmin edilmesi ile rasgele değişkenin gelecekte alacağı değer için önceden kestirimdir. Elimizde aylık enflasyon verileri varsa, önce bu verilere bir model uydurmamız gerekir.

Bu modele göre ileriki aylardaki enflasyon değerleri için öngörülerde bulunulabilir. Yani ileriki aylarda enflasyon değişkeninin alacağı değerler için önceden kestirim yapılır. Buna benzer örnekler çoğaltılabilir. Örneğin, geçmiş 10 yıla ait aylık ihracat miktarları kullanılarak, gelecek aylardaki ihracat miktarları hakkında öngörülerde bulunulabildiği gibi, geçmiş yıllara ait Ağustos ayı sıcaklık değerleri kullanılarak bir sonraki Ağustos ayının sıcaklığı hakkında öngörüde bulunulabilir. Diğer taraftan, yıllık buğday üretimleri ele alınarak önümüzdeki yılın buğday üretimi hakkında da bir öngörüde bulunulabilir. Elbette, bu öngörüleri etkileyen başka değişkenler de vardır. Örneğin, yıllık buğday miktarı için bir öngörü istendiğinde geçmiş yıllara ait buğday üretim miktarlarına ihtiyaç olduğu gibi, yağış miktarlarına da ihtiyaç duyulabilir. Bunlar ise, buğday miktarları hakkında öne sürülecek modele bağlıdır. Dolayısı ile, hemen hemen bütün istatistiki analizlerde olduğu gibi önce verilere uygun bir modelin seçilmesi gerekir. Model seçimi için bir çok kriter öne sürülebilir.

Bunlardan bazıları ileriki bölümlerde ele alınacaktır. Bu kısımda, X X 1 , 2 ,..., X n rasgele değişkenlerinin gözlenen değerleri kullanılarak, X n 1 rasgele değişkeninin (veya X n 2 , X n 3 gibi rasgele değişkenlerin) alacağı değerin öngörülmesi üzerinde durulacaktır.

Tanım 2.6.1 X X 1 , 2 ,..., X n

rasgele değişkenleri verildiğinde, X n 1

için bir öngörü

^X n+1 =E( X n+1 | X 1 , X 2 ,..., X n )

(2)

koşullu beklenen değeridir 

1 1

( ˆ

n

) (

n

)

E X

E X

oluyorsa, ˆ

1

X

n

öngörü istatistiği yansızdır denir. Bu öngörünün yansızlığı

1 1 1 2 1

( ˆ n ) [ ( n | , ,..., n )] ( n ) E X E E X X X XE X

koşullu beklenen değerin tanımından açıktır. Bir rasgele değişken için öngörü yapılabildiği gibi aynı anda birden çok rasgele değişken için de öngörü yapılabilir. Yani, Z  ( X n 1 , X n 2 ,..., X n s ) için bir öngörü

1 2

ˆ  E ( | X X , , ,  X n )

Z Z

olur.

1 , 2 ,..., n , n 1

X X X X değişkenlerinin ortak dağılımı normal ise, X n 1 için bir öngörü

1 , 2 ,..., n

X X X lerin lineer birleşimidir. Buna göre, normallik varsayımı altında çok değişkenli normal dağılımın özelliğinden X n 1 için bir öngörü

1 1 1 2 1 1 2 2

1

ˆ n ( n | , ,..., n ) n i i ... n n

i

X E X X X X a X a X a X a X

      

şeklinde yazılabilir. Buradan, koşullu beklenen değer olarak tanımlanan öngörü, örneklemin lineer birleşimi olup yansızdır. Bu öngörü, a  ( , ,..., ) a a

1 2

a 

n

ve X ( X X

1

,

2

,..., X 

n

) olmak üzere ˆ

1

X

n

 a X  şeklinde gösterilebilir. Öngörüler verildiği zaman, hata kareler ortalaması veya başka herhangi bir kritere göre karşılaştırılması gerekir.

Tanım 2.6.2 Öngörü istatistiğinin hata kareler ortalaması

MSEP( ^X n+1 )= E ( X n+1 − ^ X n+1 ) 2

dir 

Yukarıda verilen ˆ

1

X

n

 a X  öngörü istatistiği bütün lineer yansız öngörüler içinde en küçük hata kareler ortalamasına sahiptir. Yani, hata kareler ortalaması kriterine göre, koşullu beklenen değer olarak tanımlanan öngörü en iyidir. Bunu göstermek için ˆ * 1

X n gibi başka bir lineer yansız öngörü alalım. Bu öngörünün hata kareler ortalaması E X ( n 1X ˆ n * 1 ) 2 olup

E( X n+1 − ^ X n+1 ) 2E( X n+1 − ^ X ¿ n+1 ) 2

olduğu gösterilmelidir. E X ( n 1X ˆ * n 1 ) 2 beklenen değerin içine ˆ 1

X n teriminin eklenip çıkarılması ile

* 2 * 2

1 1 1 1 1 1

2 * 2 *

1 1 1 1 1 1 1 1

* 2 *

1 1 1 1 1 1 1

ˆ ˆ ˆ ˆ

( ) ( )

ˆ ˆ ˆ ˆ ˆ ˆ

( ) ( ) 2 ( , )

ˆ ˆ ˆ ˆ ˆ ˆ

( ) ( ) 2 ( , )

n n n n n n

n n n n n n n n

n n n n n n n

E X X E X X X X

E X X E X X Cov X X X X

MSEP X E X X Cov X X X X

     

       

      

    

      

     

(3)

elde edilir. Cov X ( n 1X ˆ n 1 , X ˆ n 1X ˆ n * 1 ) 0  ise E X ( ˆ n 1X ˆ * n 1 ) 2 terimi her zaman pozitif olduğundan iddia ispatlanmış olur. Diğer taraftan, ˆ 1

X n ve ˆ * 1

X n öngörüleri yansız olduğundan problem

1 ˆ 1 ˆ 1 ˆ * 1

[( n n )( n n )] 0

E X X X X  olduğunun gösterilmesine dönüşür. ˆ

1

X

n

 a X  ve ˆ

*1

X

n

 b X  olduğundan

1 1 1 2

ˆ n ( n | , ,..., n )

X E X X X X ve X ˆ n * 1E X ( n 1 | X X 1 , 2 ,..., X n )

yazılır. Her iki öngörü de yansız olduğundan E X ( ˆ n 1 )  E X ( ˆ * n 1 ) dır. Koşullu beklenen değerin tanımından ,

*

1 1 1 1 2 1 1 2

* *

1 1 1 1

1 1 1 * 1

1 1 1 * 1 1 2

[

{

ˆ ˆ ˆ

( ) [ ( | , ,..., ) ( | , ,..., )]

ˆ ˆ ˆ

( ) [ ( ) ( )] 0

ˆ ˆ ˆ

( ) ( )]

ˆ ˆ ˆ

[( )( ) , ,..., ]}

n n n n n n

n n n n

n n n n

n n n n n

E

E

E X X E E X X X X E X X X X

E X X E E X E X

X X X X

E X X X X X X X

   

   

   

   

  

   

 

 

elde edilir. Buradan da, başka herhangi bir lineer yansız öngörü ˆ * 1 X n için,

*

1 1

ˆ ˆ

( n ) ( n )

MSEP X MSEP X

olduğu görülür. Sonuç olarak X ˆ

n1

E X (

n1

| X X

1

,

2

,..., X

n

) öngörü istatistiği, hata kareler ortalaması kriterine göre en iyidir. O halde,

^X n+1 =E( X n+1 | X 1 , X 2 ,..., X n )

öngörüsü, en iyi (Best), lineer (Linear) yansız (Unbiased) öngörü (Forecast) dür. Başka bir ifade ile,

1 1 1 2

ˆ n ( n | , ,..., n )

X E X X X X öngörü istatistiği BLUF dır.

Öngörü, koşullu beklenen değer olarak tanımlandı. Veriler normal dağılımlı bir kitleden alınmış ise, koşullu beklenen değer örneklemin lineer birleşimidir. Örneklem normal değilse, koşullu beklenen değer örneklemin lineer bir birleşimi olmayabilir. O zaman, koşullu beklenen değerin doğrudan hesaplanması gerekir. Hemen hemen bütün istatistiki sonuç çıkarımlarda olduğu gibi, normallik varsayımı yapılır. Normallik varsayımında problem varsa, dönüşümler yapılarak (genellikle logaritması alınarak) normallik sağlatılır. Bu nedenle, öngörü kavramı açıklanırken sadece lineer birleşimler üzerinde duruldu. Şimdi normallik varsayımı altında bu koşullu beklenen değerin gerçekten örneklemin bir lineer birleşimi olduğunu görmeye çalışalım.

1 2

( X X , ,..., X  n )

X ve Z  ( X n 1 , X n 2 ,..., X n s )  olmak üzere, X ve Z nin ortak dağılımı normal olsun. Yani, X ve Z nin ortak dağılımı,

X Z

¿ righ

¿

¿¿

(¿)¿

¿¿

N

μ ( x ) μ ( z )

¿ righ

[¿] [¿ ¿ ¿[ ],

[

VVxxzx VVxzzz

]

)

¿

¿

¿

olarak verilmiş olsun. O zaman X verildiğinde Z nin koşullu dağılımı,

| |

| ~ MN ( z x , V z x )

Z X

olup, koşullu beklenen değer ve varyans

(4)

 

| ( ) ( )

z x   V zx

  z Xx

ve V z|x =V zz −V zx V −1 xx V xz

şeklindedir. Buradan Z için bir öngörü

^Z= E( Z|X ) = μ z| x =μ( z )+V zx ( X −μ( x ) )   c a X

şeklinde örneklemin lineer birleşimidir. Bundan böyle aksi söylenmedikçe, hata terimlerinin normal olduğu varsayılacaktır.

Örnek 2.6.1 e t ler beklenen değeri sıfır varyansı σ 2 olan bağımsız rasgele değişkenler olmak üzere, X t zaman serisi AR(1) modeline uygun olarak

1 1

, 1

, 2

t

t t

X t

XX e t

 

    

şeklinde verilmiş olsun. Ayrıca, bütün t ler için e t ve X 1 bağımsız olsun.

| α |<1 için seri durağandır. X 1 , X 2 ,..., X n değişkenlerinin değerleri gözlendiğinde,

X n+1 , X n+2 ,... , X n+s değişkenlerini öngörmek isteyelim. e n+1 ile X 1 , X 2 ,..., X n ler

bağımsız olduğundan,

E(e n+1 | X 1 , X 2 ,. .., X n )=E(e n+1 )=0

dır. Buna göre, X n 1 için bir öngörü

1 1 1 2 1 1 2

ˆ

n

(

n

| , ,...,

n

) (

n n

| , ,...,

n

)

n

X

E X

X X XEXe

X X X   X olarak yazılır. Diğer öngörüler

1 2 1 1 2

1 1 2 1

ˆ ( | , ,..., ) ( | , ,..., )

( | , ,..., ) ˆ

n s n s n n s n s n

n s n s n n s

X E X X X X E X e X X X

E X e X X X X

 

    

    

  

  

şeklinde ardışık olarak hesaplanır. Böylece, öngörüler

^X n+22 X n , ^X n+33 X n , …, ^X n+ss X n

şeklinde elde edilir. Görüldüğü gibi, bütün öngörüler rasgele değişkenin en son değerine bağlıdır.

Diğer taraftan, serinin beklenen değeri sıfırdır. Ayrıca, s →∞ iken

^X n+s = α s X n →0 =E ( X t )

dir. Yani, öngörüler serinin beklenen değerine yaklaşır. Bir sonraki bölümde görüleceği gibi, durağan zaman serileri için X ¯ n örneklem ortalaması, kitle ortalamasına ( μ ) olasılıkta yakınsar. O halde, seri durağan ise öngörüler örneklem ortalamasına yaklaşır. Seri durağan değilse, yani α =1

olduğunda, öngörüler hep aynı kalır. Bu değer ise, bütün s ler için ^X n+s = X n dir

Öngörüler hesaplandıktan sonra, öngörü hataları ve bu hataların varyanslarına istatistiksel sonuç

çıkarım açısından ihtiyaç duyulur. En azından yapılan öngörüler için bir güven aralığının verilmesi

gerekebilir.

(5)

X 1 , X 2 ,..., X n örneklemine bağlı olarak hesaplanan ^X n+1 için öngörü hatası doğal olarak

X n+1 − ^ X n+1 ve öngörü hatasının varyansı da Var( X n+1 − ^ X n+1 ) dır. Örnek (2.6.1) de elde edilen öngörülerin hataları ve öngörü hatalarının varyansları aşağıdadır. Öngörü hatalarından ilk iki tanesi,

X n+1 − ^ X n+1 =α X n + e n+1 −α X n =e n+1

 

2 2

2 2 1 2 1 2

2 2

1 2 1 2

n ˆ n n n n n n n n

n n n n n n

X X X e X X e e X

X e e X e e

    

   

     

   

       

      şeklindedir. Bu

işlemler ardışık olarak devam ettirildiğinde öngörü hataları

X n+s − ^ X n+s = ∑

i=0 s−1

α i e n+s−i

olarak yazılabilir. Öngörü hatalarının varyansları da

2 1 2

0 1

0 0

2 1 2

0

( n s ˆ n s ) s i 2 i j s ( n s i , n s j )

i

s i

i

Var X X   Cov e e

 

         

 

  

 

 

şeklindedir. Bunlardan ilk üç tanesi,

Var( X n+1 − ^ X n+1 )=Var(e n+1 )=σ 2

2 2

2 ˆ 2 1 2

( n n ) ( n n ) (1 )

Var X X Vare e    

2 2 2 4

3 ˆ 3 1 2 3

( n n ) ( n n n ) (1 )

Var X X Vare   e e       şeklinde hesaplanmıştır. Z = ( X n 1 , X n 2 ,..., X n s )  için bir öngörü de,

2 2

. .

ˆ . .

. .

n n

n n

s s n

X X

X X

X

 

 

   

   

   

   

   

  

   

   

   

     

 

Z

olup, öngörü vektörünün hatası

Z − ^Z=

X

n+ 1

− ^ X

n+ 1

X

n+ 2

− ^ X

n+ 2

X

n+ 3

− ^ X

n+ 3

.

. .

X

n+ s

− ^ X

n+ s

righ ¿

¿ ¿

¿

[

¿

] [

¿

] [

¿

] [

¿

] [

¿

] [

¿

]

¿

¿ ¿

e

n+ 1

α e

n+1

+ e

n+2

α

2

e

n+ 1

+α e

n+ 2

+ e

n+ 3

.

. .

α

s −1

e

n+ 1

+ α

s−2

e

n+ 2

+. ..+α e

n+ s−1

+ e

n+ s

righ ¿

¿ ¿

¿

[

¿

] [

¿

] [

¿

] [

¿

] [

¿

] [

¿

]

¿

¿ ¿

şeklindedir. Öngörü hatasının varyansını hesaplamak için,

(6)

A= [ . . . α α α α 1 s−1 2 3 . . . α α α 0 1 s−2 2 . . . α α 0 0 1 s−3 . . . α 0 0 0 1 s−4 . . . 0 . . . . . . . . . . . . . 0 0 0 1 ] ve e= [ . . . e e e e e n+4 n+1 n+2 n+3 n+s ]

olmak üzere, öngörü hatalarını Z − ^Z= A e şeklinde yazalım. Buradan, öngörü hata vektörünün varyans-kovaryans matrisi,

ˆ ˆ 2

(( ) ( ) ') '

E Z Z Z Z     A A şeklinde olur.

Örnek 2.6.2 Aşağıdaki verilerin AR(1) modeline uygun olduğunu kabul edelim. Satır halinde 20 veri aşağıdadır.

-2.2 -2.6 -4.0 -4.6 -3.5 -5.0 -6.5 -6.2 -8.0 -4.3

-4.5 -2.5 -2.0 -1.6 -0.3 4.6 4.2 1.9 4.9 3.3

Bu verilere ait otokorelasyon ve kısmi otokorelasyonlardan bazıları hesaplanarak aşağıda verilmiştir.

h 0 1 2 3 4 5

ρ(h) ^ 1.00 0.824 0.660 0.540 0.324 0.096

ˆ( ) h

0.824 -0.057 0.038 -0.377 0.202

X t nin X t−1 üzerine regresyonundan ( X t   X t 1e t t ,  1, 2,3,..., n ) α nın EKK tahmini α =0.90492 ^ olarak bulunmuştur. Bu model, X t −μ=α ( X t−1 −μ)+e t olarak

yazılığında, μ kitle ortalamasını X ¯ n ile tahmin edelim. Bu değer de, ¯x=−1 .945 olarak

gözlenmiştir. ( X t   )   ( X t 1   )  e t t ,  1, 2,3,..., n şeklinde verilen regresyon modeli

α 0 =μ (1−α ) olmak üzere, X t0 +α X t−1 +e t şeklinde yazılabilir. Buradan da  0 nın EKK tahmini α ^ 0 ≈−0.185 olarak elde edilmiş olur. Böylece kestirim denklemi,

^X t =−0.185+0.90492 X t−1 olarak elde edilir. Öngörülerden ilk iki tanesi,

^X 21 =− 0.185+0.90492 X 20 =−0.185+0.90492 (3.3)=2.8

^X 22 =−0.185+0.90492 { ^X 21 =−0.185+0.90492 (2.8)=2.34877≈2.35 ¿

olarak hesaplanmıştır. Öngörüler için %95 lik bir güven aralığı yazmak için verilerin normal dağılımlı bir kitleden alındığını varsayalım. Beyaz gürültü serisinin standart hatası

ˆ MSE 3.8454 1.96

    olup, normal dağılım tablosundan, z 0. 975 =1.96 dır. X 21 ’in

öngörüsü için %95 lik güven aralığı X ˆ 21s (1.96) den 2.8±3.84 veya ( 1.04, 6.64) 

olarak yazılır. Şimdi X 22 için bir güven aralığı yazalım. X ˆ 22  2.35 olup, standart hatası

(7)

s( ^X 22 )= √ MSE(1+ ^α )= √ 3.8454(1+0.90492)≈2.71

olarak bulunmuştur. Buradan %95 lik güven aralığı 2.35±1.96(2.71) veya (−2.96, 7.66)

olarak elde edilir. Aynı veriler kullanılarak SAS PROC ARIMA’da, X 21 için %95 lik güven aralığı

(−1.036, 6.7182) , X 22 için %95 lik güven aralığı da (−2.8172 , 7.6646 ) olarak

hesaplanmıştır. Aradaki fark, kesirlerin yuvarlatılması ve α ile  2 parametrelerinin başka bir yöntem ile hesaplanmasından kaynaklanmaktadır

( X t   )   ( X t 1   )  e t şeklinde verilen AR(1) modelini tekrar ele alalım. | α |<1

için model durağandır. Modelin beklenen değeri E( X t )= μ , varyansı da

Var( X t )=σ 2 /( 1−α 2 ) dir. Diğer taraftan, öngörüler μ=0 için X ˆ n s s X n

şeklindedir. Seri durağan ise öngörüler serinin ortalamasına, öngörü hatalarının varyansı da serinin varyansına yaklaşır. Durağan değilse bu yakınlaşma geçerli değildir.

X tμ=α ( X t−1μ)+e t şeklinde verilen AR(1) modeli X 0 rasgele değişkeninin değerine de bağlıdır. Buraya kadar, X 0 =0 alınarak işlemler yürütüldü. Genel olarak yapılan da budur. Ancak, X 0 değişkeninin aldığı değerin de kestirilmesi beklenebilir. Y t =X t −μ

denirse, model Y t =α Y t−1 +e t şekline dönüşür. Buradan, Y 1 =α Y 0 +e 1 eşitliğinden,

Y 0−1 Y 1 −α −1 e 1 yazılır ve Y 0 için bir kestirim de ^Y 0−1 Y 1 şeklinde yazılabilir.

Yukarıda, AR(1) modeli için öngörülerin nasıl hesaplanacağı hakkında kısa bilgiler verildi. Şimdi yüksek dereceden modeller için öngörülerin nasıl yapılacağını görelim. AR(2) zaman serisi modeli,

~ (0, 2 )

e t WN  olmak üzere

1 1 2 2

( X t   )   ( X t    )  ( X t   )  e t

olarak verilmiş olsun. AR(2) modelini α 0 =μ (1−α 1 −α 2 ) olmak üzere,

X t = α 01 X t−12 X t−2 + e t

şeklinde yazabiliriz. X 1 , X 2 ,..., X n verildiğinde X n+s için ( s  1, 2,3,... ) öngörüler,

^X n+s =E ( X n+s | X 1 , X 2 ,.. ., X n )

koşullu beklenen değeri ile hesaplanır. X n s     0 1 X n s   1   2 X n s   2e n s koşullu beklenen değerde yerine yazılırsa E(e n+s | X 1 , X 2 ,..., X n )=0 olduğu da dikkate alınarak X n s için öngörüler,

^X n+s = E ( X n+s | X 1 , X 2 ,..., X n )

= E (α 01 X n+s−12 X n+ s−2 +e n+s | X 1 , X 2 ,..., X n )

= α 0 + α 1 E( X n+s−1 | X 1 , X 2 ,..., X n )+α 2 E( X n+ s−2 | X 1 , X 2 ,..., X n )

= α 01 X ^ n+s−12 X ^ n+s−2

(8)

şeklinde ardışık olarak hesaplanır. Bunlardan ilk üç tanesi,

1 1 1 2

0 1 2 1 1 1 2

0 1 2 1

ˆ ( | , ,..., )

( | , ,..., )

n n n

n n n n

n n

X E X X X X

E X X e X X X

X X

  

  

 

 

   

  

2 2 1 2

ˆ n ( n | , ,..., n ) X E X X X X

 

0 1 1 2 2 1 2

0 1 1 2 0 1 0 1 2 1 2

0 1 1 2 2 1 2 1

( | , ,..., )

ˆ

(1 ) ( )

n n n n

n n n n n

n n

E X X e X X X

X X X X X

X X

  

        

     

 

 

   

       

    

3 3 1 2

0 1 2 2 1 3 1 2

0 1 2 1 2 2 1 1 2

0 1 2 2 1 0 1 1 1

ˆ ( | , ,..., )

( | , ,..., )

( | , ,..., ) ( | , ,..., )

ˆ ˆ

n n n

n n n n

n n n n

n n n n

X E X X X X

E X X e X X X

E X X X X E X X X X

X X c c X c X

  

  

  

 

  

 

  

   

  

     

şeklinde hesaplanmıştır. Burada,

c 00 ( 1+α 1 ( 1+α 1 )+ α 0 α 1 ) , c 1 = α 1 ( α 1 22 )+ α 1 α 2 ve c 21 2 α 2 + α 2 2

olup diğer öngörüler X n ve X n−1 ’e bağlı olarak

^X n+s = α 0 + α 1 X ^ n+s−1 + α 2 X ^ n+s−2

eşitliği ile hesaplanır.

Görüldüğü gibi, AR(2) modelinde X 1 , X 2 ,..., X n örneklem değerleri verildiğinde, öngörüler örneklemin son iki değerine bağlıdır. AR(3) modeli ele alınmış olsaydı, öngörüler örneklemin son üç değerine bağlı olacaktı. Kısaca, model nasıl verilmiş ise öngörüler de otokorelasyonlar da olduğu gibi aynı formdadır.

AR(2) modeli için elde edilen öngörü hatalarından ilk üç tanesi

 

1 1 0 1 2 1 1 0 1 2 1

1 0 1

n ˆ n n n n n n

n n

X X X X e X X

e w e

     

    

 

       

 

 

2 2 0 1 1 2 2 0 1 1 2

1 1 2 1 1 0 2

ˆ ˆ

n n n n n n n

n n n n

X X X X e X X

e e w e w e

     

    

   

       

   

 

   

 

3 3 0 1 2 2 1 3 0 1 2 2 1

1 2 2 2 1 1 3

1 1 1 2 1 2 1 3

1 2 1 2 1 1 2 3 2 1 1 2 0 3

ˆ ˆ ˆ

ˆ ˆ

( )

n n n n n n n

n n n n n

n n n n

n n n n n n

X X X X e X X

X X X X e

e e e e

e e e w e w e w e

     

 

   

   

      

    

   

     

       

    

   

      

olarak bulunmuştur. Öngörü hataları genel olarak,

X n+s − ^ X n+s = ∑

i=0 s−1

w i e n+s−i

ve öngörü hatalarının varyansı da,

(9)

Var ( X n+s − ^ X n+s )=Var [ s−1 i=0 w i e n+s−i ] = σ 2 s−1 i=0 w i 2

şeklindedir. s   iken öngörü hatalarının varyansının

2 1 2 2 2

0 0

( n s ˆ n s ) s i i ( t )

i i

Var X X w w Var X

 

     

şeklinde olduğu görülür.

Örnek 2.6.3 e t ~ WN (0,σ 2 ) olmak üzere X t =1.7 X t−1 −0.72 X t−2 +e t zaman serisi modelini ele alalım. Son iki gözlem x n 1  9 ve x n  10 olarak verilmiş olsun. Öngörülerin son iki gözlem değerine bağlı olduğunu biliyoruz. Buna göre öngörüler,

1 2

ˆ n s 1.7 ˆ n s 0.72 ˆ n s X X  X  

eşitliğinden ardışık olarak hesaplanır. İlk 20 öngörü (yuvarlatmalardan sonra) aşağıda verilmiştir.

ˆ 1

X n ˆ 2 X n ˆ 3

X n ˆ 4 X n ˆ 5

X n ˆ 6

X n ˆ 7 X n ˆ 8

X n ˆ 9

X n ˆ 10 X n

10.52

0 10.684 10.58

8 10.308 9.899 9.408 8.865 8.298 7.723 7.155

ˆ 11

X n ˆ 12

X n ˆ 13 X n ˆ 14

X n ˆ 15

X n ˆ 16

X n ˆ 17

X n ˆ 18 X n ˆ 19

X n ˆ 20 X n

6.602 6.073 5.569 5.096 4.654 4.242 3.860 3.509 3.185 2.889

Modelin karekteristik denklemin kökleri m 1 = 0.9 ve m 2 =0.8 olup iki kök de mutlak değerce 1 den küçüktür. Yani seri durağandır. Öngörüler de serinin ortalamasına yaklaşır. Yukarıda hesaplanan öngörüler incelendiğinde, ilk iki öngörüde, küçük bir sıçrama söz konusu iken daha sonra bir azalma eğilimi gözlenmektedir. Öngörü sayısı arttıkça bu azalma devam eder.

AR(2) modeli X t = α 1 X t−1 + α 2 X t−2 +e t şeklinde bir regresyon modeline benzer.

Regresyon çözümlemesi yapıldığında, α 1 ve α 2 parametrelerinin tahmin değerleri,  ˆ 1  1.7 ve  ˆ 2   0.72 olarak gözlenmiş olsun. Bir an için  ˆ 2   0.72 tahmin değeri yuvarlatılarak

ˆ 2 0.7

   alınırsa, kestirim denklemi ^X t =1.7 X t−1 −0.7 X t−2 şeklinde olur. Model

1 2

1.7 0.7

t t t t

XX X e şeklinde ise karekteristik denklemin kökleri m 1 = 1 ve m 2 =0.7

olup öngörüler yine koşullu beklenen değer ile hesaplanacaktır. Bu model göz önüne alınarak hesaplanan koşullu beklenen değerlerden ilk 20 tanesi aşağıda verilmiştir.

ˆ 1

X n ˆ 2 X n ˆ 3

X n ˆ 4 X n ˆ 5

X n ˆ 6 X n ˆ 7

X n ˆ 8

X n ˆ 9

X n ˆ 10 X n

10.70

0 11.190 11.53

3 11.773 11.941 12.059 12.141 12.199 12.239 12.267

ˆ 11

X n ˆ 12 X n ˆ 13

X n ˆ 14

X n ˆ 15

X n ˆ 16 X n ˆ 17

X n ˆ 18 X n ˆ 19

X n ˆ 20 X n

12.28

7 12.301 12.31

1 12.317 12.322 12.325 12.327 12.329 12.331 12.331

Hesaplanan değerler incelendiğinde, α ^ 2 =−0 .72 değeri yanlışlıkla α ^ 2 =− 0.7 olarak

alınırsa öngörülerin artan bir eğilim gösterdiği ve belli bir yerden sonra sabitleştiği gözlenmektedir.

(10)

Oysa, durağan halde öngörülerin azalarak serinin ortalamasına doğru yaklaşacağını biliyoruz. Dolayısı ile, parametrelerin tahmin değerlerinde yapılacak yuvarlatma hatalarına dikkat edilmesi gerekir

X t =1 . 7 X t−1 −0 . 72 X t−2 + e t ve X t =1.7 X t−1 −0 .7 X t−2 + e t modellerine uygun olarak rasgele üretilen 100 verinin ve bu serilere ait 100 öngörünün grafikleri aşağıdadır.

Grafikler incelendiğinde, durağan seri için öngörüler örneklem ortalamasına yaklaşmakta, durağan olmayan seri için ise, öngörüler belli bir yerden sonra sabitleşmesine rağmen örneklem ortalamasından uzaktır.

1 2

1.7 0.72

t t t t

XX X e ˆ    0.6627763

1 2

1.7 0.7

t t t t

XX X e ˆ    0.8530139

Burada, durağan serinin beklenen değeri  ˆ   0.662763 , durağan olmayan serinin beklenen değeri de  ˆ   0.8530139 olarak hesaplanmıştır.

X t =1 . 7 X t−1 −0 . 72 X t−2 +e t X t =1 .7 X t−1 −0 .7 X t−2 +e t

S er i

0 20 40 60 80 100

-20-100

0 20 40 60 80 100

-50-40-30-20-100

A C F

Lag

ACF

0 5 10 15 20

-0.20.00.20.40.60.81.0 S eries : x 72

Lag

ACF

0 5 10 15 20

-0.20.00.20.40.60.81.0 S eries : x 70

P A C F

Lag

Partial ACF

0 5 1 0 15 20

-0.50.00.51.0 Series : x72

L ag

Partial ACF

0 5 1 0 1 5 2 0

-0.20.00.20.40.60.81.0 Series : x70

AR(p) zaman serisi modellerinde öngörüleri hesaplamak diğerlerine göre daha kolaydır. Şimdi, ARMA(p,q) zaman serisi modellerinde öngörülerin nasıl hesaplanacağını görelim. AR serilerinde olduğu gibi öngörüleri açık bir eşitlik ile ifade etmek zordur. ARMA(p,q) modellerinde öngörüler hata terimlerinin kestirim değerlerine de bağlıdır. Bu hata terimlerinin bazıları (modele bağlı olarak) kestirildikten sonra öngörüler AR modellerinde olduğu gibi ardışık olarak hesaplanabilir. ARMA(p,q) modeli e t ~ WN (0,σ 2 ) olmak üzere,

1 ( 1 ) 2 ( 2 ) ... ( ) 1 1 ...

t t t p t p t t q t q

X     X     X      X     ee    e olarak verilsin. Bu model, α 0 =μ (1−α 1 −α 2 −. ..−α p ) olmak üzere,

0 1 1 2 2

...

1 1

...

t t t p t p t t q t q

X     X

  X

   X

  ee

   e

şeklinde ifade edilebilir. X 1 , X 2 ,..., X n rasgele değişkenlerinin değerleri verildiğinde,

s=1,2,3,... için X n+s nin öngörüleri yine

(11)

^X n+s =E ( X n+s | X 1 , X 2 ,... , X n )

koşullu beklenen değer ile hesaplanır. Karmaşıklığı önlemek için, p=q=1 alalım. Bu durumda, ARMA(1,1) zaman serisi modeli,

X t = α 01 X t−1 +e t + β 1 e t−1

biçiminde olup, birinci öngörü

1 1 1 2 0 1 1 1 1 2

0 1 1 1 1 2 0 1 1

ˆ ( | , ,..., ) ( | , ,..., )

( | , ,..., )

n n n n n n n

n n n n n n

X E X X X X E X e e X X X

X e E e X X X X e

  

     

  

    

       şeklindedir. İkinci

öngörü ise,

 

2 2 1 2 0 1 1 2 1 1 1 2

2

0 1 1 0 1 0 1 1 0 1 1 1 1

ˆ ( | , ,..., ) ( | , ,..., )

ˆ (1 )

n n n n n n n

n n n n n

X E X X X X E X e e X X X

X X e X e

  

           

    

    

         

dir. Böyle devam edildiğinde öngörüler serinin gözlenen son değeri ile en son hata terimine bağlıdır.

Bu durumda, önce bu hata teriminin kestirilmesi gerekir. Bunu aşağıda verilen örnek üzerinde görmeye çalışalım.

Örnek 2.6.4 e t ~ WN (0,σ 2 ) olmak üzere

X t = 0. 8 X t−1 +e t +0 .5 e t−1

modeline uygun olduğu varsayılan serinin ilk 6 gözlem değeri

X 1 =6 , X 2 =9 , X 3 =−8 , X 4 =−10 , X 5 =8 ve X 6 =3

şeklinde verilmiş olsun ve ^X n+h öngörülerini hesaplayalım. Yukarıda belirtildiği gibi, öngörüler hata terimlerine de bağlıdır. O halde, önce hata terimlerinin kestirilmesi gerekir. Birinci öngörü

^X n+1 =0.8 X n + 0.5 e n ( n=6 olduğunu hatırlayalım) olup, öngörü hatası,

1 ˆ 1 [0.8 1 0.5 ] [0.8 0.5 ] 1

n n n n n n n n

X X Xe eXee dir. Benzer şekilde ^X n+2 öngörü değeri,

2 2 1 2

1 2 1 1 2

1

ˆ ( | , ,..., )

(0.8 0.5 | , ,..., )

0.8 ˆ 0.8[0.8 0.5 ] 0.64 0.4

n n n

n n n n

n n n n n

X E X X X X

E X e e X X X

X X e X e

 

  

  

    

olur. İkinci öngörü hatası ise,

2 2 1 2 1 1

1 1 2 1

1 2 1 2 1

ˆ [0.8 0.5 ] [0.8 ˆ 0.5 ]

0.8[ ˆ ] 0.5 0.5

0.8 0.5 0.5 1.3 0.5

n n n n n n n

n n n n n

n n n n n n n

X X X e e X e

X X e e e

e e e e e e e

     

   

    

     

    

      

dir. Görüldüğü gibi öngörüler son gözlem değeri ile e n hata terimine bağlıdır. X n gözlenmiş olmasına rağmen, öngörülerin hesaplanabilmesi için e n hata teriminin kestirilmesi gerekir. Bunun için önce e 1 =0 alınarak X 1 , X 2 ,..., X n ler ile e 1 ,e 2 ,...,e n lerin kestirimleri hesaplanır.

Bunlardan ikinci öngörü ^X 2 =0. 8 X 1 + 0. 5 e 1 =0.8 (6)=4. 8 olup e 2 için bir kestirim

e ^ 2 = X 2 − ^ X 2 =9−4 . 8=4 . 2 olarak bulunur. Bu şekilde devam ederek diğer kestirimler

(12)

^X 3 =0.8 X 2 + 0.5 ^e 2 =0.8 (9)+0.5 (4.2) =9.3 , e ^ 3 = X 3 − ^ X 3 =−8−9 .3=−17 . 3

^X 4 =0.8 X 3 +0.5 ^e 3 = 0.8 (−8)+0.5 (−17.3) =−15.05 e ^ 4 = X 4 − ^ X 4 =−10−(−15. 05 )=5 . 05

^X 5 =0.8 X 4 +0.5 ^e 4 =0.8 (−10)+0.5 (5.05) =−5.475 e ^ 5 = X 5 − ^ X 5 =8−(−5 .475)=13. 475

^X 6 =0.8 X 5 +0.5 ^e 5 =0.8 (8)+0.5 (13. 475) =13.1375 e ^ 6 = X 6 − ^ X 6 = 3−13 .1375=−10.1375

^X 7 =0.8 X 6 +0.5 ^e 6 =0.8 (3)+0.5 (−10.1375)=−2.66875

şeklinde hesaplanmıştır. Bundan sonraki öngörüler, ^X 7+h =( 0.8) h ^X 7 şeklinde ardışık olarak hesaplanır.

h 1 2 3 4 5

Gözlem 6 9 -8 -10 8 3

Kestirim - 4.8 9.3 -15.05 -5.475 13.14 Hata 0 4.2 -17.3 5.05 13.48 -10.14

Öngörü -2.67 -2.135 -1.708 -1.37 -1.09

Bunlardan bazıları tablo halinde yukarıda verilmiştir

Aşağıda X t = 0. 8 X t−1 +e t +0 .5 e t−1 modeline uygun üretilen 100 verinin zaman serisi grafiği ile otokorelasyon ve kısmi otokorelasyon fonksiyonlarının grafikleri bulunmaktadır. Veriler SAS PROC ARIMA da,

data a; input x; cards;

. veriler

proc arima; i var=x; e p=1 q=1; forecast lead=20;

run;

kodları kullanılarak, X t = α X t−1 +e t + β e t−1 şeklinde bir modelin uygun olduğu göz önüne alınmış, parametre tahminleri α=0.82559 ^ , ^β=0.56506 ve μ=0.93095096 ^ olarak elde edilmiştir. Buna göre, ilk 20 öngörünün grafiği aşağıdadır.

Model: X t =0. 8 X t−1 +e t +0 .5 e t−1

Seri ACF PACF

0 20 40 60 80 100

-4-20246

L ag

ACF

0 5 10 15 20

-0.20.00.20.40.60.81.0

Series : x

Lag

Partial ACF

0 5 10 15 2 0

-0.4-0.20.00.20.40.60.8

Series : x

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

-3.5 -3 -2.5 -2 -1.5 -1 -0.5 0 0.5 1 1.5

(13)

Bu bölümde, bazı durağan zaman serisi modelleri ile otokorelasyon ve kısmi otokorelasyon fonksiyonları incelenmeye çalışıldı. Bununla birlikte, zaman serilerinde önemli kavramlardan biri olan öngörü kavramı ele alındı.

Otokorelasyon ve kısmi otokorelasyonlar ile öngörüler modele bağlı olarak bulunmaktadır. O zaman, verilere uygun bir modelin uydurulabilmesi için model parametrelerinin tahmin edilmesi gerekir. Bu bölümde, parametre tahminlerine girilmedi. Parametrelerin tahmin yöntemleri ile tahmin edicilerin asimptotik özellikleri bir sonraki bölümde incelenecektir.

2.7. Problemler

2.7.1 Aşağıdaki AR(2) modellerine ait otokorelasyon ve kısmi otokorelasyon fonksiyonlarını hesaplayıp grafiklerini çiziniz.

a) X t  1.6 X t 1  1.45 X t 2e t b) X t  1.6 X t 1  0.64 X t 2e t 2.7.2 AR(3) zaman serisi modeli

~ (0, 2 )

e t WN  olmak üzere

1 1 2 2 3 3

t t t t t

X   X   X   X e şeklinde verilmiş olsun.

a) Otokorelasyon fonksiyonunun ilk iki değerinin

 2 1 3 2 3 1 3 

(1) (1 ) ( )

  

    

 

  

,  1 1 2 3 3 2 1 3 2

( ) (1 )

(2) (1 ) ( )

    

    

  

   

şeklinde olduğunu gösteriniz

b) Model X t  2.1 X t 1  1.46 X t 2  0.336 X t 3e t şeklinde verilmiş ise otokorelasyon fonksiyonunu h  0,1, 2,3,...,10 için hesaplayıp grafiğini çiziniz.

2.7.3 Aşağıda verilen zaman serisi modellerinden durağan olanların otokorelasyon fonksiyonlarını h  1, 2,3,...,10 için hesaplayınız.

a) X t  1.6 X t 1  0.64 X t 2   e t e t 1 b) X t  0.9 X t 1  0.82 X t 2  0.72 X t 3e t c) X t  1.7 X t 1  0.72 X t 2   e t e t 1 d) X t   e t e t 1  0.4 e t 2

2.7.4 Aşağıda verilen zaman serisi modellerinden durağan olanların kısmi otokorelasyonlarını 1, 2,3, 4,5

h  için hesaplayınız.

a) X t  0.8 X t 1e t b) X t  0.3 X t 1  0.4 X t 2e t c) X t  0.7 X t 1  0.49 X t 2e t d) X t   e t 0.3 e t 1  0.4 e t 2

2.7.5 Aşağıda verilen zaman serisi modellerinden durağan olanlarını 0

t j t j

j

X w e

 

şeklinde yazınız. w j

katsayılarını j  0,1, 2,3, 4,5 için hesaplayınız.

a) X t  0.6 X t 1X t 2  0.6 X t 3e t

b) X t  0.8 X t 1  0.68 X t 2  0.48 X t 3   e t 0.8 e t 1 c) X t  (4 / 3) X t 1  (5 / 9) X t 2e t

d) X t  1.6 X t 1  0.6 X t 2   e t 0.5 e t 1  0.3 e t 2

Referanslar

Benzer Belgeler

(X,Y) noktalarnn en yaknndan geçen doğru denklemi ise; yeni projenin indikatörünün eski projelerin indikatörlerine oranndan elde edilen X noktalarna karş, yeni

TEK KÖRLEMELİ DENEY DÜZENİ Bu düzende; araştırıcı deneğin hangi grupta olduğunu bilir, denek ise bilmez.. Tek körlemeli deney düzeninde araştırıcının

Durağan zaman serilerinde örneklem otokorelasyon fonksiyonunun serinin otokorelasyon fonksiyonu için tutarlılığı aşağıda incelenmeye çalışılmıştır... Böylece,

Önceki problemde, atıcının hedefe yaptığı atışların “hedefsizce&#34;, “öylesine rasgele” olması durumunda

Verinin regresyon modeli bulunurken ardışık bağımlılık olmadığı varsayımı altında kestirim denklemi bulunup hata terimlerinin tahminleri (artıklar) elde edilir.. Bu

Aynı şartlar altında bağımsız Bernoulli

Örnek1:

Korelasyon katsayısı iki değişken arasındaki doğrusal ilişkinin derecesini belirleyen ve karşılaştırmaya olanak veren