ÖNGÖRÜ TEKNĐKLERĐ ÖDEV 5 (KEY)
Aşağıda verilen Y zaman sersisi bir ürünle ilgili satışları,aylar itibariyle, gösteren bir seridir.
a) Bu serinin garfiğini çizip serinin taşıdığı desenleri (Trend, mevsimsellik vb.) belirtiniz.
b) Mevsimlik değişimleri ve genel terndi yansıtacak bir regresyon modeli önerip bu modelin parametrelerini tahmin ediniz.(Gerekli olduğunu düşündüğünüz kukla (Dummy) değişkenleri ekleyiniz.)
c) Önerdiğiniz model için yapılan analizleri irdeleyerek bu modelin: anlamlı olup olmadığını; modele dahil edilen bağımsız değişkenler arasında çoklu korelasyon olup olmadığını; hata terimleri arasında seri korelasyon olup olmadığını; hata terimlerinin dağılımının sıfır ortalamalı ve sabit varyanslı olup olmadığını test ediniz.
d) Yukarıda önerdiğiniz modeli iyileştirmek amacıyla bağımsız değişkenler grubuna yeni bir değişken olarak z = t
2yi dahil edip b) ve c) deki analizleri bir kez daha yapınız. Bu Model b) de önerilen modelden daha iyi bir model midir? Neden?
e) b) ve d) de önerilen modellerden hangisi daha iyi ise onu kullanarak 5.ci yılın M1 ile M12 arasındaki aylarının her biri için öngörü değerlerini hesaplayınız.
Eğer 5.ci yılın aylar itibariyle gerçekleşen satışları aşağıda verildiği gibi ise öngörü değerlerinzi kullanarak bu son 12 ay için modelinizin verdiği RMSE değerini hesaplayınız.
aylar t Y Aylar t Y
M1 1 857 M1 25 1604
M2 2 921 M2 26 1643
M3 3 1071 M3 27 1795
M4 4 1133 M4 28 1868
M5 5 1209 M5 29 1920
M6 6 1234 M6 30 1953
M7 7 1262 M7 31 1980
M8 8 1258 M8 32 1989
M9 9 1175 M9 33 1897
M10 10 1174 M10 34 1910
M11 11 1123 M11 35 1854
M12 12 1159 M12 36 1957
M1 13 1250 M1 37 1955
M2 14 1289 M2 38 2008
M3 15 1448 M3 39 2171
M4 16 1497 M4 40 2202
M5 17 1560 M5 41 2288
M6 18 1586 M6 42 2314
M7 19 1597 M7 43 2343
M8 20 1615 M8 44 2339
M9 21 1535 M9 45 2339
M10 22 1543 M10 46 2267
M11 23 1493 M11 47 2206
M12 24 1510 M12 48 2226
Cevaplar
a) Y serisi hem pozitif trend, hem de ayları mevsim kabul eden bir desen içermektedir.
Index
Y
45 40 35 30 25 20 15 10 5 1 2500
2250
2000
1750
1500
1250
1000
Time Series Plot of Y
b) Y serisi zaman, t, ve ayların etkisini yansıtan bir doğrusal regresyonla modellenebilir. Bu amaçla 12 ayın etkilerini yansıtmak amacıyla m1’i baz alan m2-m12 arasında sembollerle gösterilen 11 dummy değişken yaratılıp modele dahil edildi. Analiz sonuçları ve model parametrelerinin tahmin değerleri aşağıdaki tablolarda verilmiştir.
Regression Analysis: Y versus t; m2; ...
The regression equation is
Y = 840 + 30,3 t + 18,4 m2 + 144 m3 + 167 m4 + 206 m5 + 204 m6 + 197 m7 + 171 m8 + 77,3 m9 + 33,9 m10 - 50,9 m11 - 37,3 m12
Predictor Coef SE Coef T P VIF Constant 839,995 9,987 84,11 0,000 t 30,3424 0,1989 152,54 0,000 1,1 m2 18,41 13,08 1,41 0,168 1,8 m3 144,07 13,08 11,01 0,000 1,8 m4 167,47 13,09 12,80 0,000 1,8 m5 206,38 13,10 15,76 0,000 1,8 m6 203,54 13,11 15,52 0,000 1,8 m7 196,95 13,13 15,00 0,000 1,8 m8 171,35 13,15 13,03 0,000 1,9 m9 77,26 13,17 5,87 0,000 1,9 m10 33,92 13,20 2,57 0,015 1,9 m11 -50,92 13,22 -3,85 0,000 1,9 m12 -37,27 13,26 -2,81 0,008 1,9
S = 18,4894 R-Sq = 99,9% R-Sq(adj) = 99,8%
Analysis of Variance
Source DF SS MS F P Regression 12 8616896 718075 2100,50 0,000 Residual Error 35 11965 342
Total 47 8628861
Unusual Observations
Obs t Y Fit SE Fit Residual St Resid 36 36,0 1957,00 1895,05 9,32 61,95 3,88R 45 45,0 2339,00 2282,66 9,91 56,34 3,61R 48 48,0 2226,00 2259,16 9,91 -33,16 -2,12R R denotes an observation with a large standardized residual.
Durbin-Watson statistic = 2,01031
Burada m2 dummy değişkeninin Y deki değişkenliği açıklamaya katkısı ihmal edilecek kadar küçük görülmektedir. Bu modeli biraz daha iyileştirmek gerekirse, m2 modelden çıkarılabilir. Yeni haliyle modelimizin analiz sonuçları aşağıda verilmiştir.
Model 2:
The regression equation is
Y = 849 + 30,3 t + 135 m3 + 158 m4 + 197 m5 + 194 m6 + 188 m7 + 162 m8 + 68,0 m9 + 24,7 m10 - 60,2 m11 - 46,5 m12
Predictor Coef SE Coef T P VIF Constant 849,116 7,704 110,22 0,000 t 30,3466 0,2016 150,54 0,000 1,1 m3 134,86 11,48 11,75 0,000 1,4 m4 158,26 11,49 13,78 0,000 1,4 m5 197,16 11,50 17,15 0,000 1,4 m6 194,32 11,51 16,88 0,000 1,4 m7 187,72 11,53 16,28 0,000 1,4 m8 162,12 11,55 14,04 0,000 1,4 m9 68,03 11,57 5,88 0,000 1,4 m10 24,68 11,60 2,13 0,040 1,4 m11 -60,17 11,63 -5,17 0,000 1,4 m12 -46,51 11,67 -3,99 0,000 1,4
S = 18,7399 R-Sq = 99,9% R-Sq(adj) = 99,8%
Analysis of Variance
Source DF SS MS F P Regression 11 8616218 783293 2230,44 0,000 Residual Error 36 12643 351
Total 47 8628861 Unusual Observations
Obs t Y Fit SE Fit Residual St Resid 36 36,0 1957,00 1895,08 9,45 61,92 3,83R 45 45,0 2339,00 2282,74 10,05 56,26 3,56R 48 48,0 2226,00 2259,24 10,05 -33,24 -2,10R R denotes an observation with a large standardized residual.
Durbin-Watson statistic = 2,08586
Bu modelin bir önceki modelden daha iyi olduğunu görüyoruz. Multi-colinearity ve serial correlation sorunları olmayan bir model (D-W istatistiği ve VIF değerelerine bakarak) olduğu görülmektedir.
Residual (Hata terimleri analizi aşağıda verimiştir.)
Descriptive Statistics: RESI1
Variable N Mean SE Mean StDev Minimum Q1 Median Q3 Maximum
RESI1 48 5,24025E-14 2,37 16,40 -33,24 -7,69 -0,295 5,99 61,92
Hataların Ortalaması yaklaşık olarak sıfır olup rassallık özellikleri taşımaktadır. Ancak hataların dağılımının normal olduğu hipotezi ret edilmektedir. (Kolmogorov-Smirnov testinde p-value<0.01 olduğu görülmektedir.) ACF ve PACF grafiklerinde herhangi bir güçlü korelasyon görülmemektedir. DW=2,08586 olup bu da serial korelasyon olmadığının işaretidir. Modelin verdiği öngörü değerleri ile gerçekte gözlemlenen Y değerleri serisinin aynı eksenler sistemindeki grafiği de modelin ne kadar iyi uyum sağladığını göstermektedir.
R
2(adj)= %99,8 olup buda grafiğin görsel olarak yansıttığını sayısal olarak doğrulamaktadır..
R E S I 1
Percent
7 5 5 0
2 5 0
-2 5 -5 0
9 9
9 5 9 0
8 0 7 0 6 0 5 0 4 0 3 0 2 0
1 0 5
1
M e a n
< 0 , 0 1 0 5 , 2 1 0 6 4 7 E -1 4
S t D e v 1 6 , 4 0
N 4 8
K S 0 , 1 6 4
P -V a l u e
P r o b a b ilit y P lo t o f R E S I1 N o rm a l
L a g
Partial Autocorrelation
1 2 1 1 1 0 9 8 7 6 5 4 3 2 1 1 , 0 0 , 8 0 , 6 0 , 4 0 , 2 0 , 0 -0 , 2 -0 , 4 -0 , 6 -0 , 8 -1 , 0
P a r tia l Au to c o r r e la tio n F u n c tio n fo r R E S I1 (w it h 5 % s ig n ific a n c e lim it s fo r t h e p a rt ia l a u t o c o rre la t io n s )
L a g
Autocorrelation
1 2 1 1 1 0 9 8 7 6 5 4 3 2 1 1 , 0 0 , 8 0 , 6 0 , 4 0 , 2 0 , 0 -0 , 2 -0 , 4 -0 , 6 -0 , 8 -1 , 0
Au to c o r r e la tio n F u n c tio n fo r R E S I1 (w it h 5 % s ig n ific a n c e lim it s fo r t h e a u t o c o rre la t io n s )
I n d e x
Data
4 5 4 0 3 5 3 0 2 5 2 0 1 5 1 0 5 1 2 5 0 0
2 2 5 0
2 0 0 0
1 7 5 0
1 5 0 0
1 2 5 0
1 0 0 0
V a ri a b l e Y F I T S 1
T im e S e r ie s P lo t o f Y ; F IT S 1
d)
t-sq modele dahil edilirse ne olur sorusunu yanıtlamak amacıyla gerekli regresyon analizleri yapıldı ve aşağıdaki sonuçlar elde edildi.
Regression Analysis: Y versus t; t-sq; ...
The regression equation is
Y = 840 + 30,3 t - 0,0000 t-sq + 18,4 m2 + 144 m3 + 167 m4 + 206 m5 + 204 m6 + 197 m7 + 171 m8 + 77,3 m9 + 33,9 m10 - 50,9 m11 - 37,3 m12
Predictor Coef SE Coef T P VIF Constant 839,98 11,86 70,81 0,000 t 30,3442 0,8007 37,90 0,000 16,8 t-sq -0,00004 0,01581 -0,00 0,998 16,7 m2 18,41 13,27 1,39 0,174 1,8 m3 144,06 13,27 10,85 0,000 1,8 m4 167,47 13,28 12,61 0,000 1,8 m5 206,38 13,30 15,52 0,000 1,8 m6 203,54 13,31 15,29 0,000 1,8 m7 196,94 13,33 14,78 0,000 1,9 m8 171,35 13,35 12,84 0,000 1,9 m9 77,26 13,37 5,78 0,000 1,9 m10 33,92 13,39 2,53 0,016 1,9 m11 -50,92 13,42 -3,80 0,001 1,9 m12 -37,27 13,45 -2,77 0,009 1,9
S = 18,7593 R-Sq = 99,9% R-Sq(adj) = 99,8%
Analysis of Variance
Source DF SS MS F P Regression 13 8616896 662838 1883,53 0,000 Residual Error 34 11965 352
Total 47 8628861
Unusual Observations
Obs t Y Fit SE Fit Residual St Resid 36 36,0 1957,00 1895,06 9,54 61,94 3,83R 45 45,0 2339,00 2282,65 10,72 56,35 3,66R 48 48,0 2226,00 2259,15 11,42 -33,15 -2,23R R denotes an observation with a large standardized residual.
Durbin-Watson statistic = 2,01030
Burada multi-colinearity sorunu(VIF değerleri t ve t-sq için çok yüksek çıktı) var. t-sq ve m2 nin katsayıları (model parametre değerleri) sıfır olabilir şeklinde yorumlanacağı için önce m2 değişkenini modele dahil etmesek ne olur sorusunu yanıtlayalım.
Regression Analysis: Y versus t; t-sq; ...
The regression equation is
Y = 849 + 30,4 t - 0,0003 t-sq + 135 m3 + 158 m4 + 197 m5 + 194 m6 + 188 m7 + 162 m8 + 68,0 m9 + 24,7 m10 - 60,2 m11 - 46,5 m12
Predictor Coef SE Coef T P VIF Constant 849,00 10,05 84,44 0,000 t 30,3613 0,8112 37,43 0,000 16,8 t-sq -0,00030 0,01602 -0,02 0,985 16,7 m3 134,85 11,64 11,58 0,000 1,4 m4 158,25 11,65 13,58 0,000 1,4 m5 197,15 11,67 16,90 0,000 1,4 m6 194,31 11,68 16,63 0,000 1,4 m7 187,71 11,70 16,04 0,000 1,4 m8 162,12 11,72 13,83 0,000 1,4 m9 68,02 11,74 5,79 0,000 1,4 m10 24,67 11,77 2,10 0,043 1,4 m11 -60,17 11,80 -5,10 0,000 1,4 m12 -46,51 11,84 -3,93 0,000 1,4
S = 19,0056 R-Sq = 99,9% R-Sq(adj) = 99,8%
Analysis of Variance
Source DF SS MS F P Regression 12 8616219 718018 1987,80 0,000 Residual Error 35 12642 361
Total 47 8628861
Unusual Observations
Obs t Y Fit SE Fit Residual St Resid 36 36,0 1957,00 1895,10 9,66 61,90 3,78R 45 45,0 2339,00 2282,67 10,86 56,33 3,61R 48 48,0 2226,00 2259,14 11,57 -33,14 -2,20R R denotes an observation with a large standardized residual.
Durbin-Watson statistic = 2,08572
Multi colinearity hala bir önemli kusur olarak kaldı. t ve t-sq arasında var olan yüksek korelasyon her iki değişkenin de modelde aynı zamanda yer almamasını gerektirir. Ayrıca bu modelin verdiği R-sq(adj) değeri ile denen ikinci modelinki aynıdır (%99,8).
Sonuç: t-sq değişkenimi içeren model bir önceki modelden daha iyi değildir.
.
e) Beşinci yıl için öngörü değerleri hesaplanırken ikinci modelin verdiği regresyon debkleminde t=49-60 arası değerler ile m3-m12 için dummy değişken değerleri konulup aşağıdaki Y-hat değerleri elde edildi. Böylece elde edilen öngörü değerlerini de içeren Y ve Y-hat zaman serilerinin grafikleri aşağıda verildiği gibi olup son 12 dönem için elde edilen değerlerin grafiği hem trendi hem de mevsimlik etki desenlerini yansıtmaktadır. Bu haliyle bakıldığında önerilen ikinci modelin vereceği öngörü değerlerine güvenebileceğimiz kanısına varabiliriz.
Sonuç olarak: ikinci model tercih edilmelidir.
t Aylar m3 m4 m5 m6 m7 m8 m9 m10 m11 m12 Y-hat 49 M1 0 0 0 0 0 0 0 0 0 0 2336,001 50 M2 0 0 0 0 0 0 0 0 0 2366,346 51 M3 1 0 0 0 0 0 0 0 0 0 2531,551 52 M4 0 1 0 0 0 0 0 0 0 0 2585,295
53 M5 0 0 1 0 0 0 0 0 0 0 2654,54
54 M6 0 0 0 1 0 0 0 0 0 0 2682,044 55 M7 0 0 0 0 1 0 0 0 0 0 2705,789 56 M8 0 0 0 0 0 1 0 0 0 0 2710,534 57 M9 0 0 0 0 0 0 1 0 0 0 2646,788 58 M10 0 0 0 0 0 0 0 1 0 0 2633,783 59 M11 0 0 0 0 0 0 0 0 1 0 2579,277 60 M12 0 0 0 0 0 0 0 0 0 1 2623,282
Index
Data
60 54 48 42 36 30 24 18 12 6 1 2500
2000
1500
1000
Variable Y FIT S1