HÜKMÜN AÇIKLANMASININ GERİ BIRAKILMASI VE MEMURİYETE ETKİSİ
II. HÜKMÜN AÇIKLANMASININ GERİ BIRAKILMASININ SONUÇLAR
y(t) = λy(t − 1) (1 − y(t − 1)) . (2.12)
Para λ ≈ 4 ou pouco menor que esse valor, y(t) apresenta baixa correlação linear ou correlação linear insignicante (considerando intervalo de conança de dois desvios padrão), semelhante a um ruído branco. A série LOGMAP utilizada neste trabalho é gerada por meio da equação anterior com λ = 4, y inicial y(0) = 0,1 e possui três mil e quinhentas observações2.
A Figura 2.3 mostra as cinquenta primeiras observações das séries apresentadas anteriormente. Pela gura, as séries parecem ser semelhantes, mas apresentam carac- terísticas estatísticas bastante distintas, como será melhor visto no Capítulo 3.
2.2 O Teste Ljung-Box
O teste Ljung-Box, descrito em Ljung & Box [1978] é um teste estatístico que possi- bilita mensurar, por meio de um único valor, a autocorrelação de uma série em vários atrasos ao mesmo tempo. Esse valor é comparado a um valor limite, acima do qual se poderia rejeitar a hipótese de que determinada série se comporta como um ruído branco gaussiano. A função de autocorrelação (FAC) mostra se há correlações em um atraso especíco da série. O teste considera a FAC em um conjunto de atrasos. Geralmente, o teste é usado para se vericar os resíduos de um modelo linear. Pode-se, todavia, usá-lo também, para testar a aleatoriedade.
O teste utiliza uma estatística q(m), uma soma ponderada dos quadrados dos coecientes da FAC que, até o atraso m, é dada por:
q(m) = N (N + 2) m ∑ l=1 ˆ ρ2 l N − l, (2.13)
em que m é o número de atrasos usados, N é o número de observações e ˆρl é a FAC, sendo l seu atraso.
Supondo um processo i.i.d. gaussiano, o valor esperado da FAC é nulo em todos os atrasos diferentes de zero. Essa é a hipótese nula de que não há correlação linear na série. No caso de um número limitado de observações, q(m) segue uma distribuição
2Para λ = 4, o mapa logístico apresenta uma crise de fronteira (destruição da bacia de atração).
Nesse caso, eventualmente, a série gerada pode divergir, mas a probabilidade de isso acontecer é pequena. Na série gerada, com 3500 observações e condição inicial y(0) = 0,1, essa divergência não aconteceu. Isso, portanto, não interfere no uso da mesma como um exemplo de série não linear e sem dependência linear signicativa.
0 5 10 15 20 25 30 35 40 45 50 −3 −2.5 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 t y(t) (a) 0 5 10 15 20 25 30 35 40 45 50 −3 −2.5 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 t y(t) (b) 0 5 10 15 20 25 30 35 40 45 50 −2.5 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 2.5 t y(t) (c) 0 5 10 15 20 25 30 35 40 45 50 −2.5 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 2.5 t y(t) (d) 0 5 10 15 20 25 30 35 40 45 50 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 t y(t) (e)
Figura 2.3. As guras mostram as cinquenta primeiras observações das séries: (a) WGN, (b) AR(1), (c) ARCH(1), (d) GARCH(1,1) e (e) LOGMAP. Embora semelhantes, as séries apresentam características bastante diferentes.
qui-quadrado com m graus de liberdade (χ2(m)). É de se esperar que isso ocorra, uma vez que provém da soma do quadrado de variáveis gaussianas. Para um determi- nado número m de atrasos, dene-se um percentil que seria um limite superior para o processo, acima do qual a hipótese nula seria rejeitada. Ou seja, para o caso de um intervalo de conança de dois desvios padrão, o percentil 95 de uma distribuição χ2(m)seria o limite superior acima do qual o processo não seria mais considerado i.i.d.
2.2. O Teste Ljung-Box 27 gaussiano. Nesse caso, 95% das séries i.i.d. gaussianas gerariam um q(m) menor que esse número. Em contrapartida, se q(m) da série for maior que o valor desse percentil, rejeita-se a hipótese nula de que não há correlação linear.
A Figura 2.4 mostra a distribuição de frequências normalizada de q(10) de uma população de 10000 séries geradas a partir de uma variável gaussiana de variância unitária em um processo i.i.d..
0 5 10 15 20 25 30 35 40 45 50 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.1 q(10) frequência normalizada qui−quadrado(10) frequência normalizada percentil 95 de qui−quadrado(10)
Figura 2.4. Distribuição de frequências normalizada do valor de q(10) e distri- buição qui-quadrado com 10 graus de liberdade de um processo i.i.d. gaussiano.
A estatística q(m) segue assintoticamente uma distribuição qui-quadrado (Tsay [2005]) de m graus de liberdade. Pode-se perceber que a frequência normalizada de q(10) se aproxima de χ2(10). A gura também mostra o percentil 95 da distribuição. Esse é o valor limite (ou valor crítico) em que se dene se as correlações são signicativas ou não, a partir do qual q(m) teria uma probabilidade de 0,95 de ter sido gerada por uma série correlacionada. Para 10 atrasos, esse valor é de 18,3. Portanto, para uma série que possua q(10) maior que 18,3, é possível rejeitar a hipótese nula de que não há correlações lineares com 95% de conança.
A Figura 2.5 mostra a distribuição de frequências de q(10) para duas populações de 10000 processos AR(1) com inovações gaussianas de variância unitária.
A primeira população, Figura 2.5.(a), é formada por processos AR(1) com o parâmetro igual a 0,2. A segunda população, Figura 2.5.(b), é formada também por
0 50 100 150 200 250 300 350 400 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.1 q(10) frequência normalizada qui−quadrado(10) frequência normalizada percentil 95
(a) AR(1) com parâmetro 0,2.
0 50 100 150 200 250 300 350 400 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.1 q(10) frequência normalizada qui−quadrado(10) frequência normalizada percentil 95
(b) AR(1) com parâmetro 0,4.
Figura 2.5. q(10) para processos AR(1), (a) com parâmetro 0,2 e (b) com parâmetro 0,4.
processos AR(1), porém com parâmetro igual a 0,4. O parâmetro pondera a correlação do processo e pode ser visto pela gura em que os processos de maior q(10), no caso os de parâmetro 0,4, indicam uma maior correlação. Ambos os processos AR(1), porém, estão claramente acima do q(10) limite (percentil 95 do χ2(10), igual a 18,3), o que indica correlações signicativas e, assim, presença de determinismo, segundo o teste. Esse fato também pode ser percebido na Tabela 2.1, que mostra também o ruído branco gaussiano (WGN) com estatística q(10) inferior ao valor limite. Nesse caso, não se pode rejeitar a hipótese de que os dados sejam descorrelacionados, o que de fato é verdade. Para o caso em que o processo não é gaussiano, os valores críticos para q (como
2.2. O Teste Ljung-Box 29 q(10) = 18,3), perdem sua utilidade pois não se pode mais aproximar q(m) limite por qui-quadrado. Esse fato limita mas não invalida o teste. Isso porque q(m) continua a quanticar o determinismo e pode-se utilizar alternativamente métodos não paramé- tricos como o de dados sub-rogados para se obter os valores limites da estatística.
Uma aplicação comum para o teste é a vericação de heteroscedasticidade. Uma série que apresente q(m) abaixo do limite (sem determinismo), mas possua q(m) acima do limite para o quadrado de suas observações, pode indicar a presença de heterosce- dasticidade. A Tabela 2.1 mostra os valores de q(m = 10) obtidos para observações das séries WGN, AR(1), ARCH(1), GARCH(1,2), LOGMAP e seus quadrados: WGN2, AR(1)2, ARCH(1)2, GARCH(1,2)2 e LOGMAP2. A heteroscedasticidade de ARCH(1) e GARCH(1,1) pode ser detectada percebendo-se que o valor do quadrado das mesmas supera o valor limite de q(10). Para o AR(1)2, o valor de q(10) não deve ser ime- diatamente considerado como heteroscedasticidade pois há correlação signicativa de AR(1), como pode ser observado na primeira linha da mesma tabela. O recomendado nesses casos é, primeiramente, obter um modelo para a série e então aplicar o teste aos resíduos desse modelo.
Tabela 2.1. Valores obtidos da estatística q(10) para várias séries conhecidas e seus quadrados. O valor limite de q(10), acima do qual o teste indica correlações signicativas, também é mostrado.
Série q(10) Valor limite de
q(10) WGN 12,7 18,3 WGN2 6,01 18,3 AR(1) 373 18,3 AR(1)2 24,5 18,3 ARCH(1) 13,7 18,3 ARCH(1)2 336 18,3 GARCH(1,1) 14,0 18,3 GARCH(1,1)2 411 18,3 LOGMAP 12,0 18,3 LOGMAP2 247 18,3
Uma deciência de q(m) é medir apenas as correlações lineares. Um exemplo dessa limitação é caso do mapa logístico (LOGMAP), um sistema completamente de- terminístico, mas que não apresenta correlações lineares signicativas para valores de seu parâmetro aproximadamente iguais a 4. A Tabela 2.1 também mostra o resultado do teste para esse mapa e seu quadrado. Nesse último caso não se pode falar em heteroscedasticidade pois a série é completamente determinística.
Essas limitações do teste não fazem com que seu resultado seja errado. Deve-se ressaltar que um valor de q(m) acima do q(m) limite rejeita a hipótese de que a série é um ruído branco gaussiano. Para valores de q(m) abaixo do limite, não se pode rejeitar tal hipótese, o que é diferente de se armar ser a série um ruído branco. Esse é caso dos processos ARCH e GARCH e do mapa logístico, que no teste possuem valor q(m) inferior ao q(m) limite.