3. KAMU GÜVENİNE KARŞI SUÇLAR VE RESMİ BELGEDE
3.1 Sahtecilik Eylemleri
3.1.4 Resmi belgede sahtecilik
3.1.4.1 Suçun unsurları
A análise de regressão se ocupa do estudo da dependência de uma variável em relação a uma ou mais variáveis (explicativas) com o objetivo de estimar e/ou prever o valor médio da primeira em termos dos valores conhecidos ou fixados das segundas (GUJARATI, 2006). Para simplificar o modelo sugere a seguinte forma exposta por Gujarati (2006):
i i =β +βΧ+ε
Υ 0 1 (21)
Essa expressão representa um modelo de regressão linear, onde Y é chamado de variável dependente, X de variável independente, “onde
β
0 eβ
1conhecidos como os parâmetros do modelo, são, respectivamente, o intercepto e o coeficiente angular” (GUJARATI, 2006).Para obter o modelo de regressão linear, um conjunto de critérios são requisitados sugerindo três critérios de avaliação:
1) avaliação estatística; 2) avaliação econométrica; 3) avaliação econômica.
Segundo Maia (2008) o critério estatístico tem como objetivo verificar se a estimação do modelo especificado gera parâmetros eficientes, consistentes e não-viesados, medida os parâmetros estimados são, ou seja, desejáveis. No intuito da obter tais objetivos, faz-se necessário o uso de alguns critérios estatísticos.
Na avaliação estatística, sugerida como primeiro critério, tem-se como objetivo verificar se a estimação do modelo especificado geram os melhores parâmentros (MELNT). Para alcançar tais objetivos, faz-se o uso primeiramente, dos testes de ajustamento global do modelo de regressão. O coeficiente de determinação (R²) é o indicador que mostra se o modelo está se ajustando aos dados coletados. Deve-se esperar que 0≤ R2 ≤1, indicando a
proporção de variação ocorrida na variável dependente que é explicada pelas variações ocorridas nas variáveis independentes (GUJARATI, 2006).
De acordo com Maia (2008) o coeficiente de determinação ou coeficiente de correlação múltipla é e definido como a proporção de variação na variável dependente que é
devida à variação combinada das variáveis explicativas (independentes), e é expressa pela fórmula:
R² = !! !!
!! (22)
Onde:
𝑒! : resíduo da soma dos quadrados;
𝑦!: soma dos quadrados da variável dependente;
Desta forma, R2 varia entre 0 e 1.
Outra ferramenta utilizada na avaliação estatística é o coeficiente de correlação entre as variáveis estudadas. A correlação é definida como grau em que duas variáveis estão relacionadas linearmente, seja por meio de causalidade direta, indireta, por probabilidade estatística ou por teoria econômica. O resultado gera um coeficiente que varia de -1, (indicando uma perfeita correlação negativa) e 1 (indicando uma perfeita correlação positiva).
De acordo com Gujarati (2006) o objetivo da análise de correlação é medir a força ou o grau de associação linear entre duas variáveis. Esta análise pressupõe que as duas variáveis sejam aleatórias, onde não há distinção entre as variáveis dependente e explanatória.
r2 = ( !!!!) ! ! !! !!! (23) Onde: 𝑥! : variável explicativa; 𝑦! : variável explicada.
O segundo critério para avaliação do modelo estimado, está relacionado ao conjunto de hipóteses do processo MQO (Mínimos Quadrados Ordinários). Para validar o método, sob a ótica econométrica, é necessário adotar algumas hipóteses do modelo.
A – Pressuposições relacionadas ao erro (εi)
I) Média Zero: O erro é uma variável aleatória de média zero E(εi) = 0. Significa que os valores esperados dos erros sejam nulos para todas as observações. Isto é, dado o valor de X, o valor médio, ou esperado, do distúrbio aleatório “εi” é zero Gujarati (2006). Simbolicamente é representado por:
E (εi) = 0
II) Variância Constante: homocedasticidade ou variância igual em “εi”. Dados os valores de X, a variância é a mesma para todas as observações. O erro tem variância constante; E(εi2) = σ2. Ou seja, o erro tem que ser uma variável aleatória com variância constante e igual, os erros da regressão da população tem que ser homocesdástico Gujarati (2006). Portanto se esse pressuposto for violado, não tendo a mesma variância para todas as observações, temos o problema da heterocesdasticidade prejudicando a eficiência dos parâmetros estimados.
E (εi2) = σ2
III) Distribuição Normal: O erro deve ter distribuição normal: εi ~ N( 0, σ2 ). Não existe influência de variáveis fora do modelo, ou seja, todas as variáveis relevantes devem estar contidas no modelo.
εi ~ N( 0, σ2 )
VI) Independentes ou Ausência de Autocorrelação: O erro de uma observação não deve estar associado a outro erro de outra observação. Cov (εi, εj) = 0, com i ≠ j. Nenhuma autocorrelação entre as perturbações. O erro (εi) do período (i) não afeta o erro do período (j).
Cov (εi, εj) = 0, com i ≠ j
De acordo com Maia (2008) sendo o objetivo do critério econométrico mensurar as variáveis e agregados econômicos, o enfoque é o isolamento dos efeitos das relações de causalidades. Dessa forma, uma premissa importante do modelo de regressão linear clássico é de que o os termos de erro (εi) da função de regressão populacional devem ser homocedástico e não autorrelacionados, isto é devem ter a variância mínima. Contudo um dos grandes problemas no processo de estimação do modelo começa pelo caso da heterocedasticidade. Isso ocorre quando a variância dos resíduos não se comporta de modo constante, ou seja, as variâncias não são as mesmas para todas as observações.
Para detectar o problema da heterocedasticidade é necessário a utilização de testes formais. Existem diversos testes: teste de Park, teste de Glejser, teste de Goldfeld-Quandt e teste de White.
Park2 (1966) formaliza o método gráfico sugerindo que a variância ( σ!!) é função da
variável explanatória 𝑥!. A forma funcional que ele indica é:
ln σ!! = ln σ
2
+ β ln 𝑥! + 𝑣! (24)
Se β for estatisticamente significativo, (β=0) considera-se que a homoscedaticidade está presente nos dados. Caso contrário, aceita a premissa de heteroscedasticidade, onde a variância não é constante.
Glejser3 (1969) sugere fazer uma regressão dos valores absolutos do termo de erro (amostra) contra a variável explicativa (𝑥!) que se considera estreitamente associada a σ!!. As
formas funcionais sugerida são:
|𝜀i | = 𝛽!+ 𝛽!+ 𝑋! + 𝑣! (25)
|𝜀i | = 𝛽!+ 𝛽!+ 𝑋!+ 𝑣! (26)
|𝜀i | = 𝛽!+ 𝛽!+1/𝑋! + 𝑣! (27)
|𝜀i | = 𝛽!+ 𝛽! +1 / 𝑋! + 𝑣! (28)
O teste de White4 (1980) é um teste usualmente utilizado no processo de estimação de um modelo na busca da ocorrência do problema da heterocedasticidade, por não estar sujeito a hipótese de normalidade e sendo de fácil aplicação [MAIA, 2008]. O teste de White é feito a partir de etapas, como:
• 1ª etapa: Estimar o modelo de regressão
𝑦! = 𝛽! +𝛽!𝑋!+𝛽!Z! + 𝜇! (29)
• 2ª etapa: Estimar uma regressão auxiliar
σi =α +α Xi +α Z i +α Xi +α Z i +α6XiZ2i +εi 2 2 5 2 4 2 3 2 1 2 ˆ (30) 2
Park, R. E. “Estimation with Heteroscedastic Error Terms” Econometrica vol. 34 n° 4, outubro 196, p 888. 3
Glejser, H. “A New Test for Heteroscedasticity” Journal of the American Statistical Association, vol 64, 1969, p 316-323.
4
White, H. “A Heteroscedasticity Consistent Covariance Matrix Estimator and a Direct Test of Heteroscedasticity” Econometrica, .vol. 48, 1980, p 817-818.
É realizada uma regressão dos quadrados dos resíduos da regressão original contra as variáveis ou regressores X e originais, seus valores elevados ao quadrado e os produtos cruzados dos regressores Gujarati (2006).
• 3ª etapa: Teste de hipótese Admitem-se as seguintes hipóteses:
§ Hipótese nula → H0: αi = 0, homoscedástico; § Hipótese alternativa → Ha: αi ≠ 0, heteroscedástico.
Outro teste econométrico de estrita importância é a autocorrelação residual. De acordo com Gujarati (2006) a autocorrelaçao é definida como a correlação entre integrantes de séries de observações ordenadas no tempo ou no espaço, isto é, eles são correlacionados entre si. Considerando o modelo linear simples a autocorrelação dos resíduos implica E(εiεj) ≠ 0 para i ≠ j. A sua ausência significa E(εiεj) = 0 para i ≠ j. Utilizaram-se os testes de Durbin- Watson (d) e o teste de ARCH.
O teste d de Durbin-Watson é o mais usual para diagnosticar a autocorrelação residual de primeira ordem. De acordo com Gujarati (2006), matematicamente tem-se:
∑
∑
= = = = − − = 2 1 2 2 1 ˆ ) ˆ ˆ ( t n t t n t t t t dε
ε
ε
(31) Como∑
2 ˆt ε e∑
2− 1 ˆtε se distinguem em apenas uma observação e admiti-se ausência de autocorrelação residual, logo são aproximadamente iguais, podendo ser definido como: ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − ≈
∑
∑
− 2 1 ˆ ˆ ˆ 1 2 t t t dε
ε
ε
(32)Desse modo, por definição, o coeficiente de autocorrelação de primeira ordem amostral é dado por ρ =
∑
∑
− 2 1 ˆ ˆ ˆ t t tε
ε
ε
. Substituindo-o na Equação 16 e relacionando o d com ρ, defini-se a seguinte expressão:
) 1 ( 2 −ρ = d (33)
Conforme a expressão acima, como −1≤ρ≤1, isso implica que 0≤ d ≤4 Desse
modo, pode-se dizer que:
§ ρ = 0 → d = 2 , o que significa não autocorrelação; § ρ = 1→ d = 0, implica em autocorrelação positiva; § ρ = -1→ d = 4, implica em autocorrelação negativa.
O valor calculado de d é confrontado com os valores do limite inferior (dL) e com o limite superior (dU) tabelado por Durbin e Watson, conforme é exposto por Gujarati (2006), utilizando-se a régua de Durbin-Watson:
Onde,
i. As regiões (i) e (v) representam respectivamente autocorrelação positiva e negativa, desse modo rejeita-se a hipótese nula de ausência de autocorrelação; ii. Nas regiões (ii) e (iv) o teste é inconclusivo;
iii. Na região (iii), aceita-se a hipótese nula (H0) de não autocorrelação.
Breusch e Godfrey (1978) desenvolveram um teste de autocorrelação que é geral no sentido em que permite a existência de regressores não estocásticos, como o valor defasado do regressando (GUJARATI, 2006). É possível, acrescentar valores defasados do regressando ao modelo, seja:
i i=β +βΧ+ε
Υ 0 1 (34)
Supõem-se que o termo de erro, 𝜀!, siga um esquema auto-regressivo de ordem p,
AR(p), como o seguinte: 𝜀! = 𝜌 !𝜀!!!+ 𝜌!𝜀!!!+ ⋯ + 𝜌!𝜀!!!+ 𝑢! (35) (i) (ii) (iii) (iv) (v) 0 dL dU 2 4 4-dL 4-‐dU Aceita Ho
Não autocorrelação Rejeita Ho Rejeita Ho
Régua de Durbin-Watson. Fonte: Gujarati, 2006
Onde a hipótese nula, H0, deve ser testada no intuito de investigar a autocorrelação entre os resíduos:
• Hipótese nula → H0: 𝜌!= 𝜌!= 𝜌!= 0, implica ausência de autocorrelação;
• Hipótese alternativa → Ha: pelo menos um parâmetro é significante 𝜌!≠ 0, implica em autocorrelação.
O teste de ARCH (Autoregressive Conditional Heteroscdasticity), Modelo Autoregressivo de Heterocedasticidade Condicional foi proposto por Engle (1982) para capturar a correlação entre os erro de previsão e o comportamento dos resíduos, ou seja, a idéia é que a variância do termo de erro (resíduo) no tempo t depende do quadrado da no momento anterior (t-1) Gujarati (2006). Engle (1982) demonstrou que se pode fazer um teste de hipótese nula partindo da seguinte regressão:
2 2 2 2 2 1 1 0 2 1 ˆ ˆ ˆ ˆ ˆ ... ˆ ˆ ˆ p t p t t− + − + + − + =α αε αε α ε ε (36)
Sendo assim, pode-se testar a hipótese nula por meio do teste F ou calculando nR2, onde R2 é o coeficiente de determinação dessa expressão utilizando-se a estatística de teste: nR2 ~ χ2p. Logo, consideram-se as seguintes hipóteses:
• Hipótese nula → H0: α1 = α2 =...= αi = 0, implica ausência de autocorrelação; • Hipótese alternativa → Ha: pelo menos um parâmetro é significante αi ≠ 0, implica em autocorrelação.
Conforme Gujarati (2006), o teste de normalidade dos resíduos apresenta como premissas relevantes: os termos de erros são não tendenciosos; há variância mínima entre os parâmetros, assim, são eficientes; o modelo apresenta estimadores consistentes. Para verificar se os resíduos apresentam distribuição normal emprega-se o teste de Jarque-Bera (JB), conforme demonstra equação a seguir:
(
)
⎪⎭ ⎪ ⎬ ⎫ ⎪⎩ ⎪ ⎨ ⎧ ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ − + ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ = 24 3 6 2 2 k s n JB (37)Onde, n é o tamanho da amostra, s é o coeficiente de assimetria e k é o coeficiente de curtose. Partindo da estatística Qui-quadrado, quando s=0, a distribuição é simétrica e se
0 <
s a distribuição é assimétrica negativa. Quando k=3 a distribuição de freqüências é a
própria distribuição (mesocúrtica, isto é, normal), se k<3 a distribuição é comprimida
(platicúrtica, alta variabilidade), e se k >3a distribuição é concentrada em torno da média
(leptocúrtica, alta homogeneidade). Desse modo, uma vez que, em uma distribuição normal, o valor da curtose é 3 (k), se aceita a hipótese nula que os resíduos são distribuídos normalmente evidenciando que os erros se comportam conforme os pressupostos da regressão (GUJARATI, 2006).
A avaliação econômica do modelo é possível analisar o efeito marginal e a elasticidade das variáveis da regressão linear. De acordo com Maia (2010) o efeito marginal é o resultado do acréscimo de uma unidade adicional à variável original analisada, isto é, o mede em quanto muda a probabilidade quando há um aumento de uma unidade desta variável. No modelo de regressão linear o efeito marginal se caracteriza pela seguinte expressão matemática:
!"
!"= 𝛽! (38)
O conceito de elasticidade é usado para medir a reação das pessoas frente a mudanças em variáveis econômicas por meio da variação percentual. A equação matemática que expressa o efeito elasticidade sobre o modelo de regressão linear é:
!" !"∗
!
! (39)