Suçun unsurları - Resmi belgede sahtecilik

3. KAMU GÜVENİNE KARŞI SUÇLAR VE RESMİ BELGEDE

3.1 Sahtecilik Eylemleri

3.1.4 Resmi belgede sahtecilik

3.1.4.1 Suçun unsurları

A análise de regressão se ocupa do estudo da dependência de uma variável em relação a uma ou mais variáveis (explicativas) com o objetivo de estimar e/ou prever o valor médio da primeira em termos dos valores conhecidos ou fixados das segundas (GUJARATI, 2006). Para simplificar o modelo sugere a seguinte forma exposta por Gujarati (2006):

i i =β +βΧ+ε

Υ 0 1 (21)

Essa expressão representa um modelo de regressão linear, onde Y é chamado de variável dependente, X de variável independente, “onde

β

0 e

β

₁conhecidos como os parâmetros do modelo, são, respectivamente, o intercepto e o coeficiente angular” (GUJARATI, 2006).

Para obter o modelo de regressão linear, um conjunto de critérios são requisitados sugerindo três critérios de avaliação:

1) avaliação estatística; 2) avaliação econométrica; 3) avaliação econômica.

Segundo Maia (2008) o critério estatístico tem como objetivo verificar se a estimação do modelo especificado gera parâmetros eficientes, consistentes e não-viesados, medida os parâmetros estimados são, ou seja, desejáveis. No intuito da obter tais objetivos, faz-se necessário o uso de alguns critérios estatísticos.

Na avaliação estatística, sugerida como primeiro critério, tem-se como objetivo verificar se a estimação do modelo especificado geram os melhores parâmentros (MELNT). Para alcançar tais objetivos, faz-se o uso primeiramente, dos testes de ajustamento global do modelo de regressão. O coeficiente de determinação (R²) é o indicador que mostra se o modelo está se ajustando aos dados coletados. Deve-se esperar que 0_{≤ R}2 _≤1_{, indicando a}

proporção de variação ocorrida na variável dependente que é explicada pelas variações ocorridas nas variáveis independentes (GUJARATI, 2006).

De acordo com Maia (2008) o coeficiente de determinação ou coeficiente de correlação múltipla é e definido como a proporção de variação na variável dependente que é

devida à variação combinada das variáveis explicativas (independentes), e é expressa pela fórmula:

R² = !! !!

!! (22)

Onde:

𝑒!_{: resíduo da soma dos quadrados;}

𝑦!_{: soma dos quadrados da variável dependente;}

Desta forma, R2 varia entre 0 e 1.

Outra ferramenta utilizada na avaliação estatística é o coeficiente de correlação entre as variáveis estudadas. A correlação é definida como grau em que duas variáveis estão relacionadas linearmente, seja por meio de causalidade direta, indireta, por probabilidade estatística ou por teoria econômica. O resultado gera um coeficiente que varia de -1, (indicando uma perfeita correlação negativa) e 1 (indicando uma perfeita correlação positiva).

De acordo com Gujarati (2006) o objetivo da análise de correlação é medir a força ou o grau de associação linear entre duas variáveis. Esta análise pressupõe que as duas variáveis sejam aleatórias, onde não há distinção entre as variáveis dependente e explanatória.

r2 = ( !!!!) ! ! !! !_!! (23) Onde: 𝑥! : variável explicativa; 𝑦! : variável explicada.

O segundo critério para avaliação do modelo estimado, está relacionado ao conjunto de hipóteses do processo MQO (Mínimos Quadrados Ordinários). Para validar o método, sob a ótica econométrica, é necessário adotar algumas hipóteses do modelo.

A – Pressuposições relacionadas ao erro (εi)

I) Média Zero: O erro é uma variável aleatória de média zero E(εi) = 0. Significa que os valores esperados dos erros sejam nulos para todas as observações. Isto é, dado o valor de X, o valor médio, ou esperado, do distúrbio aleatório “εi” é zero Gujarati (2006). Simbolicamente é representado por:

E (εi) = 0

II) Variância Constante: homocedasticidade ou variância igual em “εi”. Dados os valores de X, a variância é a mesma para todas as observações. O erro tem variância constante; E(εi2) = σ2. Ou seja, o erro tem que ser uma variável aleatória com variância constante e igual, os erros da regressão da população tem que ser homocesdástico Gujarati (2006). Portanto se esse pressuposto for violado, não tendo a mesma variância para todas as observações, temos o problema da heterocesdasticidade prejudicando a eficiência dos parâmetros estimados.

E (εi2) = σ2

III) Distribuição Normal: O erro deve ter distribuição normal: εi ~ N( 0, σ2 ). Não existe influência de variáveis fora do modelo, ou seja, todas as variáveis relevantes devem estar contidas no modelo.

εi ~ N( 0, σ2 )

VI) Independentes ou Ausência de Autocorrelação: O erro de uma observação não deve estar associado a outro erro de outra observação. Cov (εi, εj) = 0, com i ≠ j. Nenhuma autocorrelação entre as perturbações. O erro (εi) do período (i) não afeta o erro do período (j).

Cov (εi, εj) = 0, com i ≠ j

De acordo com Maia (2008) sendo o objetivo do critério econométrico mensurar as variáveis e agregados econômicos, o enfoque é o isolamento dos efeitos das relações de causalidades. Dessa forma, uma premissa importante do modelo de regressão linear clássico é de que o os termos de erro (εi) da função de regressão populacional devem ser homocedástico e não autorrelacionados, isto é devem ter a variância mínima. Contudo um dos grandes problemas no processo de estimação do modelo começa pelo caso da heterocedasticidade. Isso ocorre quando a variância dos resíduos não se comporta de modo constante, ou seja, as variâncias não são as mesmas para todas as observações.

Para detectar o problema da heterocedasticidade é necessário a utilização de testes formais. Existem diversos testes: teste de Park, teste de Glejser, teste de Goldfeld-Quandt e teste de White.

Park2 (1966) formaliza o método gráfico sugerindo que a variância ( σ_!!_{) é função da}

variável explanatória 𝑥!. A forma funcional que ele indica é:

ln σ!! = ln σ

+ β ln 𝑥! + 𝑣! (24)

Se β for estatisticamente significativo, (β=0) considera-se que a homoscedaticidade está presente nos dados. Caso contrário, aceita a premissa de heteroscedasticidade, onde a variância não é constante.

Glejser3 (1969) sugere fazer uma regressão dos valores absolutos do termo de erro (amostra) contra a variável explicativa (𝑥!) que se considera estreitamente associada a σ_!!. As

formas funcionais sugerida são:

|𝜀i | = 𝛽_!+ 𝛽!+ 𝑋! + 𝑣! (25)

|𝜀i | = 𝛽_!+ 𝛽!+ 𝑋!+ 𝑣! (26)

|𝜀i | = 𝛽_!+ 𝛽!+1/𝑋! + 𝑣! (27)

|𝜀i | = 𝛽_!+ 𝛽! +1 / 𝑋! + 𝑣! (28)

O teste de White4 (1980) é um teste usualmente utilizado no processo de estimação de um modelo na busca da ocorrência do problema da heterocedasticidade, por não estar sujeito a hipótese de normalidade e sendo de fácil aplicação [MAIA, 2008]. O teste de White é feito a partir de etapas, como:

• 1ª etapa: Estimar o modelo de regressão

𝑦! = 𝛽_! +𝛽_!𝑋_!+𝛽_!Z_! + 𝜇! (29)

• 2ª etapa: Estimar uma regressão auxiliar

σi =α +α Xi +α Z i +α Xi +α Z i +α6XiZ2i +εi 2 2 5 2 4 2 3 2 1 2 ˆ ₍₃₀₎ 2

Park, R. E. “Estimation with Heteroscedastic Error Terms” Econometrica vol. 34 n° 4, outubro 196, p 888. 3

Glejser, H. “A New Test for Heteroscedasticity” Journal of the American Statistical Association, vol 64, 1969, p 316-323.

White, H. “A Heteroscedasticity Consistent Covariance Matrix Estimator and a Direct Test of Heteroscedasticity” Econometrica, .vol. 48, 1980, p 817-818.

É realizada uma regressão dos quadrados dos resíduos da regressão original contra as variáveis ou regressores X e originais, seus valores elevados ao quadrado e os produtos cruzados dos regressores Gujarati (2006).

• 3ª etapa: Teste de hipótese Admitem-se as seguintes hipóteses:

§ Hipótese nula → H0: αi = 0, homoscedástico; § Hipótese alternativa → Ha: αi ≠ 0, heteroscedástico.

Outro teste econométrico de estrita importância é a autocorrelação residual. De acordo com Gujarati (2006) a autocorrelaçao é definida como a correlação entre integrantes de séries de observações ordenadas no tempo ou no espaço, isto é, eles são correlacionados entre si. Considerando o modelo linear simples a autocorrelação dos resíduos implica E(ε_iε_j) ≠ 0 para i ≠ j. A sua ausência significa E(ε_iε_j) = 0 para i ≠ j. Utilizaram-se os testes de Durbin- Watson (d) e o teste de ARCH.

O teste d de Durbin-Watson é o mais usual para diagnosticar a autocorrelação residual de primeira ordem. De acordo com Gujarati (2006), matematicamente tem-se:

∑

= = = = − − = 2 1 2 2 1 ˆ ) ˆ ˆ ( t n t t n t t t t d

ε

(31) Como

_∑

2 ˆt ε e

_∑

2₋ 1 ˆt

ε se distinguem em apenas uma observação e admiti-se ausência de autocorrelação residual, logo são aproximadamente iguais, podendo ser definido como: ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − ≈

∑

− 2 1 ˆ ˆ ˆ 1 2 t t t d

ε

(32)

Desse modo, por definição, o coeficiente de autocorrelação de primeira ordem amostral é dado por ρ =

∑

− 2 1 ˆ ˆ ˆ t t t

ε

. Substituindo-o na Equação 16 e relacionando o d com ρ, defini-se a seguinte expressão:

) 1 ( 2 −ρ = d (33)

Conforme a expressão acima, como −₁≤ρ≤₁, isso implica que 0_{≤ d} _≤4_Desse

modo, pode-se dizer que:

§ ρ = 0 → d = 2 , o que significa não autocorrelação; § ρ = 1→ d = 0, implica em autocorrelação positiva; § ρ = -1→ d = 4, implica em autocorrelação negativa.

O valor calculado de d é confrontado com os valores do limite inferior (dL) e com o limite superior (dU) tabelado por Durbin e Watson, conforme é exposto por Gujarati (2006), utilizando-se a régua de Durbin-Watson:

Onde,

i. As regiões (i) e (v) representam respectivamente autocorrelação positiva e negativa, desse modo rejeita-se a hipótese nula de ausência de autocorrelação; ii. Nas regiões (ii) e (iv) o teste é inconclusivo;

iii. Na região (iii), aceita-se a hipótese nula (H0) de não autocorrelação.

Breusch e Godfrey (1978) desenvolveram um teste de autocorrelação que é geral no sentido em que permite a existência de regressores não estocásticos, como o valor defasado do regressando (GUJARATI, 2006). É possível, acrescentar valores defasados do regressando ao modelo, seja:

i i=β +βΧ+ε

Υ 0 1 (34)

Supõem-se que o termo de erro, 𝜀!, siga um esquema auto-regressivo de ordem p,

AR(p), como o seguinte: 𝜀_! _{= 𝜌} !𝜀!!!+ 𝜌!𝜀!!!+ ⋯ + 𝜌!𝜀!!!+ 𝑢! (35) (i) (ii) (iii) (iv) (v) 0 dL dU 2 4 4-dL 4-‐dU Aceita Ho

Não autocorrelação Rejeita Ho Rejeita Ho

Régua de Durbin-Watson. Fonte: Gujarati, 2006

Onde a hipótese nula, H0, deve ser testada no intuito de investigar a autocorrelação entre os resíduos:

• Hipótese nula → H0: 𝜌_!= 𝜌_!= 𝜌!= 0, implica ausência de autocorrelação;

• Hipótese alternativa → Ha: pelo menos um parâmetro é significante 𝜌_!≠ 0, implica em autocorrelação.

O teste de ARCH (Autoregressive Conditional Heteroscdasticity), Modelo Autoregressivo de Heterocedasticidade Condicional foi proposto por Engle (1982) para capturar a correlação entre os erro de previsão e o comportamento dos resíduos, ou seja, a idéia é que a variância do termo de erro (resíduo) no tempo t depende do quadrado da no momento anterior (t-1) Gujarati (2006). Engle (1982) demonstrou que se pode fazer um teste de hipótese nula partindo da seguinte regressão:

2 2 2 2 2 1 1 0 2 1 ˆ ˆ ˆ ˆ ˆ ... ˆ ˆ ˆ p t p t t− + − + + − + =α αε αε α ε ε (36)

Sendo assim, pode-se testar a hipótese nula por meio do teste F ou calculando nR2, onde R2 é o coeficiente de determinação dessa expressão utilizando-se a estatística de teste: nR2 ~ χ2p. Logo, consideram-se as seguintes hipóteses:

• Hipótese nula → H0: α1 = α2 =...= αi = 0, implica ausência de autocorrelação; • Hipótese alternativa → Ha: pelo menos um parâmetro é significante αi ≠ 0, implica em autocorrelação.

Conforme Gujarati (2006), o teste de normalidade dos resíduos apresenta como premissas relevantes: os termos de erros são não tendenciosos; há variância mínima entre os parâmetros, assim, são eficientes; o modelo apresenta estimadores consistentes. Para verificar se os resíduos apresentam distribuição normal emprega-se o teste de Jarque-Bera (JB), conforme demonstra equação a seguir:

(

)

⎪⎭ ⎪ ⎬ ⎫ ⎪⎩ ⎪ ⎨ ⎧ ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ ₋ + ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ = 24 3 6 2 2 k s n JB (37)

Onde, n é o tamanho da amostra, s é o coeficiente de assimetria e k é o coeficiente de curtose. Partindo da estatística Qui-quadrado, quando s₌0_{, a distribuição é simétrica e se}

0 <

s _{a distribuição é assimétrica negativa. Quando}k₌3_{a distribuição de freqüências é a}

própria distribuição (mesocúrtica, isto é, normal), se k_<3_{a distribuição é comprimida}

(platicúrtica, alta variabilidade), e se k _>3_{a distribuição é concentrada em torno da média}

(leptocúrtica, alta homogeneidade). Desse modo, uma vez que, em uma distribuição normal, o valor da curtose é 3 (k), se aceita a hipótese nula que os resíduos são distribuídos normalmente evidenciando que os erros se comportam conforme os pressupostos da regressão (GUJARATI, 2006).

A avaliação econômica do modelo é possível analisar o efeito marginal e a elasticidade das variáveis da regressão linear. De acordo com Maia (2010) o efeito marginal é o resultado do acréscimo de uma unidade adicional à variável original analisada, isto é, o mede em quanto muda a probabilidade quando há um aumento de uma unidade desta variável. No modelo de regressão linear o efeito marginal se caracteriza pela seguinte expressão matemática:

!"= 𝛽! (38)

O conceito de elasticidade é usado para medir a reação das pessoas frente a mudanças em variáveis econômicas por meio da variação percentual. A equação matemática que expressa o efeito elasticidade sobre o modelo de regressão linear é:

!" !"∗

! (39)