• Sonuç bulunamadı

II. BÖLÜM

3. SONUÇ VE ÖNERİLER

Foram ajustados diversos modelos, tanto com efeito fixo quanto com efeito aleatório, sempre considerando a possibilidade de variação apenas individual nas seções cruzadas, dado que se descartou previamente a hipótese de variação temporal. Os quarenta modelos ajustados são apresentados no Anexo III e seguiram o procedimento de retirar uma a uma as variáveis fortemente correlacionadas, na tentativa de melhorar a especificação do modelo.

A etapa seguinte foi escolher o melhor modelo de ajuste para o painel com efeito aleatório e para o painel com efeito fixo e só depois aplicar o teste de Hausman entre eles a fim de indicar a melhor alternativa para a análise dos dados amostrais. A seguir são apresentadas as especificações dos modelos de determinação do PIBCC e as regressoras que se mostraram estatisticamente mais significativas para cada caso – painel com efeito aleatório e com efeito fixo. A regressão estimada no caso de dados em painel com efeito aleatório seguiu a equação (13):

Log (PIBCCit) = a0i + a1log(OPit) + a2 log(LUCROit) + a3 log(CREDit) + a4 log(POPit) + a5log(CIMit) + a6 log(CONFit) + eit (13) A Tabela 4.30 apresenta os coeficientes subjacentes da regressão (13) estimados, seus erros padrão, a estatística t e respectivos valores de probabilidade (p-valor), além de algumas propriedades da reta ajustada por MQO. Os resultados indicam que o modelo parece consistente e estatisticamente significativo para estimar o valor médio do PIBCC nas unidades estaduais com base nos regressores escolhidos, haja vista a análise dos coeficientes estimados

156

e respectivos testes de significância. Todos os regressores apresentaram valores do teste t e p- valor (que resume a força de evidência empírica do teste t) aceitos num intervalo de confiança maior do que 97%, exceto para a variável independente LUCROit que somente pode ser aceita

ao nível de significância de 7%. Os regressores também apresentaram sinais esperados de acordo com a proposta teórica do modelo, exceto para a variável CONFit, que apresentou sinal

negativo. A análise dos resíduos mostra que a variável de resposta está bem ajustada aos regressores do modelo, com coeficiente de determinação (R2) de 0,71 e F-estatístico de 43,8, ratificando a significância estatística conjunta das variáveis explicativas ao nível de 5%. Entretanto, o Teste de Durbin-Watson (dw) sugere a presença de correlação serial positiva nos resíduos: o dw estimado de 0,38 ficou bem abaixo do valor crítico para a fronteira inferior (dL = 1,550), de modo que não se pode rejeitar a hipótese nula de nenhuma autocorrelação nos erros estocásticos.

TABELA 4.30 - Resultados da regressão (equação 13): modelo de dados em painel estimado com efeito aleatório (EA)

Coeficientes Estimativas Erro-padrão valor de t p-valor

Intercepto 5,755111 1,677476 3,4308 0,0006 log(OP) 0,008950 0,002109 4,2429 0,0000 log(LUCRO) 0,062397 0,034419 1,8129 0,0699 log(CRED) 0,0206553 0,006458 3,1983 0,0014 log(POP) 0,1393330 0,063300 2,2012 0,0277 log(CIM) 0,4547523 0,033224 13,6874 0,0000 log(CONF) -0,3324643 0,122178 -2,7211 0,0065

Soma Total dos Quadrados: 0,74468 Soma dos Quadrados dos Resíduos: 0,2182 n = 116 ; k = 6

F-estatístico: 43,8338 com 6 e 110 graus de liberdade e p-valor < 2,22e-16 R2 = 0,7069882

Teste de Durbin-Watson para correlação serial: dw = 0,3789 p-valor = 0,00000

FONTE: Teixeira (2009).

Como medida de correção para o problema de autocorrelação nos resíduos, aplicou-se o método de estimação através da técnica FGLS) ou método dos MQGF. A Tabela 4.31 apresenta o modelo da equação (13) estimado por meio do método FGLS, que produz estimadores MQO consistentes, não tendenciosos e eficientes ao corrigir a correlação serial. De acordo com a nova reta de regressão ajustada, para todas as variáveis explicativas os valores computados de z estão bem acima dos níveis críticos, indicando que os coeficientes estimados são estatisticamente significativos com baixa probabilidade de erro (considerando

157

um intervalo de confiança acima de 99%), melhorando consideravelmente a significância estatística e a evidência empírica do modelo da equação (13). A medida de qualidade do ajuste para a variável resposta (PIBCC) aos regressores propostos subiu de 0,71 para 0,89. Este, então, foi o modelo em painel com efeito aleatório selecionado e posteriormente usado no teste de Hausman a fim de definir qual dos efeitos não observados - fixos ou aleatórios - é mais adequado aos dados amostrais em estudo.

TABELA 4.31 - Resultados da regressão equação (13): modelo de dados em painel com efeito aleatório estimado pela técnica FGLS

Coeficientes Estimativas Erro-padrão valor de z p-valor

Intercepto 9,311719 2,613938 3,5623 0,000368 log(OP) 0,019704 0,004361 4,5178 0,000006 log(LUCRO) 0,185543 0,037479 4,9506 0,000001 log(CRED) 0,026907 0,006672 4,0331 0,000055 log(CIM) 0,659082 0,045885 14,3639 0,000000 log(POP) 0,124270 0,044742 2,7775 0,005478 log(CONF) -0,768356 0,186123 -4,1282 0,000037

Soma Total dos Quadrados: 71,181 Soma dos Quadrados dos Resíduos: 8,0182 R2: 0,8873548

FONTE: Teixeira (2009).

Os procedimentos de ajuste dos vários modelos indicaram que, para o caso de painel com efeitos fixos, a melhor especificação para a determinação do PIBCCit é dada pela

equação (14):

Log (PIBCCit) = a0i + a1log(OPit) + a2 log(LUCROit) + a3 log(CREDit) + a4log(CIMit) +

a5log(CONFit) + uit (14)

A Tabela 4.32 mostra os resultados do modelo estimado para o caso de dados em painel com efeitos fixos. A regressão ajustou-se bem aos dados amostrais para o período considerado. O teste t de significância dos coeficientes estimados indicou que os regressores OPit, CIMit e CREDit são estatisticamente significantes a um nível menor que 1%, enquanto a

variável LUCROit só pode ser aceita a um nível de significância de 9% e a variável CONFit ao

nível de significância de 6%. Entretanto, Wooldridge (2007, p. 126) esclarece que “diferentes pesquisadores preferem níveis de significância diferentes, dependendo da aplicação particular. Não há nível de significância „correto‟”. Gujarati (2006, p. 22) também esclarece que a ciência econômica trabalha com dados não-experimentais, de modo que o pesquisador social precisa aceitar que os dados econômicos são de natureza imprecisa, sujeitos a erros de

158

observação como resultado da qualidade da coleta ou pela interação de vários fatores não controlados (ou ambos) que afetam o fenômeno pesquisado. Assim, níveis de confiança maiores em ciências sociais aplicadas são aceitáveis. Ademais, o objeto do estudo não é fazer previsões sobre eventos futuros, mas analisar a realidade de forma factível, a fim de propor linhas gerais de políticas públicas.

TABELA 4.32 - Resultados da regressão equação (14): modelo de dados em painel estimado com efeito fixo (EF)

Coeficientes Estimativas Erro-padrão valor de t p-valor

log(OP) 0,088374 0,001964 4,26450 0,000002

log(LUCRO) 0,194334 0,031795 1,70890 0,087470

log(CRED) 0,144172 0,006046 3,00560 0,002650

log(CIM) 0,424813 0,031337 13,55650 0,000000

log(CONF) -0,191766 0,101148 -1,89590 0,057980 Soma Total dos Quadrados: 0,54443

Soma dos Quadrados dos Resíduos: 0,16927 n = 116 ; k = 5

F-estatístico: 43,4401 com 5 e 98 graus de liberdade e p-valor = 0,00000 R2 = 0,68908767

Teste de Durbin-Watson para correlação serial: dw = 1,741 p-valor = 0,05278

FONTE: Teixeira (2009).

As variáveis explicativas selecionadas também apresentaram sinais de acordo com as expectativas teóricas, exceto para o caso da variável CONFit. A análise dos resíduos mostra

que a variável de resposta está bem ajustada aos regressores do modelo, com coeficiente de determinação (R2) de 0,69 e F-estatístico de 43,4 bem acima do nível crítico, respaldando a evidência empírica para o conjunto das variáveis de estímulo. Com base no teste usual de Durbin-Watson (dw), o d estimado oscila entre as fronteiras críticas superiores e inferiores, indicando que a estatística está na área de indecisão para a hipótese nula de nenhuma autocorrelação serial, ao nível de significância de 5%. Todavia, com base no d teste modificado (d ≤ dU), não se pode rejeitar a hipótese nula de que não há presença de correlação

serial positiva nos resíduos, uma vez que o d estimado (1,741) ficou abaixo da fronteira superior.

Assim, o modelo estimado, conforme resultados apresentados na Tabela 4.32, foi o modelo em painel com efeitos fixos selecionado para confrontar o modelo de efeitos

159

aleatórios no teste de Hausman, definindo qual dos dois é mais adequado aos dados amostrais pesquisados.

Wooldridge (2007, p. 445) esclarece que, na literatura de trabalhos aplicados, muitos autores decidem entre modelos de efeitos fixos ou aleatórios com base em se os termos de efeitos não observados são mais bem entendidos como parâmetros a serem estimados ou como resultado de uma variação aleatória.

Quando não podemos considerar as observações como extrações aleatórias de uma grande população – por exemplo, se temos dados de estados ou municípios - frequentemente é racional pensar os termos de efeitos não observados como parâmetros a estimar, caso em que usamos os métodos dos efeitos fixos (WOOLDRIDGE, 2007, p. 445)

Este é o caso dos dados amostrais em estudo, indicando que a estimação do modelo de efeitos não observados pela técnica de dados em painel com efeitos fixos seria a mais adequada.

Entretanto, a comparação das estimativas de efeitos fixos e efeitos aleatórios pode ser feita com base no teste de especificação de Hausman, para verificar se existe correlação entre o efeito não observado e as variáveis explicativas. O estimador de efeitos aleatórios é mais adequado quando o efeito não observado for não-correlacionado com as variáveis explicativas. Com base no resultado do teste de Hausman, pode-se concluir que o modelo com efeitos fixos é o mais adequado aos dados amostrados. Pelo valor estimado do χ2 (qhi- quadrado = 77,17), o referido teste rejeitou a hipótese nula de que o efeito não observado é não-correlacionado com uma ou mais variáveis regressoras a um valor de probabilidade de erro bastante baixo. Ou seja, com elevado grau de confiança (intervalo de confiança maior que 99%), pode-se inferir que o efeito não observado tem distribuição correlacionada com uma ou mais variáveis regressoras, aceitando-se a hipótese alternativa de que o modelo com efeitos fixos é o mais adequado para a distribuição amostral.

Com base nesses resultados, o modelo a priori escolhido foi o de dados em painel com efeitos fixos da equação (14), estimado usando variáveis dummies (binárias) para computar os interceptos individuais de cada unidade de corte transversal através do método de MQO, que neste caso obtém estimativas consistentes e não tendenciosas. As estimativas dos diferentes interceptos para cada unidade da federação que compõe a base amostral e demais estimadores são apresentadas na Tabela 4.33. Os resultados mostram que os efeitos individuais dos estados brasileiros (unidades de corte transversal) são estatisticamente significativos; as estimativas dos interceptos de todos os estados apresentam valor elevado para o teste t, ratificando a

160

validade empírica dos estimadores a um p-valor muito baixo (ou a um intervalo de confiança bastante elevado). Os valores dos interceptos podem ser ordenados de forma a indicar quais estados estão acima ou abaixo do valor médio na amostra. O ordenamento decrescente indica que São Paulo, Minas Gerais, Rio de Janeiro, Paraná e Rio Grande do Sul são as unidades de corte transversal com os valores de interceptos maiores que a média amostral. Estes resultados são mais bem discutidos no item 6.2, que trata da análise dos resultados do modelo estimado.

Uma vez que o teste de homogeneidade de Bartlett indicou que as variâncias dos erros são homocedásticas ao longo do tempo, o teste de Chow pôde ser aplicado para verificar a estabilidade estrutural do modelo. Pelo teste de Chow, não houve instabilidade dos parâmetros ao longo do período analisado, ou seja, não houve mudança ou quebra estrutural nos anos analisados. O valor da estatística F calculado (4,6081), com graus de liberdade de 60 e 58, não permite rejeitar a hipótese nula de estabilidade dos parâmetros a um nível de significância de 5% (ANEXO III).

TABELA 4.33 - Resultados da regressão da equação (14): modelo de dados em painel com efeitos fixos estimado por variáveis dummies para os interceptos diferentes entre as unidades da federação

Variáveis Estimativas Erro-padrão valor de t p-valor

DMAmazonas 5,1155 1,5110 3,3854 0,000711 DMPará 4,9837 1,5168 3,2856 0,001018 DMCeará 5,2245 1,5160 3,4463 0,000568 DMPernambuco 5,3850 1,5166 3,5508 0,000384 DMBahia 5,3473 1,5193 3,5194 0,000432 DMMinas Gerais 6,0201 1,5260 3,9450 0,000008 DMEspírito Santo 5,0360 1,5128 3,3290 0,000872 DMRio de Janeiro 5,8578 1,5219 3,8489 0,000119 DMSão Paulo 6,2699 1,5342 4,0868 0,000004 DMParaná 5,6867 1,5230 3,7339 0,000189 DMSanta Catarina 4,9181 1,5221 3,2311 0,001233

DMRio Grande do Sul 5,4453 1,5210 3,5802 0,000343

DMGoiás 4,9817 1,5204 3,2765 0,001051 log(OP) 0,089456 0,0042 4,3885 0,000009 log(LUCRO) 0,194679 0,0027 4,8060 0,086541 log(CRED) 0,141263 0,0014 2,2413 0,027522 log(CIM) 0,432214 0,0228 14,5191 0,000000 log(CONF) -0,194235 0,1748 -1,6715 0,084614 R2 = 0,765252 FONTE: Teixeira (2009).

O teste de Breusch e Pagan também foi aplicado para auxiliar na seleção do modelo que melhor se assentava aos dados amostrais. Conforme apresentado no Anexo III, o referido

161

teste não rejeitou a hipótese de não dependência nas seções cruzadas, indicando que o modelo com efeito individual é mais adequado para a equação de regressão proposta, em detrimento do modelo com dados empilhados.