2. AMAÇ VE ÖNEM 1 Amaç
2.2. Temel Problem
A análise de regressão linear múltipla foi utilizada visando atender ao objetivo geral do estudo e identificar se determinadas características dos Estados brasileiros e do Distrito Federal podem ser determinantes no nível de disclosure de informações contábeis.
De acordo com Gujarati (2011) a análise de regressão é o estudo da dependência de uma variável, a variável dependente, em relação a uma ou mais variáveis, as variáveis independentes ou explicativas, que podem ser quantitativas ou qualitativas, buscando estimar ou prever o valor médio da variável dependente em termos dos valores conhecidos ou fixados das variáveis independentes. A especificação de um modelo é o processo de análise e escolha das variáveis, da forma funcional e das pressuposições probabilísticas feitas sobre as variáveis que entrarão no modelo de regressão. Para o presente estudo a variável dependente foi o ID de as variáveis explicativas foram: Receita Orçamentária, Transferências de recursos da União para os Estados, PIB per capita, Índice Firjan de Desenvolvimento Municipal, Índice de Desenvolvimento Humano nas suas três dimensões Educação, Longevidade e Renda, Taxa de Alfabetização e População.
A regressão foi estimada pelo Método dos Mínimos Quadrados Ordinários (MQO). Esse método é o mais amplamente utilizado para estimar os parâmetros da função de regressão populacional, que como o próprio nome sugere, define uma função chamada de Função Soma de Quadrados dos
Quando o MQO foi desenvolvido, foram estabelecidas algumas pressuposições sobre o modelo de regressão. Essas pressuposições definem o que seria uma norma, um padrão ou um ideal que deveriam ser testados e atendidos pelos modelos de regressão estimados. Os pressupostos do modelo clássico de regressão linear múltipla são: A média dos erros é zero; Homocedasticidade e Ausência de Correlação Serial nos Resíduos; Ausência de Multicolinearidade; Linearidade; Exogeneidade das Variáveis Explicativas e Independência dos Resíduos; e Normalidade dos Resíduos.
Com isso, foram realizados testes para analisar se esses pressupostos estavam sendo atendidos pelo modelo especificado. Para analisar a normalidade dos resíduos foi utilizado o teste de Shapiro-
Wilk. Em relação ao pressuposto de Homocedasticidade dos resíduos foi realizado o teste de Breusch-Pagan para Heterocedasticidade. A Multicolinearidade foi diagnosticada por meio do
teste de Fator Inflação da Variância (FIV), que observa a velocidade com que as variâncias e covariâncias podem ser vistas. Como regra prática, o FIV é indicativo de problemas de multicolinearidade se FIV>10, e através do fator de tolerância 1/FIV, que serão os valores mais aproximados de 0 (GUJARATI, 2011).Para verificar a existência de multicolinearidade entre o conjunto de variáveis a média do FIV não deve ser maior do que 1 ou o maior FIV não deve ser maior do que 10.
No caso de problemas de multicolinearidade entre as variáveis sugere-se, anteriormente à análise da regressão linear múltipla, a aplicação da técnica de Análise Fatorial (AF), com o intuito de eliminar as correlações existentes entre as variáveis observadas, possibilitando a utilização da regressão linear múltipla que pressupõem a não existência de correlação entre as variáveis.
3.5.2.1Análise Fatorial (AF)
A AF é uma técnica multivariada de análise utilizada para reduzir a quantidade de variáveis analisadas. Esse método transforma um conjunto de variáveis em um novo conjunto de variáveis compostas ou componentes principais não correlacionados uns com os outros. Essas combinações lineares de variáveis, segundo Cooper e Schindler (2003), são chamadas fatores e respondem pela variação nos dados como um todo.
A análise fatorial parte do pressuposto de que a correlação entre as variáveis surge porque essas variáveis compartilham ou estão relacionadas ao mesmo fator. Assim, o objetivo da AF é identificar fatores não diretamente observáveis, a partir da correlação entre um conjunto de variáveis, estas sim observáveis e passíveis de medição.
Para composição dos fatores foi utilizado, nesta pesquisa, o método de extração de fatores denominado Método dos Componentes Principais.
Para a utilização da AF deve-se analisar sua adequabilidade. Para isso, o primeiro passo no planejamento de uma análise fatorial é examinar a matriz de correlações simples, procurando visualizar algum padrão de relacionamento entre as variáveis, devendo existir grupos de variáveis correlacionadas. Uma das premissas de uma análise fatorial é que exista uma estrutura de dependência clara entre as variáveis envolvidas. Essa estrutura é expressa através da matriz de covariância ou de correlação. A existência de tal estrutura implica que uma variável pode, dentro de certos limites, ser prevista pelas demais. Para verificar esse fato, pode-se calcular os coeficientes de correlação parcial entre os pares de variáveis, eliminando o efeito das demais.
Outro pressuposto para a utilização da AF é a realização dos testes de esfericidade de Bartlett e o
Kaiser-Meyer-Olkin (KMO). O teste de esfericidade de Bartlett verifica se a matriz de correlações
é estatisticamente igual a uma matriz identidade, se for, não é adequada para AF. O que se busca, então, é rejeitar a hipótese nula de que a matriz de correlação verdadeira é uma matriz identidade (valor-p<0,05), fato que indica um bom nível de correlação entre as variáveis. Já a medida KMO é um índice que compara correlações simples e parciais e varia entre 0,0 e 1,0. Quanto mais próximo de 1,0, mais adequados são os dados para a AF. Pallant (2007) sugere 0,60 como um limite razoável.
Assim, após a aplicação da técnica de análise fatorial, as variáveis independentes selecionadas foram agrupadas em dois fatores, um fator socioeconômico e um fator tamanho. Esses fatores foram utilizados no modelo de regressão para verificar a relação entre os fatores gerados a partir da AF e o ID. Antes da utilização desses fatores na análise de regressão múltipla, foi necessário verificar se eles atendiam aos pressupostos do modelo clássico de regressão linear múltipla.