• Sonuç bulunamadı

BÖLÜM V: SONUÇ, TARTIŞMA ve ÖNERİLER

5.2. Tartışma

De forma didática será desenvolvida, primeiramente, uma explanação hierárquico-linear para depois especificar o modelo logístico hierárquico.

Muitas pesquisas sociais envolvem uma estrutura hierárquica dos dados. Em determinados estudos, é importante conhecer como diferenças entre níveis decisórios interagem para influenciar determinado fenômeno. Por exemplo, como diferenças no desenvolvimento da economia nacional interagem com a escolaridade para influenciar as taxas de fecundidade. Dessa maneira, a variável dependente é definida no menor nível de agregação (no exemplo acima, o domicílio) e as variáveis independentes nos demais níveis (HOX, 1995).

15

A boa localização não será tratada somente pela oferta de serviços e infraestruturas urbanas, mas também pela proximidade das atividades desenvolvidas pelos membros do domicílio, principalmente trabalho. Também é importante destacar que, no contexto brasileiro, em especial nas Grandes Regiões Metropolitanas, sabe-se que a oportunidade de escolha habitacional é bastante restrita para uma parcela da população. Os grupos sociais mais carentes, cuja escolaridade e renda encontram-se abaixo do desejado, são obrigados a viver em condições de pobreza, participando de um processo de favelização e de periferização metropolitana, ocupando, em geral, habitações de baixa qualidade em áreas com pouca infraestrutura urbana.

Nos modelos hierárquicos lineares, cada um dos níveis é formalmente representado pelo seu próprio submodelo. Estes submodelos expressam associações entre as variáveis dentro de um determinado nível e especificam como a variável de um nível influencia as relações do outro. Dessa maneira, a aplicação desse modelo melhora a estimação dos efeitos dentro das unidades individuais, a formulação e o teste de hipótese entre os efeitos dos diferentes níveis e a partição da variância e covariância entre os níveis (BRYK &

RAUDENBUSH,2002).

O modelo, portanto, considera que o intercepto e eventualmente a inclinação não são os mesmos nas unidades de nível 2 e que a variação pode se dar pelo efeito de alguma variável explicativa de nível 2 e/ou componente aleatório (RIANI, 2005).

O modelo hierárquico mais simples não possui variáveis explicativas e apenas o intercepto tem efeito aleatório. Estimar esse modelo sempre é útil para a análise preliminar dos dados hierárquicos. Esse modelo é considerado totalmente não-condicional, pois nenhuma variável preditora é especificada. O modelo cria uma estimativa pontual e um intervalo de confiança para a grande média e promove informação sobre a variabilidade em cada um dos níveis. A equação no primeiro nível é descrita conforme abaixo:

Yij = β0j + rij (4.1)

O subscrito j (1...J) é referente ao segundo nível e i (1...Nj) é referente ao primeiro nível. O primeiro nível β1 é definido como zero para todas as unidades de nível 2, j, cada erro de nível 1, rij, é normalmente distribuído com média de zero e variância constante, σ2. Este modelo prediz o resultado dentro de cada unidade de nível 1 com apenas um parâmetro de nível 2, o intercepto – β0j.

A equação do nível 2 é dada por:

β0j = ɣ00 + u0j (4.2)

onde ɣ00 representa o resultado da grande média da população e u0j é o efeito aleatório associado com j que tem a média zero e variância σ200.

Substituindo-se a Equação 4.2 em 4.1, tem-se o modelo combinado (EQUAÇÃO 4.3):

Yij = ɣ00 + u0j + rij (4.3) O modelo hierárquico se desenvolve à medida que são incorporadas variáveis explicativas de nível 1. Isto é, acrescenta variáveis associadas ao indivíduo para explicar parte da variabilidade associada a este nível. A Equação 4.4 apresenta a equação no primeiro nível com apenas uma variável dependente. Yij = β0j + β1j X1ij + rij (4.4)

Nesta equação β0j é o intercepto, β1j é coeficiente de regressão e rij é o termo de erro residual. A diferença consiste em cada j tendo um intercepto (β0j), cuja variação é dada por (ɣ00 + u0j), e o mesmo coeficiente (β1j) (EQUAÇÃO 4.5 e 4.6).

β0j = ɣ00 + u0j (4.5)

β1j = ɣ10 (4.6)

Em seguida considera-se, além do intercepto com efeito aleatório, a inclinação aleatória entre os j. Neste caso, a equação de nível 1 continua a mesma (4.4), mas o nível 2 é alterado conforme Equação 4.7 e 4.8.

β0j = ɣ00 + u0j (4.7)

β1j = ɣ10 + u1j (4.8)

ɣ00 é média do intercepto e ɣ10 a média da curva de regressão entre as unidades de nível 2 u0j e u1j são os incrementos únicos do intercepto e da curva associados à unidade de nível 2. A variância no intercepto e na curva no nível e covariância entre o intercepto e a curva de nível 1 são não-condicionais.

O próximo passo no modelo de regressão hierárquica é predizer a variação dos coeficientes de regressão βj através da introdução das variáveis explanatórias do segundo nível (EQUAÇÃO 4.9 e 4.10).

e

β1j = γ10 + γ11 Zj + u1j (4.10)

Substituindo esses três conjuntos de equação em (4.4), tem-se a Equação 4.11:

Y = γ00 + γ10 Xij + γ01 Zj + γ11 Zj Xij + u1j Xij + u0j + eij (4.11)

Este modelo provê uma covariável de nível 2, Zj, enquanto também se controla o efeito da covariável de nível 1, Xij, e efeito aleatório de nível 2, u0j. O erro eij

em cada j tem a média igual a zero e variância σ2j. Isto implica em dizer que o intercepto e o coeficiente variam entre os diversos j e por esta razão são considerados coeficientes aleatórios. Entre os j, os coeficientes de regressão βj têm a distribuição com alguma média e variância.

A variância do segundo nível é agora residual ou condicional, pois representa a variabilidade de β00 e β1j depois de controlada pelas variáveis independentes do segundo nível. Se essas variáveis conseguissem captar toda a variabilidade do intercepto e da inclinação existente no nível superior, não sobraria nenhuma parte aleatória, porém, dificilmente consegue-se incluir variáveis que expliquem toda a aleatoriedade (RIANI, 2005).

Contudo, as variáveis respostas neste trabalho são binária (0,1), o que impede o uso de um modelo hierárquico linear, pois o termo de erro de nível 1 não possui uma distribuição normal e variância homogênea (HOX, 1995). Além disso, o valor predito da variável binária, como probabilidade, não pode assumir qualquer valor real, mas somente valores entre zero e um. Dessa maneira, é necessário utilizar o modelo hierárquico linear geral, que consiste em uma equação linear de regressão, uma distribuição de erro específica e uma função de ligação.

Para variáveis binárias num modelo hierárquico, utiliza-se a função de ligação que transforma o valor predito em logaritmo da chance de sucesso, conhecido como log-odds. A função muda a escala de razão para outra aditiva e altera o conjunto de números para uma escala que vai de -∞ a +∞.

A equação final do modelo logit hierárquico é dada por:

ηij = ln (πij / 1-πij) = γ00 + γ10 Xij + γ01 Zj + γ11 Zj Xij + u1j Xij + u0j + eij (4.12)

Sendo ln (πij / 1-πij) o log da chance de sucesso para o indivíduo e πij a probabilidade de sucesso para o indivíduo i. O valor predito do log da chance é convertido no valor predito da probabilidade:

πij = 1 / [1 + exp (-ηij)] (4.13)

Se a probabilidade de sucesso for igual a 0,5, a chance de sucesso (odds) será 1,0 e o logit igual a zero. Quando a probabilidade de sucesso for menor que 0,5, a chance de sucesso será menor que 1 e o logit negativo. Mas, quando a probabilidade de sucesso for maior que 0,5, a chance de sucesso será maior que 1 e o logito positivo (BRYK & RAUDENBUSH, 2002).