A primeira técnica a ser utilizada no presente estudo será a correlação linear simples. Ela procura medir o grau da relação entre duas variáveis aleatórias quantitativas. A correlação é importante porque fornece os primeiros indícios do grau de relacionamento entre
duas variáveis, embora não tenham relação de causa e efeito. Pode-se verificar o grau de correlação existente entre as variáveis estudadas, conforme segue a tabela:
Tabela de correlação: 1---> perfeita 0,8 ---|0,99 forte 0,6 ---| 0,8 média 0,3 ---| 0,6 fraca 0 ---| 0,3 fraquíssima 0---| nula
Importante considerar que, se não houver uma correlação linear significativa (entre 0,6 e 0,8), a equação de regressão provavelmente também não apresentará resultados significativos. Uma vez determinada uma correlação linear significativa entre duas variáveis aleatórias, procura-se descrever a relação entre elas através de uma função, que é o principal objetivo da análise de regressão de causa e efeito. A análise de regressão é uma técnica estatística para investigar e modelar a relação entre variáveis, sendo uma das mais utilizadas na análise de dados.
Conforme argumenta Hair et all, (2005) o objetivo da análise de regressão é prever uma única variável dependente a partir do conhecimento de uma ou mais variáveis independentes. Segundo o autor, na regressão múltipla as variáveis independentes são ponderadas para garantir a máxima previsão advinda do conjunto de variáveis explicativas. Esse conjunto forma a “variável estatística da regressão”, ou seja, uma combinação linear das variáveis independentes que melhor prevê a variável dependente.
Tornou-se uma especificação funcional padrão, para a compreensão da renda do trabalho, a utilização da equação minceriana, esse tipo de especificação contempla algumas variáveis do capital humano. No presente estudo optou-se pela formalização mais elementar que especifica a renda do trabalho em função da escolaridade média, da idade (como proxy para experiência) e da idade ao quadrado (para captar possíveis rendimentos decrescentes). A equação minceriana é utilizada, apenas como exemplo, na técnica de decomposição de OAXACA-BLINDER, que decompõe a diferença salarial em duas partes: uma parte capta a diferença salarial decorrente dos atributos produtivos de homens e mulheres e a outra parte capta a participação da discriminação no mercado de trabalho.
Uma análise fatorial exploratória será construída no presente estudo, pois fornecerá o grau de interdependência entre todas as variáveis, inclusive o padrão de relacionamento existente entre a renda do trabalho e as variáveis explicativas.
Para a análise fatorial é necessário que se respeite alguns pressupostos e procedimentos estatísticos; o primeiro deles diz respeito ao teste de correlação entre as variáveis, pois deve haver correlação entre elas para que se possa aplicar o modelo fatorial (Pestana apud Camillo, 2003) Além disso, são necessários dois testes que indicarão se as variáveis possuem o grau mínimo de correlação múltipla.
O primeiro teste é o KMO (Kaiser-Meyer-Olkin) e precisa atingir um coeficiente mínimo de 0,5. O segundo teste é o de Bartlett segundo o qual identifica a correlação entre as variáveis a partir de um nível de probabilidade predefinido e precisa respeitar uma significância de 5%. Ambos os testes indicam o grau de validade da análise fatorial (CAMILLO, 2003).
Realizado os testes de KMO e Bartlett, podem-se extrair os fatores comuns e os fatores únicos que são os principais resultados da análise fatorial, obtidos através da decomposição da variância. Nessa decomposição, segundo Camillo (2003) geralmente são escolhidos os fatores que explicam mais de 70% da variância, pois se admite que dessa forma há apenas uma pequena perda de informação estatística.
Na definição de Camillo (2003) os fatores comuns podem ser classificados como comunalidade, pois além de indicar a proporção de variação de uma variável descrita pelos fatores comuns, também pode indicar o percentual de variação que uma variável tem em comum com o conjunto das demais variáveis do modelo, ou seja, a comunalidade permite avaliar o comportamento conjunto e a mútua interdependência entre as variáveis do modelo.
Uma ferramenta importante na interpretação dos fatores únicos obtidos com a análise fatorial é a sua rotação, que pode ser ortogonal ou oblíqua. Segundo Hoffmann (1999), o objetivo da rotação ortogonal é obter uma estrutura simples, isto é, obter uma nova matriz n x m de coeficientes de fatores, de maneira que os valores absolutos dos elementos de cada coluna dessa matriz se aproximem, na medida do possível, de 0 ou 1. De acordo com Rezende, Fernandes e Silva (2007) isso facilita a interpretação dos fatores, pois cada um dos novos fatores, após a rotação, deve apresentar uma correlação relativamente forte com uma ou mais variáveis e correlação relativamente fraca com as demais variáveis.
Segundo Hair et all (2005), entre os métodos de rotação ortogonal destaca-se o VARIMAX. Esse método é usual na literatura e minimiza o número de variáveis, com altas cargas sobre o fator, reforçando a interpretabilidade dos fatores. Conforme argumenta Camillo (2003) uma vez rotacionados, os coeficientes das variáveis contidos nos fatores únicos são ranqueados, possibilitando avaliar a importância de cada variável individualmente e suas relações com as demais variáveis do mesmo fator único. Neste caso, a análise fatorial permite quantificar o grau de inter-relacionamento entre as variáveis selecionadas no modelo e também possibilita analisar suas individualidades descritas nos fatores únicos independentes (CAMILLO, 2003).
Depois da rotação e interpretação dos fatores, os autores Malhotra (2004) e Hair
et all (2005) mostram que se devem calcular as cargas fatoriais. Segundo Rezende, Fernandes
e Silva (2007) cada variável possui, para cada fator encontrado, um escore fatorial. O peso ou coeficiente das cargas fatoriais pode ser obtido na matriz de coeficientes de cargas fatoriais.
Portanto, a fim de complementar a análise fatorial descrita acima, optou-se também pela construção dessa regressão com score dos dois fatores gerados na análise fatorial. Os procedimentos são os seguintes: i) roda-se outra análise fatorial retirando-se a variável dependente, ou seja, a renda do trabalho; ii) com a “nova” análise fatorial constrói-se o “score” das variáveis, o que significa na prática, a construção de uma outra variável a partir das variáveis dos fatores, ou seja, a variável resultante expressa a participação do conjunto de variáveis de cada fator na explicação da renda do trabalho, em que assume, portanto, a variável dependente.