Com o objetivo de verificar quais fatores possuem maior capacidade de discriminar os produtores de leite entre eficientes e ineficientes, utilizar-se-á da análise discriminante. Tal análise consiste num método de estatística multivariada que possibilita a classificação de elementos de uma dada amostra de acordo com grupos previamente conhecidos, sendo também possível elaborar uma regra de classificação a ser utilizada para enquadrar eventuais novas observações nos grupos existentes (MINGOTI, 2005).
De acordo com Malhotra (2011), a análise discriminante é uma técnica de análise de dados em que a variável dependente tem natureza categórica (separa os elementos em dois ou mais grupos de categoria) e as variáveis independentes têm natureza métrica (medidas em uma escala de razão).
Malhotra (2011) apresenta como objetivos da análise discriminante: (i) Estabelecer funções discriminantes, ou combinações lineares das variáveis independentes, que melhor discriminem entre as categorias da variável dependente (grupos); (ii) Verificar se existe diferenças significativas entre os grupos, em termos das variáveis independentes; (iii) Determinar as variáveis independentes que mais contribuem para a diferença entre os grupos; (iv) Classificar os casos em um dos grupos com base no valor das variáveis independentes; e (v) Avaliar a precisão da classificação.
Dependendo do número de categorias da variável dependente, a técnica de análise discriminante pode ser de dois grupos, onde é deduzida somente uma função discriminante, ou múltipla, onde pode ser estimada mais de uma função. Neste estudo a técnica utilizada será a de dois grupos.
Segundo Gomes, Baptista e Wendling (2005), a análise discriminante reduz o número de variáveis para um número menor de parâmetros, que são funções discriminantes linearmente dependentes das variáveis originais. Os coeficientes da função discriminante indicam a contribuição da variável original para a função. O modelo é dado de acordo com a equação:
= � + � + � + � + + � (16)
em que D é o valor da função discriminante; � são os coeficientes discriminantes; e são os valores das variáveis independentes.
Os coeficientes � serão estimados de modo a diferenciar os grupos ao máximo, ou seja, os coeficientes do mesmo grupo serão os mais parecidos possíveis, e estes serão os mais diferentes possíveis dos coeficientes do outro grupo.
O processo estatístico da análise discriminante pode ser dividido em seis estágios: (i) Definição dos objetivos, ou seja, definir quais os objetivos que a análise deve alcançar; (ii) Pesquisa para a análise discriminante, onde compreende-se a seleção das variáveis dependentes e das variáveis independentes, a escolha do tamanho da amostra e a divisão dessa amostra; (iii) Hipóteses da análise discriminante, sendo a hipótese básica da análise discriminante a existência de multivariedade entre as variáveis independentes e a dependente, além de uma desconhecida, mas igual estrutura de variância e covariância para os grupos formados, supondo ainda a existência de normalidade das variáveis; (iv) Estimação do modelo de análise discriminante, isto é, a estimação dos parâmetros da função discriminante e a obtenção da função Z correspondente; (v) Interpretação dos resultados, de forma a interpretar os parâmetros e dividir os grupos determinados pela função discriminante; e (vi) Validação dos resultados, ou seja, a verificação do poder de explicação da análise, fazendo uma análise crítica dos resultados encontrados.
Um método comum na análise discriminante é o stepwise, que seleciona as variáveis para entrar na análise, baseando-se nas suas capacidades de discriminação. O
processo inicia-se selecionando a variável que apresenta maior valor de discriminação. Esta variável é pareada com as demais variáveis, uma de cada vez, e o critério de seleção é novamente comparado. A variável que, em conjunto com a primeira selecionada, produzir o melhor valor para o critério é a segunda variável escolhida para entrar na análise. Estas duas variáveis selecionadas são combinadas com as demais remanescentes e a combinação que apresentar o maior valor para o critério de seleção determinará a terceira variável a entrar na equação. Do mesmo modo, todas as demais variáveis são testadas através do critério de seleção, até que todas sejam ordenadas pelas suas capacidades de discriminação.
Segundo Gomes, Baptista e Wendling (2005), o método de decisão estatística para o caso de dois grupos classifica uma observação no Grupo 1 se:
̅ + ̅
+ [�� ⁄⁄ ] (17)
e outra observação será classificada no Grupo 2 se:
< ̅ + ̅ + [�� ⁄⁄ ] (18)
em que Z é o valor discriminante para uma dada observação; ̅ é valor discriminante médio para o grupo j; � é a probabilidade prévia do grupo j; e C ⁄ é o custo de classificação incorreta dentro do grupo i de uma observação que pertence ao grupo j.
Para a determinação da significância da função de discriminação, de acordo com Malhotra (2011), pode-se testar estatisticamente a hipótese nula, de que as médias de todas as funções discriminantes em todos os grupos sejam iguais. Para Hair et al. (2009), um dos métodos mais utilizados para identificar o poder discriminatório de uma variável é o teste Lambda de Wilks ( ∗). Este teste considera como critério de seleção de variáveis o valor da Estatística F Multivariada, para o teste da diferença entre os centróides dos grupos. A variável que maximiza o valor da estatística F também minimiza o ∗, que é uma medida de discriminação entre os grupos.
Posteriormente, é realizada a interpretação dos resultados, em que o valor do coeficiente � para uma determinada variável independente depende das outras variáveis independentes que fazem parte da função discriminante. Por fim, procede-se com a
avaliação da validade da análise discriminante, em que os coeficientes � estimados são multiplicados pelos valores das variáveis independentes na amostra retida, a fim de gerar valores discriminantes para os casos nessa amostra (MALHOTRA; 2011).
Para consultas mais detalhadas sobre a análise discriminante, recomenda-se referências como Hair et al. (2009), Malhotra (2011) e Mingoti (2005).