Após as análises dos valores faltantes e da distribuição de frequência das variáveis, deve ser feita a verificação de outliers na amostra, sendo este o último passo da análise univariada (HAIR et. al, 1998). Outliers são observações que possuem características únicas, distintas das características das demais observações na amostra que podem surgir de um erro de procedimento ou de um evento ou observação extraordinário (HAIR et. al, 1998). Independentemente de sua origem, ao mesmo tempo que outliers podem levar à distorção de resultados, estas observações podem trazer informações não esperadas pelo pesquisador; logo, é necessária sua análise antes de se decidir por excluí-lo ou não da amostra (PEDHAZUR e SCHMELKIN, 1991).
O método de detecção de outliers consiste em padronizar os dados (média 0 e desvio padrão + ou -1) e identificar as observações que apresentam valores superiores a (+) 3 ou (-) 3 (HAIR et. al., 1998, p.65). Este limite de corte é o comumente usado quando a amostra é considerada grande, caso desta dissertação.
Aqui a análise univariada de outliers foi realizada por questionário, por variável e cruzada, padronizando-se os dados e identificando-se valores acima do limite de corte. O intuito de fazer a análise univariada com três leituras, horizontal (por variável), vertical (por questionário) e cruzada, foi garantir que o processo não retirasse da amostra observações que, embora fora do limite de corte, representassem a realidade de algumas concessionárias.
“Após identificação ... dos outliers, o pesquisador deve decidir por manter ou excluir cada um. [...] os outliers devem ser
mantidos4 a menos que haja provas que demonstrem que estes
sejam realmente aberrantes e não representativos da população. Mas, se representam um segmento da população, devem ser mantidos para garantir a generalidade.” (HAIR et. al., 1998, p. 66)
Na análise vertical, verificou-se o total de casos de outliers por concessionária da amostra. Do total da amostra, 40 questionários apresentaram valores fora do limite de corte estabelecido, conforme Tabela 35. O critério de decisão para análise da permanência ou exclusão destes questionários foi, mais uma vez, estabelecido pelo pesquisador. Os questionários que apresentaram mais de 10% de suas respostas classificadas como outliers, sendo dois da Volkswagen e três da Ford, foram analisados individualmente. Não se optou pela retirada imediata destes questionários, já que os valores outliers podem não ser ‘aberrantes’ e também pelo fato de que sua exclusão pode não trazer melhoras à amostra, mas causando perda de informações.
O questionário da Ford com o maior número de variáveis outliers, conforme Tabela 35, é de uma concessionária do Pará. Este estado possui somente duas concessionárias da Ford e dezenove concessionárias das quatro montadoras da pesquisa, representando 1,0% da amostra. Por se tratar de um estado ‘atípico’ em relação aos estados do Sul e do Sudeste, que representam 73% da amostra (conforme Tabela 12), supõe-se tais observações tidas como outliers são, na realidade, observações extraordinárias, revelando uma característica real daquele mercado optando-se por manter o questionário na amostra.
4
TABELA 35
Análise Vertical de Outliers
Total de Variáveis
Outliers
Percentual Frequência (c)
(a) (b) General
Motors
Fiat Volkswagen Ford Total
2 5,0% 9 4 11 2 25 3 7,5% 2 1 5 1 9 4 10,0% 0 0 2 0 2 5 12,5% 0 0 0 1 1 6 15,0% 0 0 0 1 1 8 20,0% 0 0 0 1 1 Total - 11 5 18 6 40
(a) total de variáveis consideradas outliers por questionário; (b) razão entre o total de variáveis outliers pelo o total de variáveis do questionário (quarenta); (c) total de questionários.
Fonte: dados da pesquisa
A concessionária da Ford com seis variáveis tidas como outliers é do estado do Espírito Santo, que possui 8 concessionárias Ford e 36 no total, participando com 1,9% da amostra. Por não ter sido identificada nenhuma característica atípica que explique o número de outliers, a decisão de exclusão ou permanência deste caso na amostra será tomada quando da análise cruzada.
Quanto à concessionária da Ford que apresenta cinco variáveis como outliers, ela é de Pernambuco e foi fundada em 1998. Este estado possui 10 concessionárias da Ford e 55 de todas as montadoras da pesquisa, representando 2,9% da amostra. Especula-se que sua recente fundação pode ser a causa da concentração das observações classificadas como outliers. Optou-se, assim, por manter esta concessionária na amostra.
No tocante às duas concessionárias da Volkswagen que apresentam quatro variáveis outliers, uma é de São Paulo e a outra é de Santa Catarina. Como elas fazem parte das regiões Sudeste e Sul, que representam 73% da amostra, poderiam ser tidas como outliers que deturpariam a amostra. Entretanto a exclusão ou permanência delas será decidida quando da análise cruzada. Antes desta, a seguir é realizada a análise horizontal.
A análise horizontal por variável identificou 16 variáveis, das 40 da amostra, com observações classificadas como outliers. Aqui são destacadas, na Tabela 36, as variáveis com mais de 2% de outliers. A decisão de manter ou não uma variável outlier levou em consideração que a exclusão de uma variável afeta mais o resultado, devido à perda de informações, do que a exclusão de um questionário, dado o tamanho considerável da amostra. Novamente a decisão aqui foi estabelecer um limite para exclusão ou permanência de uma variável. O limite estabelecido para a análise horizontal foi de 4%, devendo assim, serem analisadas as variáveis V5 e V28, conforme Tabela 36. A análises delas levou em consideração o exposto por HAIR et. al. (1998) que, caso uma observação, mesmo sendo outlier, represente um segmento da população, ela será mantida na amostra.
TABELA 36
Análise Horizontal de Outliers
Variável Percentual Frequência por Faixa (b) Valor ‘z’
(a) Baixa Média Alta Padronizado (c)
V3 0,5% 3 - - -4,11 1,7% 10 - - 3,20 V5 4,0% 24 - - -3,12 V6 1,7% 10 - - -4,14 1,2% 7 - - -3,34 V22 2,8% 1 16 - 3,20 V23 1,3% 8 - - -3,94 1,3% 8 - - –3,12 V27 3,0% - - 18 3,48 V28 5,3% - - 32 3,26
(a) razão entre o total de outliers com o total de respostas válidas; (b) total de questionários que apresentaram a variável em questão como outlier; (c) valores padronizados fora do limite de corte de +3 e -3.
Fonte: dados da pesquisa
Para a variável V5 (“A nossa concessionária periodicamente mede a satisfação do cliente com pesquisas”), as 24 observações classificadas como outliers encontram-se na faixa baixa, representando 4% do total das respostas, conforme Tabela 55 no Apêndice 4. Esta variável não foi excluída supondo-se que nem todas as concessionárias realizam pesquisas junto ao cliente, podendo refletir uma realidade do mercado e não caracterizar um outlier.
Quanto à variável V28 (“A nossa concessionária é a única do ramo na região em que atua, isto é, não tem concorrentes direto.”), esta apresenta 29 observações tidas como outliers na faixa alta da distribuição, conforme Tabela 72 no Apêndice 4. Ela também não foi excluída por provavelmente representar as
concessionárias dos estados brasileiros que possuem baixa concentração de concessionárias.
Pelas análises vertical e horizontal nenhuma variável ou observação foi excluída da amostra. Agora, para os casos que ultrapassaram o limite de corte estabelecido pelo critério estatístico (valor padronizado fora da faixa de +3 e – 3), e que não atenderam ao limite estabelecido pela autora desta dissertação (10% para análise vertical e 4% para análise horizontal), realizou-se a última análise para outliers, a cruzada.
Então foram cruzados os questionários identificados na análise vertical com as variáveis identificadas na análise horizontal que não tiveram a decisão de permanência ou exclusão tomada. Aí, analisou-se o grau de participação da observação nas variáveis, verificando se é um caso isolado de outlier, sendo mantido na amostra, ou se é recorrente, devendo ser excluído.
Tomou-se de início, as variáveis identificadas na análise horizontal, com valores muito superiores a +3 ou –3 já que, segundo PEDHAZUR e SCHMELKIN (1991, p.398), valores ‘z’ que se apresentam perto da ‘linha’ de + 3 ou - 3 não são considerados por alguns pesquisadores como ‘deturpadoras’ da amostra. Deste modo, conforme Tabela 36, serão aqui analisadas as variáveis V3, V6, V23 e V27.
Para a variável V3 (“A nossa concessionária tem conhecimento das necessidades do cliente.”), os 13 casos classificados como outliers se encontram na faixa baixa, representando 2,3% dos casos, conforme Tabela 53 no Apêndice 4. Esta variável não foi excluída supondo-se que algumas concessionárias não praticam a estratégia de relacionamento com clientes, mesmo divergindo da maioria da amostra.
A variável V6 (“A nossa concessionária oferece serviço pós-venda”), com 17 observações classificadas como outliers, representando 2,9% da amostra, constatante da Tabela 56 no Apêndice 4, também não foi excluída supondo-se representar um segmento das concessionárias que possivelmente não prestam este tipo de serviço.
As observações classificadas como outliers para a variável V23 (“Os nossos vendedores possuem uma certa liberdade em negociar diretamente com os clientes, procurando satisfazer suas necessidades.”), concentram-se na faixa baixa da distribuição e representam 2,6% da amostra, conforme Tabela 67 no Apêndice 4. Supõe-se que essas observações refletem uma realidade do mercado, não sendo, portanto, excluídas.
Para a variável V27 (“Os nossos fornecedores são exclusivos, isto é, atendem somente a nossa concessionária”), as 18 observações tidas como outliers se encontram na faixa alta, representando 3,0% do total da amostra, conforme Tabela 71 no Apêndice 4. Embora possa parecer contraditório ao esperado, que os fornecedores das concessionárias são os mesmos, supõe-se que algumas concessionárias têm fornecedores exclusivos, sendo esta a realidade do mercado não devendo, ser excluída a variável.
Portanto, nenhuma variável que tenha apresentado observações classificadas como outliers foi excluída da amostra. Para cada caso, tais observações podem medir uma realidade do mercado, mesmo se contrapondo à maioria da amostra.
Retomando-se agora o questionário da Ford e os dois da Volkswagen com mais de 10% de outliers, nenhum deles é responsável pelos outliers das variáveis acima analisadas, isto é, a retirada deles não afetaria a condição de outliers para as variáveis. Isto de acordo com HAIR et. al. (1998, p.67): uma variável pode ter várias observações caracterizadas como outliers, mas caso nenhuma dessas
observações seja caracterizada como outlier em muitas outras variáveis, estas não devem ser excluídas da amostra como não representativas da população. Sua exclusão resultaria mais em perda de informação para a amostra do que em ganho pela exclusão dos outliers.
Em síntese, as três análises realizadas evidenciaram que as observações apontadas como outliers não são ‘aberrações’, mas sim características específicas da amostra pesquisada. Estas observações não deturpam, mas sim contribuem para a amostra, trazendo informações não esperadas, dando mais generalidade às inferências por fazer. Optou-se, assim, por manter todos os questionários e todas as variáveis, permanecendo a amostra com 584 questionários e 40 variáveis.
Analisados os dados de forma univariada, a próxima etapa é a análise multivariada dos dados, apresentada na seção seguinte.