V. KAYNAKLARIN TANITIMI
2.4. KABZIN ġARTLARI
2.4.1. Kabzedende Aranan ġartlar
Nesta seção, serão apresentados os resultados obtidos através da aplicação do software
“Answer Tree” para a análise dos dados das entrevistas aos usuários.
Conforme relatado na metodologia para realização da análise qualitativa, será utilizada técnica de mineração de dados (Data Mining – DM). Segundo Pitombo (2007), para sua aplicação, não se sabe inicialmente o comportamento entre as variáveis definidas, e o objetivo é estabelecer as relações existentes entre elas. Nessas análises, geralmente há uma questão genérica a ser respondida (por exemplo: “o que afeta o comportamento de clientes?”).
No estudo proposto neste trabalho, pretende-se estabelecer as principais variáveis que influenciam na decisão dos usuários em relação à escolha do melhor tipo de sistema de transporte oferecido – sistema convencional ou integrado. A técnica de DM utilizada foi a Árvore de Decisão (AD), método de segmentação de dados não paramétrico, uma vez que o estudo realizado foi exploratório e sem definição, a priori, da amostra de pesquisas e sem
47 Os dados de entrada no programa são definidos como as variáveis envolvidas na análise. Foi utilizada como variável dependente a “escolha do sistema de transporte”, última pergunta do questionário aplicado. As variáveis independentes foram representadas através de três conjuntos de variáveis:
• período (uma variável nominal): “horário da pesquisa”, agrupado em dois grupos (pico - 06h às 07h59 e 16h às 18h59; fora-pico - 08h às 15h59 e após 18h59);
• características da utilização do transporte coletivo (três variáveis ordinais e três nominais): “frequência de utilização de ônibus”, “frequência de utilização da tarifa regional”, “forma de pagamento da tarifa”, “espera para ir sentado”, “frequência de utilização das linhas 62 e 64” (que permitem o acesso direto à região da Savassi e do Santo Agostinho) e “realização de segunda baldeação para se chegar ao destino final”;
• características socioeconômicas (duas variáveis ordinais e duas nominais): “sexo”, “idade” (três grupos: menor, adulto, idoso), “escolaridade” e “renda mensal”.
A TAB. 5.3 apresenta detalhadamente todas as variáveis envolvidas, indicando as categorias pertencentes a cada uma delas.
TABELA 5.3. – Variáveis utilizadas no estudo
Tipo Variável Classificação Categorias
1 - Sistema Atual Integrado 2 - Sistema convencional
1 - Diária, 2 - 3X / semana, 3 - 2X / semana 4 - 1X / semana, 5 - Outra
1 - Diária, 2 - 3X / semana, 3 - 1X / semana 4 - 15 em 15 dias, 5 - Não utilizo, 6 - Outra 1 - Paga pelo usuário, 2 - Vale transporte 3 - Gratuito
1 - Sim 2 - Não
1 - Diária, 2 - 3X / semana, 3 - 1X / semana 4 - 15 em 15 dias, 5 - Não utilizo, 6 - Outra 1 - Sim 2 - Não 1 - Pico 2 - Fora Pico 1 - Masculino 2 - Feminino
1 - Anlfabeto, 2 - Primário, 3 - Ginásio 4 - Colegial, 5 - Superior, 6 - Não respondeu 1 - Menor, 2 - Adulto
3 - Idoso
1 - Até 1 S.M., 2 - Entre 1 e 2 S.M., 3 - Entre 2 e 4 S.M. 4 - Entre 4 e 6 S.M., 5 - Acima de 6 S.M., 6 - Não respondeu Ordinal
Independente
Período do dia Nominal
Sexo Nominal Escolaridade Ordinal Idade Nominal Renda Mensal Independente Independente Independente Independente
Independente Necessidade da realização de 2º transbordo Binária Ordinal Ordinal Nominal Nominal Ordinal Nominal Independente Espera para ir assentado no ônibus
Independente Frequência de utilização das linhas 62 e 64
Independente Frequência de utilização somente da tarifa regional
Independente Tipo de passageiro (forma de pagamento da tarifa) Escolha do Sistema de Transporte Dependente
Frequência de utilização do ônibus Independente
O Answer Tree apresenta os resultados obtidos tanto graficamente (árvore de classificação) quanto em forma de tabelas. As tabelas apresentam os resultados da árvore gerada para cada um dos nós terminais. Os valores apresentados nesses nós representam o padrão de indivíduos para cada grupo delimitado pela árvore.
A árvore gerada apresentou como resultado final sete classes distintas de indivíduos (folhas) e suas respectivas escolhas predominantes, ou seja, a AD gerou sete nós terminais a partir da amostra de entrevistas realizadas. A FIG. 5.1 apresenta o mapa dos nós, indicando a numeração utilizada para cada um, para melhor entendimento dos resultados.
FIGURA 5.1: Mapa com a numeração dos nós da AD gerada FONTE: dados da pesquisa.
Para melhor visualização, as FIG. 5.2 e 5.3 apresentam os resultados obtidos sob as formas de tabela e gráfico. A árvore pode ser representada tanto com os valores obtidos por nós quanto com os gráficos.
49 FIGURA 5.2: Árvore de decisão gerada pelo Answer Tree – valores obtidos por nó
FIGURA 5.3: Árvore de decisão gerada pelo Answer Tree – gráficos obtidos por nó FONTE: dados da pesquisa
No geral, avaliando-se todas as respostas obtidas nos questionários aplicados, os usuários preferem o sistema integrado de transporte. Do total, 80,42% escolheram esse sistema, enquanto 19,58% preferem o sistema convencional de linhas diretas.
Analisando-se a AD obtida para a amostra de usuários do transporte coletivo na estação BHBUS Venda Nova, pode-se perceber que algumas variáveis independentes (constantes no formulário aplicado) foram descartadas pelo modelo, sendo consideradas não significativas na escolha do sistema de transporte preferido pelo usuário. Vale ressaltar que os critérios de parada do modelo foram definidos no início do processo. Para a criação dessa árvore, foi utilizado um mínimo permitido de trinta casos para os nós pais e de quinze casos para os nós
51 Para a análise da influência de cada variável independente encontrada na árvore gerada pelo
Answer Tree, é necessário observar a hierarquia da árvore, ou seja, sua construção ramo a
ramo. Essas análises serão apresentadas na próxima seção.
Na TAB. 5.4 estão apresentados os resultados obtidos, com o detalhamento de cada um dos nós terminais. O relatório apresenta um resumo das estatísticas obtidas para cada nó terminal, considerando a escolha do “sistema integrado” para a variável dependente.
TABELA 5.4. - Síntese do relatório da AD
FONTE: dados da pesquisa.
No relatório apresentado, pode-se perceber que o nó terminal “8” (primeira linha da tabela) capturou quinze indivíduos, ou 5,24% do número total pesquisado. A coluna “Resp:n” indica quantos, desses quinze, escolheram o sistema de transporte integrado como opção da variável dependente - nesse caso, 100% (indicado na coluna “Gain (%)”). A coluna “Resp (%)” indica o percentual de indivíduos desse nó que escolheu a opção “sistema integrado” em relação a todos os indivíduos entrevistados que escolheram essa opção. Finalmente, a coluna “Index
(%)” indica a composição do nó (no que diz respeito à variável dependente escolhida) em relação à composição da amostra total. Nesse caso, o índice para o nó 08 é calculado dividindo-se o percentual de escolha da variável dependente como “sistema integrado” obtido no nó (100%) pelo percentual de escolha dessa variável obtido pela amostra total pesquisada (80,42%). É esse índice que determina a ordem (decrescente) de apresentação dos nós terminais na tabela de síntese do relatório da AD.