O interesse é encontrar um modelo estatístico que possa estimar a probabilidade do candidato ser reeleito em função das variáveis adotadas para explicarem o voto. Nessa situação em particular o melhor modelo que se ajusta é o modelo de regressão binária conhecido como Regressão Logística.
A regressão logística se originou em meados de 1960 para atender demandas da área de medicina como método de previsão de fatores de risco para a saúde cardíaca. Esse modelo tornou-se tão popular que se alastrou para outras áreas do conhecimento e, principalmente, nas áreas socioeconômicas.
No modelo de Regressão Logística a variável resposta ou variável independente é uma probabilidade, ou seja, varia de 0 a 100%. Essa probabilidade como resposta é estimada a partir de um conjunto amostral de variáveis explicativas que podem ser métricas (quantitativas) ou não métricas (qualitativas) e uma variável resposta binária ou dicotômica indicando do parlamentar foi eleito ou não. Esse conjunto amostral compõe o histórico do comportamento do eleitor frente às características do vereador.
. Assim, se o objetivo é estimar a probabilidade de um candidato a vereador ser reeleito (variável resposta) a partir das suas características específicas (variáveis explicativas) devemos estimar os parâmetros do modelo a partir das informações obtidas do perfil dos candidatos reeleitos confrontados com os que não foram reeleitos.
Pode-se equacionar o Modelo de Regressão Logística através da expressão:
( )
Nessa expressão, indica a probabilidade de ocorrência do evento de interesse (reeleição), ( ) representa o conjunto de variáveis
explicativas (perfil do candidato) e ( )o conjunto de parâmetros (ou coeficientes) do modelo a serem estimados. O termo (
) corresponde
ao logaritmo natural da razão entre a probabilidade de ser eleito e de não ser eleito. Quando essa razão é menor do que 1, indica que a probabilidade de ser eleito é menor do que não ser eleito. Caso o valor for superior a 1, a probabilidade de ser eleito é maior do que não ser. Na estatística essa razão é chamada de chance, ou seja, se a probabilidade de ser eleito, , é 80%, temos que
, o que indicaria que a chance de ser eleito é 4 vezes maior
do que não ser.
Uma das vantagens desse modelo está na possibilidade de se obter essa razão a partir de uma transformação na expressão anterior assumindo a forma a seguir:
( )
Além da vantagem de se obter a chance diretamente a partir do modelo, existe a possibilidade de se comparar as chances obtidas para cada situação através da razão entre elas. Essa razão é chamada de razão de chances, a qual é de extrema importância para a análise dos resultados a partir dos diversos estratos gerados pelas variáveis estudadas.
A estimativa dos parâmetros permite verificar quais atribuições do perfil do candidato são estatisticamente significativas quanto a sua probabilidade de reeleição.
Para uma melhor clareza, o modelo é reescrito a seguir considerando-se as variáveis do estudo:
Onde:
probabilidade do candidato ser reeleito; parâmetro do termo constante;
parâmetros das variáveis explicativas;
RECEITA: variável explicativa relacionada com receita, em R$, obtida pelo candidato e gasta na sua campanha;
CURRÍCULO: variável explicativa que aponta se o candidato possui experiência prévia na política, no trabalho social ou sindical. Essa é do tipo dicotômica, ou seja, somente pode assumir dois valores. No modelo essa variável assume o valor 0 (zero), caso o parlamentar não possua experiência prévia ou o valor 1 (um) caso possua alguma experiência.
EFICIÊNCIA: variável explicativa que quantifica a produção legislativa relevante do candidato. Trata-se de uma variável contínua no intervalo entre zero e um. Esse valor corresponde à razão entre o número de projetos relevantes e o número total de projetos apresentados pelo candidato. Caso, por exemplo, o candidato apresente o valor 0,3 então 30% dos seus projetos foram considerados relevantes.
RECALL: Esta variável explicativa corresponde ao número de vezes em que o nome do candidato foi citado na ferramenta de busca Google.
O próximo passo é determinar quais dessas variáveis explicativas eleitas apresentam significância estatística, ou seja, apesar da intuição de que existe uma correlação entre o volume de votos e a variável explicativa sob análise, entretanto, não apresentam indícios estatísticos que corroboram a intuição.
Para seleção das variáveis explicativas com significância estatística, foi utilizado, dentro do modelo de Regressão Logística, o método “Stepwise”, o qual permite a avaliação de cada uma das variáveis quanto a sua significância estatística, ou seja, a eliminação passo a passo daquelas variáveis não
representativas no modelo. O resultado da modelagem foi obtido através do pacote estatístico de uso livre R-Software, sendo apresentado na tabela xxx a seguir.
A tabela mostra que o método apresenta como resultado final três variáveis significativas no nível de 5% de significância: a variável RECEITA, com um p-valor de 0,2%, a variável EFICIÊNCIA, com p-valor de 4,5%, e a variável RECALL, com um p-valor de 0,8%.
Tabela 30: Resultado do modelo de regressão logística usando o método "Stepwise" do pacote estatístico R.
Passo Variável β e.p. Sig. Exp(β)
1 Receita 0,000 0,000 0,003 1,000 Currículo -0,029 0,414 0,945 0,972 Eficiência 1,952 0,975 0,045 7,040 Recall 0,000 0,000 0,008 1,000 Constante -1,982 0,813 0,015 0,138 2 Receita 0,000 0,000 0,002 1,000 Eficiência 1,945 0,969 0,045 6,992 Recall 0,000 0,000 0,008 1,000 Constante -2,002 0,760 0,008 0,135
Fonte: Elaborada pelo autor
Esse resultado mostra que a variável CURRÍCULO não apresentou significância estatística para efeito da reeleição do candidato, entretanto, as variáveis RECEITA, EFICIÊNCIA e RECALL apresentaram significância estatística (medida pelo p-valor) considerando nível descritivo de 5%, ou seja, são importantes para que o candidato seja reeleito.
Um resultado importante da análise está relacionado com o fato de que a produção legislativa relevante do parlamentar é levada em consideração por uma parcela do eleitorado. Isso mostra que parte do eleitorado dos grandes centros urbanos não está totalmente alheia ao trabalho do parlamentar na Câmara Municipal, considerando esse fator no momento do seu voto.
Quanto à variável RECEITA, já era de se esperar sua significância estatística, pois está diretamente relacionada aos gastos do candidato com a
propaganda da sua candidatura. Tal estudo comparativo entre número de votos obtidos e gasto com propaganda eleitoral já foi realizado em outras ocasiões, demonstrando cabalmente a correlação entre voto e gasto. Um estudo sobre as eleições para deputado federal em 2002 enfatizando os gastos dos candidatos declarados no Tribunal Superior Eleitoral foi realizado por FIGUEIREDO (2005). Nesse estudo pode constatar a correlação positiva entre o gasto e o número de votos.
É importante enfatizar que foi demonstrado que a quantidade de recursos (variável receita) possui correlação positiva e significante com o número de votos obtidos. Ou seja, quanto mais recursos são investidos nas campanhas, maior é o número de votos recebidos por um determinado candidato (FIGUEIREDO, 2005).
O gráfico da
Figura 20 mostra a relação entre os gastos de campanha e o número de votos obtido pelo parlamentar nas eleições para vereador no Município de São Paulo em 2008.
Figura 20: Eleições para vereador no Município de São Paulo. Relação entre receita para fins de campanha e número de votos obtidos.
Fonte: TSE (2008).
Nesse gráfico foram destacados os candidatos eleitos, suplentes e não eleitos dentro do universo de todos os candidatos. Nota-se claramente o posicionamento dos eleitos na parte superior direita do gráfico, indicando que quanto maior o gasto, maior o número de votos obtidos.
Outro resultado interessante é a acentuada significância estatística da variável referente ao nível de lembrança “RECALL”, apresentando um p-valor de 0,8%. Isso mostra que a exposição na mídia tem algum benefício para o candidato, desde que não seja negativa.
A Figura 21 mostra a relação entre o nível de lembrança e o número de votos com destaque para os candidatos reeleitos e não reeleitos. Observando o gráfico pode-se constatar, visualmente, uma maior concentração de não reeleitos entre aqueles com baixo nível de lembrança (abaixo de 50 mil). Para um nível de lembrança acima de 100 mil, 90% dos candidatos foram reeleitos e para um nível de lembrança abaixo de 50 mil a proporção cai para 53% de reeleitos.
Na amostra encontra-se um candidato com alto nível de lembrança (acima de 150 mil), entretanto, não foi reeleito. Provavelmente a lembrança não
seja positiva, causando perda de votos pelo candidato. Isso mostra que seria necessário um maior aprofundamento na pesquisa, pois se adotando outras metodologias de busca de citações, estratificando citações positivas (favoráveis ao candidato) daquelas negativas (desfavoráveis ao candidato), é possível melhorar a qualidade do modelo e encontrar resultados mais significativos.
Figura 21: Correlação entre o nível de lembrança ("Recall") e o número de votos.
Capítulo 5
O perfil do candidato e o comportamento do eleitor: eleições para vereador no Estado de São Paulo em 2012.
Os capítulos 2 e 3 analisam o comportamento do eleitor considerando características específicas do seu perfil. No capítulo 4 é feita uma inversão, considerando-se o perfil do candidato que concorre à reeleição. Esse perfil considera variáveis mais complexas e construídas pelo candidato ao longo da sua atividade parlamentar.
Neste capítulo também será feita uma análise do perfil do candidato, entretanto, são características mais comuns, tais como condição social ou natural. São características que colocam o candidato como um cidadão comum, tornando mais fácil o julgamento da população de eleitores. Assim, diferentemente dos capítulos anteriores, a análise proposta busca mostrar como o eleitor identifica os candidatos com base em características que podem ser encontradas nesse mesmo eleitor.
Faremos agora uma análise exploratória do perfil dos candidatos a vereador dos municípios do Estado de São Paulo e como esse perfil impacta na decisão do eleitor. Foram analisados 72.263 candidatos a vereador, quanto suas chances de serem eleitos, a partir dos atributos Gênero, Idade, Profissão, Partido, Estado Civil e Escolaridade. Essas informações foram obtidas a partir dos arquivos disponibilizados do Tribunal Superior Eleitoral (TSE) referentes a todos os candidatos a vereador nos municípios do Estado de São Paulo nas eleições de 2012.
Sempre que possível, a análise exploratória dos dados quanto à eficiência dos candidatos é feita a partir da estratificação do atributo focado por Gênero.