A. MADDİ UNSURLAR
3. Konu
A amostra de consumidores em geral (AMOSTRADOMICÍLIOS) foi determinada em 1.500 entrevistas, enquanto a amostra com consumidores que entraram com uma ação con- tra a Light (AMOSTRAPROCESSOS) foi determinada em mil entrevistas. O nível de precisão das estimativas da pesquisa, apesar de depender do tamanho da amostra utilizado para o cálculo da estimativa, também depende de outros fatores, como uma medida de variabilidade da variável e de parâmetros relacionados ao desenho amostral.
Como a maior parte das estimativas dessa pesquisa são proporções, descre- ve-se neste relatório apenas como calculadas medidas de precisão para esse tipo de estimativa. Além disso, há diversas formas de se apresentar o nível de precisão de uma estimativa (variância amostral, erro padrão, coeficiente de variação e mar- gem de erro, por exemplo). Aqui é descrito apenas como calcular o erro padrão e a margem de erro de uma proporção.
Para uma amostra aleatória simples (AAS), como foi realizado dentro dos es- tratos da pesquisa com consumidores que entraram com uma ação contra a Light, o erro padrão de uma proporção é obtido pela fórmula:
Em que p é a estimativa da proporção da variável de interesse e n é o tamanho da amostra utilizado para se calcular tal proporção.
Ainda para uma AAS, a margem de erro para uma proporção com coeficiente de confiança de 100(1-α)%, em que 0 <
α
< 1, é dada por:Em que tn1-1 é o valor crítico com probabilidade (1-α) da distribuição t-Student com n-1 graus de liberdade (em que n é novamente o tamanho da amostra utilizado para calcular a estimativa).
Dessa forma, para qualquer proporção calculada utilizando-se a amostra den- tro do estrato de consumidores que entraram com uma ação contra a Light, pode- se utilizar a abordagem mencionada.
Para uma amostra aleatória estratificada (AAE), como a realizada para con- sumidores que entraram com uma ação na justiça contra a Light, o erro padrão de uma proporção é dado por:
Em que H é o número de estratos, , Nh é o tamanho da população no h-ésimo estrato; N é o tamanho da população; ph é a estimativa da proporção da variável de interesse no h-ésimo estrato; e nh é o tamanho da amostra utilizado para se calcular a proporção no h-ésimo estratoida para uma AAE, a margem de erro para uma proporção com coeficiente de confiança de 100(1-α)%, em que 0 < α < 1, é dada por:
Em que tn‒H;1‒α é o valor crítico com probabilidade (1-α) da distribuição t-Stu- dent com n-H graus de liberdade (em que n é o tamanho da amostra utilizado para calcular a estimativa e H é o número de estratos). Para qualquer proporção calcu- lada utilizando-se toda a amostra de consumidores que entraram com uma ação contra a Light pode-se utilizar essa abordagem.
A amostra de consumidores em geral (AMOSTRADOMICÍLIOS) possui um desenho amostral um pouco mais complexo, envolvendo uma seleção em dois estágios com o uso de conglomerados (setores censitários) no primeiro estágio. Isso faz com que o cálculo da precisão das estimativas também se torne mais complexo. Uma abordagem para simplificar esse processo é utilizar o efeito do planejamento (EPA). Caso deseje-se calcular a precisão de estimativas dentro de um estrato dessa amos- tra, deve-se proceder como nas etapas a seguir.
a) Inicialmente calcula-se o erro padrão assumindo-se uma AAS, como de- monstrado anteriormente:
b) Calcula-se o EPA. Nesse caso, o EPA para uma proporção é dado por:
Em que é o tamanho médio dos conglomerados na amostra (nesta pesqui- sa, ) e é o coeficiente de correlação intraconglomerados, com .Em geral,
tal coeficiente assume valores menores que 0,2. Seu valor depende da variável com que se está trabalhando e pode ser calculado utilizando-se softwares estatísticos específicos para esse fim. Sugere-se utilizar valores próximos a zero, como 0,01, quando se acredita que elementos dentro de um setor censitários não são muito correlacionados entre si; um valor próximo a 0,1 quando existe uma correlação mo- derada; e 0,2 quando acredita-se que tal correlação seja alta.
c) Finalmente, aplica-se o EPA no erro padrão inicial para se obter uma esti- mativa do erro padrão final:
A margem de erro é, então, dada por:
Em que ta‒1;1‒α é o valor crítico com probabilidade (1-α) da distribuição t-Student com a-1 graus de liberdade (em que a é o número de conglomerados na amostra). Para qualquer proporção calculada utilizando um dos estratos da amostra de con- sumidores geral pode-se utilizar essa abordagem.
Caso seja utilizada a amostra inteira de consumidores geral basta substituir a estimativa inicial do erro padrão por:
De tal forma que a estimativa final do erro padrão será:
Finalmente, a margem de erro nesse caso é dada por:
Em que ta‒H;1‒α é o valor crítico com probabilidade (1-α) da distribuição t-Stu- dent com a-H graus de liberdade (em que a é o número de conglomerados na amos- tra e H é o número de estratos).
Estratificação
Ambas as amostras foram estratificadas por município. A amostra foi alocada tendo 24% das entrevistas (600 entrevistas entre os consumidores em geral e 240 entrevis- tas entre os consumidores que entraram no Judiciário contra a Light) no município do rio de Janeiro e o restante das entrevistas foram alocadas igualmente entre os
demais municípios da área de cobertura (100 entrevistas por município com consu- midores em geral e 40 entrevistas por município entre os consumidores que entra- ram com uma ação contra a companhia). A alocação da amostra entre os grupos de municípios é apresentada no Quadro 4.1. A amostra de setores censitários foi, então, selecionada independentemente em cada estrato.
Quadro 4.1
Alocação de entrevistas por municípios
Estrato Município Consumidores em geral procuraram o PJ contra LightConsumidores que
1 rio de Janeiro 600 240 2 Nova Iguaçu 100 40 3 São João de Meriti 100 40 4 Duque de Caxias 100 40 5 Belford roxo 100 40 6 Nilópolis 100 40 7 Mesquita 100 40 8 Queimados 100 40 9 Volta redonda 100 40 Barra Mansa 40 Itaguaí 40 Três rios 40 10 Japeri 100 40 Seropédica 40 Paracambi 40 Valença 40 Barra do Piraí 40 Paraíba do Sul 40 Pinheiral 40 Piraí 40 TOTAL 1.500 1.000
Note que alguns municípios menores foram agrupados em Clusters —e a se- leção do Cluster se deu de acordo com a localização geográfica e a quantidade de processos registrados nas comarcas de referência.