Inicialmente foi realizada caracterização dos sujeitos participantes do estudo para aprimorar o momento analítico, logo após a aceitação dos adolescentes e a devida autorização dos pais. Para a fase de análise dos dados serão analisados com auxilio do software Statistical Package for Social Sciences (SPSS), versão 17.0 for Windows. Salienta-se que a análise também ocorreu baseada na literatura da referente temática.
5.6.1) Análise estatística da primeira etapa da pesquisa
Quatro modelos baseados na teoria da resposta ao item foram desenvolvidos a partir dos dados coletados de 125 estudantes e que apresentavam perfil similar à amostra da fase quase-experimental. Esta amostra foi submetida a uma avaliação contendo 30 questões (itens). O objetivo foi construir dois conjuntos de questões que apresentassem capacidade discriminativa e grau de dificuldade similar para serem aplicados antes e após a intervenção educativa.
A análise inicial foi realizada com base nas estatísticas descritivas que incluíram as proporções de acerto e erro de cada item, correlações bisserais e o cálculo do Alpha de Cronbach. As proporções de acerto de cada item permitem verificar a dificuldade de cada item isoladamente. As correlações bisseriais permitem verificar o quanto cada item estava associado aos demais e a o Alpha de Cronbach permite avaliar a consistência interna dos itens.
Em seguida, foram desenvolvidos os seguintes modelos de ajuste dos itens: Modelo Rasch com um parâmetro de coerção (Constraint); Modelo Rasch sem parâmetros de coerção ou de suposição; Modelo logístico com dois parâmetros; e Modelo Rasch com um parâmetro de suposição (Guessing). Os modelos foram comparados entre si pela aplicação do teste da razão de verossimilhança. Os modelos que apresentaram diferenças estatísticas entre si foram analisados quanto aos critérios de informação de Akaike, Bayesiano e o valor do logaritmo de verossimilhança na convergência, sendo considerado melhor ajustado aquele que apresentasse o menor valor em dois dos três critérios.
Estes modelos permitiram calcular os índices de dificuldade e de discriminação de cada item. O índice de dificuldade é uma medida que representa o quão difícil é um item em relação à média dos demais itens considerando o modelo escolhido. Quanto maior o valor do item maior é a dificuldade do mesmo. O índice de discriminação é uma medida que representa
a capacidade de item em identificar indivíduos com maior ou menor conhecimento. Assim, quanto maior é este valor, maior é a capacidade de discriminação do item.
O modelo que apresentasse as melhores estatísticas de ajuste era utilizado para a definição e distribuição dos itens para compor os dois conjuntos de questões. Foram excluídos os itens que apresentaram índices de calibração (dificuldade) discrepantes em relação aos demais. Os itens foram inicialmente distribuídos de forma alternada segundo o índice de calibração em dois subconjuntos. Assim, o item com maior calibração foi alocado no primeiro grupo, o segundo maior no segundo grupo. O terceiro foi alocado no segundo grupo, o quarto no primeiro e assim sucessivamente. O objetivo foi produzir dois grupos de itens com capacidade total de discriminação similar.
Curvas características, curvas de informação e a função de informação dos itens foram ajustadas de acordo com o modelo escolhido para avaliar o desempenho global do conjunto de itens. Curvas características dos itens são gráficos que resumem a informação referente à dificuldade e discriminação dos itens. Itens mais difíceis são os que apresentam curvas mais próximas do eixo das abscissas. Itens com maior capacidade discriminativa apresentam um formato em S mais verticalizado. As curvas de informação dos itens são gráficos que representam a quantidade de informação que é produzida por um item sobre o conhecimento dos sujeitos. Estas curvas mostram quais itens permitem identificar indivíduos com alta ou baixa habilidade para responder corretamente a questão.
Curvas cujo centro se localiza mais à esquerda do zero representam itens que identificam melhor indivíduos com baixa habilidade. A função de informação do teste permite verificar como se distribui a habilidade geral do teste para identificar os indivíduos com baixa ou alta habilidade para responder corretamente o conjunto de questões. Assim, o intervalo entre -4 e 0 representa a quantidade de informação do teste que permite identificar sujeitos com baixa habilidade. Por outro lado, o intervalo de 0 a 4 representa a quantidade de informação do teste que permite identificar sujeitos com alta habilidade para responder corretamente o teste.
Nesta primeira análise foram incluídos os 30 itens iniciais e selecionados 24, os quais compuseram dois conjuntos de 12 itens. Em seguida, estes dois conjuntos foram analisados separadamente e quatro modelos foram novamente analisados quanto ao ajuste, bem como, foram analisados os gráficos de curva característica, curva de informação, função de informação dos itens. Além disso, foi realizada a checagem de unidimensionalidade usando análise paralela modificada. Após esta análise, dois itens foram excluídos e um novo processo
de avaliação similar a anterior foi desenvolvido. Após esta análise, dois conjuntos de questões compostas por 10 itens foram definidos para comporem o pré e o pós-teste.
5.6.2) Análise estatística da segunda etapa da pesquisa
Os dados quantitativos foram verificados quanto a aderência a distribuição normal utilizando o teste de Kolmogorov-Smirnov. Todas as variáveis comparadas demonstraram não aderência à distribuição normal. Na análise inicial de comparação da linha de base entre os três grupos de adolescentes utilizou-se o teste de Qui-quadrado de Pearson para comparar as variáveis qualitativas. Neste caso, quando pelo menos 25% das frequências esperadas eram menores que cinco aplicou-se o teste de Fisher-Freeman-Halton. Na comparação entre variáveis quantitativas aplicou-se o teste de Kruskal-Wallis.
Após a primeira comparação, observou-se desequilíbrio na linha de base para algumas variáveis. Para contornar o problema, foram calculados escores de propensão tendo como base a variável nota no pré-teste, a qual apresentou maior diferença entre os grupos. Utilizou- se um modelo de regressão logística para identificar indivíduos que apresentassem escores de propensão similares entre os três grupos. Com base nesta identificação os indivíduos eram então agrupados em trios (pareamento nos três grupos) para uma análise considerando a dependência entre os mesmos. Somente foi possível formar 46 trios de indivíduos, ou seja uma perda de 20 indivíduos em cada grupo. Para tal procedimento, uma diferença máxima de 0.09 entre os escores de propensão foi tolerada.
Em seguida os grupos foram novamente comparados quanto a linha de base. Entretanto, como neste momento os dados apresentavam-se organizados em trios (dependência), as variáveis foram analisadas considerando amostras relacionadas. Assim, na comparação de variáveis qualitativas aplicou-se o teste Q de Cochran, na comparação de variáveis ordinais utilizou-se o teste W de Kendall e na comparação de variáveis quantitativas aplicou-se o teste de Friedman. Para as comparações múltiplas, adotou-se o método da diferença mínima significante. Para todas as análises adotou-se um nível de significância de 5%.