encontra-se na aplicação de diversos testes psicológicos na população. Cada teste é elaborado de forma a mensurar idealmente uma habilidade cognitiva, ou poucas habilidades, o que garante a sua especificidade e precisão. Dessa forma, os instrumentos denominados de baterias de testes normalmente são formados por um conjunto de testes, e cada um deles pretende medir especificamente um traço ou componente da arquitetura mental, como é o caso do Conjunto de Testes de Referência para Fatores Cognitivos do Educational Testing Service (Ekstrom, French & Harman, 1976; Ekstrom, French, Harman & Dirmen, 1979).
Dois pressupostos básicos norteiam o uso dos testes. O primeiro define que: • Através da mensuração do comportamento é possível se identificar traços
psicológicos latentes.
Segundo esse postulado, as respostas das pessoas aos itens de um teste são comportamentos que representam processos mentais. Por meio da mensuração dos comportamentos emitidos pode-se chegar a traços internos (Pasquali, 2003).
O segundo pressuposto estabelece que:
• É possível aos números representarem os fenômenos psicológicos. Para que a representação seja adequada os números não devem perder suas características estruturais.
Esse postulado sustenta que os números podem representar adequadamente os fenômenos psicológicos. De fato, um número não representa adequadamente a diferença entre raiva e tristeza. Números não são bons para registrar qualidades ou atributos. Se há diferenças entre essas características, elas não são bem capturadas pela representação numérica. No entanto, números são muito bons para representar magnitudes. As pessoas têm intensidades diferentes de raiva e de tristeza dependendo de uma série de situações. Há diferentes níveis de raiva ou tristeza, do ponto de vista da força com que o fenômeno psicológico é expresso. Essas diferenças de magnitude o número é capaz de representar adequadamente e nesse campo das magnitudes o fenômeno psicológico é bem representado pela mensuração.
No entanto, não é somente o número que deve respeitar a estrutura dos fenômenos psicológicos. Qualquer comportamento humano traduzido em números deve manter a estrutura dos números, pelo menos as características de identidade e ordem. Os números 1 e 2, por exemplo, possuem identidades próprias, de forma que números diferentes correspondem a entidades ou magnitudes diferentes. Quanto à ordem, os
números possuem posições distintas. O número 1 possui uma posição em relação ao número 2, ao 3 e assim sucessivamente. Esta característica de ordem deve se manter no momento de tradução do fenômeno psicológico para a estrutura numérica.
A condição de identidade e ordem garante minimamente que as estruturas numérica e fenomenológica sejam respeitadas razoavelmente em suas características internas, de maneira que o número possa representar o fenômeno psicológico sem perder as suas propriedades fundamentais.
A aditividade é uma terceira característica estrutural dos números que normalmente não é cumprida pelas escalas que medem os comportamentos psicológicos humanos. A aditividade significa, em linhas gerais, que um número somado por outro gera um terceiro número. Por exemplo, o número 1 somado ao número 2 gera o número 3. A maioria dos fenômenos psicológicos não corresponde a esse princípio. Quando um pesquisador elabora uma escala e pede às pessoas que digam se gostam muito pouco, medianamente, ou muito de ler, não é possível dizer que a distância entre gostar muito pouco de ler e gostar medianamente seja a mesma distância entre gostar medianamente e gostar de muito de ler. Diferentemente, quando se mede um termômetro, pode-se dizer que há uma distância de 10 graus entre o intervalo de 35 e 45 graus, da mesma forma que há essa diferença no intervalo entre 90 e 100 graus. A ausência de uma distância definida entre os pontos da maior parte das escalas atribuídas aos fenômenos psicológicos dificulta a presença do princípio da aditividade. No entanto, isso não inviabiliza o processo de mensuração e representação do fenômeno pelo número, mas salienta uma qualidade inferior do dado numérico.
Tendo em vista a relação de dependência entre a qualidade dos testes e o tipo de dado numérico extraído, pode-se afirmar com segurança que a tecnologia da construção dos testes é um dos componentes mais importantes da psicometria. Sem a presença de
bons testes não é possível garantir que os dados numéricos obtidos sejam válidos e meçam verdadeiramente habilidades cognitivas e, muito menos, que as respostas dadas pelas pessoas tenham confiabilidade, ou seja, possuam uma pequena margem de erro de medida.
Não será discutido neste tópico o largo número de técnicas de análise do item, análise do teste, da confiabilidade e validade. Há muitas referências adequadas ao tema. Este tópico foca a atenção em dois exemplos representativos de testes de natureza cognitiva, um teste focado em níveis de desenvolvimento e um teste focado em níveis de performance. A base da maioria dos testes de inteligência existentes na literatura da psicometria encontra-se dentro desses dois protótipos.
O primeiro desses protótipos é a Escala de Inteligência de Stanford-Binet, mais conhecida como o teste de QI. Desenvolvido inicialmente pelo psicólogo francês Alfred Binet, o teste de QI se sustentou no pressuposto de que um instrumento sobre as capacidades humanas deveria ser composto por tarefas graduadas a partir da capacidade média das crianças em diferentes níveis etários. Os itens formulados por Binet buscavam mensurar processos mentais de cada faixa etária estipulada pelas teorias sobre inteligência infantil da época, de modo que eles possuíam um caráter teórico, enquanto seu agrupamento um caráter empírico. De uma maneira geral, os itens eram aplicados a amostras de crianças, de forma que se podia identificar o nível de dificuldade do item, através da identificação da idade mínima onde ele era resolvido pela média das crianças. Por exemplo, se um item era realizado somente pela média das crianças de oito anos e acima, esse item era agrupado no nível de itens para crianças de oito anos.
Terman continuou o empreendimento de Binet, adaptando os itens para os Estados Unidos e gerando novas tarefas que eram classificadas em termos da idade na qual a criança conseguia realizá-las com sucesso. Foram refinados os critérios para
definir o que poderia ser considerado uma tarefa mental. A grosso modo, o teste de QI fornecia um escore geral e refletia o progresso total da criança sobre um conjunto amplo de habilidades.
O foco maior do teste de QI era obter a “idade mental” da criança. Essa idade era obtida através do número de tarefas resolvidas com sucesso. Se uma criança de nove anos resolvesse as tarefas realizadas pela média das crianças de 12 anos, sua idade mental atribuída seria de 12 anos. O contrário também era verdade. Uma criança de 12 anos que conseguisse resolver somente as tarefas realizadas pela média das crianças de nove anos era classificada como tendo uma idade mental de nove anos.
Para avaliar o desenvolvimento intelectual da criança os pesquisadores elaboraram um quociente intelectual (QI). Basicamente, o QI era obtido através da divisão da idade mental (IM) sobre a idade cronológica (IC), multiplicando-se o resultado por 100. Uma criança de 10 anos que alcançasse a performance da média das crianças de seis anos teria um QI de 60 (seis anos de Inteligência Mental divido por 10 anos de idade cronológica vezes 100). Um Quociente de Inteligência no valor de 100 evidentemente representava a performance média das crianças em uma determinada idade. Assim, estar abaixo de 100 representava estar abaixo da média de sua própria idade, enquanto estar acima de 100 representava estar acima da média de sua idade.
Apesar do seu caráter empírico, o teste de QI tinha e continua tendo como alicerce a presença de uma teoria rústica de desenvolvimento mental (Carroll, 1997). Dois fortes princípios desenvolvimentais estão presentes implicitamente. O primeiro princípio sustenta que diferentes aspectos do desenvolvimento mental acontecem em paralelo. Já o segundo pressupõe que há uma norma para o desenvolvimento mental, passível de ser representada pela performance média das crianças. Apesar desses princípios implícitos, o teste não possui nenhuma teoria declarada sobre os mecanismos
do desenvolvimento intelectual e sua dinâmica, o que faz Carroll (1997) afirmar que testes desse tipo são na melhor das hipóteses bons indicadores empíricos de normas grosseiras de desenvolvimento.
Carroll (1997) oferece uma orientação sobre como o teste de QI deveria ser interpretado. Ele sustenta que o QI 100 deveria ser analisado como a curva de desenvolvimento esperada, ou o curso médio do desenvolvimento para as crianças e adolescentes de 3 a 20 anos da cultura ocidental contemporânea. Segundo ele, de forma alguma o teste de QI mensura perfeitamente a capacidade mental das pessoas, ou todos os aspectos da inteligência. O teste de QI é um teste rústico onde sua principal contribuição encontra-se na explicitação de uma curva de crescimento desenvolvimental das crianças e adolescentes. Se as tarefas são adequadas, se mensuram diversas habilidades cognitivas em diferentes níveis e conteúdos, representando diferentes aspectos dos mecanismos do desenvolvimento, isso é outra questão.
(...) o QI pode ser interpretado como medida da taxa de avanço da idade mental da criança como resultado da exposição à cultura e ao aprendizado derivado dela. O número do QI expressa o grau relativo de progresso conquistado em comparação com o progresso adquirido por um indíduo típico ou modal (“médio”) dentro daquela cultura. Porque, com o correr do tempo histórico, os níveis médios de progressos obtidos por indivíduos em uma dada cultura pode mudar – crescer ou diminuir, mas normalmente crescer – os QIs médios podem mudar também, como documentado, por exemplo, por Flynn (1987). (Carroll, 1997, p. 38)
O teste de QI foi amplamente aceito pelos psicólogos. Essa aceitação deveu-se principalmente devido aos seus atributos de validade e confiabilidade em amostras e populações, assim como a boa correlação dos seus resultados com os escores escolares. Em última análise, o teste de QI pode ser entendido como um bom preditor do desempenho escolar das pessoas.
Conforma salienta Carroll (1997), o teste de QI não deve ser descartado. Ele é um indicador rústico do desenvolvimento intelectual e representa uma parcela do crescimento intelectual a grosso modo. No entanto, novos testes devem ser elaborados e seus itens devem ser construídos especificamente para mensurar fases diferentes do desenvolvimento, assim como identificar diferentes mecanismos que interferem no crescimento intelectual.
Se o teste de Stanford-Binet, em suas várias versões, é um modelo típico de instrumento voltado para a mensuração do progresso intelectual das crianças, o teste ASVAB (Armed Services Vocational Aptitude Test) é um modelo prototípico de teste focado na mensuração de habilidades cognitivas em adultos. Ao invés de definir tarefas que possuem conexão com o nível de desenvolvimento próprio de cada faixa etária, o teste da ASVAB se define na construção, classificação e seleção de tarefas, e análise da proporção de adultos capazes de realizá-las com êxito.
O teste da ASVAB foi formado através da seleção de itens que tivessem um bom poder de predição com relação à performance de várias ocupações ou especialidades militares. Os itens deveriam compor 10 subtestes. Para sua avaliação, foram realizadas análises da distribuição apropriada dos escores e do grau de confiabilidade, através do uso de procedimentos envolvidos na Teoria de Resposta ao Item (Carroll, 1997). Através da análise fatorial foi possível observar que os subtestes mensuravam habilidades cognitivas nomeadas como Habilidade Verbal (V), Raciocínio Quantitativo (RQ), Facilidade Numérica (N), Conhecimento Mecânico (MK), Conhecimento em Matemática (M) e Informação Geral (GO). Além desses fatores específicos, um fator geral foi encontrado, através das correlações entre esses fatores primários.
Apesar de mensurar um fator geral, o teste da ASVAB é bastante influenciado por aspectos verbais, na medida em que todos os subtestes envolvem como pré-requisito
uma boa capacidade de leitura e interpretação das instruções (Carroll, 1997). Apesar do caráter verbal excessivo da bateria, os desenvolvedores da ASVAB não modificaram a estrutura do teste, na medida em que esse componente era central para que o teste se mantivesse como um bom preditor de diversas tarefas e ocupações militares.
O teste da ASVAB, enquanto exemplo prototípico, demonstra o tipo comum de instrumento da psicometria para mensurar habilidades cognitivas. Em linhas gerais, um largo conjunto de itens são elaborados e aplicados em uma amostra determinada de pessoas. A verificação empírica da facilidade ou dificuldade dos itens ajuda a compor a ordem e a apresentação dos itens do teste. Através de técnicas da Teoria de Resposta ao Item é possível ao desenvolvedor obter uma medida do grau de confiabilidade dos itens, e se a distribuição dos itens é adequada. Concomitantemente, os pesquisadores esperam que determinados grupos de itens, com conteúdos e formas diferentes mensurem um mesmo fator, representando uma habilidade cognitiva.
Diferentemente dos dois testes prototípicos indicados, há também um conjunto muito importante de testes, denominados de testes marcadores, ou testes de referência. Os testes marcadores são instrumentos elaborados especialmente para a identificação de apenas, ou preferencialmente, um fator cognitivo. Eles provêm do desenvolvimento do campo da psicometria e da necessidade de mensuração mais precisa e apurada do universo das habilidades cognitivas humanas. Diferentemente dos testes ASVAB e do Stanford-Binet, os testes marcadores buscam intencionalmente mensurar diretamente um fator cognitivo. Um exemplo de testes dessa natureza é o Conjunto de Testes de Referência para Fatores Cognitivos do Educational Testing Service (Ekstrom, French & Harman, 1976).
Apesar do amplo desenvolvimento das técnicas de construção de testes e dos métodos de análise fatorial, a psicometria tem falhado em mensurar alguns aspectos
fundamentais da natureza intelectual humana, justamente por carências teóricas no campo do desenvolvimento das habilidades cognitivas e do papel do contexto social na formação da inteligência humana:
Na minha opinião, entretanto, desde os primeiros passos da disciplina até os dias de hoje, os psicometristas não têm conseguido adotar uma perspectiva suficientemente ampla quanto à forma pela qual o progresso no desenvolvimento mental ocorre, os tipos de forças que encorajam ou inibem esse desenvolvimento e o contexto social no qual ele ocorre. (Carroll, 1997, p. 42)
De fato, não há um consenso entre os pesquisadores da psicometria, da psicologia cognitiva, e tampouco da psicologia do desenvolvimento sobre o que seja a inteligência humana. Poucos estudos analisam a concepção das pessoas comuns sobre o que seja ser inteligente (Sternberg, 1981) e faltam teorias capazes de sintetizar diferentes frentes e vertentes do campo da cognição e inteligência, apesar de algumas iniciativas bastante promissoras, como é o caso do Estruturalismo Experiencial de Demetriou e colaboradores.
6.12 AGENDA FUTURA DA PSICOMETRIA E QUESTÕES