No âmbito internacional, especificamente no período pós-guerra (1958-1972), a
avaliação educacional tornou-se impositiva em decorrência da urgência em diagnosticar as reais causas dos baixos rendimentos escolares. Nos anos 1960, época de recessão econômica nos Estados Unidos da América, houve uma grande preocupação com as desigualdades sociais na diferenciação das oportunidades educacionais. De um lado, a sociedade americana exigia serviços de ensino de qualidade para educar e profissionalizar crianças e jovens, de outro, o sistema educativo, com viés mais econômico, preocupava-se com a alocação financeira rentável sem desperdícios.
Nesse contexto, foi decretada, por impositivo legal, a obrigatoriedade da avaliação de todos os programas educacionais dos Estados Unidos da América financiados pelo poder público. Em 1964, estabeleceu-se a Elementary and Secondary Education Act (ESEA) e criou-se o National Study Committee on Evaluation, iniciativas dos legisladores que emergiram da insatisfação da sociedade civil americana, que refutava a qualidade da educação no país. Com a avaliação educacional sistemática, o governo americano lançou uma nova perspectiva de avaliação de programas e práticas educativas, a qual incidia tanto para otimizar os investimentos públicos voltados à melhoria dos rendimentos escolares quanto para publicizar e prestar contas dos serviços educacionais (ESCUDERO, 2003).
A avaliação passa a ser fortemente associada à prestação de contas (accountability), o que implica uma cobrança por bons resultados e a demanda de que cada um dos atores envolvidos assuma a sua responsabilidade na produção desses resultados (BROOKE, 2006; CORVALÁN; MCMEEKIN, 2006; FERRER, 2006).
A necessidade por maiores informações sobre os resultados dos sistemas escolares tem sido respondida pela implementação de políticas de accountability, ou seja, de responsabilização, mediante as quais se tornam públicas as informações sobre o trabalho das escolas e consideram-se não só os alunos, mas os professores, os gestores e outros membros da equipe escolar como corresponsáveis pelo nível de desempenho alcançado pela instituição (BROOKE, 2006).
Ao longo das últimas décadas, nos Estados Unidos, o entusiasmo pelas medidas de responsabilização só tem aumentado. Brooke (2006) evidencia que o estímulo inicial foi a publicação, em 1983, do relatório Uma nação em risco (GARDNER et al., 1983), que desenhou um quadro alarmante de perda de competitividade provocada por um declínio nos padrões educacionais. As políticas de responsabilização foram reconhecidas pela legislação federal nos Estados Unidos, em 2001, recebendo o nome de Nenhuma Criança Deixada para Trás ou, em inglês, No Child Left Behind (NCLB).
O NCLB aumentou significativamente as obrigações dos estados na aplicação de avaliações, estipulou metas de accountability para escolas, distritos e estados e legislou sobre o ‘progresso anual aceitável’ em direção às metas de 2014 para todos os alunos e subgrupos de alunos por nível socioeconômico, raça, língua materna e necessidade especial. (BROOKE, 2013, p. 50).
Atualmente, os estados norte-americanos são disciplinados por leis que estabelecem padrões curriculares, testes alinhados com esses padrões, regras para a promoção e graduação de estudantes, metodologias direcionadas à publicização e à comparação dos resultados dos testes entre as unidades escolares. Em vários estados, existem também medidas
de incentivo e sanções compensatórias mediante o alcance sistemático do desempenho considerado mínimo.
Essa política educacional americana, baseada em metas, testes padronizados, responsabilização dos docentes pelo desempenho dos alunos e prêmios por desempenho, no Governo Obama, chama-se “corrida ao topo”. Conforme Amaral (2011), a “corrida” das escolas para atingir o topo do ranking utiliza como estratégia os mecanismos de premiação de educadores baseados no desempenho discente. Todavia, como a avaliação pode levar à perda dos adicionais, surgiram mecanismos para burlar o sistema, a exemplo de professores americanos que passaram a ensinar aos educandos os macetes para se saírem bem nos testes. Essa realidade não é restrita aos Estados Unidos, visto que as disputas, no mercado global, entre as nações ricas por um lugar competitivo vêm levando os governos a se preocuparem cada vez mais com os resultados dos seus sistemas de educação. Tal competição desencadeou dos governos a adoção de práticas de monitoramento, controle e aprimoramento do sistema educacional, na perspectiva de que “[...] o grande volume de recursos destinados à educação suscita questões relativas à eficácia dos investimentos neste setor e impõe uma aferição cada vez mais detalhada da qualidade da educação oferecida.” (ANDERSON, 2005 apud BROOKE, 2006, p. 378).
A ideia de que existe uma relação entre produtividade econômica e educação está presente nas políticas educacionais de vários países já há algum tempo, expressando a crença na relação entre competitividade econômica internacional, eficiência e qualidade dos seus sistemas educacionais. Exemplo disso foi a reforma educacional inglesa empreendida pelo Partido Conservador de Margaret Thatcher, que postulava a criação de um currículo comum nacional e um sistema de avaliação de desempenho dos educandos ao final de cada etapa curricular. A política de avaliação voltava-se para a congruência entre objetivos lançados e resultados alcançados. Pela primeira vez, a partir dos resultados da avaliação, fizeram-se as comparações entre as escolas em termos da aprendizagem demonstrada por todos seus alunos. Porém, os exageros dos primeiros ranqueamentos das escolas, sem levar em consideração as diferenças socioeconômicas e de aprendizagem prévia entre os aprendizes, provocaram rejeições e desinteresse pela política de responsabilização por parte da comunidade acadêmica e das autoridades educacionais locais (BROOKE, 2006).
Diante do exposto, percebe-se que tanto a Inglaterra como os Estados Unidos, nas décadas de 1980 e 1990, apresentavam motivações semelhantes para a adesão das políticas de responsabilização. Ambos os países, com raízes da administração pública na teoria de capital humano, tinham como princípio fundante o argumento que relaciona a qualidade da educação
à conquista de mercados, ou seja, formar o discente com as competências necessárias para a competição global.
A versão accountability ganhou também espaço na agenda da política educacional na América Latina. A administração pública latino-americana, nos últimos decênios, introduziu a gestão por responsabilização em consonância com a noção inglesa de accountability, no sentido de referir tanto o dever do setor público de prestar contas à sociedade como o direito dos cidadãos de controlar a ação dos seus governos (NARDI; SCHNEIDER, 2012).
O Chile foi um dos primeiros países latino-americanos que adotaram políticas de livre escolha e de prêmio por desempenho. O governo chileno, desde os anos 1980, proporciona a política da livre escolha de escolas por parte dos estudantes e de suas famílias. Através do voucher, ou vale, para pagar a matrícula, os alunos escolhem as escolas em que preferem estudar e levam consigo o subsídio para pagar seu funcionamento. Com isso, teoricamente pelo menos, as escolas municipais teriam que competir com as privadas sob pena de perderem seus educandos, o que, de fato, ocorreu de maneira bastante significativa. Esse sistema é criticado por ser influenciado por uma ideologia que dá importância indevida aos mecanismos de mercado para melhorar o processo de ensino-aprendizagem14.
Quanto à política de premiação por desempenho, o sistema educacional chileno introduziu em 1996 o Sistema Chileno de Avaliação dos Estudantes (SNED), que proporciona um pagamento adicional aos professores das escolas subvencionadas (públicas e privadas) cujos alunos obtêm melhor desempenho na prova do Sistema Chileno de Avaliação dos Estudantes (SIMCE). O desempenho não é medido em termos absolutos, porque isso beneficiaria as escolas que recebem educandos de nível social mais alto, mas em termos relativos, levando em conta também a melhoria de desempenho da instituição em relação ao período anterior e a outros indicadores, como taxas de aprovação e de repetência. O prêmio é dado à escola e os benefícios são distribuídos para sua equipe. A análise estatística dos resultados do SNED mostra que o incentivo parece ter efeito positivo sobre o desempenho das escolas, atingindo, porém, de maneira majoritária, aquelas unidades com aprendizes cujos pais possuem mais educação e maior renda (SCHWARTZMAN, 2007).
No campo educacional brasileiro, as pressões circunstanciais dos organismos internacionais de incremento do modelo de accountability têm balizado as atuais políticas adotadas pelo Estado. Dada a valorização das avaliações em larga escala como peça-chave
14 “Essa conclusão reflete sem dúvida o posicionamento do relator da avaliação, Martin Carnoy, que é um conhecido crítico de mecanismos de mercado e competitivos na educação [...].” (SCHWARTZMAN, 2007, p. 12).
para maior visibilidade e transparência a respeito dos aspectos centrais do processo de aprendizagem, atribuíram ao Estado o papel de avaliador da eficiência e qualidade educacional. Coutinho (2012, p. 2905) argumenta que esse novo papel do Estado deve-se às “[...] políticas de cunho neoliberal, que ganham espaço possibilitando o surgimento de novos modos de organização educacional. Visto que as políticas neoliberais corroboram com a lógica mercantilista redirecionando o papel do Estado na economia [...].”.
O Estado, ao assumir o papel de avaliador, utiliza-se, predominantemente, da prescrição do currículo mínimo e da avaliação em larga escala como medidas para exercer um maior controle dos sistemas de ensino, atenuar a grande diversidade de padrões e garantir os níveis mínimos de qualidade previstos na Constituição Federal (1988) e na Lei de Diretrizes e Bases da Educação Nacional (LDB nº 9.394/96).
Entretanto, no Brasil, a tendência accountability é recente, até meados da década de 1990, não existiam medidas de avaliação da aprendizagem que produzissem evidências sólidas sobre a qualidade dos sistemas de ensino no país, com exceção do sistema de avaliação da pós-graduação, sob a responsabilidade da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (Capes), as políticas educacionais eram formuladas e implementadas sem qualquer avaliação sistemática (CASTRO, 2009). Nesse período, constatou-se a necessidade da criação de estudos que mostrassem, de forma específica, a eficácia ou não do modelo de ensino adotado (currículo) e o desempenho dos alunos (proficiência), estimulando, assim, as primeiras experiências de avaliação educacional (COUTINHO, 2012).
O desenho das políticas de responsabilização iniciou-se com a criação do Sistema de Avaliação da Educação Básica (SAEB), porém ainda de forma muito sutil, haja vista que o seu caráter amostral não permitia seu uso para accountability escolar. Essa avaliação, iniciada com provas baseadas no modelo clássico de testes, a partir de 1997, passou a adotar a metodologia da teoria da resposta ao item (TRI), método estatístico utilizado na elaboração e análise dos itens, como também na própria elaboração dos testes. Esse procedimento permite comparar os resultados do SAEB de diferentes edições, bem como com os das diversas avaliações implementadas pelos estados brasileiros, desde que esses testes apresentem entre si itens em comum para serem utilizados na equalização. O SAEB, em sua concepção original, seria o melhor exemplo da primeira geração, visto que apresentava caráter diagnóstico e a divulgação dos resultados era restrita, portanto não havia impacto significativo para as escolas.
Dessa maneira, “[...] no entender dos especialistas poderia oferecer informações mais seguras sobre o repertório escolar das crianças e jovens, bem como oferecer condições de comparabilidade em escala, o que não era possível diretamente no modelo anterior.”
(ANDRADE; FONTANIVE; KLEIN, 2000; FLETCHER, 1991, 1995; VALLE, 1998 apud GATTI, 2014, p. 19).
Com o surgimento da Prova Brasil, avaliação para aferir o desempenho dos alunos de 5º e 9º ano do ensino fundamental, nos componentes de Língua Portuguesa e de Matemática, deu-se início à segunda geração das políticas brasileiras de avaliação, agora não aplicada somente para diagnóstico e planejamento, mas também para monitorar o desempenho individual de todas as escolas públicas de nível fundamental. Essa geração caracterizou-se pela ampla divulgação dos resultados de desempenho escolares, na perspectiva de prestação de contas dos serviços educacionais. Com a Prova Brasil e com alguns sistemas estaduais de avaliação, os resultados passaram a ser analisados até o âmbito da escola, permitindo a responsabilização dos gestores e dos professores, causando maior exposição das escolas, mas sem atribuição de recompensas ou sanções. O propósito da avaliação é, de certa maneira, redirecionado, tendo o intuito de:
[...] trazer a público os resultados, de um lado para prestar contas públicas sobre os resultados educacionais, de outro, na intenção de influir nos planejamentos e currículos educacionais, provocando a busca de formas de superação da precária situação das aprendizagens escolares. (GATTI, 2014, p. 19).
A política de responsabilização vai alcançar seu ápice a partir do ano de 2005, quando o Ministério da Educação (MEC), através do Instituto Nacional de Estudos e Pesquisas Anísio Teixeira (INEP), implantou o Índice de Desenvolvimento da Educação Básica (IDEB), que se compõe de duas variáveis: o fluxo escolar e as médias de desempenho nas avaliações nacionais. Essas médias referem-se ao desempenho no SAEB para os estados e na Prova Brasil para os municípios. É possível dispor de um valor do indicador para o país como um todo, cada estado, município e escola (FERNANDES, 2007).
Especificamente na educação básica, a incorporação dos objetivos da accountability, no processo de expansão do papel da avaliação em larga escala, foi demarcada pela implantação do IDEB, peça-chave do Plano de Desenvolvimento da Educação (PDE) (FERNANDES; GREMAUD, 2009). Como um divisor de águas, o IDEB marcou a forma de fazer política educacional, gerando uma mudança radical nos critérios a serem empregados na avaliação do trabalho escolar e dos responsáveis pelos sistemas de educação. A partir do IDEB, inicia-se a terceira geração do sistema de avaliação brasileiro, representada por sistemas estaduais e municipais de avaliação que apresentam políticas de responsabilização de consequências fortes para os atores educacionais, premiando escolas em função de seus resultados.
A sistematização dos processos de avaliação em larga escala influenciou decisivamente na consolidação da política de responsabilização, visto que as estratégias de
avaliação padronizadas e seus resultados assumiram o status de tradutores da qualidade, condicionando as escolas a buscarem atingir os índices desejáveis, o que pressupõe a melhoria do desempenho escolar. O Estado, atualmente, determina os princípios e as bases da avaliação, desenvolve os exames, aplica os testes, corrige-os, afere e divulga os resultados.
Isso indica uma perspectiva produtivista em educação, que veio se acentuando, principalmente com a vinculação às pressões de organismos internacionais, que favorecem financiamentos de diferentes ordens ao país e apontam para um modelo gerencialista passando a modelar as propostas educacionais centradas nos resultados de rendimento escolar dos alunos. (RAVELA, 2000; AFONSO, 2000 apud GATTI, 2014, p. 21).
Nesse sentido, ao que parece, a questão central da política de avaliação brasileira não é buscar subsídios para intervenções mais precisas e consistentes do poder público, ou seja, uma análise das informações coletadas para a definição e implementação de medidas para a educação básica, o foco principal é apontar se o IDEB está baixo ou se atende aos níveis de desempenho escolar desejáveis. Tal política tem como interesse “[...] difundir nos sistemas escolares uma dada concepção de avaliação, que tem como finalidade a instalação de mecanismos que estimulem a competição entre as escolas, responsabilizando-as, em última instância, pelo sucesso ou fracasso escolar.” (SOUSA, 2003, p. 180).
O modelo de avaliação em larga escala foi implementado no sistema educacional brasileiro para dar ênfase aos resultados, ao ranqueamento das instituições, e, quanto ao currículo, para promover uma conformação ou homogeneização do processo pedagógico, escolha das atividades, preparação de material didático e seleção dos conteúdos, que passam a ser vistos como delimitadores do conhecimento oficial, ou seja, o conjunto de informações que os alunos precisam assimilar, pois são passíveis de testagem (COUTINHO, 2012).
Os relatórios técnicos das avaliações e a forma de divulgação dos resultados, em geral, não são concebidos a partir da visão integradora de resultados com os fatores intervenientes, da perspectiva diagnóstica e do olhar para conjunturas regionais, esses preceitos vêm perdendo espaço para as pressões por resultados nos testes com matrizes de conteúdo definidos genericamente por especialistas e para os rankings gerais (GATTI, 2014). Atualmente, 21 estados brasileiros possuem sistemas próprios para avaliar suas redes de ensino e produzir seus resultados por escola (BROOKE; CUNHA; FALEIROS, 2011). A título de experiência, apresenta-se um breve panorama do caso do Estado do Ceará, uma das unidades federativas do país que vêm consolidando fortemente o viés da avaliação educacional como instrumento de gestão da política de responsabilização low-stakes e high-stakes.