BÖLÜM 2 : MİKROKREDİ UYGULAMALARININ EKONOMİK, SOSYAL VE
2.1. Mikrokredinin Ekonomik, Sosyal ve Mali Hedefleri
2.1.1. Ekonomik Hedefler
2.1.1.2. İstihdam Sağlama ve Girişimciliği Arttırma Hedefi
Na Figura 4.14 temos uma descrição dos procedimentos manuais envolvidos na tarefa de anotação das estratégias retóricas de um córpus. Para tanto, é necessário um modelo teórico que descreva esses tipos de estratégias em uma dada seção de artigo científico, um manual de anotação para que a forma, os procedimentos e exemplos de textos anotados sejam consultados sempre que haja necessidade.
Figura 4.14: Diagrama da Etapa de Anotação Manual das Estratégias Retóricas de um córpus.
4.11.1 Instrução da Etapa E5
Conforme pode ser observado na figura 4.14, é uma etapa manual de anotação das estratégias retóricas dos textos de um córpus. Para tanto, é necessário escolher um modelo de estratégias retóricas para anotar os textos, elaborar um protocolo de anotação desses textos, isto é, uma descrição das categorias a serem classificadas, com seus respectivos exemplos, e, por fim, realizar a anotação manual propriamente dita dessas estruturas, com o auxílio de um
Escolha de um Modelo de Estratégias Retóricas
Elaboração de um Protocolo Para a Anotação dos textos
Anotação Manual dos textos
Córpus anotado
Ferramenta Computacional
editor de textos, como o Word da Microsoft, ou de uma ferramenta computacional, com funcionalidades semelhantes às apresentadas pela ferramenta TagAlign (Caseli et al, 2002) apresentada na seção que descreve a Etapa E1’. Apesar de manual, pode ser interessante a existência de uma ferramenta computacional que auxilie nessa tarefa de categorizar as estratégias retóricas contidas nas sentenças, bastando um clique em um dado botão dessa ferramenta para se ter a etiqueta referente à estratégia retórica anexada à sentença.
4.11.2 Instanciação da Etapa E5
Em nosso córpus Met, essa anotação foi realizada por quatro juízes (anotadores) a fim de assegurar maior confiabilidade na anotação das partes dos textos e adotamos como modelo de anotação, o esquema de Passos (Steps) proposto por Swales (1990), que é apresentado na Tabela 4.7.
Siglas das categorias Descrição das siglas MAT-LIST Listagem dos materiais utilizados no estudo MAT-FONT Detalhamento da Fonte dos materiais utilizados
MAT-INFO Fornecimento de informações a respeito dos materiais PRO-DOC Detalhamento dos procedimentos utilizados para a execução
correta da metodologia
PRO-DET Detalhamento dos procedimentos utilizados
PRO-JUST Fornecimento de justificativa sobre os procedimentos
EQU Equipamentos utilizados
PAD Procedimentos de análise dos dados
RES Resultados da Pesquisa
Tabela 4.7: Note que a sigla da categoria é composta sempre por letras contidas em suas respectivas categorias, de forma a facilitar a memorização e fácil identificação do significado da categoria que deverá ser empregada nas sentenças do córpus.
Antes de realizar a anotação, os quatro anotadores receberam um manual que descreve o modo como esse processo deveria ser feito e depois de esclarecidas algumas dúvidas, iniciaram o procedimento de familiarização com o modelo adotado e com os textos a serem trabalhados, semelhantemente ao procedimento descrito na etapa E1’, porém nesse momento, estão em foco a anotação das estratégias retóricas. Entre as dificuldades sentidas no processo de anotação dessas estratégias, a maior delas estava relacionada ao fato de uma sentença possuir ao mesmo tempo mais de uma estratégia retórica e esse fato ser identificado por todos os anotadores. Nem sempre os juízes identificavam todas as estratégias contidas, o que contribuiu para haver queda de concordância entre eles.
O processo de anotação dessas estratégias consistiu na anotação de agrupamentos de palavras/estratégias retóricas que pudessem ser reutilizadas em contextos distintos dos quais foram retiradas. Essa atividade, no entanto, não consiste em plágio, uma vez que sentenças completas não são reutilizadas, as informações factuais dessas sentenças, isto é, aquelas informações que dizem respeito a um dado experimento, não são anotadas/compiladas. Essas partes não reutilizáveis consistem nas lacunas a serem preenchidas com a parte factual do experimento do autor do novo artigo a ser escrito.
Assim, o autor do artigo poderá construir seu texto montando peças, isto é, por meio da identificação de diferentes combinações das estratégias que aparecem no texto original e criando, a seguir, sua própria combinação.
Assim como foi realizado um teste estatístico para avaliar o grau de concordância na anotação das estruturas esquemáticas do córpus Met, o mesmo teste foi realizado para avaliar o grau de concordância/discordância entre os anotadores em relação à anotação das estratégias retóricas do córpus anotado. Em nosso estudo com o córpus Met, o valor de k obtido para essa tarefa foi K=0.676 (mais informações sobre a estatística Kappa aqui aplicada ver Capítulo 5), o que significa dizer que houve uma boa concordância entre os anotadores. Há que se considerar para esse resultado obtido que apesar da subjetividade envolvida na tarefa e o fato de haver sentenças no córpus que possuíam mais de uma função retórica (que nem sempre era detectada por todos os anotadores), o valor k obtido, ainda assim, foi um bom resultado. Fato esse que mostra que o modelo de estruturação adotado em nosso trabalho foi útil para a classificação das estratégias retóricas contidas no córpus Met, as quais contribuirão enquanto exemplos que serão utilizados na seção “Metodologia” de artigos científicos da área de Ciências Farmacêuticas.
Uma dúvida que pode surgir nesse momento do trabalho diz respeito ao tamanho do córpus que se deve construir. Em geral, o tamanho de um córpus depende sempre do propósito a que ele serve. Portanto, um córpus deve ser grande o bastante para conter ocorrências dos elementos de linguagem que se queira estudar/analisar. Tribble (1997) afirma que um pequeno córpus composto por 25.000-30.000 palavras pode ser adequado à maioria dos propósitos educacionais. Vale lembrar, que uma das características mais importantes de um córpus destinado a uma ferramenta de auxílio à escrita é o de conter uma boa quantidade de estratégias utilizadas em cada componente de cada seção constitutiva de um artigo científico, uma vez que servirão de base de exemplos de consulta para o usuário desse tipo de ferramenta. Portanto, devem estar bem representados em termos de quantidade e de qualidade. Em nosso córpus Met, as estatísticas referentes às estratégias retóricas (nove estratégias)
encontradas para cada componente da estrutura esquemática (cinco componentes) podem ser observadas na tabela 4.8. Estratégias Retóricas Número de exemplos PRO-DET 644 MAT-FONT 132 PRO-DOC 116 PAD 96 Estruturas Esquemáticas Número de exemplos EQU 77 PRO 829 MAT-INFO 77 MAT 221 PRO-JUST 66 PAD 96 RES 36 EQU 77 MAT-LIST 12 RES 36
Tabela 4.8: Estatísticas das estratégias retóricas e estruturas esquemáticas contidas em 30 textos de Metodologia das Ciências Farmacêuticas.
Como as seções do SciPo-Farmácia foram analisadas separadamente quanto a sua adequação aos modelos de estrutura e qualidade de escrita, elas possuem quantidade de material textual diferente, nem sempre vindo de uma mesma publicação. Atualmente, a base contém 43 Resumos, 39 Introduções, 26 Resultados, 11 Discussões e 22 Conclusões. A média de textos contidos no SciPo-Farmácia pode ser observada abaixo:
____________________________________________________________ Total de textos do SciPo-Farmácia => 171 textos - 100%
Resumos => 43 textos - 25.14% Introduções => 39 textos - 22.80% Resultados => 26 textos - 15.20% Discussões => 11 textos - 6.43% Conclusões => 22 textos - 12.86% Metodologia => 30 textos - 17.54% _____________________________________________________________
Trinta textos podem parecer um volume grande para ser anotado manualmente, no entanto, não é pequeno para constituir uma ferramenta de auxílio à escrita. É por esse motivo que existe o trabalho de um mestrando do ICMC-USP, cujo objetivo, conforme apresentado na etapa E1, é automatizar o processo de anotação de componentes esquemáticos de um córpus, ainda que se precise revisar posteriormente. Revisar ainda é mais fácil e rápido que
anotar manualmente, como já foi comprovado em experiências de anotação morfossintática no projeto Lacio-Web14.
No entanto, vale lembrar que existem dois objetivos em nosso trabalho com o córpus da seção “Metodologia” o córpus Met. Além de disponibilizar tal córpus para uso nessa seção do ambiente, isto é, compilar esse córpus e extrair os recursos lingüísticos existentes, também é objetivo deste trabalho, aplicar a estatística Kappa para verificar se as tarefas de anotação realizadas com ele foram facilmente entendida pelos anotadores. Fato comprovado pelos valores satisfatórios obtidos.