BÖLÜM 1 : MİKROKREDİNİN KAVRAMSAL ÇERÇEVESİ, DÜNYADA ve
1.3. Dünyada Mikrokredi: Genel Bir Değerlendirme
Para se realizar a anotação manual da estrutura esquemática de uma seção qualquer de um artigo científico, é interessante separar as sentenças da seção a ser analisada com espaço de uma linha entre elas para facilitar o processo de anotação da estrutura esquemática contida em cada uma delas. Esse procedimento pode ser realizado manualmente em um editor de textos qualquer ou de maneira automática, com o emprego de uma ferramenta computacional como, por exemplo, o Senter (Pardo, 2006). O Senter é uma ferramenta computacional que
Segmentação das sentenças Escolha da Estrutura Esquemática Córpus Anotado Córpus Balanceado Elaboração de protocolo para anotação Anotação Manual Editor de Texto TagAlign
serve para segmentar automaticamente um texto (em inglês ou português) em sentenças. Tal ferramenta está disponível gratuitamente para download em http://www.icmc.usp.br/~taspardo/senter.html e depois de instalada, basta executar a linha de comando “senter.exe myfile.txt”. A seguir, o texto segmentado será salvo em um arquivo com o mesmo nome do arquivo submetido à segmentação + “.seg”, por exemplo, resumos.seg no qual haverá uma sentença por linha. O arquivo de entrada dessa ferramenta é do tipo texto sem formatação, ou seja, arquivos com o formato .txt.
Depois dessa organização, o próximo passo é escolher os componentes esquemáticos a serem identificados em cada sentença do texto. Neste trabalho foram utilizados, principalmente, os trabalhos de Swales (1990) e Weissberg & Buker (1990), muito respeitados na área de estudos de gênero e que propuseram modelos deste tipo de estrutura para todas as seções de artigos científicos. Interessante ainda dizer que os modelos de componentes esquemáticos propostos por estes autores foram baseados em análises de textos de diferentes áreas do conhecimento, o que possibilita a replicação destes modelos com quaisquer seções de textos científicos das três grandes áreas: Exatas, Humanas e Biológicas. No entanto, vale ressaltar que esses modelos não podem ser vistos como verdades absolutas, mas sim como possibilidades de tipos de componentes esquemáticos que podem ser encontrados em uma dada seção de artigo científico. Assim, se durante a anotação de um texto for observada a ausência de um dado componente não contido no modelo escolhido, mas que tenha sido identificado no córpus, é indicado optar pela inclusão do mesmo na anotação, uma vez que o texto mostrou necessidade de tal inserção, que o modelo não foi possível de prever.
Depois de escolhido o modelo de estrutura esquemática, é preciso que se elabore um protocolo (manual) de anotação dos componentes esquemáticos. Esse protocolo consiste em um tipo de documentação escrita na qual, além do modelo de estrutura esquemática adotado, também deve constar exemplos de sentenças nas quais os componentes esquemáticos ocorrem, como também, procedimentos indicados em momentos de dúvida no processo de anotação. A confecção de um manual é aconselhável uma vez que facilita a replicação da tarefa de anotação por diferentes pessoas que o poderão consultar sempre que sentirem necessidade. Para a anotação da Seção “Metodologia”, por exemplo, foi preparado um manual de anotação. Além disso, foram desenvolvidos manuais para a anotação de componentes da estrutura esquemática para as outras seções que um artigo científico pode apresentar. Estes manuais correspondem aos Apêndices 1, 2, 5, 6, 7 e 8.
Depois de elaborado um manual, inicia-se a anotação dos textos. Essa anotação pode ser feita por um editor de textos, como o Microsoft Word® ou por uma ferramenta computacional
que tenha as funcionalidades, por exemplo, da TagAlign (Caseli et al, 2002) apresentada na Figura 4.7. Como pode ser observado na Figura 4.7, o funcionamento desse tipo de ferramenta é simples e pode facilitar o trabalho do anotador. Trata-se de uma interface de fácil interação, bastando apenas ao usuário submeter à ferramenta um arquivo com as etiquetas que vai utilizar no processo de anotação, como também o texto a ser anotado. Selecionando a sentença a ser anotada, basta um clique na etiqueta a ser adicionada à sentença para que seja finalizado o processo de anotação. Assim, o usuário repete esse procedimento até o fim do texto, quando salvará o arquivo que será automaticamente salvo em formato XML, formato de arquivo requerido por ferramentas de auxílio à escrita semelhantes ao SciPo-Farmácia. Portanto, no caso de se optar por realizar a anotação dos textos em um editor do tipo Word, será necessário que se converta esse arquivo do tipo .doc para o formato XML, pois é esse formato que recupera e exibe ao usuário da ferramenta de suporte exemplos reais de seções de artigos científicos.
Figura 4.7: Tela da Ferramenta de auxílio à anotação TagAlign. O fato de utilizar apenas um botão do mouse para fazer a anotação em vez de ter que digitar as siglas das categorias faz com que a tarefa de anotação seja efetuada mais rapidamente e sem riscos de digitação incorreta das siglas, além da interface ser de fácil entendimento e manuseio. Interessante também dizer que é simples alterar as etiquetas para trabalhar com textos de outras seções. Para isso, é preciso apenas alterar o arquivo de etiquetas, que deve ser inserido num dado formato, cujo exemplo está inserido no pacote de instalação dessa ferramenta. Além disso, dá para indicar mais de uma etiqueta para sentenças com mais de uma função retórica. No entanto, poderiam ser sugeridas algumas alterações, como: (1) Ao carregar o texto a ser anotado, que deve estar em formato .txt, seria interessante que a separação existente entre as linhas (espaço de uma linha) se conservasse, pois facilitaria a leitura do texto. (2) Seria interessante que a fonte dos textos apresentados na tela dessa ferramenta fosse um pouco maior, facilitando a leitura. (3) Se as etiquetas fossem coloridas facilitaria a identificação da distribuição das funções nas sentenças e no texto em geral.