• Sonuç bulunamadı

Gelir ve Servet Dağılımında Eşitliği Sağlama Hedefi

BÖLÜM 2 : MİKROKREDİ UYGULAMALARININ EKONOMİK, SOSYAL VE

2.1. Mikrokredinin Ekonomik, Sosyal ve Mali Hedefleri

2.1.2. Sosyal Hedefler

2.1.2.1. Gelir ve Servet Dağılımında Eşitliği Sağlama Hedefi

A Figura 4.15 mostra que para se obter a extração automática de termos de um córpus, basta submetê-lo a uma ferramenta computacional que extraia automaticamente esse tipo de informação lingüística e que fornecerá como saída uma lista de termos que serão adicionados, na Etapa E7, a um concordanciador.

Figura 4.15: Diagrama da etapa de Extração Automática de termos da área a qual pertence o córpus.

Conforme é observado na Figura 4.15, é efetuada nessa etapa é efetuada a submissão dos textos do córpus a uma ferramenta computacional que extrai termos específicos da área a qual o córpus pertence. Em seguida, esses termos são submetidos a Etapa E7, que os retornará em seu contexto de uso, por meio de um concordanciador.

14 http://www.nilc.icmc.usp.br/lacioweb/index.htm Córpus anotado Extrator Estatístico de Termos Lista termos da área Córpus anotado

Existem três tipos de abordagens para se realizar essa tarefa de extração de termos de uma dada área de especialidade: a abordagem estatística, a lingüística e a híbrida que combina as duas anteriores (Teline, 2004). Entre essas abordagens de extração, a estatística foi escolhida para o nosso trabalho por ser o tipo mais simples de ser utilizado segundo a literatura.

Entre os métodos estatísticos existentes podem ser citados as medidas estatísticas do pacote NSP (N-gram Statistics Package)15, escrito em linguagem Perl, que foi implementado por Ted Pedersen, Satanjeev Banerjee e Amruta Purandare na Universidade de Minnesota, Duluth. Ele é constituído por um conjunto de programas que auxilia na análise de n-gramas16 em arquivos texto. Outro método é o BootCaT (do inglês Bootstrapping Corpora and

Terms)17, que é composto por várias ferramentas escritas em linguagem Perl que foram

projetadas para executar pequenas partes do processo de extração automática de córpus e de termos. Uma terceira ferramenta que poderia ser citada para esse tipo de tarefa de extração de termos é a KeyWords, parte integrante da suíte de ferramentas WordSmith Tools (Scott, 1998), a qual segundo Berber-Sardinha (1999a), tem sido referência para vários estudos e investigações sobre linguagem.

Entre esses três métodos estatísticos citados, o terceiro foi o escolhido para ser aplicado neste projeto, pois considerando que será um método a ser executado não só por lingüistas já acostumados ou familiarizados com o WordSmith Tools, mas também por pesquisadores de outras áreas do conhecimento, portanto nem tão cientes da existência ou até mesmo do tipo de uso que se pode fazer com esse ferramental computacional para a extração, no nosso caso, de termos. Entre as razões dessa escolha pode ser citado o fato de ser um programa que é executado no ambiente Windows, familiar para a maioria dos usuários, e pode ser obtido pela Internet mediante pagamento de licença. Ser executável no ambiente Windows significa não só uma interface amigável de interação, mas também a ausência de necessidade de linhas de comandos, que por mais simples que possam ser, podem intimidar o interessado em realizar a tarefa de extração de termos de um córpus.

Conforme já mencionado, a ferramenta KeyWords se destina à comparação de listas de palavras de um córpus de estudo com uma lista de palavras de um córpus de referência. O resultado desta comparação é uma lista de palavras-chaves, cujas freqüências no córpus de

15

http://www.d.umn.edu/~tpederse/nsp.html. 16

Termo composto por uma ou mais palavras, por exemplo: uni-grama:termo formado por uma palavra, bi- grama termo formado por duas palavras. Pode ser também referenciado como multipalavra.

17

estudo são diferentes do córpus de referência. Em outras palavras, sua função é comparar por meio de um método estatístico as palavras cujas freqüências no córpus de estudo são maiores do que no córpus de referência, que deve ser representativo. Assim, os principais componentes na extração das palavras-chaves são: 1) um córpus de estudo, representado por uma lista de freqüência de palavras, e 2) um córpus de referência, também representado como uma lista de freqüência de palavras, cuja função é a de fornecer o conjunto de palavras com o qual se fará as comparações.

Portanto, após a extração de termos realizada na Etapa E0, o próximo passo para o usuário do CECARL é reutilizar essa mesma lista de palavras-chaves anteriormente gerada como recurso para a composição de um concordanciador voltado para o córpus de especialidade. A razão da existência de tal concordanciador pode ser justificada pela facilidade que o usuário terá de acessar, sempre que preciso, os termos de especialidade de sua área dentro de seu contexto de uso, ou seja, nas possíveis realizações lingüísticas contidas no córpus compilado. Esse contexto de uso permite verificar os colocados existentes no córpus, o local dentro de uma frase onde regularmente dados termos, marcadores discursivos ou mesmo expressões formulaicas ocorrem, em geral. Pode ainda auxiliar na dúvida de uso de um dado verbo combinado com uma também dada preposição, permitindo aos estudantes fazerem suas próprias descobertas sobre linguagem (Johns, 1991a; Tribble & Jones, 1990; Swales & Lee, 2006) ao mesmo tempo em que são expostos a diferentes formas de linguagem geradas de diferentes perfis de autores, portanto advindas de diferentes conceitos de gramática, de estilo e de convenções lingüísticas.

Para isso, esse concordanciador possibilitará dois tipos de interação: uma voltada para os termos da área e outra para uma outra dada instância lingüística que o usuário desejar, ou seja, de outros elementos existentes no córpus. Assim, ao selecionar o botão “termos” desse concordanciador, o usuário terá a sua esquerda uma lista com as palavras-chaves do córpus, que após um clique em uma delas, aparecerá à sua direita, esse mesmo termo em seu contexto de uso. Se o usuário desse concordanciador optar pelo botão “todas as palavras do córpus”, ele terá que digitar no campo de busca a palavra ou expressão que deseja ver na concordância. Importante ainda dizer que o texto completo do qual o termo ou expressão foi retirado aparece na tela do concordanciador quando se realiza um clique na palavra nódulo do concordanciador. A Figura 4.16 ilustra esse concordanciador descrito (ainda idealizado).

Figura 4.16: Figura montada de um Concordanciador idealizado para compor parte da ferramenta de auxílio à escrita criada pelo ambiente Web gerador de ferramentas.

Vale dizer que esse concordanciador será gerado, futuramente com a contribuição de um outro trabalho, junto da ferramenta de auxílio à escrita científica construída pelo ambiente Web gerador, o projeto maior que inclui o projeto em tela.

A próxima e última etapa a ser apresentada trata do acoplamento e submissão de todos os recursos lingüísticos que foram produzidos até o momento a uma ferramenta de auxílio à escrita científica genérica, o Scientific Writing.