• Sonuç bulunamadı

1. MEVCUT DURUM

1.6. EĞİTİM

Coletar dados empíricos de uma maneira científica e sistemática é um dos principais objetivos do Léxico-Gramática. Considerando também que nesse quadro teórico- metodológico a descrição de um fenômeno linguístico é baseada em suas propriedades formais, é de extrema importância que a metodologia utilizada seja adequada para que a manipulação dos dados não seja feita de forma equivocada. Em consequência disso, o uso da introspecção associado à utilização de corpora revelou-se o mais conveniente e satisfatório método de coleta de informações para a realização deste estudo.

Por se tratar de um método empírico, no Léxico-Gramática a intuição do linguista e dos falantes nativos da língua é utilizada para observar os ambientes em que uma sequência seja natural e faça sentido. Segundo Laporte (2008, p.6), a informação compartilhada pelo linguista deve ser reprodutível, ou seja, seu julgamento deve ser reproduzido da mesma maneira por outros falantes.

Visto que a qualidade dos resultados depende da capacidade do linguista em prever exemplos construídos, existem precauções metodológicas a serem tomadas. Para melhorar a reprodutibilidade, é pertinente que se aplique testes distribucionais e transformacionais que reorientam a análise, visando obter resultados mais precisos e realistas. Esses resultados, sobretudo, dirão se uma sequência é aceitável e que pode ser reproduzida em um contexto linguístico significativo. Laporte (2015) evidencia a questão da aceitabilidade, contrastando-a

Procedimentos metodológicos 51 com a gramaticalidade gerativista, porém, essa ideia é irrelevante para o Léxico-Gramática, pois um dos seus objetivos é o de fornecer recursos para o processamento de linguagem natural, que por sua vez, necessita de informações aceitáveis e não apenas gramaticais.

Outra precaução metodológica para reprodutibilidade está ligada a avaliação diferencial dos sentidos, ou seja, a análise de uma frase deve ser feita comparando-a com outra frase e não isoladamente. Ainda, um treinamento contínuo através da análise de centenas de entradas lexicais e a publicação dos resultados, faz com que a informação linguística atestada por meio da introspecção seja mais real e transparente.

Apesar de todas as precauções metodológicas, o uso de corpora pode ser integrado ao trabalho para complementar o método introspectivo validando os resultados obtidos inicialmente. De acordo com Laporte (2015), somente a utilização de corpora para analisar os aspectos formais da língua não é o suficiente. Segundo ele, a introspecção é essencial, porém cada método pode ser eficiente para contrastar diferentes aspectos da realidade de uso de uma língua, e assim, gerar resultados mais completos.

O que pode ser considerado como um corpus nos dias atuais? Do mesmo modo que o Léxico-Gramática avançou por considerar o uso de corpora como um método complementar de análise, a definição de corpus também passou por mudanças nos últimos anos. A citação abaixo apresenta uma definição adequada para a atualidade.

Um corpus é uma coleção de textos de um idioma em formato eletrônico, selecionados de acordo com critérios externos para representar, na medida do possível, uma língua ou a variação da língua, como fonte de dados para a pesquisa linguística. (SINCLAIR, 2004)17

Para complementar, quando usado em um contexto da linguística moderna, um

corpus tende a ter uma significação mais especifica do que uma simples definição pode

fornecer, ao considerar quatro critérios: amostra e representatividade, tamanho finito, legível por máquina e referência padronizada (KILGARRIFF; GREFENSTETTE, 2003). Além disso, o formato eletrônico deu ao corpus diferentes formas de armazenamento e exploração, uma vez que as ferramentas computacionais permitiram que uma grande quantidade de textos fosse

17 Cf. original: ―A corpus is a collection of pieces of language text in electronic form, selected according to external criteria to represent, as far as possible, a language or language variety as source of data for linguistic research.‖ Disponível em: http://www.ahds.ac.uk/creating/guides/linguistic-corpora/chapter1.htm#section2.

Procedimentos metodológicos 52 processada em questão de segundos, fornecendo-lhe ao linguista respostas mais rápidas. 16981370370

Em alguns casos, neste em particular, a web pode ser usada, legitimamente, como um

corpus levando em conta o crescimento dos textos disponíveis em sites de busca e o livre

acesso a uma ferramenta de busca mais elaborada, o concordanciador WebCorp Live. Essa ferramenta permite o acesso à web voltado para buscar informações linguísticas que pode ser realizada de forma simples ou avançada18, a depender do que se espera alcançar com a busca.

Além do seu constante crescimento, o tamanho é mais uma vantagem que o linguista tem ao utilizar a web como corpus por englobar diferentes tipos de informações em diversas fontes mostrando também sua representatividade. Kilgarriff et. al. (2003) defende a web como

corpus, entre outros fatores, por ser um ambiente que fornece textos produzidos por uma

variedade de autores, por seu tamanho e por ser multilíngue, mas alerta que seu uso deve ser feito de maneira cautelosa.

Um dos cuidados que devem ser tomados diz respeito ao modo de como a busca deve ser feita para se obter o resultado esperado, pois a web não é um corpus limpo e por isso é preciso se atentar aos erros que podem ser encontrados durante a busca. Contextos insuficientes, estatísticas não confiáveis e remoção de páginas podem ser problemas a serem encontrados. Porém, ao utilizar a web com prudência e considerando sua multiplicidade, os resultados podem ser muito satisfatórios e confiáveis.

Ainda assim, seja para confeccionar ou para utilizar um corpus, a introspecção do linguista é essencial na decisão de forjar estruturas e julgá-las corretas para serem pesquisadas. Não obstante, o fato de um corpus garantir que as ocorrências de uma língua sejam autênticas, não exclui a introspecção no momento da sua manipulação. A atividade introspectiva, entretanto, ainda é alvo de críticas por ser julgada como uma forma não cientifica de obtenção de dados. Por esse motivo, os dados devem ser verificados em corpora, porém, a inexistência de uma determinada estrutura não significa que ela realmente não exista, o que evidencia a necessidade de se utilizar ambos os métodos de análise.

18 Pela busca simples é possível preencher a palavra de busca, selecionar o buscador (Google, Yahoo, entre outros), escolher entre palavras com letras maiúsculas ou minúsculas, escolher quantas palavras aparecem à direita e à esquerda da palavra de busca e escolher o idioma. Além dessas especificações, a busca avançada fornece a inclusão de domínios da web (br, pt, uk, entre outros) e a opção de se pesquisar em sites da mesma área ou tema relacionado à busca.

Procedimentos metodológicos 53

Benzer Belgeler