• Sonuç bulunamadı

2.3. Yirmi Birinci Yüzyıl Becerileri

2.3.3. Yaşam ve kariyer becerileri

Inicialmente, é importante considerar que a expressão corpus, neste trabalho, está sendo referenciado a partir de duas perspectivas: em primeiro lugar, a Linguística de Corpus (em maiúsculo), como a área de pesquisa que “ocupa-se da coleta e da exploração de

corpora, ou conjunto de dados linguísticos textuais coletados criteriosamente, com o

propósito de servirem para a pesquisa de uma língua ou variedade linguística”

(SARDINHA, 2004, p. 3). E, segundo, na observação empírica de um corpus (em minúsculo), que representa “uma coletânea de dados linguísticos naturais [que existem na linguagem e

que não foram criados com o propósito de figurarem no corpus], legíveis por computador”

(SARDINHA, 2004, p. 16).

Há mais de quatro décadas foi lançado nos Estados Unidos o primeiro corpus linguístico eletrônico, o Brown43. Compilado pelos linguistas Henry Kucera e Nelson Francis,

43

A nomenclatura completa deste corpus é Brown University Standard Corpus of Present-Day American English.

esse corpus continha, em 1964, um banco de dados de um milhão de palavras selecionadas do inglês americano de uso corrente à época. Seu pioneirismo científico influencia, significativamente, a construção de outros corpora. O caráter inovador se destaca pela capacidade de coletar um considerável número de dados numa época em que os avanços tecnológicos estavam dando seus primeiros passos, conforme assevera Sardinha (2000). A informatização nesse período era feita através da transferência de dados por meio de cartões perfurados de forma individual. O conjunto de textos compilados era catalogado nestes cartões. Dessa forma, o processo de compilação realizava-se a partir desses recursos computacionais e, devido a certas limitações à época, esse tipo de trabalho experimentou grandes dificuldades.

No que diz respeito à relevância dos computadores para essa modalidade de pesquisa, o trabalho desenvolvido pela Linguística de Corpus está intimamente atrelado ao uso desses suportes tecnológicos (SARDINHA, 2004). Estes otimizam a compilação dos dados empíricos, ampliam o processo de armazenamento de quantidades maiores de informações, facilitam a rápida recuperação das palavras. Contudo, em uma época anterior ao início do processo de informatização dos dados empíricos, já se realizava o estudo investigativo para a compilação de corpus. Por iniciativa de Alexandre, o Grande, foi definido um corpus helenístico na Grécia Antiga. Citações bíblicas também foram compiladas na Antiguidade e na Idade Média, produzindo-se diversos corpora com o objetivo de descrever a linguagem (SARDINHA, 2004).

O caráter empírico da Linguística de Corpus é a principal característica da abordagem das teorias linguísticas44, que se baseiam na observação de dados provenientes da língua em

44 As teorias da linguagem discutidas por Sinclair, em 1966, e Halliday, em 1992, enfatizam que a língua possui uma função social, em que se gera um sistema que influencia e é influenciado pelos que estão a sua volta. A língua é considerada como um constructo, um sistema probabilístico, em que o falante realiza determinadas escolhas em detrimento de outras. Nesse sentido, o usuário pratica ações, que se relacionam às representações de mundo, à interação com os demais indivíduos no mundo e à organização da linguagem propriamente dita (GONÇALVES, 2010). Dessa maneira, a abordagem empírica e o conceito de sistema probabilístico da língua sedimentam o quadro conceitual dos estudos da Linguística de Corpus (SARDINHA, 2000)

uso. No tocante à concepção de linguagem, a língua está fundamentada em um sistema probabilístico. A abordagem empírica se opõe à racionalista representada pelas idéias de Chomsky. No racionalismo, o conhecimento sobre a língua provém de princípios gerativistas pré-estabelecidos e fundamentados pela determinação de quais construções sintáticas são gramaticalizáveis de acordo com seu funcionamento estrutural. Nesse quadro teórico, o trabalho do linguista é descrever e explicar o sistema linguístico a partir das possibilidades de gramaticalização da língua, considerando o processamento cognitivo do falante nativo. O processo de introspecção, quer dizer, o processamento intuitivo do indivíduo, determina a descrição da linguagem a partir de padrões linguísticos definidos.

Já em situações comunicativas, a abordagem empírica, fundamentada na observação de dados, apesar de reconhecer que certas características linguísticas são teoricamente possíveis, se sustenta na verificação da probabilidade de ocorrência de determinado traço. “A visão da linguagem como sistema probabilístico pressupõe que, embora muitos traços

linguísticos sejam possíveis teoricamente, não ocorrem com a mesma frequência”

(SARDINHA, 2004, p. 30-31). Desse modo, considera a frequência de ocorrência a partir da observação de amostras da linguagem em uso. Nessa perspectiva, a Linguística de Corpus analisa as amostras do falante nativo em situações comunicativas a fim de observar as possibilidades sistêmicas: “o pesquisador pode deparar-se com um mundo de informações e

fatos novos que não foram previamente hipotetizados por ele, revelando características da

língua com muito mais credibilidade” (GONÇALVES, 2010, p. 25).

Nesse sentido, a abordagem empírica se distancia da abordagem racionalista no modo em que se detém sobre os dados para analisá-los, direcionando o foco do estudo na observação das evidências linguísticas compiladas pelo corpus, no qual este se presta a “validar, exemplificar ou construir uma teoria da linguagem” (GONÇALVES, 2010, p. 30). Nessa perspectiva, coexistem duas vertentes linguísticas que se contrapõem, porém atuam

paralelamente: a perspectiva da linguagem enquanto estrutura e a perspectiva da linguagem enquanto uso. O estudo da Linguística de Corpus, integrando uma análise probabilística da língua, tenta contribuir para a reflexão do seu funcionamento.

Segundo Oliveira (2005, p. 43), ancorado nas hipóteses de Sardinha (2000), está claro que “não se deve entender que há uma total ruptura entre corpus e intuição, mas que ambos

podem servir, em maior ou menor grau, de base em um mesmo tipo de pesquisa” (grifo do

autor). Dessa forma, os fundamentos da Linguística de Corpus se baseiam no desempenho linguístico do falante nativo, na descrição linguística e na visão empírica na pesquisa cientifica (SARDINHA, 2000).