Contrastando com os corpora paralelos, há os corpora comparáveis. Baker (1995:234) define corpora comparáveis como duas coletâneas de textos na mesma língua: uma delas composta com textos originais da língua em questão e a outra com textos traduzidos para esta mesma língua, cobrindo domínio, variedade de linguagem e período de tempo similares, além de ter tamanho comparável.
Baker (1996), concentrando-se nos universais de tradução, pressupõe algumas características de tradução que podem ser estudadas por meio de corpora comparáveis, como, por exemplo, tendência à explicitação ou simplificação nos textos traduzidos quando comparados com textos não
traduzidos, ou o uso mais convencional da linguagem em textos traduzidos, indicando uma normalização.
Segundo Olohan (2004:38), a utilização de corpora comparáveis permite o estudo do processo de tradução a partir do produto. A identificação de traços que emergem em textos traduzidos pode ser baseada na comparação com textos da língua alvo.
No nosso estudo, compilamos um corpus chamado ‘corpus de base’, que é uma amostra retirada de um corpus de língua geral do português, o Banco de Português, para compará-lo com o texto traduzido no intuito de saber se os tamanhos do vocabulário de ambos são aproximados.
O corpus de base foi criado devido a fato de que as línguas inglesa e portuguesa morfologias diferentes, não sendo, portanto, possível uma comparação direta entre número de types das duas línguas. Por exemplo, um substantivo no inglês e’ flexionado em termos de plural apenas (possuindo dois types possíveis, por exemplo: cat, cats), enquanto no português ele se flexiona em gênero, número e grau (possuindo pelo menos doze types: ‘gato’, ‘gata’, ‘gatos’, ‘gatas’, ‘gatão’, gatões’, ‘gatinho’, ‘gatinhos’, ‘gatinha’, ‘gatinhas’, ‘gatona’, ‘gatonas’). Como o type-token ratio é computado a partir das formas exibidas no texto (e não das formas lematizadas, o que seria possível, mas não perfeito, visto que os lematizadores muitas vezes apenas substituem o plural pelo singular, mas não normalizam os casos de aumentativo e diminutivo ou de masculino e feminino), não se pode comparar a quantidade de formas do texto em inglês com as do texto em português, pois haveria distorção. Por isso, precisamos comparar o texto traduzido a textos em língua portuguesa, para que seja respeitada a morfologia das línguas em questão. Entretanto, o TTR também e’ sensível ao tamanho do corpus, por isso não podemos comparar corpora de tamanhos diferentes, visto que, conforme dito, corpora maiores possuem TTRs menores e
vice-versa. Tendo em mente todas essas restrições, foi preciso criar um corpus de comparação que chamamos de ‘corpus de base’ para servir como ponto de comparação do tamanho do vocabulário do texto traduzido. Dessa maneira, foi criado um corpus com dimensões semelhantes ao corpus de estudo para que pudéssemos descobrir em que medida a tradução se aproxima ou se afasta do que consideramos como base para a língua portuguesa em termos de tamanho.
A comparação dos dois corpora em termos de tamanho de vocabulário se fundamenta em duas premissas.
A primeira, é o universal da estabilização. Este universal prevê que textos traduzidos apresentam características diferentes daqueles escritos originalmente na LA. Portanto, o tamanho do vocabulário do texto traduzido comparado a um texto original pode indicar a presença da estabilização.
Em segundo lugar, nas discussões sobre a liberdade humana no exercício da linguagem. A observação de Stubbs (1996:56 apud Hoey, 2005:8), de que “os falantes são livres, mas apenas dentro de determinados limites [...] A reprodução do sistema é o produto não intencional do comportamento rotineiro do falante”, encontra complemento em Biderman (2001:10):
“[...] os condicionamentos da fala e da estrutura da língua impõem ao indivíduo um complexo mecanismo de automação no exercício da linguagem. Mais ainda: sendo a língua uma instituição herdada, o indivíduo não cria o sistema convencional de comunicação que recebeu por herança e adotou desde a infância, inconscientemente. [...] O ato de comunicação falada e escrita tem, pois, essas duas faces paradoxais: as coerções impostas pelo sistema lingüístico e a liberdade relativa que tem o sujeito de servir-se dos elementos constitutivos da língua. Em alguns níveis do sistema lingüístico, a liberdade poderá exercer-se um pouco mais (domínio sintático e léxico), em outros será consideravelmente reduzida (domínio morfológico) e, por fim, poderá ser quase nula (domínio fonético)”
Sabendo-se que a liberdade individual no uso da linguagem é circunscrita, a comparação da tradução com o corpus de base do português deve revelar se o tamanho do vocabulário de ambos os texto é aproximado.
Encerramos aqui a seção de Fundamentação Teórica, cujos conceitos serão retomados durante a descrição da Metodologia e Análise dos Dados.
CAPÍTULO 2: Metodologia
Este capítulo é destinado à descrição da metodologia utilizada para este estudo. Aqui também serão descritos os corpora especialmente compilados, os métodos de coleta e os critérios para seleção e análise dos itens pesquisados.
Remetendo-nos ao início deste trabalho, o objetivo da pesquisa é descrever características lexicais de uma tradução por meio da comparação entre dois textos, o original e a tradução de um livro premiado, no intuito identificar como o tradutor explorou o repertório da língua portuguesa e produziu um texto fluente.
Escolhemos trabalhar com uma tradução premiada porque desejávamos encontrar, de modo sistemático, características de uma tradução premiada que revelassem a expertise do tradutor. Além disso, supõe-se que a tradução foi produzida por um profissional experiente, que fez um uso adequado e fluente da língua portuguesa, podendo proporcionar uma análise que mostre a excelência e o comportamento de um tradutor experiente reconhecido pela comunidade acadêmica.