Por meio da aplicação da ferramenta WordList, na leitura do Corpus de Estudo, observou-se que cada um dos TOs apresentou um número de itens superior a seu respectivo TT. Mas, em contrapartida, os TTs revelaram uma quantidade superior de formas, em relação a cada um dos TOs. Essa diferença registrou uma Razão forma/item superior nos TTs, fato que leva a pensar em uma maior diversidade lexical nas traduções e um possível indício de explicitação de conceitos e referências culturais, por meio de mais palavras diferentes (BERBER SARDINHA, 2009). O recorte realizado para a composição do corpus de análise da AFE&P também registrou essa mesma variação.
Munday (2002), na análise de um corpus paralelo espanhol/inglês, também identificou entre os resultados uma razão forma/item superior nos TTs, em contraste com os TOs. Já em pesquisa anterior, Munday (1998) obteve um primeiro resultado diferente, com
103
uma razão forma/item menor no TT. Após considerar as diferenças sistêmicas entre as línguas espanhola e inglesa, e por meio da remoção dos pronomes pessoais, geralmente omitidos em espanhol, e de recursos como a lematização manual de formas flexionadas, Munday observou uma inversão da razão forma/item do texto traduzido, que passou a ser maior que o TO, sugerindo uma variedade lexical maior.
No caso do espanhol e do português, embora existam diferenças em seus sistemas linguísticos, trata-se de línguas neolatinas, portanto, mais próximas em função da mesma origem. Saldanha (2005) aponta a estreita relação entre essas línguas. Assim, a expectativa é que a razão forma/item seja mais consistente que aquela encontrada por Munday, no contraste entre as línguas espanhola e inglesa. Berber Sardinha (2004, p. 94) aponta que ―na prática, a razão forma/item indica a riqueza lexical do texto‖.
Especificamente no âmbito da tradução e analisando ―tendências de larga escala passíveis de observação em textos traduzidos‖, Berber Sardinha (2009, p. 58-59) assinala três índices, entre os fatores determinantes da presença de Explicitação nos TTs, se comparados aos TOs: (1) textos mais extensos, (2) vocabulário maior e (3) maior número de orações ligadas por conjunções. Segundo Berber Sardinha (ibidem), esses três índices seriam decorrentes da tentativa de o tradutor ―explicitar conceitos e referências culturais do texto original‖.
Rodrigues (2010, p. 93) apresenta em tabela os dados estatísticos de sua pesquisa de doutoramento, em que a pesquisadora compara três traduções do conto Bliss, de Katherine Mansfield, feitas da língua inglesa ao português brasileiro, e outras três traduções desse mesmo original feitas ao espanhol europeu. Os dados de Rodrigues também corroboram a presença de uma diversidade lexical maior nos TTs em ambas as línguas neolatinas, com uma leve superioridade para a língua espanhola.
Embora num corpus de extensão menor, os dados estatísticos mostrados por Magalhães (2005, p. 228), na análise de duas traduções do conto La continuidad de los
parques, do escritor argentino Julio Cortázar, feitas do espanhol rio-platense ao português
brasileiro e ao inglês, também revelaram uma Razão forma/item maior no TT ao português e mais próxima do TO no TT ao inglês. Também Pagano (2005, p. 273-274) destaca essas diferenças entre TT e TO, reveladas ao comparar o número de itens e o número de formas, na análise de duas traduções do conto Espantos de agosto, do escritor colombiano Gabriel García
104
Márquez, feitas do espanhol ao português e ao inglês. Nesse estudo, as diferenças também resultaram num número superior de formas no TT, na tradução da língua espanhola para a língua portuguesa.
A Tabela 3.1, a seguir, ilustra a relação em que se constata a razão forma/item superior nos TTs, se comparados aos TOs, no Corpus de Estudo e no recorte realizado para a Análise da AFE&P. Também são incluídos na tabela os resultados da significância estatística (coluna p-valor), no contraste quantitativo das diferenças observadas entre cada um dos TOs e TTs.
Tabela 3.1: Dados estatísticos do Corpus de Estudo e do Corpus de Análise da AFE&P Corpus Itens Formas Razão forma /
item (%) Razão forma/item padronizada (%) p-valor Es tu d o ET_Sabato 31.741 5.183 16,33 45,26 0,0040 ET_Molina 30.635 5.259 17,19 47,31 ADF_Sabato 31.379 7.099 22,68 50,33 0,0000 ADF_Molina 29.815 7.348 24,72 54,13 LR_Sabato 20.474 4.643 22,80 46,70 0,0000 LR_Molina 19.599 4.811 24,70 50,43 A n ál is e da A F E& P ET_Sabato 9.445 2.412 25,54 45,04 0,0720 ET_Molina 9.120 2.431 26,70 46,97 ADF_Sabato 9.108 2.875 31,65 49,60 0,0000 ADF_Molina 8.761 3.028 34,67 53,56 LR_Sabato 9.452 2.572 27,36 45,98 0,0005 LR_Molina 9.063 2.672 29,66 49,40
Como se observa na Tabela 3.1, o comportamento dos TTs em relação aos TOs se mostra semelhante nos três pares linguísticos: um menor número de itens, porém um número de formas superior. Essas diferenças resultaram estatisticamente significativas, uma vez que o valor de p foi menor que 0,05, tomado como nível de confiança, com a única exceção do recorte para análise da AFE&P em ET_Sabato/Molina, que registrou um valor superior a 0,05. Esses resultados, em que a significância estatística das diferenças foi comprovada, rejeitam a hipótese de o resultado haver ocorrido por acaso.
A partir desse fato, surge a hipótese de uma linguagem possivelmente mais variada nos TTs que compõem o corpus, já formulada em diversos trabalhos que analisaram traduções, principalmente para a língua inglesa, no âmbito dos ETBC. Desse modo, essa característica pode-se configurar, também, como uma peculiaridade dos textos traduzidos
105
analisados nesta pesquisa e como um indício de explicitação, seja de conceitos, seja de referências culturais (BERBER SARDINHA, 2009).
Por exemplo, os termos ―acintosa‖ e ―bricabraque‖ traduzem, respectivamente, ―ostentosa‖ e ―cambalaches‖ em A resistencia, nas seguintes frases:
¿Creen que es posible seguir mirando por televisión el horror que padece la pobre gente a la par que la frivolidad ostentosa y corrupta, entremezclada como en el peor de los cambalaches? (03A)
Vocês acham que é possível continuarmos a assistir pela televisão ao horror que sofrem os pobres a par da frivolidade acintosa e corrupta, tudo misturado como no mais sórdido bricabraque? (03B)
Ambas as palavras registraram uma única ocorrência nos TTs e, ora explicitam um conceito, no caso o da ―frivolidade‖, que passa a ser entendida como de má intenção, ora especifica uma referência cultural, o do ―bricabraque‖, que indica uma mistura de objetos de proveniências e épocas diversas32.
A partir dos resultados obtidos com a ferramenta WordList, a quantidade de itens menor, em todos os TTs, aponta para a simplificação, já a quantidade maior de formas revela um indicativo de explicitação, conforme os índices propostos por Berber Sardinha (2009). Isto é, a hipótese da explicitação é sustentada pelo traço da variedade lexical (número de formas), mas não pelo índice da extensão dos textos (número de itens). Em outras palavras, o tradutor parece simplificar, se considerada a extensão dos textos, mas utiliza uma linguagem mais variada, se considerado o número das formas, provavelmente com o intuito de explicitar referências e tornar os textos mais acessíveis para seus leitores.
Contudo, a interpretação desses dados deve ser cuidadosa, uma vez que, por um lado, o corpus não foi lematizado e, por outro lado, a maior diferença registrada entre os pares de TOs e TTs no Corpus de estudo, em termos percentuais, esteve na ordem dos 2%, em ADF, representando exatamente 249 palavras diferentes a mais do que no TO correspondente. De qualquer modo, o cálculo estatístico confirmou a significância dessas diferenças. Ainda que as línguas espanhola e portuguesa apresentem formas de conjugação e flexão morfológica muito parecidas – se comparadas, por exemplo, à língua inglesa – deve-se observar que as variações decorrentes dos usos dados em uma ou em outra língua poderão apresentar uma maior ou menor frequência nas ocorrências de determinados termos, mas que esses não serão
32
106
exatamente os termos que justificarão as diferenças observadas acima, em relação à variedade lexical.
Por exemplo, os pronomes pessoais sujeito da 1ª pessoa do singular ―yo‖ (espanhol) e ―eu‖ (português) aparecem no corpus com uma frequência aproximadamente 46% superior nos TTs (476 ocorrências contra 259 nos TOs). Independentemente dessa diferença na frequência, uma vez que ambos os termos ocorrem nos TOs e nos TTs, não são elementos atrelados às diferenças mencionadas no contraste da razão forma/item. Já no caso das contrações, existentes em número superior na língua portuguesa, se comparadas à língua espanhola, trata-se de itens gramaticais que desencadearão um número maior de formas nos textos em língua portuguesa, e que justificarão parte das diferenças, mas não sua totalidade. Em português, além da preposição ―em‖, por exemplo, e do artigo definido ―o‖, ainda existe a forma contrata ―no‖. A língua espanhola apenas registra as contrações ―del‖ (preposição de + artigo el) e ―al‖ (preposição a + artigo el). Desse modo, cada uma das contrações diferentes, presentes em cada um dos TTs, representará uma forma que não será correspondente a um termo único independente nos TOs.
Com o intuito de analisar mais de perto as diferenças observadas a partir da razão forma/item, procedeu-se à comparação entre a quantidade dos hapax legomena, formas de frequência 1, isto é, que apresentaram uma única ocorrência, no subcorpus de TOs, por um lado, e de TTs, por outro. O procedimento consistiu em eliminar, nas listas de palavras de cada um dos subcorpora, todas as formas que registrassem acima de uma ocorrência. Desse modo, nas listas ficaram apenas os hapax legomena.
A Tabela 3.2 apresenta os dados em números absolutos e a relação entre as formas de frequência 1 com o total dos itens , das formas em porcentagens e também com o cálculo da significância estatística entre as diferenças das proporções:
Tabela 3.2: Itens, Formas e Hapax Legomena
Subcorpus TOs Subcorpus TTs p-valor
Itens 83.594 80.049 -
Formas 12.119 12.567 -
Hapax Legomena 6.797 7.299 -
Razão Hapax/Itens 8,13% 9,12% 0,0000
107
Na tabela anterior, observa-se que do contraste entre os hapax dos subcorpora de TOs e de TTs resulta uma diferença de 502 formas com única ocorrência, no conjunto das traduções. Esse fato sustenta a hipótese de uma linguagem mais variada nos TTs, ainda levando em consideração que o corpus não foi lematizado, e que, dadas as similitudes morfológicas das línguas espanhola e portuguesa, os efeitos da lematização se aplicariam em ambas as línguas de modo bastante parecido. Também o resultado do cálculo estatístico confirmou a significância dessas diferenças, tanto entre os hapax e os itens como entre os
hapax e as formas, apontando uma variedade lexical maior nos TTs.
Considerando o caráter exploratório do presente trabalho e adotando uma abordagem guiada pelo corpus, espera-se poder observar, entre outros aspectos, se a hipótese de uma maior variedade lexical, formulada nesta pesquisa a partir da razão forma/item entre TOs e TTs, também será confirmada por meio do levantamento, análise e comparação das listas de palavras-chave. Esses aspectos serão retomados, no quarto capítulo desta tese, assim como também o cotejo estrito das palavras lexicais e das gramaticais entre os subcorpora, atrelado a indícios de explicitação nos TTs.