• Sonuç bulunamadı

2. DA-DA KONVERTÖRLER

2.2 Anahtarlama Modlu Güç Kaynakları

A utilização dos n-gramas é estatística e fundamental para o conhecimento da quantidade de unidades que compõem os topônimos e gentílicos da nossa lista.

Observem-se as composições dos nomes oficiais no Gráfico 5.

Gráfico 5 - Composições em n-gramas dos nomes de cidades brasileiras

Fonte: elaborado pelo autor

Unigramas (2904) 52,14% Bigramas (1278) 22,94% Trigramas (767) 13,77% Tetragramas (564) 10,13% Pentagramas (52) 0,93% Hexagramas (4) 0,07% Heptagramas (1) 0,02% 0 500 1000 1500 2000 2500 3000 3500

Excluem-se nesta subseção, portanto, os topônimos unigramas pelo fato de eles possuírem somente uma unidade que receberá o sufixo, ou seja, eles podem ser explicados somente pela análise derivacional (cf. subseção 4.1) – fenômeno comum a todos. O topônimo Louveira (SP), por exemplo, têm seu gentílico louveirense, sendo formado somente por um radical e um afixo. Mais da metade dos topônimos (52%) recebe a sufixação diretamente, sem que uma ou outra unidade seja menos ou mais privilegiada. Nos quadros do decorrer desta subseção, serão demonstradas as preferências na escolha da base que irá receber o sufixo para o caso dos topônimos formados por lexias complexas.

Ao excluirmos os unigramas, sobram os n-gramas, que são os formados por mais de uma palavra, como por exemplo: São Carlos (bigrama), Palmeiras de Goiás (trigrama), Bela Vista de Minas (tetragrama), Conceição da Barra de Minas (pentagrama), São João do Rio do Peixe (hexagrama) e São José do Vale do Rio Preto (septagrama).

Para tentar entender se há ou não um padrão na escolha da base que receberá o sufixo, criamos a seguinte tipologia dos topônimos constituídos por lexias complexas:

Lexias complexas formadas com numeral cardinal; Lexias complexas formadas com adjetivos;

 Lexias complexas formadas com nomes de pessoas ou de santos;

 Lexias complexas formadas com pronomes de tratamento, títulos de nobreza ou nomes de cargo/função.

Abaixo, seguem-se os Quadros 3, 4, 5 e 6, com exemplos ilustrativos das tipologias acima, estando os sufixos assinalados com cores diferentes.

Quadro 3 - Topônimos constituídos por lexias complexas formadas com numeral cardinal e seus respectivos gentílicos

Gentílicos cuja base é o ultimo elemento da lexia (bigramas)

Gentílicos cuja base é formada por todos os elementos da lexia

(bigramas)

Gentílicos cuja base é formada por dois elementos, excluindo-se a

preposição (trigramas)

Gentílicos cuja base é formada pelos dois primeiros elementos

da lexia (tetra e pentagramas)

Dois Riachos →

riachense Dois Vizinhos → dois-vizinhense Dezesseis de Novembro → dezesseis-novembrense Dois Irmãos das Missões → dois- irmãosense

Buriti → buritiense irmãosense setembrense Tocantins → doisirmanense

Sete Barras →

barrense Três trirranchense Ranchos → Treze de Maio → treze-maioense Três Barras do Paraná → tribarrense

Três Corações →

tricordiano Quinze de Novembro → quinze-novembrense Santa Rita do Passa Quatro → santa-ritense Três Pontas → três-

pontano Dois Irmãos das Missões → dois-

irmãosense Três Lagoas → três-

lagoense

Três Rios → Trirriense Passa Quatro → passa- quatrense

Quatro Barras → quatro- barrense

Quatro Irmãos → quatro- irmanense

Passa Sete →

passassetense

Sete Lagoas → sete- lagoano

Fonte: elaborado pelo autor e pela orientadora

Quadro 4 - Topônimos constituídos por lexias complexas formadas com adjetivo e seus respectivos gentílicos Gentílicos cuja base é formada por todos os elementos da lexia (bigramas e trigrama). O sufixo se agrega ao adjetivo: Gentílicos cuja base é formada por todos os elementos da lexia (bigramas e trigrama). O sufixo se agrega ao nome: Gentílicos cuja base é formada pelo primeiro elemento da lexia (bigramas e trigramas). O sufixo se agrega ao nome: Gentílicos cuja base é formada pelos dois primeiros elementos da lexia (tetragramas). O sufixo se agrega ao adjetivo ou ao nome: Gentílico cuja base é formada pelo último elemento da lexia. O sufixo se agrega ao nome: Gentílico cuja base é formada pelos dois últimos elementos da lexia (tetragrama). O sufixo se agrega ao adjetivo: Mar Vermelho → mar- vermelhense Alto Santo →

alto-santense Breu Branco → breuense Rancho Alegre d'Oeste → rancho- alegrense Baixo Guandu → guanduense Palmas do Monte Alto → monte-altense Ouro Branco → ouro- branquense Alto Horizonte → alto horizontino Capela do Alto Alegre → capelense Água Doce do Maranhão → aguadocense Rio Branco →

jequitibaense coqueirense pretano Cerro Azul →

cerro-azulense Bom Jesus → bom-jesuense Cachoeira Grande → cachoeirense Nova Esperança do Sudoeste → novaesperancen se Céu Azul →

céu-azulense Boa Ventura → boa- venturense

Cabeceira Grande → cabeceirense Barro Alto →

barro-altino Urbano Santos → urbano- santense Casa Grande → casa- grandense Nova Londrina → nova- londrinense Pinheiro Preto → pinheirense Lagoa Grande → lagoa- grandense Campo Magro → campomagren se Campos Verdes → campo- verdense Campo Largo → campo- larguense

Fonte: elaborado pelo autor e pela orientadora

Quadro 5 - Topônimos constituídos por lexias complexas formadas com nome de pessoas e de santos e seus respectivos gentílicos

Gentílicos cuja base é formada por todos os elementos da lexia,

excetuando-se, às vezes, a preposição (bigramas e trigramas)

Gentílicos cuja base é formada apenas pelo primeiro elemento da lexia (bigramas e

trigramas)

Gentílicos cuja base é formada apenas pelo último elemento da lexia

(bigramas, trigramas e tetragramas)

Gentílicos cuja base é formada apenas pelos dois primeiros

elementos da lexia (tetragramas)

Augusto de Lima →

augusto-limense Anísio de Abreu → anisiense João Pessoa → pessoense Santa Helena de Goiás → santa- helenense

Licínio de Almeida →

licínio-de-almeidense Casimiro de Abreu → casimirense José de Freitas → freitense Santa Rita de Caldas → santa-ritense Carlos Gomes → carlos-

gomense Cristiano cristianense Otoni → Júlio de Castilhos → castilhense Santo Antônio de Jesus → santo- antoniense

Elói Mendes → eloi-

mendense Delfim delfinense Moreira → Mendes pimentelense Pimentel → Santa Maria de Jetibá → santa-mariense João Lisboa → joão- Magalhães de Almeida → Nossa Senhora de Nazaré

lisboense magalhense → nazareno Lauro de Freitas →

lauro-freitense Oliveira de Fátima → oliveirense Santa filomenense Filomena → Paulo de Faria → paulo-

fariense Peixoto de Azevedo → peixotense São Francisco de Assis → assisense Rolim de Moura →

rolimorense Plácido de Castro → placidiano São João dos Patos → patoense Santa Helena → santa-

helenense Prudente de Morais → prudentino São José de Ribamar → ribamarense São Carlos → são-

carlense Teixeira de Freitas → teixeirense São leopoldense Leopoldo → Cândido de Abreu →

cândido-abreuense Trejano de Morais → trejanense São Tomás de Aquino → aquinense São Domingos → são-

dominguense

Fonte: elaborado pelo autor e pela orientadora

Quadro 6 - Topônimos constituídos por lexias complexas formadas com pronomes de tratamento, títulos de nobreza e nomes de cargo/função

Gentílicos cuja base é formada por todos os elementos da lexia, excetuando-se, às vezes, a

preposição (bigramas e tetragramas)

Gentílicos cuja base é formada apenas pelos dois últimos elementos da

lexia (trigramas e tetragramas)

Gentílicos cuja base é formada apenas pelo último elemento da lexia

(bigramas, e trigramas)

Casos específicos

Dom Pedro → dom-

pedrense Capitão Leônidas Marques → leônidas-marquesiense Conselheiro Mairink → mairinquense Senador ModestinoGolçalve s → modestinense Dom Pedro de Alcântara

→ dom-pedro-

alcantarense

Governador Nunes Freire

→ nunes-freirense Coronel Fabriciano → fabricianense Senador Betense → senabetense Dom Viçoso → dom-

viçosense Visconde do Rio Branco → rio-branquense Dona euzebense Eusébia → Engenheiro Coelho →

engenheiro-coelhense Doutor severianense Severiano →

Frei Rogério → frei-

rogeriense Duque de Caxias → caxiense

Major Sales → major-

salense Frei miguelinhense Miguelinho →

Monsenhor Gil →

monsenhorgilense General mainardense Maynard →

Governador Valadares → valadarense

Marechal Cândido Rondon → rondonense

Monsenhor Paulo → paulense

Presidente Juscelino → juscelinense

Fonte: elaborado pelo autor e pela orientadora

Como podemos observar em todos os Quadros, de 3 a 6, os critérios para a escolha da base que receberá o sufixo gerador de gentílico não é preciso. Possivelmente, a motivação de escolha da base para sufixação pode ser originária de algum fator externo38 à

estrutura linguística que tivemos como objeto de análise. Além de a lista estudada ser muito extensa, as variações são enormes e, por isso, não foram devidamente descritas a ponto de serem analisadas neste trabalho. No entanto, podemos também observar certa adequação sonora, que faz com que uma construção (composição) pareça mais agradável aos ouvidos do que outra, influenciando na formação dos gentílicos.

No entanto, os topônimos compostos, embora sejam somente 48% da lista do IBGE, são responsáveis por formar gentílicos unigramas. No Gráfico 6 a seguir, podemos observar os tipos de formação de gentílicos tomando como critério o tamanho das formações (em n-gramas).

38 Regionalismo ou apelido frutos, por exemplo, de algum tipo de variação geotrópica, diatópica, diagenérica, diacrônica, etc.

Gráfico 6 - Formações dos gentílicos brasileiros a partir de n-gramas

Fonte: elaborado pelo autor

Podemos observar que 76% dos gentílicos não são compostos nem por meio de espaços, muito menos por meio de hifenização. Com relação aos topônimos compostos, observamos que, no momento de se tornarem gentílicos, um de seus elementos torna-se a base que vai receber a derivação sufixal, embora não seja possível prever qual base será essa, como já comentamos acima. Aproximadamente 52% dos topônimos são unigramas e cerca de 76% dos gentílicos também, o que nos mostra uma certa tendência à simplificação quando os topônimos são transformados em gentílicos. Por exemplo, muitos dos topônimos tetragramas tornaram-se gentílicos trigramas, bigramas ou unigramas, assim como muitos trigramas ou bigramas perderam algum de seus elementos. Como exemplo, temos: (bigrama) Coronel Fabriciano (MG) → fabricianense; (trigrama) Marechal

Cândido Rondon (PR) → rondonense; (tetragrama) São Francisco de Assis (PI) →

assisense; etc.

Há casos em que uma unidade constituinte de um topônimo também forma Não compostos (4227) 75,89%

Bigramas (1172) 21,04%

Trigramas (151) 2,71%

Tetragramas (19) 0,34%

parte de outro topônimo de uma cidade próxima e uma das cidades adota um gentílico a partir da derivação de outro componente de seu nome: Anadia (AL) → anadiense,

Limoeiro de Anadia (AL) → limoeirense. Porém, quando muito distantes, são possíveis

dois gentílicos idênticos: Prudente de Morais (MG) → prudentino, Presidente Prudente

(SP) → prudentino. Parece-nos que muitas das variações motivadoras dos gentílicos estão

associadas a variações diatópicas em nível lexical, caracterizando certa dificuldade de implementar computacionalmente esses elementos. A história do Brasil é muito rica e o seu território possui dimensões continentais, não nos permitindo examinar as causas que motivam essas variações de forma definitiva.

Resumindo:

 embora existam padrões de combinação das lexias complexas, não há regularidade na escolha da base que receberá o sufixo fruto da derivação morfológica, impossibilitando assim a formação de regras que compreendam os topônimos compostos;

 aproximadamente 75% dos gentílicos são unigramas, ou seja, pressupomos que os 52% dos topônimos unigramas se mantiveram como unigramas e alguns n-gramas perderam alguns elementos da sua composição;

 como pudemos observar, quando há cidades com nomes parecidos em proximidades, os gentílicos adotados parecem ser diferentes para haver uma desambiguação.