• Sonuç bulunamadı

1.3.8.1. Análise dos dados para os genes mitocondrial e nucleares

A caracterização do polimorfismo (identificação dos haplótipos, freqüências relativas, número de sítios polimórficos, distâncias genéticas) do citocromo b, do íntron 1 da RAG1 e do gene nuclear S7 (exceto a identificação de todos os haplótipos) foi conduzida por meio dos programas MEGA versão 4.0 (Tamura et al., 2007), DNASP 4.10 (Rozas et al., 2003) e/ou Arlequin (Excoffier et al.,2005). A polaridade das árvores filogenéticas foi

determinada por comparação com grupo externo (Nixon e Carpenter, 1993) com seqüências homólogas de Pseudoplatystoma sp e Brachyplatystoma sp.

Desvios da premissa de neutralidade seletiva foram estimados pelos testes D de Tajima (Tajima, 1989), F* e D* (Fu e Li, 1993) e Fs (Fu, 1997), presentes no programa DnaSP 4.10. (Rozas et al., 2003). Quando a hipótese nula de neutralidade é rejeitada em favor de um Fs significativo, os resultados podem estar indicando ocorrência de expansão popuacional recente (Fu, 1997; Schneider e Excoffier, 1999). Os testes de neutralidade de D* e F* são mais sensíveis à seleção e, ao serem comparados com os valores de Fs, podem auxiliar na distinção entre expansão populacional e “background selection”. Valores de Fs significativos e D* e F* não significativos indicam expansão demográfica, enquanto que o caso contrario sugere que os efeitos da seleção são mais pronunciados. A distribuição das diferenças nucleotídicas pareadas entre indivíduos (“mismatch distribution”) foi calculada como um teste adicional para inferências de expansão populacional (Rogers e Harpending, 1992) utilizando o programa DnaSP. Populações estáveis geralmente apresentam gráficos com padrões de curvas bi- ou multimodales, emquanto que, curvas unimodais são frequentemente observadas em populações que sofreram expansão demográfica recente (Rogers e Harpending, 1992; Harpending, 1994). A soma do desvio dos quadrados (SSD), que verifica a existência de desvio entre as curvas observadas e esperadas da “mismatch distribution” dentro do modelo de expansão populaional foi calculada usando o programa Arlequin.

Uma rede de haplótipos que ilustra as interações filogenéticas entre os haplótipos observados foi estimada utilizando o programa network (Fluxus Technology Ltd.).

A história evolutiva foi inferida por meio de uma árvore de neighbor-joining (software DNAsp). Indels foram considerados apenas para a árvore do primeiro íntron da RAG1 e do gene S7. As análises foram todas feitas no MEGA versão 4.0 (Tamura et al. 2007). O suporte para os nós foi avaliado por bootstrap (1000 pseudo-réplicas) (Felsenstein, 1985) e interpretados segundo Hall (2001), que considera um valor igual ou superior a 90-95% para que um agrupamento seja considerado como significativamente apoiado, independentemente da repetibilidade.

1.3.8.2. Análise dos dados para a caracterização populacional com microssatélites

Para as análises baseadas em microssatélites foram utilizados os locos prospectados e validados neste estudo.

1.3.8.3. Caracterização da variabilidade genética

Com a finalidade de se avaliar a variabilidade genética em cada uma das localidades estudadas foram calculados dados sobre o equilíbrio de Hardy-Weinberg (p≤ 0,05), que tem como hipótese nula a união aleatória de gametas, avaliado por meio de um teste análogo ao exato de Fisher (Guo e Thompson 1992), sendo a significância de “p” calculada pelo método da cadeia de Markov-Monte Carlo, utilizando-se o programa GENEPOP 3.4. Com o mesmo software também foram calculadas as freqüências alélicas, heterozigosidades esperadas e observadas, assim como a presença de desequilíbrio de ligação o qual é calculado por meio de tabelas de contingência para cada par de locos, utilsando-se o Fisher exact test para estimar se os genótipos de um loco é independente do outro loco em termos de freqüência de ocorrência. O mesmo programa foi utilizado para verificar a presença de desequilíbrio de ligação. O programa cria tabelas de contingência para cada par de locos, realiza um teste de probabilidade (ou teste exato de Fisher) para cada tabela e pela cadeia de Markov são estimados os valores de P que indicam se as freqüências genotípicas entre os dois locos são independentes.

As estimativas de riqueza alélica (Petit et al. 1998), e os valores de diversidade gênica (Nei, 1987) foram obtidos por meio do programa FSTAT (Goudet, 2001). Estes parâmetros são independentes do tamanho amostral, e por isso podem ser comparados mesmo entre amostras de diferentes tamanhos, ao contrário dos valores obtidos com a heterozigosidade e do número de alelos, a diversidade gênica e a riqueza alélica

Em todas as análises múltiplas efetuadas foi considerada a correção seqüencial de Bonferroni (Rice 1989).

A diferenciação populacional foi estimada pelos índices de fixação de Wright FIS e FST

para cada loco entre as populações com a utilização do programa FSTAT.

O coeficiente de endocruzamento (FIS) (Weir e Cockerham, 1984) para cada loco entre

as populações foi calculado partindo da hipótese nula de união aleatória de gametas. A proporção de valores de FIS presentes nesta distribuição que foram maiores que o valor

observado (PL) nos indica se há ou não um déficit de heterozigotos. Ao contrário, a proporção de valores de FIS menores que o valor observado (PS) nos indica se há excesso de

heterozigotos.

A diferenciação genética entre as populações estimada por meio do FST foi realizada

conforme Weir e Cockerham (1984). Tal estimativa se baseia no modelo de alelos infinitos (Infinite Alleles Mutation) (Kimura e Crow, 1964), para seus cálculos recriando populações de genótipos para verificar se os valores diferem significativamente de zero. Nesse modelo cada mutação sempre cria um novo alelo a uma determinada taxa de mutação (μ) e conseqüentemente não admite homoplasia. A significância dos valores encontrados foi avaliada por meio das randomizações implementadas no próprio programa.

Foi utilizado o FST, pois além de ser o índice mais utilizado para estimar a distância

genética entre populações de peixes (O’Connell eWright, 1997), é o mais indicado para estudos com amostras de tamanho moderado a pequeno (menor que 50) e que utilize menos do que 10 locos.

A existência de diferenciação significativa quanto à distribuição gênica e genotípica entre as populações foi verificada com a utilização do software FSTAT. Para se testar a hipótese nula de que a “distribuição alélica ou genotípica é idêntica entre as populações” tabelas de contingência são construídas e no caso da diferenciação gênica, é utilizado o teste exato de Fisher e para a diferenciação genotípica o teste G (Goudet et al., 1996) é utilizado, e os valores de “p” estimados pela cadeia de Markov.

A estrutura populacional baseada nos genótipos dos indivíduos foi examinada usando o procedimento Bayesiano modelo-baseado, implementado no software Structure, 2.1 (Pritchard et al., 2000). Por meio deste programa é possível a determinação do número de populações genéticas (K) com base nos genótipos fornecidos (X) sem que sejam dadas informações prévias sobre os locais de origem dos indivíduos analisados. Essas populações são clusters com distintas freqüências alélicas.

Simultaneamente é realizado um assignment test onde os indivíduos são direcionados probabilisticamente a um ou a mais de um cluster quando as populações são geneticamente misturadas. Por meio da cadeia de Markov- Monte Carlo (período de burn-in 100.000, 1.000.000 réplicas) foram testados modelos com K=1, 2, 3, e 4 populações, replicados por dez vezes, assumindo o modelo de mistura e com frequências alélicas correlacionadas.