Os Algoritmos genéticos são muito conhecidos na realização de uma pesquisa global ao analisar várias soluções do espaço de busca em cada iteração, como já foi detalhado na seção 3.1. Estes algoritmos trabalham com a representação de indivíduos, onde cada indivíduo representa uma solução para o problema a ser resolvido. O indivíduo é representado por um vetor de 8 posições, como ilustrado na Figura 4.3, representando os termos Vn e γ da Equação 2.8.
Figura 4.3. Representação do indivíduo do Algoritmo Genético da primeira parametrização.
A escolha dessa representação foi baseada na tabela de torção [20] que informa que para a torção da ligação glicosídica existem 4 periodicidades. Dessa forma pre- cisaríamos de 4 barreiras torcionais (Vn) e 4 fases (γ), totalizando 8 variáveis para o
cálculo da energia. Como os valores que elas assumem são valores reais achamos mais coerente trabalhar com a representação numérica ao invés da binária.
O procedimento de busca padrão do AG é mostrado na Figura 4.4. No primeiro passo, uma população inicial de indivíduos é gerada aleatoriamente, seguindo uma distribuição normal com média 0 e desvio padrão definido como 1. Em seguida, os indivíduos são avaliados de acordo com o quão bem eles resolvem o problema em questão. Como os nossos indivíduos são parâmetros de torção, são avaliados de acordo com o quanto distante a energia da mecânica molecular EM M (obtida por Tinker com
os parâmetros otimizados AG) está da energia quântica EQM (obtido por GAMESS).
O RMSE (já definido na Eq. 4.3) será a função de fitness definida pelo AG. Quanto menor o RMSE, melhor é a aproximação do campo de força. Entretanto, o AG irá otimizar os parâmetros (para o AGN e AGW) a fim de minimizar o RMSE.
Na estrutura do AG mostrada na Figura 4.4, após a avaliação os indivíduos são selecionados para realizar operações de cruzamento e mutação de acordo com as suas probabilidades chamadas de pc (probabilidade de cruzamento) e pm (probabilidade de
mutação). O método de seleção torneio é utilizado no AG implementado neste trabalho [40]. Este procedimento foi detalhado na seção 3.1.2.2 do Capítulo 3. O indivíduo com a melhor fitness (neste caso, menor RMSE), é selecionado. Note que os indivíduos com maior aptidão têm maior probabilidade de sobreviverem, e essa probabilidade varia de
Figura 4.4. Fluxograma do Algoritmo Genético, onde pc e pm são as probabili-
dades de cruzamento e mutação, respectivamente.
acordo com o tamanho de indivíduos (k) do torneio.
Os indivíduos selecionados através de vários torneios consecutivos poderão ser modificados usando o operador de cruzamento ou de mutação, antes de serem inseridos na nova população. O cruzamento utiliza dois indivíduos (pais), e seu principal objetivo é a troca de material entre eles, levando a criação de dois filhos.
A mutação por sua vez, tem como objetivo causar uma pequena modificação ale- atória no indivíduo, a fim de deixar uma estagnação local na região de busca (ótimo local). A mutação usada aqui muda o valor de cada parâmetro selecionado aleatoria- mente por um valor de +(-) 0,02.
Todos os indivíduos gerados pela Figura 4.4 são inseridos em uma nova população, juntamente com o melhor de todos os indivíduos, o que é preservado de uma geração para a seguinte (procedimento conhecido como elitismo). Este processo continua até que um critério de parada seja atendido, o que geralmente é um erro mínimo ou o número máximo de gerações.
É importante observar que o algoritmo usa um conjunto de parâmetros, que são: número de indivíduos, número de gerações, probabilidades de cruzamento e de muta- ção e tamanho do torneio. Uma escolha adequada destes parâmetros é fundamental para uma boa cobertura do espaço de busca. O número de indivíduos e gerações são parâmetros altamente dependentes do tamanho do espaço de busca e determinados por problemas ainda pouco estudados. Foi testado o tamanho das populações de 50,
100, 150 e 200, e gerações de 200, 500 e 800. Muitas combinações foram testadas, e os melhores resultados obtidos são com 200 indivíduos e 800 gerações, pois atingiram a convergência esperada.
As probabilidades de cruzamento e mutação têm valores padrões, com altas ta- xas de cruzamentos e taxas de mutações baixas. Foram testadas probabilidades de cruzamentos 0,9 e 0,95, e as taxas de mutações de 0,01, 0,1, 0,2, 0,25 e 0,3. Todas as combinações possíveis foram testadas, e os melhores resultados obtidos foram 0,95 e 0,3 para cruzamento e mutação, respectivamente. Para o tamanho do torneio, os valores de 8, 10, 20 e 30 foram testados, com 8 apresentaram os melhores resultados. Todos os parâmetros testados foram executados cinco vezes, pois o algoritmo genético é um método heurístico. No final os melhores resultados foram selecionados assumindo os mesmos critérios do parágrafo anterior.
4.2
Modelo do Sistema II
A mesma metodologia da segunda abordagem (AGW) foi utilizada nessa segunda re- parametrização realizada na ligação fósforo diéster com o objetivo de melhorar ainda mais a precisão do campo de força. Dessa forma, essa nova parametrização irá focar na eficácia dos parâmetros do termo torcional na torção fósforo diéster para represen- tar o RNA. Devido a metodologia aplicada nessa segunda parametrização ser muito parecida com a primeira, então será destacado apenas nas diferenças entre as duas parametrizações.
Preparação da base de dados Os dados desse sistema foram obtidos no mesmo banco de dados do sistema I, porém ao invés de isolar as bases nós a retiramos e inserimos dois grupos metoxi no lugar delas, pois a ligação glicosídica já teria sido parametrizada (primeira reparametrização), e com isso os cálculos se tornam mais rápidos do que se fossem realizados com as bases do RNA. A inserção dos hidrogênios ocorreu também da mesma forma que no sistema I, porém foi necessário adição de mais hidrogênios com o objetivo de neutralizar a molécula.
Depois da preparação o segundo modelo que servirá de dado de entrada, na Figura 4.1, para os cálculos quânticos é composto por duas unidades de açúcares ligados pelo grupo fosfato (ligação fósforo diéster) e dois grupos metoxi ligados via ligação glicosídica (ver Figura 4.5), simulando um dinucleotídeo.
Como se pode observar na Figura 4.5 a molécula possui seis combinações de ângulos rotacionais (α, β, γ, δ, ε e ζ). Porém, para os nossos testes preliminares apenas o ângulo α foi o escolhido [6]. A diferença em relação à primeira molécula é que
Figura 4.5. Molécula utilizada como entrada. O ângulo torcional parametrizado é definido pelos átomos OH-P-OS-CT (ângulo de torção α da ligação fósforo diéster).
agora vamos reparametrizar dois nucleotídeos ligados por um grupo fosfato, além da ausência dos quatro nucleotídeos, pois nessa nova reparametrização não necessitamos otimizar a ligação glicosídica, visto que já a temos otimizada.
Os métodos para se obter os perfis de torção, realizar os cálculos quânticos e de mecânica molecular são os mesmo realizados para o sistema I, como já foi citado acima.