referem-se ao índice de afinidade (affinity score) da conformação mais estável identificada dentre as diferentes conformações, tautômeros e protômeros estudados para um mesmo composto químico.
A classificação dos contatos foi utilizada para incorporar relativa flexibilidade, devido a preferência por perfis de interação ligante-alvo distintos, na seleção de arquivos PDB. Esta abordagem incorpora maior dispersão nos resultados e esta deve ser avaliada, uma vez que mesmo pequenas mudanças de conformação do sítio de ligação podem causar grandes mudanças no índice de afinidade.
Foram eliminados os resultados negativos obtidos, considerando inativo, os compostos com número de resultados positivos menor que 2. Resultados negativos indicam que a conformação assumida pelo sítio ativo do receptor no arquivo pdb não se apresenta adequada para a ancoragem do ligante (composto químico de interesse), e podem ocorrer até mesmo quando se avalia somente compostos ativos ou que apresentam resultados experimentais indicando alta afinidade ao receptor. Ao contrário, o maior resultado na ancoragem ligante-alvo, representa a melhor ou mais provável conformação assumida pela estrutura química do ligante e do sítio de ligação na interação ligante-alvo.
Foram tratados estatisticamente os dados (índice de afinidade) obtidos de arquivos protomol que apresentaram resultados válidos (resultados positivos) para pelo menos 30% dos triterpenos pentacíclicos estudados. Também foi calculado o desvio padrão médio (desvio padrão amostral) dos resultados válidos obtidos para ancoragem molecular de um mesmo par ligante-alvo.
52 Foi aceito como melhor resultado calculado por Surflex para cada par ligante-alvo, o maior valor de índice de afinidade dentre os resultados válidos obtidos.
A identificação da conformação mais provável é uma componente adicional a estimação da incerteza global do estudo de ancoragem molecular. Esta componente está relacionada a precisão do processo de previsão do índice de afinidade (affinity score) para moléculas de estruturas distintas, em condições de precisão intermediária.
Uma das medidas utilizadas nesta avaliação de qualidade dos resultados de ancoragem é o desvio quadrático médio (RMSD) na orientação nos eixos X, Y, Z na posição dos átomos na conformação indicada pela ferramenta como a mais provável e a orientação espacial dos átomos do mesmo ligante definida em arquivo cristalográfico. A superposição da conformação obtida no estudo de ancoragem molecular (processo de busca conformacional) com o existente nas estruturas cristalográficas demonstra o quão próximo do real a previsão se apresenta. Foi calculado o RMSD para os arquivos pdb de estruturas cristalográficas utilizadas no trabalho. Para o cálculo de RMSD foi utilizado o software Surflex 2,11, que determina as diferenças entre a conformação ancorada e a estrutura cristalográfica usando a comparação átomo a átomo das duas estruturas. Segundo Holt e colaboradores (2008), valores de RMSD inferiores a 2,5 Å (em angstrons) representam alto grau de superposição e orientação relativa da conformação proposta com a conformação na estrutura cristalográfica (de menor energia). Assim, os resultados foram analisados para avaliar qual o percentual de resultados satisfatórios foi obtido na identificação das conformações mais prováveis (RMSD < 2,5 Å).
A função de score do software Surflex classifica as poses (conformações) por um índice de afinidade (Affinity Score) que se equivale (é proporcional) ao logaritmo da constante de dissociação (pKd) (Jain, 2003; Hold, 2008).
A capacidade de produzir resultados coerentes, do modelo de ancoragem molecular utilizado, foi avaliada através da comparação e correlação com resultados de testes in vitro e in vivo disponíveis nas bases de dados BindingDB, PDBBind e BindMoad.
Para identificação TTPCs mais promissores a cada um dos alvos estudados, foi utilizada a classificação dos dados em probabilidade de ser ativo e de ser inativo.
Foram ancorados compostos ativos aos alvos estudados e seus resultados de índice de afinidade foram utilizados na determinação da “probabilidade de ser ativo” (Pa). A probabilidade calculada do TTPC ser ativo (Pa), representa a posição relativa do resultado do mesmo em relação aos resultados de índice de afinidade obtidos para os compostos ativos.
53 Foram ancorados, todos os compostos existentes no base de ligantes em todos os alvos da base de alvos construída. Os resultados de ligantes não ativos a um determinado alvo, foram utilizados para a determinação da “probabilidade de ser inativo” (Pi) para os TTPCs estudados. A probabilidade calculada de um TTPCs ser inativo (Pi), representa a posição relativa de seu resultado em relação aos resultados de índice de afinidade obtidos para compostos considerados inativos.
Quanto maior for Pa, maior a probabilidade do TTPCs ser ativo. Quanto maior Pi, maior a probabilidade do TTPCs ser inativo. Por exemplo: um TTPC que obteve Pa=0,75, apresentou resultado de índice de afinidade maior que 75% dos compostos ativos estudados. Ao contrário, um TTPC que obteve Pi=0,75, apresentou resultado inferior a 75% dos compostos inativos avaliados.
Os resultados de Pa e Pi foram apresentados na forma de índice, ou seja, divididos pelo nº total de compostos ativos e inativos, respectivamente. Na Figura 4.7 foi apresentado um modelo que exemplifica a comparação da dispersão dos resultados dos compostos ativos e inativos e o processo de decisão.
Figura 4.7 – Modelo adotado de análise de dados usando os valores de Pa e Pi.
No modelo apresentado na Figura 4.7, podemos observar que o composto A apresentou índice de afinidade superior a 10% dos compostos ativos e inferior a 60% dos compostos inativos estudados. O composto A apresenta Pa-Pi inferior a zero o que indica a maior probabilidade do composto ser inativo. O composto B apresentou resultado de índice de afinidade superior a 30% dos compostos ativos e inferior a 30% dos compostos inativos, neste caso Pa-Pi = 0,3 - 0,3 = 0 indica baixa probabilidade de ser ativo. Analisando os resultados obtidos para o composto C, observamos que ele apresenta índice de afinidade superior a 60% dos compostos ativos e inferior a apenas 10% dos compostos inativos, indicando alta
54 probabilidade de ser ativo (Pa-Pi > 0). Foram avaliados neste trabalho os resultados de Pa e de Pa-Pi obtidos para os compostos TTPCs frente aos alvos estudados.
Esta estratégia de análise se insere nas abordagens de “Big data”, e se apresenta como uma alternativa a dificuldade de correlação entre resultados experimentais e resultados de experimentos in silico (Filimonov, 2008; Filimonov, 2014).
A incerteza de precisão dos resultados obtidos pela abordagem ensemble docking, utilizando diferentes arquivos protomol para um mesmo alvo estudado, pode ser estimada pelo desvio padrão da média (desvio padrão amostral) de medições repetidas, dividido pela raiz do número de medições realizadas de acordo com a Equação 2 (Montgomery, 2011; Eurachem, 2000). Na Equação 2 é apresentada a equação utilizada na combinação dos dados para obtenção da incerteza relativa desta componente em condições de reprodutibilidade. Equação 4.2 – Estimativa da incerteza relativa para n medições de cada ligante-alvo.
2 1 1 . 1 m x n n n urelativa
m i = n Onde n = número de medições por par ligante-alvo e σm representa o desvio padrão médio (desvio padrão amostral) dos resultados para um mesmo par ligante-alvo.
A incerteza expandida do resultado de cada para ligante-alvo foi calculada, através do produto da incerteza relativa e um fator de abrangência igual a 2 (dois) (95% de confiança).
Os resultados de incerteza e de desvio padrão amostral possibilitam análise da dispersão dos resultados válidos e possibilita avaliar a dispersão dos resultados de índice de afinidade obtidos para os diferentes pares ligante-alvo.