Existe um paradigma no estudo de proteínas que fala da relação que existe entre a sequência de uma proteína e a sua estrutura tridimensional, devido a que uma proteína pode realizar corretamente sua função biológica só em um único estado de enovelamento, o qual é efetivamente determinado pela sequência de aminoácidos. (110) Deste modo, conhecer a estrutura tridimensional de uma proteína fornece informação importante para inferir sua função dentro da célula.
A dificuldade para determinar experimentalmente a estrutura de uma proteína, enfatizada pela discrepância entre o número de sequencias obtidas com projetos de genomas e o número de estruturas disponíveis no PDB, motivou aos pesquisadores na criação de métodos computacionais para a determinação (predição) da estrutura delas, apenas a partir das suas sequências. Nas últimas décadas foram desenvolvidas diversas metodologias para a predição da estrutura de proteínas, dentro delas a modelagem comparativa ou modelagem por homologia que é uma das mais utilizadas pela rapidez, precisão e fidelidade na predição da estrutura. (111) A modelagem por homologia constrói um modelo teórico para a estrutura da proteína comparando a sequência da proteína de interesse com uma proteína relacionada evolutivamente e que apresenta a sua estrutura tridimensional conhecida (template). Portanto o pré-requisito para esta metodologia é uma proteína
homóloga com estrutura caracterizada previamente por métodos experimentais. (112) Por estas proteínas serem relacionadas evolutivamente (portanto homólogas), a estrutura da proteína de interesse é similar à estrutura do template (com o qual os aminoácidos na nova estrutura ocuparão posições equivalentes e em geral compartilharão ambientes físico-químicos parecidos). (113) Os passos básicos para obter a estrutura de uma proteína por modelagem por homologia estão descritos na figura 18.
Uma vez que a modelagem é baseada na similaridade de sequências de aminoácidos, a porcentagem de identidade entre as sequência a ser modelada e a sequência do template pode ser utilizada como indicador da qualidade do modelo esperado, sendo que: 50% de identidade nas sequências permite obter modelos com alta precisão, onde o erro entre as cadeias principais do modelo e o template
Figura 18 - Passos para a predição da estrutura de uma proteína utilizando modelagem por homologia. Fonte: Adaptada de BISHOP et al. (125)
varia aproximadamente 1 Å (RMSD), entre 30 – 50% de identidade são obtidas estruturas com precisão média, onde o 90% da cadeia principal do modelo presenta um desvio de 1,5 Å sobre o molde e finalmente com menos do 30% de identidade são obtidas estruturas com baixa precisão. (114) Com isto, estruturas modeladas com alta precisão podem ser utilizadas para o desenho de fármacos, screening virtual de fármacos e para planejamento de mutagêneses sitio dirigida. Por outro lado, modelos obtidos com baixa precisão podem ser utilizados para reconhecimento de topologias e assinação de famílias proteicas. (115)
Um dos principais focos de estudo do nosso grupo é entender as bases estruturais que determinam a especificidade na montagem de um filamento de septinas, isto é, quais interações são especificas para cada uma das diferentes interfaces (G e NC) que estão presentes num filamento corretamente montado. Em vista da ausência de uma estrutura de um heterocomplexo com o detalhamento suficiente para analisar esta especificidade, modelagem por homologia para as diferentes interfaces G de septinas, uma vez que o objetivo do trabalho é entender os determinantes estruturais da interface G entre SEPT5 e SEPT8, foram feitas em colaboração com a doutoranda Sabrina Matos de Oliveira da Silva. Interfaces G tanto canônicas quanto não canônicas (não baseadas nas regras de Kinoshita) foram estudadas. Uma vez que as interações não canônicas não obedecem às regras de Kinoshita, e não serem esperados fisiologicamente, representam um controle negativo no experimento.
De tal modo, foram alinhados os domínios GTPase das 13 septinas humanas com SEPT10 de Schistosoma mansoni (SmSEPT10, template) com o programa
Jalview 2.8.2 e utilizando o algoritmo de alinhamento do ClustalW. Este alinhamento
foi refinado utilizando a sobreposição das estruturas cristalográficas disponíveis (2QNR, 3T5D, 3SOP e 4KV9). Para preservar os elementos de estrutura secundária nas septinas, os gaps presentes dentro das sequências de aminoácidos pertencentes a hélices α e folhas β foram removidos e transferidos para as sequências pertencentes a loops usando um ajuste manual. Uma vez feito o alinhamento, os resíduos totalmente característicos para cada grupo de septinas foram identificados. Um resíduo característico para um grupo é definido como sendo conservado em todas as septinas pertencentes ao grupo mas ausente das septinas
dos demais grupos. O raciocínio para identificar resíduos característicos para cada grupo nasce das regras de Kinoshita, porque é esperado que contatos importantes para a especificidade nas interfaces sejam conversados entre os membros dos grupos. Desta forma, uma septina qualquer possa ser substituída por outra do mesmo grupo sem perder o contato na interface.
SEPT2, SEPT6, SEPT7 e SEPT9 foram escolhidas como septinas representantes para cada um dos grupos (grupos III, II, IV e I respectivamente) levando a 10 possíveis interfaces do tipo G. Assim, cinquenta modelos para cada uma das dez diferentes combinações (segundo a tabela 8) foram gerados usando o programa Modeller 9.14, utilizando como template SmSEPT10-GTP (4KVA) e
SmSEPT10-GDP (4KV9). SEPT2, SEPT7 e SEPT9 foram modeladas no complexo
com SmSEPT10 ligada a GDP (porque são catalíticamente ativas) e SEPT6 com
SmSEPT10 ligada a GTP (porque é catalíticamente inativa).
Tabela 8 - Combinações canônicas (✔) e não canônicas (X) de septinas.
Fonte: Elaborada pelo autor.
A optimização dos modelos foi feita com um Variable Target Function Method
(VTFM) seguida de um simulated annealing. Para incluir todas as restrições de
distância tanto para a cadeia principal quanto para as cadeias laterais, valores padrões foram utilizados. O resultado da modelagem foi avaliado em termos da pseudo energia usando as opções DOPE e GA341 do MODELLER. A estereoquímica foi avaliada com Procheck, o ambiente dos resíduos com Verify-3D e os contatos atômicos com What_check. Finalmente os resíduos característicos
SEPT2