• Sonuç bulunamadı

1. ANALIĞA İLİŞKİN DÜZENLEMELER

1.6. KISMİ SÜRELİ ÇALIŞMA HAKKI

A análise dos ecossistemas microbianos é atualmente um exercício taxonômico, que se utiliza de ferramentas experimentais para a obtenção de sequências de genes. A espécie é o elemento central da sistemática bacteriana, assim técnicas modernas se concentram em distinguir, de maneira eficiente, esta posição taxonômica.

Existem diversas técnicas de extração de DNA, sendo que ao final do processo todas isolam um peso muito rarefeito de macromoléculas de ácidos nucleicos, que são solvidas em um tampão de eluição (agua ultrapura ou uma solução TRIS-HCl de baixa molaridade). Devido a esta baixa recuperação há necessidade de amplificação destas macromoléculas. A técnica de PCR (Polymerase Chain Reaction) possibilita milhões de cópias de sequências alvo-específicas e/ou aleatórias. Os métodos indiretos de análise destes fragmentos amplificados são chamados de fingerprint ou ribotipagem, e possuem um baixo poder de resolução aos perfis gerados pelos fragmentos. Este perfil é dado por uma imagem em um gel de eletroforese. São chamados de indiretos, pois analisam bandas estabelecendo uma composição de comunidade. Tais bandas, comumente, não passam pelo processo de identificação taxonômica (MUYZER et al., 1993). As técnicas dependentes de PCR mais comumente utilizadas nos estudos de diversidade microbiana são (VANDAMME et al., 1996): DGGE - Denaturing Gradient Gel Electrophoresis; RAPD - Random Amplified Polymorphic; T-RFLP - Terminal-Restriction Fragment Length Polymorfism; TGGE - Temperature Gradient Gel Electrophoresis; ARISA - Automated Ribosomal Intergenic Spacer Analysis; RISA - Ribosomal Intergenic Spacer Analysis; SSCP - Single-Strand Conformational Polymorphism; ASDRA - Amplified Ribosomal DNA Restriction Analysis (Figura 3).

A técnica da PCR-DGGE, especialmente, se tornou um meio rápido de se comparar e estudar a estrutura de comunidade sem o uso de metodologias de cultivo. Investigando aspectos básicos de comunidades (COLARES & MELO, 2013). Tal técnica consiste na eletroforese de fragmentos de genes do rRNA 16S amplificados previamente por PCR, onde cada um dos iniciadores apresenta uma região rica em G+C (grampo GC) com uma sequência 5’-CGCCCGCCGCGCGCGGCGGGCGGGGCGGGGGCACGGGGGG-3’ (MUYZER et al., 1993). Este grampo tem o objetivo de impedir a desnaturação total da dupla fita do DNA durante a eletroforese, em gel de poliacrilamida contendo um crescente gradiente de desnaturantes (uréia e formamida). Os compostos desnaturantes rompem as pontes de hidrogênio entre os nucleotídeos, possibilitando a separação de fragmentos do mesmo tamanho, mas com composição nucleotídica diferente. Portanto a DGGE é baseada na mobilidade eletroforética da molécula de DNA parcialmente desnaturada no gel de poliacrilamida, resultando em diferentes fragmentos de DNA migrando no gel em posições diferentes. Os diferentes padrões de bandas gerados são característicos de cada comunidade (MUYZER et al., 1993).

Outras estratégias baseiam-se no sequenciamento dos ácidos nucleicos ou fragmentos amplificados, analisando sequências tanto das bibliotecas de clones, quanto das bibliotecas genômicas e de 16S rRNA (Figura 3). O sequenciamento permite uma análise direta das sequências, tendo um maior poder de resolução (MACLEAN et al., 2009). O método de

Sanger foi pioneiro, envolvendo a extração de DNA total, amplificação por PCR de genes de interesse, clonagem e posterior sequenciamento.

Além da biblioteca de clones ser muito trabalhosa, ela não consegue abranger toda a diversidade presente em uma amostra. Esses fatores limitantes incentivaram o desenvolvimento de novas tecnologias de sequenciamento, chamadas de “nova geração”, os quais permitiram reduzir os custos, evitar a clonagem, promover a miniaturização das reações, alto rendimento, e uma análise em profundidade dos micro-organismos ou genes funcionais presentes nos ambientes (MACLEAN et al., 2009; SINCLAIR et al., 2015). Dentre as plataformas de sequenciamento chamadas de nova geração ou segunda geração, duas são as mais utilizadas em todo o mundo: plataforma 454 (pirosequenciamento) da Roche; e as plataformas Solexa, MiSeq e HiSeq da Illumina. Dentre as técnicas de sequenciamento de segunda geração, as plataformas Illumina se mostraram mais eficientes que a técnica do pirosequenciamento 454, apresentando melhores resultados de uniformidade e correspondência, mesmo com os protocolos de preparação de biblioteca muito semelhantes (SINCLAIR et al., 2015). Todas essas tecnologias de nova geração promovem o sequenciamento de DNA em plataformas capazes de gerar informação sobre milhões de pares de bases em uma única corrida (MACLEAN et al., 2009).

Atualmente, já existem os sequenciadores de terceira e quarta gerações com sequenciamento de moléculas individuais em tempo real, e análise da cinética da polimerase, como o: Ion Torrent da Life Technologies; Nanopore da GridIon/MiniIon; e SOLiD System da Applied Biosystems.

Figura 3: Esquema do processamento genômico da amostra desde a extração até as técnicas de purificação e isolamento dos genes que possibilitam o estudo da composição e filogenética microbiana. Análises que formam bibliotecas genômicas são mais específicas quanto a sequência exata de nucleotídeos nos fragmentos de DNA, podendo chegar a análises mais profundas como a diversidade filogenética e funcional. Análises de fingerprint são adequadas para se identificar a estrutura da comunidade microbiota, com um perfil de bandas especifico a cada microbioma. Fonte: o próprio autor.

As técnicas citadas acima podem sequenciar bibliotecas de genomas inteiros e metagenomas. A metagenômica analisa a comunidade de microrganismos provenientes da extração do DNA total diretamente do ambiente e construção de uma biblioteca utilizando como substrato o genoma misto (DNA metagenômico) fragmentado aleatoriamente (shotgun). Sendo que grande parte destes genomas recuperados nem sempre estão descritos (OTUs). A obtenção de uma quantidade suficiente de DNA de alta qualidade, representando a comunidade microbiana inteira, é o primeiro passo na análise metagenômica de uma amostra ambiental (SINCLAIR et al., 2015). Estudos de diversidade taxonômica, diversidade funcional e de prospecção de genes e enzimas de interesse podem ser realizados em poucas horas devido à metagenômica associada aos métodos de sequenciamento de alto rendimento descritos acima (high throughput) (BEZERRA et al., 2015).

Tanto no sequenciamento pelo método de Sanger, quanto no sequenciamento das plataformas Illumina, ocorre a síntese de fragmentos a partir da DNA-polimerase e nucleotídeos terminadores marcados com diferentes fluoróforos. A inovação consiste numa superfície de clonagem in vitro dos fragmentos em uma plataforma sólida de vidro (flow cell).

Na plataforma MiSeq a flow cell possui uma linha, já na plataforma HiSeq possuem oito linhas que podem ser utilizadas para o sequenciamento de até oito bibliotecas.

O DNA é fragmentado aleatoriamente, sendo ligado a adaptadores em ambas as extremidades dos fragmentos. Em cada linha, os adaptadores são fixados à superfície pela extremidade 5’, deixando a extremidade 3’ livre para servir na iniciação da reação de sequenciamento dos fragmentos imobilizados no suporte por hibridização. As moléculas de DNA fita simples são aderidas por afinidade ao suporte sólido onde estão também aderidos, em alta densidade, oligonucleotídeos complementares aos adaptadores das extremidades do fragmento. Na etapa de anelamento, é formada uma estrutura em ponte, onde o adaptador da extremidade livre da molécula aderida ao suporte encontra seu oligonucleotídeo complementar também no suporte. Iniciando a PCR pela extremidade 3’ livre do oligonucleotídeo com o iniciador. Na etapa de desnaturação, a estrutura de ponte é desfeita mediante elevação de temperatura. Então se repete a etapa de anelamento, formando novas estruturas em ponte e iniciando um novo ciclo de amplificação. Entre as etapas, ocorre uma lavagem para remoção dos reagentes excedentes e remoção do terminal 3’ bloqueado e do fluoróforo do nucleotídeo incorporado no ciclo anterior (já lido por captação de imagem) para que a reação de sequenciamento prossiga. Após uma série desses ciclos, são gerados clusters de moléculas idênticas (clones de fragmentos) ligadas ao suporte. Devido à incorporação de nucleotídeos terminadores marcados com diferentes fluoróforos, a excitação a laser gera um sinal, o qual é captado (imagem) e interpretado. O processo de incorporação de nucleotídeo marcado, excitação e leitura é repetido para cada nucleotídeo componente da sequência. Até 50 milhões de clusters podem ser produzidos por linha, correspondendo a uma representação satisfatória da biblioteca A leitura é feita de forma sequencial, cerca de 25-35 são lidas em cada cluster, o que permite a montagem da sequência completa do cluster. (SHENDURE & JI, 2008; CARVALHO & SILVA, 2010; COLARES, 2014).

As plataformas de nova geração produzem um volume muito superior de dados de que o método de Sanger, porém os fragmentos são mais curtos, o que torna a montagem das sequências uma tarefa mais desafiadora (SHENDURE & JI, 2008). Este enorme volume de dados necessita de um robusto aparato de processamento. A bioinformática é a ciência que une as informações taxonômicas à montagem das sequências e assinala a taxonomia e ferramentas para análises de diversidade e estatística (análise dos dados), através de softwares e plataformas in silico. Os bancos de dados genômicos são fundamentais para a bioinformática e os agrupamentos filogenéticos adequados. Estes bancos podem ser particulares ou públicos. Uma colaboração internacional (INSDC - International Nucleotide Sequence Database Collaboration) une os três maiores e mais creditados bancos de dados genéticos públicos: o banco norte americano GenBank do NCBI (National Center for Biotechnology Information); banco japonês DDBJ (DNA DataBank of Japan); e o banco

inglês ENA (European Nucleotide Archive). Essas três organizações possuem dados de fragmentos (metagenomas) e genomas completos, ambos são conectados e trocam dados diariamente para todos os domínios da árvore da vida. Considerando apenas os microrganismos, os principais bancos de dados utilizados pelos programas de bioinformática são: GreenGenes - banco de dados 16S rRNA e de sequências quiméricas (DESANTIS et al., 2006); SILVA – banco de dados de genes ribossomais 16S e 18S (QUAST et al., 2012); OM- RGC - Ocean Microbial Reference Gene Catalog, banco gerado a partir do projeto Tara Oceans para fragmentos de rRNA apenas encontradas em amostras de agua salgada (SUNAGAWA et al., 2015); MBGD - banco de dados de microrganismos (UCHIYAMA et al., 2015). Existem também bancos de proteínas, os quais armazenas as sequências de DNA e RNA que codificam os aminoácidos que geram as cadeias proteicas.