BÖLÜM 1: DIŞ TİCARET VE DÖVİZ KURU
1.5. Döviz Kuru Riskine Yol Açan Faaliyet Alanları
Inicialmente, os SAS de interesse foram alinhados por BlastN contra o genoma de sorgo (v2.1, www.phytozome.net) e, nos casos onde o SAS não continha a sequência completa do transcrito, o transcrito desta espécie com maior similaridade ao SAS foi utilizado como referência para mapear a localização e estimar o tamanho das UTRs e da ORF do SAS correspondente. Em seguida, os SAS foram alinhados por BlastN contra os contigs e
singletons obtidos pelo sequenciamento de BACs e whole genome shotgun da variedade de
cana-de-açúcar SP8032080, armazenados em sucest-fun.org/wsapp. Com o alinhamento múltiplo do SAS, transcrito de sorgo e contig do genoma, foi possível identificar nos contigs a sequência i ediata e teà à o ta teà daà -UTR do transcrito de cana-de-açúcar, que compreende o possível promotor. Para transcritos que apresentaram expressão do a tisse so,à ta à foià pes uisadaà aà se u iaà i ediata e teà à jusa teà daà -UTR do transcrito senso, a qualàse iaàoà -UTR do antissenso. O tamanho das sequências promotoras foi limitado em 1,5 kb e em alguns casos não foi possível identificá-las.
Os promotores foram então submetidos à análise para identificação dos cis- elementos específicos de parede celulares já caracterizados em outras espécies: SNBEs (Zhong et al. 2010), SMRE (Zhong & Ye 2012) e M46RE (Kim et al. 2012). Inicialmente, a matriz para busca dos cis-elementos foi gerada pelo programa TOMTOM (http://meme.nbcr.net/meme/cgi-bin/tomtom.cgi) que utiliza como input a sequência consenso do DNA e gera como resultado a matriz referente à sequência do input. As matrizes de cada cis-elemento geradas pelo TOMTOM foram utilizadas na ferramenta FIMO
(Grant et al. 2011), disponível online em http://meme.nbcr.net/meme/cgi-bin/fimo.cgi, para analisar as sequências promotoras em busca dos SNBEs, SMREs e M46RE, utilizando p<0,01.
3.16. Construção de bibliotecas de cDNA e seqüenciamento (RNAseq)
As bibliotecas de cDNA foram geradas em colaboração com a Life Techonologies (Carlsbad, CA, EUA). A partir de 1-2 mg de RNA total, os mRNAs com cauda poli-A foram isolados utilizando-se o FastTrack MG mRNA Isolation kit (Life Technologies). As bibliotecas
full length foram construídas com o SuperScript Full-Lenght cDNA Library Construction Kit
(Life Technologies) seguindo-se as instruções do fabricante com pequenas modificações. Resumidamente, a primeira fita de cDNA foi sintetizada utilizando-se o primer attB2-dT19 contendo uma sequência específica (barcode) para cada uma das cinco bibliotecas ao invés do primer padrão. Após a síntese de cDNA, um adaptador contendo o sítio de recombinação attB à foià ligadoà à e t e idadeà à doà DNáà pa aà pe iti à aà lo age à por recombinação (Gateway, Invitrogen). Quantidades iguais de cada biblioteca foram reunidas em uma única amostra para os procedimentos posteriores. A biblioteca física, clonada em E. coli, foi construída no vetor de entrada pENTR222 utilizando o sistema Gateway (Invitrogen), de acordo com protocolo do fabricante, que utiliza os sítios de recombinação attB1 e attB2, e posteriormente transferidas para vetor de destino pCMVSport6.1, também utilizando o sistema Gateway.
De cada amostra, foi utilizada uma alíquota de 10 µg de mRNA com cauda poli-A, isolado com o kit descrito acima, para a síntese da primeira fita de cDNA com o kit
SuperScript III (Life Technologies) e o primer oligo-dT21VN. Para enriquecer o cDNA full length, o híbrido mRNA:cDNA foi tratado com RNAse I, que degrada especificamente RNA
fita simples, seguido de seleção por anticorpo específico para a estrutura Cap- àdoà ‘Náà (Cap antibody selection, Life Technologies) de acordo com as instruções do fabricante.
A primeira fita de cDNA foi utilizada para o sequencimento no Ion Personal Genome
Machine (PGM). A biblioteca foi preparada utilizando-se o kit Ion-Total RNA-seq (Life
Technologies) de acordo com o protocolo versão 2 para preparo de bibliotecas para reads de 300 bases na plataforma PGM. As partículas monoclonais ion sphere particles (ISPs) foram produzidas e enriquecidas usando o sistema One Touch 2 seguindo-se o protocolo base Ion
PGM Template OT2 400. As ISPs fita molde positiva enriquecidas de cada uma das amostras
foram corridas no chip Ion 318 de acordo com instruções do fabricante, totalizando cinco corridas de sequenciamento.
Para o sequenciamento na plataforma Genome Sequencer FLX System (454), a segunda fita de cDNA foi sintetizada com o kit cDNA Synthesis (Life Technologies). O cDNA fita dupla enriquecido em full length foi sonicado utilizando-se o sonicador Covaris 220 para obter fragmentos de cDNA com tamanho entre 1 a 2 kb, os quais foram seqüenciados no 454 de acordo com as recomendações do fabricante. Foram utilizadas MIDtags para cada biblioteca e o sequenciamento realizado em três corridas; os reads de cada amostras foram separados posteriormente pelas sequências das MIDtags.
O sequenciamento dos insertos dos clones descrito na Tabela 21 foi realizado com o kit Big Dye Terminator 3.1 (Applied Biosystems) e o sequenciador automático ABI Prism 3100
Genetic Analyser (Applied Biosystems), de acordo com as instruções do fabricante. Os primers utilizados nas reações de sequenciamento foram o M13F e M13R. Os 30 clones
selecionados aleatoriamente e sequenciados foram analisados no programa BioEdit
Sequence Alignment Editor (Hall 1999) e posteriormente alinhados por BlastX contra os
http://www.phytozome.net/) e também contra banco de dados do NCBI (http://blast.ncbi.nlm.nih.gov/Blast.cgi).
Todas as análises dos dados de sequenciamento no 454 e PGM foram conduzidas pelo bioinformata Milton Yutaka. A primeira etapa foi a trimagem dos dados de sequenciamento, utilizando os parâmetros de qualidade Q<20 e tamanho da sequência L<70 para os reads do 454 e Q<15 com qualidade média mínima de Q<20, tamanho de sequência L<50 e poli-A/T para os reads do PGM, e para ambas as plataformas o filtro por sequências de baixa complexidade com método dust e valor de threshold < 7 e trimagem das pontas com qualidade Q<20, Poly-N's >= 5. A montagem dos contigs foi realizada com o programa Trinity (Grabherr et al. 2011) utilizando todos os reads do PGM e 454 e com tamanho mínimo do contig >= 200 pb e parâmetros default de sobreposição e identidade. Após a montagem, os contigs foram mapeados por BlastN contra 6 espécies de gramíneas (Zea
mays, Sorghum bicolor, Oryza sativa, Setaria italica, Panicum virgatum e Brachypodium distachyon) além do próprio SUCEST, utilizando critério de cutoff de e-value <= e-20. Nos
casos onde mais de um contig alinhava contra um mesmo gene de uma das gramíneas, a porcentagem de cobertura foi determinada somando-se a cobertura final com algoritmo para concatenar regiões separadas em uma região única.
Para identificação da origem de cada read, a ferramenta bowtie2 foi utilizada para mapear os reads do PGM nos contigs do Trinity, utilizando os parâmetros de alinhamento
sensitive-local e max penalty for mismatch = 6.
A análise de expressão utilizou o algoritmo RPKM, mapeando os reads do PGM contra os contigs para gerar um valor de expressão para cada contig em cada amostra. Os dados então foram analisados com o pacote RSEM para estimar os níveis de expressão dos genes e isoformas para os dados de RNA-Seq e os mais abundantes em cada amostra. Para
identificar os genes diferencialmente expressos em pelo menos um par de amostras com intensidade da expressão pelo menos 4 vezes (log2(4)=2) diferencialmente expresso com significância estatística corrigida para falsa descoberta de pelo menos 0,001. Os dados submetidos à análise de clusterização hierárquica dado o conjunto de transcritos diferencialmente expressos, extraídos os valores de expressão normalizado e agrupados por padrões de expressão entre as amostras nos parâmetros definidos acima.
A estratégia utilizada para a análise de antissenso foi mapear os reads de cada biblioteca com o software bowtie2 com parâmetro very-sensitive contra os genes das 6 espécies de gramíneas. Baseado no arquivo de mapeamento dos genes nos respectivos genomas (gff3), é extraída a informação da orientação do gene. Assim, se o hit de um read no gene for nas orientações forward/forward ou reverse/reverse este é considerado senso; se o hit for reverse/forward ou forward/reverse o read é considerado antissenso. Para o SUCEST, primeiramente foi criada uma matriz de codon-usage de cana-de-açúcar com auxílio do programa ESTScan para a predição das proteínas, gerando 42524 SAS únicos com predição, 66 predições duplicadas e 617 SAS sem predição. A orientação da ORF foi definida e seguiu-se análise descrita acima.
A anotação baseada no Gene Ontology (Ashburner et al. 2000) foi conduzida mapeando-se os reads do RNAseq contra o banco de dados do Gene Ontology (GO) com o
software blastX, critério de cutoff de e-value <= 1e-08 para identificar as categorias
4. RESULTADOS