• Sonuç bulunamadı

İkili Ve Çoklu Hizalama (BLAST)

N/A
N/A
Protected

Academic year: 2021

Share "İkili Ve Çoklu Hizalama (BLAST)"

Copied!
41
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

İkili Ve Çoklu Hizalama

(BLAST)

(2)

• Bir gen ya da protein ile ilgili en temel sorulardan biri başka bir gen ya da protein ile ilişkili olup olmadığıdır.

• Birbirleri ile ilişkili olan proteinler aynı zamanda aynı fonksiyona da sahip olabiliriler.

• İlişkilendirme analizleri sekansları hizalayarak gerçekleştirilir.

(3)

• Protein sekans hizalamaları DNA sekans hizalamalarına kıyasla daha bilgilendiricidir.

• Protein sekans kıyaslamaları 1 milyar yıl önce ortak soy paylaşmış homolog sekansları belirleyebilirken DNA

sekansları 600 milyon yıl öncesine uzanabilmektedir.

• DNA sekans hizalamaları polimorfizm ve cDNA klonu araraken ya da primer spesifisitelerini kontrol etmek için kullanılır.

(4)

Homoloji, Benzerlik (similarity) ve Aynılık (Identity)

• Eğer sekanslar ortak evrimsel bir soydan geliyorlarsa bu sekanslar homologdur.

– Ortolog’lar türlerin evrimi sırasında ortaya çıkan ortak soydan gelen genlerdir. Farklı türlerdeki homolog sekanslardır (insan myoglobin geni ve fare myoglobin geni ya da insan ve farede bulunan alpha hemoglobin geni)

ortho=exact

– Paralog’lar gen duplikasyonu gibi bir mekanizma ile ortaya çıkan homolog sekanslardır (insan alpha-1 globin ve alpha-2 globin, alpha ve beta hemoglobin).

para=in parallel

(5)

• Protein sekanslarının %25’i benzer ise homolog olarak adlandırılırlar.

• DNA için %70 benzerlik gereklidir

• %25’in altı “alacakaranlık kuşağı” olarak

adlandırılır”

(6)
(7)

• Identity is the extent to which two amino acid or nucleotide sequences are invariant.

EVGGYLSEDKLH * * *

EVGGHLAEDKIH

• Similarity is being related structurally or functionally.

Homoloji, Benzerlik (similarity) ve

Aynılık (Identity)

(8)

İkili Hizalama: Temel noktalar

• İkili hizalama iki sekans arasındaki benzerlik ya da aynılık yüzdesini belirlemeye yardım eder.

• İkili hizalama %100 benzerlikler için pozitif değerler ile skorlanırken, eşleşmeme ve boşluklar farklı skorlanırlar.

• PAM and BLOSUM matrices provide a set of rules for

assigning scores. PAM10 and BLOSUM80 are examples of matrices appropriate for the comparison of closely related sequences. PAM250 and BLOSUM30 are examples of matrices used to score distantly related proteins.

(9)

BLAST

BLAST (Basic Local Alignment Search Tool)

Bir sekans sorgusunun bir veritabanı ile kıyaslanmasını sağlar.

BLAST algoritması hızlı, güvenli ve web üzerinden ulaşılabilirdir.

page 87

(10)

Why use BLAST?

BLAST searching is fundamental to understanding the relatedness of any favorite query sequence

to other known proteins or DNA sequences.

Applications include

• identifying orthologs and paralogs

• discovering new genes or proteins

• discovering variants of genes or proteins

• investigating expressed sequence tags (ESTs)

• exploring protein structure and function

page 88

(11)

BLAST Taramasının 4 Bileşeni

(1) Sekans seçimi (sorgu)

(2) BLAST programının seçimi (3) Veritabanı seçimi

(4) Opsiyonel parametrelerin belirlenmesi “BLAST”

page 88

(12)
(13)

Step 1: Sekans seçimi

Sekanslar FASTA formatında ya da accession numarası olarak girilebilirler

page 89

(14)

Example of the FASTA format for a BLAST query

(15)

Step 2: BLAST programının seçimi

(16)

Step 2: BLAST programının seçimi

blastn (nucleotide BLAST) blastp (protein BLAST)

tblastn (translated BLAST) blastx (translated BLAST) tblastx (translated BLAST)

page 90

(17)

DNA potentially encodes six proteins

5’ CAT CAA 5’ ATC AAC 5’ TCA ACT

5’ GTG GGT 5’ TGG GTA 5’ GGG TAG

5’ CATCAACTACAACTCCAAAGACACCCTTACACATCAACAAACCTACCCAC 3’

3’ GTAGTTGATGTTGAGGTTTCTGTGGGAATGTGTAGTTGTTTGGATGGGTG 5’

(18)

Choose the BLAST program

Program Input Database

1

blastn DNA DNA

1

blastp protein protein

6

blastx DNA protein

6

tblastn protein DNA

36

tblastx DNA DNA

(19)
(20)
(21)
(22)
(23)
(24)

BLASTing DNA Sequences

(25)

Different BLAST Programs Available for DNA Sequences

Program Query Database Usage

blastn DNA DNA Very similar DNA sequences tbalstx TDNA TDNA Protein discovery and ESTs blastx TDNA Protein Analysis of the query DNA

sequene

(26)

Choosing the Right Flavor of BLAST for DNA

Question Answer

Am I interested in non-coding

DNA? Use blastn. Never forget that blastn is only for closely related DNA sequences (>70%

identical) Do I want to discover new

proteins? Use tblastx

Do I want to discover proteins encoded in my query DNA sequence?

Use blastx

Am I unsure of the quality of my

DNA? Use blastx if you suspect your DNA sequence is the coding for a protein but that it may

contain sequencing errors.

(27)

5’CCTGCAGATCATCAGAGGAA3’

5’CCATCGACATGTTGCTGAGA3’

(28)
(29)
(30)
(31)

Comparing Two Sequences

“Pairwise Alignment”

(32)
(33)
(34)
(35)

BLAST Servers around the World

Country Program URL

USA BLAST/PSI-BLAST www.ncbi.nlm.nih.org/BLAST

Europe BLAST www.expasy.ch/tools/blast/

Europe BLAST www.ch.embnet.org/software/

bBLAST.html

Europe BLAST www.ebi.ac.uk/blast

Japan BLAST/PSI-BLAST www.ddbj.nig.ac.jp/search/

blast-e.html

(36)

Multiple Sequence Alignment

(37)

Multiple Sequence Alignment

• Predicting protein structures

• Central for predicting the function of proteins

• Indispensible for phylogenetic analysis

(38)

• ClustalW: everybody uses it

• MUSCLE: it is very fast

• Tcoffee: it is very accurate, let you combine sequences and structures

• http://pir.georgetown.edu/pirwww/search/mu

ltialn.shtml

(39)
(40)

(*) indicates an entirely conserved column

(:) indicates all residues have rougly the same size and the same hydropathy (.) indicates columns where the size or the hydrophaty hasbeen preserved in the course of evolution

(41)

Multiple Sequence Alignment Resources over the Internet

Method Description Address Tcoffee Accurate combination of

sequence and structures

www.tcoffee.org Probcons A Bayesian version of

Tcoffee

probcons.stanford.edu/

MUSCLE A fast and acurate sequence cruncher

www.drive5.com/muscle/

Kalign A fast sequence aligner msa.cgb.ki.se MAFFT A fast and acurate

sequence cruncher timpani.genome.ad.jp/~mafft/

server Dialign Ideal for sequence with

local homology Bibiserv.techfak.uni- bielefeld.de/dialign/

Referanslar

Benzer Belgeler

Çekirdek DNA’sına göre mitokondriyal DNA’da oksidatif baz hasarının fazla şekillenmesinin olası nedenleri, mtDNA’nın en önemli hücre içi ROS kaynağı

Wilkins • They examined the diffraction pattern of DNA (formed by atomic weight and spatial arrangement of molecules) • DNA is helical • The helix needs a length of 3.4 nm

Comparison of DNA vaccines with others • Plasmid DNA purity, ease of production, physico-chemical stability, • Various combinations of immunogens in a single dose • Cheaper in

 Bakteriyel veya baculovirus ekspresyon sistemlerinde yüksek miktarda protein üretimi oldukça rahat uygulanabilirken aynı durum bu proteinlerin izolasyonu için

• Replikasyon ilerledikçe DNA Polimeraz I tarafından RNA primerleri kesilip çıkarılarak ortaya çıkan boş alanlar kalıp DNA ya uygun olarak sentezlenir. • İki

DNA Aşılarının Avantajları •  Herhangi bir DNA sekansı uzun ekler içerenler dahi plasmid içine yerleştirilebilir, •  Fazla miktarda üretilip purifiye edildiklerinde,

Bidirectional replication of a circular bacterial chromosome is initiated at a single origin.... DNA Polymerases Are the Enzymes That

• The strands of the double helix are antiparallel and are held together by hydrogen bonding between complementary nitrogenous bases.. • The structure of DNA provides the means