• Sonuç bulunamadı

• Smith-Waterman Algoritması• BLAST BLAST

N/A
N/A
Protected

Academic year: 2021

Share "• Smith-Waterman Algoritması• BLAST BLAST"

Copied!
14
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

BLAST BLAST

• Smith-Waterman Algoritması

• BLAST

(2)

Smith-Waterman Hizalama Algoritması Smith-Waterman Hizalama Algoritması

• Algoritma Temel Özellikleri:

1. Kullanılan dinamik programlama 2. Hesaplanan puanlama matrisi

3. Boşluklar için Penaltılar: Daha fazla boşluklar ile bir hizalama daha az boşluk ile hizalanmış bir sekanstan daha iyidir.

Gap Penaltılar:

* Bu iki hizalamaların aynı puanı var, fakat ilk hizalama önemlidir.

(yani daha az boşluklar vardır) ATCG AT-CG ATTG ATT-G

* Giriş Boşluklarını aza indirmek için cezalar (penaltılar) ekle

* İki çeşit Gap Cezaları (Penaltıları) vardır.

– Gap açıklığı (GO): Başlangıçta boşluk açıldığında değerlendirilen

– Gap uzama (GE): Bir boşluk birbirini izleyen uzantısı ile değerlendirildiğinde

GO ve GE hizada boşlukları sokulması için istenilen duyarlılığı bağlı olarak seçilebilir ya da 3 boyutlu yapısal hatları tahmin edilebilir.

(3)

Gap Cezaları (Penaltıları): Örnek Gap Cezaları (Penaltıları): Örnek

• Boşluk açıklığı (GO) ceza = -2 ve boşluk uzatma (GE) penaltı varsayalım = -1

• C-T ikame cezası varsayalım = -1

• Eşleşme için Puan = 1

• Bu gruplaşmada __ bir yüksek puan var hangisi “daha iyi“ ?

AT-C-TA ATC--TA AT-C--TA ATTTTTA ATTTTTA ATT-TTTA

4 uyumlu, 1 uyumsuz, 4 uyumlu, 1 uyumsuz, 4 uyumlu

2 gap açıklığı (GO) 1 GO, 1 GE, 3 GO, 1 GE

Sonuç = +4-1-2-2 Sonuç = +4-1-2-1 Sonuç = +4-2-2-2-1

Sonuç = -1 Sonuç = 0 Sonuç = -3

(4)

Uyum Anlamı ve Terminoloji Uyum Anlamı ve Terminoloji

Uyum Anlamı:

• Bir hizalama puanı göz önüne alındığında, ne zaman önemlidir?

• Bazı durumlarda, bu homolog olduğu bilinen sekanslar deneysel testler ile belirlenebilir

• Yüksek hizalama puanı" dizileri ortak bir atadan evrimleştiği düşünülmektedir.

• "Düşük hizalama puanı", sadece bir bilginin eksikliği karşıt

anlamına gelmez.

(5)

Terminoloji:

. Dizi Kimliği: Toplam dizi uzunluğuna bölünmesiyle kesin eşleşmelerin sayısı (% ID)

. Benzerlik: "benzer" amino asitler (% benzerlik) için verilen kısmi skor - kullanılan puanlama matrisine bağlıdır.

. Homoloji : İki dizileri ortak bir ata dizisi ya da ortak bir atadan yok (Yok% homoloji)

(6)

BLAST Amacı Nedir?

BLAST Amacı Nedir?

• Bir proteini yada DNA dizilerinin, bir protein yada DNA veri tabanlarında karşılaştırılmasını sağlar.

• BLAST veritabanındaki tüm homolog dizileri alır

(7)

Neden BLAST Gereklidir?

Neden BLAST Gereklidir?

• Teorik olarak, bir veri tabanında bulunan, bir sorgulama dizisi ve her bir proteini ya da DNA dizisi arasında küresel bir hizalama gerçekleştirebilir

Bu tür yaklaşımların hesaplamaları son derece yoğun olacağından çoğu amaçlar için pratik değildir.

• BLAST buluşsal bu yöntemlere yakındır.

BLAST siparişleri ise daha hızlı diğer sezgisel yöntemlere göre daha büyüklükte.

BLAST diğer sezgisel yöntemlere göre ayrıca daha hassas ve seçicidir.

• BLAST dezavantajları:

Bir miktar homoloji ilişkileri kaçırır Optimal uyum garanti etmez

(8)

BLAST Nasıl Çalışır?

BLAST Nasıl Çalışır?

• Sezgisel Üç Adım:

1. Yüksek puanlama kelimelerin bir listesini derlemek

2. Hit olarak adlandırılan bu kelimelerin örnekleri için veritabanı tarama

3. Rastgele anlamlı hitleri ayırt etmek ve uzatmak

(9)

BLAST: Terminoloji BLAST: Terminoloji

• Kompozisyon

Belirli bir sıra ile Alfabe kullanım ölçüsü

• Kompozisyon Karmaşıklık

Bir dizinin bilgi içeriği bir ölçüsüdür

Düşük Karmaşıklık Yüksek Karmaşıklık

AGAAGAGGGAA TGHIGAVRLAC

(10)

• Boşluksuz vs Boşluklu Hizalama:

Boşluksuz: VHREMAARTSPLRPLVATAGPALSPVPP ASRDPVARTSPLQTPAAPGAAAGPALSP

Boşluklu: VATAGPALSPVPPCVHLTLRRAGDDFSR

VIPMAA---VKQALREAGDE

(11)

E-Değerleri E-Değerleri

• Skorlar her yüksek puanlama sırası çifti için BLAST tarafından bildirilen (HSP) e-değerleri olarak

• Tesadüfen beklenen skor S ile e-değerleri HSP sayısına yaklaştığı kabul edilir. (yani ilgili değildir)

• Düşük karmaşıklık dizilerinin filtrelemesi devre dışıysa, E-

değerleri anormal yüksek olacak.

(12)

• E-değerleri aşağıdaki formül kullanılarak hesaplanır:

E(S) = Kmne¯ʎS

K = Sabit (Uyumlu başlama noktaları için mümkün olmayan bağımsızlık için düzeltme ) m = Veri tabanında bulunan dizilerin toplam uzunluğu

n = Soru sekansının uzunluğu ʎ = Sabit ölçekleme

S = Yüksek skorlu dizi çiftinin skoru (HSP)

(13)

BLAST Çalıştırma BLAST Çalıştırma

• Seçenekler:

Düşük karmaşıklık filtresi

Bu dizileri hizalamak X adı ile olmaz -- uzantıları yerini alır düşük karmaşıklık dizisi ile uzanır.

Limite göre sorgu girme

Veritabanı dize sorgu sonuçlarına karşı sorgu BLAST olacak

Beklemek

E-değeri kesilen HSP'leri bildirdiği için

Kelime boyutunu

Kullanıcı look-up tablosu için kelime boyutunu tanımlamak için izin verir

Proteinler için, varsayılan 3'tür. 2 düşürücü duyarlılığını artırmak , aynı zamanda çalışma süresini artıracak

Matrix

İkame matrisi seçin puanlama için kullanılacak

Boşluk maliyetleri

Boşluk açma ve genişletme cezaları seçin

(14)

Blast Arama İpuçları Blast Arama İpuçları

• Başlangıçta BLOSUM62 ve varsayılan boşluk cezaları kullanmak

• Anlamlı sonuçlar, BLOSUM30 ve alt boşluk cezaları kullanırsanız

• Tipik 0.0001 BLAST E-değer sınır değeri kullanın

• Uzun dizilerinin isabetine dikkat edin veya sıradışı dizisi bileşim ile isabet edin.

(AQQQQQQQQQRQQG, etc)

• DNA için, 1000 baz bölümler halinde BLAST bireysel dizisini bölmek

• Proteinler için, 300 amino asit dizisini parça halinde, ayrıca segmenti çapında bilinen motiflere bölmek

• Sınırlı sorgu bölgesini kullanarak sınırda öneme sonuçlarını yeniden değerlendirmek

Referanslar

Benzer Belgeler

anlamın munbasıt hâli (genişleme), anlamda derinleşme, çok boyutlu anlam aktarmaları, anlam çözülmeleri; anlamsal gerilimler, anlam parçalanmaları, anlam çatışmaları;

TABLOLAR LİSTESİ ... Parçacıklar Arasındaki Etkileşim Kuvvetleri ... Standart Model ... Kuark model ... MIT Çanta Modeli ... Spin, Helisite ve İzospin ... Delta Baryonları

• Rekabet boşluğu: rakiplerin bölgesine veya rekabetin olmadığı pazar bölümlerine gidilmesi.. İkincil talep için

Çevremizde bu kadar futbol düşkünü spor yazarı ve muhabir varken, gazetelerin spor sayfalarında militarist, erkek egemen, konuları kadın.. bedeni üzerinden tartışan

 The predicted blast damage levels (maximum deflections) for the prototype building structural members with the ESDOF analysis were on the unconservative side by 19% to 85% for

yöntemi, daha çok damla sulama yöntemine benze- yen, a¤aç alt› mikro ya¤murlama yöntemidir.. A¤aç- lar›n alt›na yerlefltirilen küçük ya¤murlama bafll›kla- r›yla

blastn DNA DNA Very similar DNA sequences tbalstx TDNA TDNA Protein discovery and ESTs blastx TDNA Protein Analysis of the query

• e) Haksız yazarlık: Aktif katkısı olmayan kişileri yazarlar arasına dâhil etmek, aktif katkısı olan kişileri yazarlar arasına dâhil etmemek, yazar