• Sonuç bulunamadı

TERSİYER

5.3. Sekonder Analiz (Haritalama / Sekans hizalama dahil Sekanların İşlenmesi):

5.3.3. Varyant Arama (Variant Calling- VCF file):

5.3.3.1. Varyantların Belirlenmesi Sonrası Değerlendirilmesi Gereken Kalite Parametreleri:

Bu aşamada map edilen readler üzerinden varyasyon ve mutasyonlar tespit edilir.

Elde edilen herhangi bir varyasyonun uygunluğu açısından güvenlirliklerinin değerlendirilmesi gerekmektedir. Bu kriterler aşağıda kısaca tanımlanmıştır.

a. Heterozigot dağılımlarının oranlarının tutarlılığı Kontaminasyon

Bu genel dğerlendirmeye yönelik bir parametredir. Henüz bu değer üzerinden kalite skoru veren bir araç olmamakla birlikte bakılmasında fayda olabilecek bir parametredir. Heterozigot varyasyonların normal koşullarda alllellik dengesi %50 olmalıdır. Ancak kontaminasyon ve farklı anomaliliklerde bu denge bozulmaktadır. Bu durumun tespit edilmesi durumunda lab. ile değerlendirme yapılarak problemin sebebi tespit edilmelidir.

b. Varyasyon/Mutant karar verilen lokasyonun okuma derinliği

Söz konusu varyasyonun bulunduğu dizileme derinliği bu noktada verilen kararın güvenilirliğini ortaya koymaktadır. Bu değerin 12X’in üzerinde olması het./hom.

kararının verilebilmesi için önem arz etmektedir.

c. Herbir okumanın ortalama kalite score’u

Bu varyasyonun tespitini yapan biyoenformatik aracının ürettiği kalite score’udur. Bu skor ilgili aracın tanımladığı yeterlilik skorunun üzerinde olması gerekmektedir.

Herbir varyantın doğruluğu bu değerle ortaya konabilir.

d. Transition/transversion oranı

Toplumsal genom dizileme projelerinden elde edilen bilgilere göre, herhangi bir bireyin tüm genom dizi verisinden elde edilecek nokta mutasyonların transition/transversion oranı 2.0 ila 2.1 değerlerinde olmalıdır. Bu oran ekzom dizisinde 2.8 ila 3.0 olabilmektedir. Targeted ve amplikon dizilemelerinde bu oran dizilenen bölgeye bağlı olarak çok daha farklı değerler alabilir.

e. Varyantın duplikasyon/Homopolimer/Tandem tekrar bölgesinde olup olmaması durumu

Tespit edilen varyantlar duplikasyon bölgesinde olup olmadığına bakılması gerekmektedir. Bu değerler ilgili veri bankalarından anotasyon aşamasında çekilmektedir. Özellikle ilgili mutasyonun heterozigot ve homozigot olduğu konusunda kararın güvenilirliğine etki etmektedir. Duplikasyon bölgesinde heterozigot olarak tanımlanmış bir mutasyonun esasında iki ayrı bölgeden aynı yere haritalanmış edilmiş homozigot mutasyonlar olabilir. Bu noktaya dikkat edilmesi

Bilgi Kutusu 6: Variant Call Format (VCF/BCF)

DNA sekans analizinde hizalanmış veriye variant calling yapıldıktan sonra oluşan dosya formatıdır. SNP ve INDEL variant yapılarının tutulduğu yazı tabanlı dosyadır. 8 tane sütundan oluşmaktadır. VCF dosyasının sıkıştırılmış hali BCF olarak adlandırılır.

Şekil 10. VCF dosyasında her sütunun ne anlama geldiği bilgisidir (http://samtools.sourceforge.net/mpileup.shtml).

Şekil 11. Örnek bir VCF dosyası içeriğidir

(https://en.wikipedia.org/wiki/Variant_Call_Format).

gerekmektedir. Dizileme platformuna bağlı olarak homopolimer bölgelerde tespit edilen varyasyonların güvenilirlikleri düşük olabilmektedir. Aynı durum tandem repeatler için de geçerli olduğu durumlar ortaya çıkmaktadır.

f. Sürekli yanlış varyant tespit edildiği bölgelerde olması durumu

Genomun bazı bölgelerinin dizi içeriğinden dolayı dizileme cihazları çok hatalı okuma yapmaktadır. Bu bölgeler cihazdan cihaza farklılıklar göstermektedir. Karar vericinin değerlendirmeye aldığı mutasyonun bu şekilde bir mutasyon olup olmadığını değerlendirmesi gerekmektedir. Bu durum daha önce aynı platform ve aynı lab ile dizileme yapılmış verilere bakılarak değerlendirilebilir. Söz konusu mutasyon eski birkaç dizilme ile birlikte görüntüleme araçları ile açılır ve bu durum kontrol edilerek karara bağlanır.

g. Varyantın MAF değerleri

İlgili varyantın yerel veya uluslararası veri tabanlarındaki görülme sıklığı önemlidir.

Zaten çok görülen bir varyantın ilgili numunede de görülmüş olması okumanın potansiyel olarak daha güvenilir olabileceğini işaret edebilir. Hiç görülmemiş veya nadir bir mutasyon için kalite skorları ve okuma kalitesi daha dikkatli incelenmelidir.

Gerekirse Sanger validasyonu faydalı olabilmektedir.

h. Aile veya Trio dizilemesi ise tutarlılığı

Eğer dizileme aile bireyleri ile birlikte (kısaca trio dizilemesi) yapılmış ise tanımlanan varyantın bulunduğu lokasyonun aile segregasyonu ile tutarlı olması gerekmektedir.

Bu durumu sağlamaması durumunda varyantın tespitinin güvenilirliğinden şüphe edilmesi gerekmektedir. Mutasyonun de novo olduğundan şüpheleniliyor ise trio’da doğal olarak segregasyon söz konusu olmayacaktır.

i. Okumanın hastalık veritabanlarında yer alması

Eğer ilgili varyant veya mutasyon herhangi bir hastalık veritabanında yer alıyor ve hastalığın semptomları ile örtüşüyorsa ve yukarıdaki kalite parametrelerini sağlıyorsa nispeten güvenilirliği yüksek bir mutasyon olarak tanımlanabilir. Bu noktada değerlendirilmesi gereken en önemli husus hastalık veritabanında yer alan mutasyonun ne kadar güvenilir olduğudur. Bazı veritabanlarındaki hastalık mutasyon ilişkilendirilmeleri çok geçmiş tarihli yayınlara veya tutarsız yaklaşımlara dayandırılabilmektedir.

j. Homozigot olduğu ifade edilen bir nükleotidin gerçekten de homozigot olma değerlendirmesi

Araçların homozigot olduğunu ifade ettiği bir varyantın gerçekte homozigot olup olmadığı önemli bir husustur. Bireydeki varyant gerçekte homozigot ise tespiti doğal olarak doğru bir tespit olacaktır. Güvenilirliği de doğrudan okuma derinliği veya okuma kalitesi ile ilişkili olacaktır. Ancak bireydeki gerçek mutasyon heterozigot olduğu halde homozigot okuma olasılığı da söz konusu olabilir. Bu duruma nispeten sıklıkla rastlanmaktadır. Bunun sebebi yukarıda birçok başlık altında bahsedilen okuma derinliğine bağlıdır. İlgili varyantın tespit edildiği lokasyonun 12X altında okunması durumunda heterozigot bir lokasyonun yanlışlıkla homozigot olarak değerlendirilmesi olasılığı oldukça yükselmektedir. Bu durum Sanger ile validasyona gönderilerek çözülebilir. Ayrıca örneğin 12X ile okunmuş bir lokasyonda bir alel 11 kere diğeri ise 1 kere okunduğunda bu hatalı okuma olarak atlanarak homozigot rapor edilebilir. Bu notadaki asıl dramatik etki ise 11 kere okunan allelin referans ile aynı olması durumudur. Bu durumda potansiyel varyant hiç rapor edilmeyecektir.

k. Heterozigot olanın heterozigot olma olasılığı

Heterozigot olan bir varyasyonun heterozigot olarak tespit edilmesi doğru bir tespittir. Gerçekte homozigot olan varyasyonun heterozigot olarak rapor edilmesi nadiren ortaya çıkmaktadır. Bunun en temel nedeni az derinlikte okunmuş bir lokasyonda cihazın hatalı okuması ve rapor etmesi durumudur. Yukarıdaki kriterleri sağlayan bir varyasyonda nadiren bu durum gerçekleşir. Diğer bir etki ise yine yukarıda bahsedildiği gibi nükleotid dizisine veya cihaza bias (yanlılık) bir lokasyonda sürekli hatalı okuma yatkınlığından kaynaklanabilir. Burada dikkat edilmesi gereken en önemli husus her bir allelin hangi derinlikte okunmuş olduğudur. 6X kere okunmuş bir alel asgari doğrulanmış sayılabilir.

l. Hastalıkla ilişkili hiçbir mutasyonun olmadığı kararının verilmesi

Bu oldukça karmaşık ve mevcut hesaplama akışlarının desteklemediği bir durumdur.

Bilimsel araştırmalardaki ana motivasyon fenotiple ilgili olabilecek bir mutasyon aranması şeklindedir. Ancak klinik uygulamalarda iki temel soru vardır. Birincisi semptomlarla ilişkli bir mutasyonun varlığının tespit edilmesidir. Bu durum bilimsel araştırmalar ile benzerlik taşıdığı için yukarıda açıklanan kriterler esas alınarak bu durum çalışılabilir.

İkincisi ve daha karmaşık olanı ise genel manada herhangi patojenik bir mutasyonun olmadığının belirlenmesidir. Bu durumun mutlak manada garanti edilmesi uygulamada mümkün değildir. Yeterli derinlikle okunamayan bölgelerde hangi mutasyonun olup olmadığı bilinemeyeceği için bu soruyu daha somut hale getirmek gerekmektedir.

Soruyu daha kolaylaştıracak olursak hastanın sahip olduğu semptomlara dayanarak şüphelenilen hastalıkla ilgili bir mutasyonun olmadığının tespit edilmesi gerekebilmektedir. Bu durum pratikte mümkün olmakla birlikte mevcut biyoinformatik akışlar bilimsel araştırmalara göre yapıldığı için söz konusu duruma cevap verememektedirler. Başka bir ifade ile söz konusu hastalıkla ilgili bir gen veya birkaç gen olsun ve hastalıkla ilişkilendirilmiş örneğin 20 mutasyon noktası olsun.

Biyoinformatik akışlar varyasyon listelerini sadece bulunan mutasyonların yer alacağı şekilde raporladıkları için okunmayan bölgelerde potansiyel olarak var olan mutasyon yok olarak varsayılmaktadır. Örneğe dönecek olursak 20 mutasyon noktasının sadece 19’unun yeterli derinlikte okunduğu ve ilgili bir mutasyonun olmadığı söylenebilir. Ancak okunmamış olan mutasyon da yok varsayıldığı için orjinal soruya dönecek olursak bu hastalığın olmadığı söylenememiş olmaktadır. Bu durum aslında yeni programlar yazılarak düzenlenebilir ancak her biyoinformatik akış bunu desteklememektedir.