Mikrodizin Veri Analizi
Bâlâ GÜR DEDEOĞLU
Ankara Üniversitesi Biyoteknoloji Enstitüsü
Mikrodizin Veri Analizi
Mikrodizin Veri Analizi
Ön işleme
normalizasyon dağılım grafikleri
Inferensiyal (sonuca odaklı) istatistik yöntemleri t-test
ANOVA
Tanımlayıcı (descriptive) istatistik yöntemleri uzaklıklar (distances)
gruplamalar (clustering)
principal components analysis (PCA)
Mikrodizin Veri Analizi
• Veri matriksi (gen ifade değerleri-örnekler)
Mikrodizin Veri Analizi
Ön işleme
Inferensiyal istatistik Tanımlayıcı istatistik
• Veri matriksi (gen ifade değerleri-örnekler)
Ön işleme
Gen ifade profillerinde gözlenen değişiklikler gerçekten ifade farklılıkları
olabileceği gibi aşağıda belirtilen işlem hataları yüzünden de kaynaklanabilir.
• DNA’nın yüzeye eşit basılmamış olması
• RNA miktarındaki ya da kalitesindeki farklılıklar
• Yıkama verimliliğindeki farklılıklar
• Tarama verimliliğindeki farklılıklar
Ön işlemenin temel amacı, işlem hatalarından kaynaklanan yanılmaları, gen ifadelerindeki farkları koruyarak ortadan kaldırmaktır.
Robust multi-array analysis (RMA)
• Developed by Rafael Irizarry (Dept. of Biostatistics), Terry Speed, and others
• Available at www.bioconductor.org as an R package
• Also available in various software packages (including Partek, www.partek.com and Iobion Gene Traffic)
There are three steps:
[1] Background adjustment based on a normal plus exponential model (no mismatch data are used)
[2] Quantile normalization (nonparametric fitting of signal intensity data to normalize their distribution)
[3] Fitting a log scale additive model robustly. The model is additive:
probe effect + sample effect
array
log signal intensity
array
log signal intensity
Histograms of raw intensity values for 14 arrays (plotted in R) before and after RMA was applied.
Precision Kesinlik
Low variance
Accuracy
Doğruluk, hatasızlık
Lower bias
Kesinlik ve doğruluk
Tekrarlanabilir sonuçlar İyi kalite sonuçlar (relative to a
gold standard)
Robust multi-array analysis (RMA)
RMA offers a large increase in precision (relative to Affymetrix MAS 5.0 software).
precision
average log expression
log expression SD
RMA
MAS 5.0
Robust multi-array analysis (RMA)
RMA offers comparable accuracy to MAS 5.0.
log nominal concentration
observed log expression
accuracy
Beyin
Astrosit Astrosit
Fibroblast
Dağılım grafikleri
Iki ayrı mikrodizi deneyinden elde edilen gen ifade düzeylerinin görüntülenmesi için kullanılır
Ifade seviyesi
yüksek
düşük
Ifade seviyesi (2. örnek)
İfade seviyesi (1. örnek)
Mikrodizin Veri Analizi
Ön işleme
normalizasyon dağılım grafikleri
Inferensiyal (sonuca odaklı) istatistik yöntemleri t-test
ANOVA
Tanımlayıcı (descriptive) istatistik yöntemleri uzaklıklar (distances)
gruplamalar (clustering)
principal components analysis (PCA)
Verinin Excel’de analizi
kontrol hasta
Genlerin hastalardaki ifade düzeyleri, kontrollerdeki ifade düzeyleri ile kıyaslanarak ifade farklılıkları hesaplanır.
Istatistiksel olarak anlamlı mı?
Verinin Excel’de analizi
T-test ile ifade farklılıkları arasındaki Istatistiksel anlamlılıklar
hesaplanabilir
Verinin Excel’de analizi
Sonuçlar şu şekilde olabilir…
Küçük p değeri (<0.05) yüksek ifade farklılığı Küçük p değeri (<0.05) önemsiz ifade farklılığı Büyük p değeri (>0.05) yüksek ifade farklılığı Büyük p değeri (>0.05) önemsiz ifade farklılığı
Verinin Excel’de analizi
Inferensiyal istatistiksel yöntemler
Örnekler Parametrik test Nonparametrik
Eş olmayan iki grubun
karşılaştırılması Unpaired t-test Mann-Whitney test Eş iki grubun
karşılaştırılması Paired t-test Wilcoxon test
Birden fazla grubun
karşılaştırılması ANOVA