IST3002 Deney Tasarımı
Bir Y¨onl¨u (One-way) ANOVA Varsayımları
Fatih Kızılaslan
Marmara ¨Universitesi
2019-2020 Bahar
Artıklar
yij = µ + τi+ εij, i = 1, ...a, j = 1, ..., n bir y¨onl¨u ANOVA modeli i¸cin µ ve τi i¸cin EKK (en k¨u¸c¨uk kareler) ve en ¸cok olabilirlik tahmin edicileri aynıdır ve
µ = yb .. vebτi = yi .− y.., i = 1, ..., a olarak bulunur.
Artıklar
eij = yij −ybij = yij− (µ +b bτi) = yij − yi ., i = 1, ...a, j = 1, ..., n bi¸ciminde olur.
Normallik Varsayımı
eij, i = 1, ...a, j = 1, ..., n artıkları kullanarak normallik varsayımını kontrol ederiz.
1
2 Q-Q (quantile-quantile) grafi˘gi: Standart normal da˘gılımın y¨uzdelikleri ile verinin y¨uzdeliklerini kar¸sıla¸stıran bir y¨ontemdir. E˘ger olu¸san grafikte noktalar d¨uz bir do˘gru etrafında yayılım g¨ostermi¸sse ilgili verinin normal da˘gılıma sahip oldu˘gu sonucuna varılır. (R: qqnorm(veri))
3 Kolmogorov-Smirnov Test: Bir verinin herhangi bir da˘gılıma
uygunlu˘gunu kontrol etmek i¸cin kullanılna bir testtir. F (x ) ¨orneklememizin bilinmeyen birikimli da˘gılım fonksiyonu ve F0(x ) ¨orneklemin oldu˘gunu d¨u¸s¨und¨u˘g¨um¨uz da˘gılımının birikimli da˘gılım fonksiyonu olmak ¨uzere
H0 : F (x ) = F0(x ), H1: F (x ) 6= F0(x )
hipotezleri test edilir. E˘ger p-de˘geri> α ise H0 hipotezi (veri normal
3.1 Lilliefors Test: Normal da˘gılıma uygunluk testinde da˘gılımım
parametreleri bilinmiyorsa ve bunlar yerine ¨orneklemden elde edilen tahmin ediciler kullanılıyorsa Lilliefors Testi kullanılmalıdır.
E˘ger p-de˘geri> α ise H0 hipotezi (veri normal da˘gılır) kabul edilir.
R: (”nortest” paketi)
https://cran.r-project.org/web/packages/nortest/nortest.pdf lillie.test(veri) ile ks.test(veri, ”pnorm”,mean(veri), sd(veri)) test istatistikleri aynı olmasına ra˘gmen, bilinmeyen parametreler tahmin edildi˘ginde da˘gılım fonksiyonları farklı olur ve dolayısıyla p−de˘gerleri farklı olur.
4.1 Shapiro-Wilk Test: Normalli˘gi test etmek i¸cin kullanılan en g¨u¸cl¨u testlerden biridir. E˘ger p-de˘geri> α ise H0 hipotezi (veri normal da˘gılır) kabul edilir.
R: (”stats” paketi) shapiro.test(veri)
5. Ayrıca, Anderson-Darling testi ve Cramer-von Mises testleri de kullanılabilir.
R: (”nortest” paketi) ad.test(veri) ve cvm.test(veri)
Varyansların homojenli˘ gi i¸cin testler
Fakt¨or d¨uzeylerinin varyansları σ21, σ22, ..., σ2a olmak ¨uzere homojenliklerini H0 : σ21 = σ22 = ... = σ2a
H1 : σ2i 6= σ2j en az bir (i , j ) i¸cin hipotezleri ile test ederiz.
Homoscedasticity: Homojen varyanslılık Heteroscedasticity: De˘gi¸sen varyanslılık
1
2 Modelden tahmin edilen yanıt de˘gerleri (ybij) ile modelin artıklarının (eij) grafi˘gi ¸cizilerek yorumlanır.
3 Bartlett Test: Verideki ¨orneklemlerin normal da˘gılıma sahip olan kitlelerden alındı˘gı bilindi˘ginde varyansların homojenli˘gini test etmek i¸cin kullanılır. E˘ger veriler normal da˘gılımıyorsa testin g¨uc¨u azalır. Bu durumda tercih edilmemelidir.
p-de˘geri> α ise H0 hipotezi (homojen varyanslılık) kabul edilir.
R: (”stats” paketi) bartlett.test(veri˜fakt¨or)
3.1 Levene Test: Bartlett testine alternatiftir. Normallik varsayımı
sa˘glanmadı˘gında varyansların homojenli˘gini test etmek i¸cin kullanılır. Test istatisti˘gi
W = (N − a)Pa
i =1ni(zi .− z..)2 (a − 1)Pa
i =1
Pni
j =1(zij − zi .)2 olmak ¨uzere zij nin tanımına g¨ore ¨u¸c farklı versiyonu vardır.
W > Fa−1,N−a,αise H0 hipotezi red edilir. p-de˘geri> α ise H0 hipotezi (homojen varyanslılık) kabul edilir.
zij = |yij − yi .| ortalama kullanarak ⇒Levene testi
zij = |yij −yei .| medyan kullanarak (yei .: i . d¨uzeyin medyanı) ⇒Robust Brown-Forusythe Levene testi
zij = |yij − y∗i .| medyan kullanarak (y∗i .: kesilmi¸s (trimmed) ortalama, verinin alttan ve ¨ustten %5 lik kısımları ¸cıkarılarak hesaplanan ortalama)
⇒Robust Levene type test
1
2 R: (”car” paketi) leveneTest(x, factor(fakt¨or), center=median or mean) ve leveneTest(x, factor(fakt¨or),center=mean, trim=0.1)
D¨ on¨ u¸s¨ umler
Varsayımlar sa˘glanmadı˘gında veri ¨uzerinde bazı d¨on¨u¸s¨umler ile varsayımlar sa˘glatılabilir.
G¨ozlemler Poisson da˘gılımına (¨orne˘gin meydana gelen olayların sayısı) sahip ise yij∗ =√
yij veya yij∗ =p1 + yij
G¨ozlemler log-normal da˘gılıma sahip ise (fakt¨or d¨uzeylerinin ortalamaları ve standart sapmaları orantılı σy ∝ µ veya de˘gi¸sim katsayısı=σ/µ sabit ) yij∗= ln(yij)
Fakt¨or d¨uzeylerinin ortalamalarının karesi standart sapmaları ile orantılı (σy ∝ µ2) ise yij∗ = 1/yij
G¨ozlemler Binom da˘gılımına sahip ise yij∗ = arcsin√ yij
d¨on¨u¸s¨umleri kullanılır.