• Sonuç bulunamadı

Kıl keçisi oğlaklarının büyüme hızına ana yaşı ve işletme etkisini araştırmada bazı çoklu karşılaştırma testlerinin karşılaştırılması

N/A
N/A
Protected

Academic year: 2021

Share "Kıl keçisi oğlaklarının büyüme hızına ana yaşı ve işletme etkisini araştırmada bazı çoklu karşılaştırma testlerinin karşılaştırılması"

Copied!
50
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

T.C.

SELÇUK ÜNĠVERSĠTESĠ SAĞLIK BĠLĠMLERĠ ENSTĠTÜSÜ

KIL KEÇĠSĠ OĞLAKLARININ BÜYÜME HIZINA ANA YAġI VE ĠġLETME ETKĠSĠNĠ ARAġTIRMADA BAZI ÇOKLU KARġILAġTIRMA

TESTLERĠNĠN KARġILAġTIRILMASI

Zehra GÜNLÜ

YÜKSEK LĠSANS TEZĠ

BĠYOĠSTATĠSTĠK ANABĠLĠM DALI

DanıĢman

Prof. Dr. M. Emin TEKĠN

(2)
(3)

ii

ÖNSÖZ

Bilimsel araĢtırmalar oldukça fazla emek, zaman ve kaynak ayrılarak büyük fedakârlıklar ile yürütülmektedir. Bu emeklerin istenilen sonuçlara ulaĢması, elde edilen ham verilerin uygun istatistik metotlarla analizi ve doğru değerlendirilmesi ile mümkündür. Bu tez çalıĢmasında Veteriner Hekimlik ve hayvan yetiĢtiriciliğinde oldukça yaygın kullanılan varyans analizine bağlı post-hoc testleri incelendi. Alternatifi çok olan bu testler aynı ham verilere uygulanarak karĢılaĢtırıldı.

Yüksek Lisans eğitimi ve tez çalıĢmamda konunun belirlenmesi, tez verilerinin elde edilmesi sırasındaki yardımlarını esirgemeyip sabırla yardımcı olan çok değerli danıĢman hocam; Prof. Dr. Mehmet Emin Tekin’e teĢekkür ederim. Yüksek Lisans eğitimini aldığım değerli hocalarıma teĢekkür ederim.

Yüksek Lisans eğitimim boyunca bana destek veren ve sabır gösteren eĢim ve canım çocuklarım ile kıymetli kayınvalideme teĢekkür ederim.

Yüksek Lisans eğitimim sırasında gösterdikleri hoĢgörü ve destek için Selçuk Üniversitesi Sağlık Bilimleri Enstitüsünün değerli idarecileri ile çalıĢma arkadaĢlarıma teĢekkür ederim.

(4)

iii ĠÇĠNDEKĠLER ÖNSÖZ………ii ĠÇĠNDEKĠLER……….iii ÇĠZELGE LĠSTESĠ………...v SĠMGELER ve KISALTMALAR………...vi ÖZET.………...vii SUMMARY………..…viii 1 GĠRĠġ ... 1

1.1 ÇOKLU KARġILAġTIRMA TESTLERĠ (POST-HOC TESTLER) ... 2

1.2 VARYANSLARIN HOMOJEN OLMASI DURUMUNDA KULLANILAN ÇOKLU KARġILAġTIRMA TESTLERĠ ... 4

1.2.1 LSD (Least Significant Difference) En Küçük Önemli Fark (EKÖF) ... 4

1.2.2 Bonferroni Testi ... 5

1.2.3 Sidak Testi ... 6

1.2.4 Scheffe Testi; ... 6

1.2.5 R E G W (Ryan-Einot-Gabriel-Welsh) Q Testi ... 8

1.2.6 R E G W (Ryan-Einot-Gabriel-Welsh) F Testi ... 8

1.2.7 Student Newman Keuls (SNK) Testi ... 9

1.2.8 Tukey HSD Testi ... 9

1.2.9 Tukey’s B Testi (Tukey WSD Testi) ... 10

1.2.10 Duncan Testi ... 10

1.2.11 Hochberg GT2 Testi ... 12

1.2.12 Gabriel Testi ... 12

1.2.13 Waller-Duncan Testi ... 12

1.2.14 Dunnett Testi ... 13

1.3 VARYANSLARIN HOMOJEN OLMAMASI DURUMUNDA KULLANILAN ÇOKLU KARġILAġTIRMA TESTLERĠ ... 13

1.3.1 Tamhane T2 Testi; ... 13

1.3.2 Dunnett T3 Testi; ... 14

1.3.3 Games-Howell Testi; ... 14

1.3.4 Dunnett’s C Testi; ... 14

1.4 ÇOKLU KARġILAġTIRMA YÖNTEMĠNĠN BELĠRLENMESĠ ... 15

1.5 ÇOKLU KARġILAġTIRMA ĠġLEMLERĠNĠN DEĞERLENDĠRĠLMESĠ ... 15

2 GEREÇ VE YÖNTEM ... 20

2.1 GEREÇ ... 20

2.2 YÖNTEM ... 20

3 BULGULAR ... 22

(5)

iv

5 SONUÇ VE ÖNERĠLER... 35

6 KAYNAKLAR ... 36

7 EK A ETĠK KURUL KARARI ... 40

(6)

v

ÇĠZELGE LĠSTESĠ

Çizelge 1.1: SPSS paket programında kullanılan çoklu karĢılaĢtırma testleri ……...4 Çizelge 1.2 :Yaygın kullanılan bazı çoklu karĢılaĢtırma testleri ve değerlendirilmesi……….15 Çizelge 3.1 ĠĢletme ve ana yaĢı faktörlerinin normallik ve varyansların homojenliği testi sonuçları ……….22 Çizelge 3.2: Oğlakların günlük canlı ağırlık artıĢı ile ilgili varyans analizi tablosu..22 Çizelge 3.3: Çoklu karĢılaĢtırma testleri ile iĢletmelerin ikili karĢılaĢtırılması (P değerleri)……….24 Çizelge 3.4: Farklı testlere göre iĢletmeler arası farklılıkların harflendirme ile gösterilmesi……….24 Çizelge 3.5: Oğlakların GCAA’nın ĠĢletme faktörüne göre homojen alt grupları….25 Çizelge 3.6: Oğlakların GCAA’na ana yaĢının etkisine ait çoklu karĢılaĢtırma testi sonuçları (P değerleri)……….26 Çizelge 3.7.: Farklı testlere göre ana yaĢı grupları arası farklılıkların harflendirme ile gösterilmesi……….27 Çizelge 3.8: Çoklu aralık testi sonuçlarına göre ana yaĢına ait homojen alt gruplar..28

(7)

vi

SĠMGELER ve KISALTMALAR LĠSTESĠ SPSS: Statistical Package for the Social Sciences LSD: Least Significant Difference

EKÖF:En Küçük Önemli Fark

R E G W Q Testi: Ryan-Einot-Gabriel-Welsh Q testi R E G W F Testi: Ryan-Einot-Gabriel-Welsh F testi SNK: Student Newman Keuls Testi

Tukey HSD: Honestly Significant Difference

Tukey WSD Testi: Tukey Wholly Significant Difference Testi, Tukey’s B HKO: Hata Kareler Ortalaması

V: Hata kareler ortalamasının serbestlik derecesi GCAA: Günlük Canlı Ağırlık ArtıĢı

(8)

vii

ÖZET T.C.

SELÇUK ÜNĠVERSĠTESĠ SAĞLIK BĠLĠMLERĠ ENSTĠTÜSÜ

Kıl Keçisi Oğlaklarının Büyüme Hızına Ana YaĢı ve ĠĢletme Etkisini AraĢtırmada Bazı Çoklu KarĢılaĢtırma Testlerinin KarĢılaĢtırılması

Zehra GÜNLÜ

Biyoistatistik Anabilim Dalı

YÜKSEK LĠSANS TEZĠ / KONYA-2016

Bu araĢtırma, Kıl Keçisi oğlaklarının süt emme dönemi büyüme hızına (günlük canlı ağırlık artıĢı GCAA) ana yaĢı ve iĢletme faktörü etkisini karĢılaĢtırmada farklı post-hoc testlerinin etkisini belirlemek amacıyla yürütüldü.

ÇalıĢmada araĢtırma materyali olarak, 2015 yılında Karaman Ġli Damızlık Koyun Keçi YetiĢtiricileri Birliğine üye 6 farklı iĢletmede, farklı yaĢtaki analardan doğan 1189 kıl keçisi oğlağının süt emme dönemindeki büyüme hızı verileri kullanıldı. SPSS paket programında genel doğrusal model ile ana yaĢı ve iĢletme faktörünün etkisi analiz edildi. Grupların ikiĢerli karĢılaĢtırılmasında programdaki bütün çoklu karĢılaĢtırma testleri kullanılarak ürettikleri sonuçlar karĢılaĢtırıldı.

ĠĢletmeler arasında yapılan ikiĢerli karĢılaĢtırmalarda Tukey HSD, Bonferroni, Sidak, Gabriel ve Hochberg testleri aynı benzerlik ve farklılıkları bulurken, Scheffe testi 2 ve 4 numaralı iĢletmeler arasındaki farkı önemsiz (P>0.05), LSD testi ise 2 ve 3 numaralı iĢletmeler arasındaki farkı önemli (P<0,05) bulmuĢtur. Çoklu aralık testlerinden SNK, Duncan ve Scheffe testleri iĢletme faktörünün düzeylerini 4; Tukey HSD, Tukey B, Gabriel, REGW-F, REGW-Q, Waller Duncan ve Hochberg GT testleri ise 5 homojen alt grup yapmıĢtır.

Ana yaĢı grupları karĢılaĢtırmasında Scheffe ve LSD testlerinin dıĢındaki testler aynı benzerlik ve farklılıkları bulmuĢtur; Scheffe testi 2-7 ve 4-5 grupları arasındaki farklılığı önemsiz (P>0,05) bulurken diğer testler önemli bulmuĢtur. LSD testi ise, diğer testlerin önemsiz bulduğu 4-6, 5-7 ve 6-7 grupları arasındaki farklılıkları önemli (P<0.05) bulmuĢtur. Buna göre LSD bir uçta Scheffe diğer uçta olmak üzere diğer testler arada yer almıĢtır denebilir.

Sonuç olarak, çoklu karĢılaĢtırma testlerinde grup sayısı 3 olduğu durumlarda LSD testinin tercih edilebileceği; Bonferroni ve Sidak testlerinin birbirlerinin yerine kullanılabileceği; I. Tip hatayı kontrol altında tutmak için Scheffe, Tukey HSD, SNK, II. Tip hatayı kontrol altında tutmak için LSD ve Duncan testlerinin tercih edilebileceği söylenebilir.

(9)

viii

SUMMARY T.C.

SELÇUK ÜNĠVERSĠTESĠ SAĞLIK BĠLĠMLERĠ ENSTĠTÜSÜ

Comparing of Some Multiple Comparision Test in the Dam’s Age and Enterprises Effects on Growth Rate of Hair Goat Kids

Zehra GÜNLÜ

Biyoistatistik Anabilim Dalı

YÜKSEK LĠSANS TEZĠ / KONYA-2016

This research has been conducted to determine the effects of Dam’s Age and enterprise factors on suckling period Growth Rate (daily live weight gain) of Hair Goat Kids by different multiple comparison tests.

The data suckling period daily live weight gain of 1189 hair goats kids born from dams of different ages in 2015 year in 6 different enterprises, member of Karaman Sheep and Goat Breeders Association was used as a research material in this study. The effects of maternal age and enterprises have been analysed by General Linear Model in SPSS. For pairwise comparison of the groups, all post hoc comparisons test in SPSS were used and obtained results evaluated.

The effect of maternal age and enterprises factor on growth rate in hair goat kids was significant (P<0,001) according to the result of GLM procedure. Tukey HSD, Scheffe, LSD, Bonferroni, Sidak, Gabriel and Hochberg tests revealed the same similarities and differences for all comparisons. The growth rate of kids between in the enterprise of 2-4 was not statistically important (P>0,05) by the Scheffe test. According to the LSD test results, the difference between 2 and 3 was statistically important (P<0,05), unlike the others test. SNK, Duncan, and Scheffe tests created 4 homogeny subgroup and the others created 5 homogeny subgroup in all enterprises groups.

In comparison for dam age groups, all tests except for Scheffe and LSD found the same similarities and differences all groups; while Scheffe test found the difference between 2-7 and 4-5 not significant (P>0,05), other test resulted in significant difference. However, LSD test found significant differences between 4-6, 5-7 and 6-7 groups (P>0,05) and the other test not detected any differences. In conclusion, all other test placed between LSD at one end, and Scheffe in the other end.

As a result of the study; it could be concluded that LSD test could be used in the multiple comparison procedures if the group number is 3. It was determined that Bonferroni and Sidak test could be used interchangeably. If Type I error is wanted to be under control, Scheffe, Tukey HSD and SNK should be use for post hoc comparison. In the case that Type II error is wanted to be under control, LSD and Duncan test could be used for the post hoc comparison.

(10)

1

GĠRĠġ

Deneysel araĢtırmalarda, karĢılaĢtırmalı çalıĢmalar yaygın olarak kullanılmaktadır. Varyans analizi, bu çalıĢmalarda en sık kullanılan yöntemlerden biridir. Varyans analizi çok geniĢ bir konudur. DeğiĢik deneme düzenlerine göre değiĢik varyans analiz testleri kullanılmaktadır. Dolayısıyla varyans analizi denilince gruplar arası farklılıkların önemli olup olmadığını analiz eden bütün testler akla gelmektedir. Ancak özel anlamda varyans analizi denildiğinde, ikiden çok grubun bir veya birkaç faktör bakımından karĢılaĢtırılmasında gruplar arası farklılıkların önemli olup olmadığının anlaĢılması için yapılan testler akla gelmektedir (Tekin 2010). Fisher tarafından geliĢtirilen bu yöntem araĢtırmacılar tarafından yaygın olarak kullanılmaktadır. Bu nedenle yöntem, Fisher ismine atfen F testi olarak da bilinir.

Varyans analizinin amacı gruplar arasındaki farklılıkların karĢılaĢtırılmasıdır. Analiz sonucunda farklılık bulunduğunu belirtmek yeterli olmaz. Ayrıca farklılık yaratan grup veya grupların belirlenmesi gerekir. Varyans analizindeki F testi bu sorulara doğrudan cevap veremez. Çoklu karĢılaĢtırmalar olarak bilinen test iĢlemleri bu sorulara cevap vermek için geliĢtirilmiĢ test iĢlemleridir (Özkaya 2011).

Eğer gruplar arası fark önemli çıkmıĢ ise (P<0,05) o zaman bunun anlamı, en az bir grup diğerlerinden farklıdır demektir. Gerçekten de bu durumda ya sadece bir grup diğerlerinden farklıdır veya her biri bir diğerinden istatistiki olarak farklı olabilir. Varyans analizinde yapılan ilk test iĢlemleri bunu vermemektedir. Bunu anlamak için çoklu karĢılaĢtırma testleri yapılması gerekmektedir (Tekin 2013). Çoklu karĢılaĢtırma; üç ya da daha fazla denemenin hangisinin daha iyi hangisinin daha kötü olduğunun belirlenebilmesi için ortalama etkilerini karĢılaĢtırmak, yanlıĢ bir karar verme olasılığının kontrol edilmesinde hangi denemenin ne kadar daha iyi ya da ne kadar daha kötü olduğuna karar verebilmektir (Doğan ve Doğan 2014).

Çoklu karĢılaĢtırma terimi bir grup içindeki varyanslar, oranlar ya da ortalamalar arasındaki farklılığın istatistiksel anlamlılığı için yapılan testleri ifade etmektedir. Çoklu karĢılaĢtırma yöntemleri, çoklu etkisinden kaynaklanan hatalı sonuç çıkarmalarını düzenli kontrolünü göz önünde bulunduran istatistiksel iĢlemlerdir. Çoklu karĢılaĢtırma yöntemleri uygulamalardaki önemliliğinden dolayı

(11)

2

temel bir problemdir ve farklı yollarla kullanıcılara yol göstermektedirler (Doğan ve Doğan 2011).

Bilindiği üzere, varyans analizinde kurulan hipotez; Ho: µ1 = µ2 = µ3 = µ4… = µk

H1: En az bir µi ≠ µj; i ≠ j; i, j = 1, 2,…,k Ģeklindedir.

AraĢtırmacı, Varyans Analizi sonucu H0 hipotezini reddedip, H1 hipotezini

kabul etmesi durumunda, farklılığın hangi grup ya da gruplardan kaynaklandığını tespit etmek üzere çoklu karĢılaĢtırma testi seçimi yapmak durumundadır. Ancak, karĢılaĢtırma testi seçiminde isabetli yöntemin seçimi, hipotezlerin I. ve II. tip hata risklerini asgari seviyeye indirme yönünde oldukça önem taĢımaktadır (Kayri 2009).

Sıfır hipotezinin reddedilmesi durumunda grup ortalamaları arasındaki farklılığın hangi grup veya gruplardan kaynaklandığını belirlemek amacıyla literatürde bulunan ve yaygın olarak kullanılan ikili ve çoklu karĢılaĢtırma metotları kullanılmaktadır. Varyans Analizi sonucunda yapılması gereken ilk iĢ, grupların varyanslarının eĢit olup olmadığına yani incelenen grupların aynı ana kütleden ya da aynı dağılıma sahip bir ana kütleden çekilip çekilmediğine karar vermektir. Varyansların homojen olması durumunda araĢtırmacı, çoklu karĢılaĢtırma veya çoklu aralık testlerinden birini tercih etmek durumundadırlar. Ayrıca verilerin normal dağılım göstermesi gerekmektedir. Bunun için de bir ön analiz uygundur. Varyans Analizinde test edilecek değiĢkenlerin sürekli sayısal değiĢken olmaları mutlak Ģarttır (Koca 2013).

1.1 Çoklu KarĢılaĢtırma Testleri (post-hoc testler)

Çoklu karĢılaĢtırma testleri ile alt gruplar hakkında ayrıntılı bilgi elde edilebilir. Burada dikkat edilmesi gereken iki önemli nokta vardır. Bunlar Varyans Analizi uygulayabilmenin varsayımları ve karĢılaĢtırılacak grup sayısının fazlalığıdır. Varyans Analizi varsayımları, gözlemlerin normal dağılıĢ sergilemesi, grup varyanslarının homojen olması ve grupların birbirinden bağımsız olmasıdır. Bu varsayımlar çoklu karĢılaĢtırma testlerinin yapılabilmesi için de sağlanmalıdır. Varsayımlara da bağlı olarak grup hacimlerinin eĢit olması çoklu karĢılaĢtırma testlerinin performansını da etkiler. Hangi çoklu karĢılaĢtırma testinin kullanılacağına

(12)

3

karar verilmesi kolay bir iĢlem değildir. Bazı çoklu karĢılaĢtırma testleri sağlanan ve ihmal edilen varsayımlara göre daha etkili sonuçlar vermektedir.

Çoklu karĢılaĢtırma testleri post-hoc testler olarak bilinmektedir. Varyans analizi sonucunda sıfır hipotezinin reddedilmesi durumu, grup ortalamalarından en az birinin diğerlerinden farklı olduğu, yani ortalamaların aynı evrenden (ana kütleden) gelmediği Ģeklinde ifade edilmektedir. Bu ortalamaların hangilerinin farklı olduğu çoklu karĢılaĢtırma teknikleri ile belirlenmektedir. Bu testlerin seçilmesinde ve kullanılmasında bazı varsayımlar vardır. Her post-hoc yöntemi belirli ön koĢullar çerçevesinde güvenilir sonuçlar vermektedir.

Varyansların eĢit olması durumunda kullanılacak post-hoc istatistikler genel itibariyle iki yöntemle ele alınmaktadır. Bunlar: “Çoklu karĢılaĢtırma testleri” (multiple pairwise comparisons) ve “çoklu aralık testleri” (multiple range tests) olarak bilinmektedir. Çoklu aralık testleri, grup ortalamalarına iliĢkin (k means) homojen alt setler (homogeneous subset) oluĢturarak, gruplardan farklı olanları tespit etmeye çalıĢmaktadır. Çoklu karĢılaĢtırma testleri ise, her grubu sırasıyla diğer gruplarla teker teker kıyaslar ve bir karĢılaĢtırma matrisi elde eder (Kayri, 2009). Böylece α=0,05 seviyesinde farklı gruplar belirlenir.

Çoklu karĢılaĢtırma testinin seçilmesi grup varyanslarına bağlı olarak da değiĢmektedir. Homojen veya heterojen varyans durumunda farklı çoklu karĢılaĢtırma testleri kullanılmaktadır (Özkaya 2011).

Günümüzde araĢtırma sonuçlarının istatistiksel olarak değerlendirilmesinde genellikle bilgisayar destekli paket programlardan yararlanılmaktadır. Bu tez çalıĢmasında araĢtırıcılar tarafından oldukça yaygın olarak kullanılan SPSS (Statistical Package for the Social Sciences) paket programında yer alan çoklu karĢılaĢtırma yöntemleri anlatılmaya çalıĢılacaktır. Hazırlanan veriler ilgili paket programında çözülerek testler arasında elde edilen sonuçlar ortaya konulacaktır. SPSS paket programında yer alan çoklu karĢılaĢtırma testleri Çizelge 1.1’de verilmiĢtir (Anonim 2015a).

(13)

4

Çizelge 1.1: SPSS paket programında kullanılan çoklu karĢılaĢtırma testleri

Testin Adı Yaptığı ĠĢlem

Aralık Testi KarĢılaĢtırma Testi

Varyansların Homojenliğini Gerektiren Testler

LSD Evet Bonferroni Evet Sidak Evet Dunnett Evet R-E-G-W F Evet R-E-G-W Q Evet S-N-K Evet Duncan Evet Waller-Duncan Evet Tukey's-b Evet

Tukey HSD Evet Evet

Hochberg's GT2 Evet Evet

Gabriel Evet Evet

Scheffe Evet Evet

Varyansların Homojenliğini Gerektirmeyen Testler

Tamhane's T2 Evet

Dunnett's T3 Evet

Games-Howell Evet

Dunnett's C Evet

Çizelge 1.1’den anlaĢılacağı üzere, ilgili programda analizler varyansların homojenliğini gerektiren 14 adet çoklu karĢılaĢtırma testi ve varyansların eĢit olmaması durumunda kullanılan 4 adet olmak üzere toplam 18 çoklu karĢılaĢtırma testi mevcuttur. Ancak literatürde yukarıda bildirilenlerin dıĢında, yaygın olarak kullanılmayan, baĢka çoklu karĢılaĢtırma testleri de mevcuttur (Doğan ve Doğan 2014).

1.2 Varyansların Homojen Olması Durumunda Kullanılan Çoklu KarĢılaĢtırma Testleri

1.2.1 LSD (Least Significant Difference) En Küçük Önemli Fark (EKÖF) Fisher tarafından geliĢtirilen LSD testi, “En Küçük Önemli Fark” testi demektir. LSD testi, farklılığın belirleneceği grup sayısının (k) 3’ten fazla olması durumunda tercihi sakıncalı görülen bir testtir. F değeri anlamlı çıktığında, t dağılımından yararlanarak anlamlı fark gösteren ortalamaların belirlenmesinde

(14)

5

kullanılır. Bu teste çoklu t testi karĢılaĢtırması da denilmektedir. Matematiksel olarak da I. tip hataya karĢı oldukça korunmasız özellik taĢımaktadır (Özkaya 2011).Yani, bu test kullanıldığında, gruplar arasında fark yokken var çıkabilir. Ġkili karĢılaĢtırmalarda t tablo dağılımını kullanır.

Testin iĢlemleri;

t= 𝑦 i−𝑦 j

𝐻𝐾𝑂(𝑛 𝑖1+1

𝑛 𝑗 )) ;

Eğer; |t|>tα/2;N-k ise H0 hipotezi reddedilir. Gruplar arası fark önemlidir.

𝑦𝑖=i. grubun ortalaması;

yj=j. Grubun ortalaması;

𝑛𝑖=i. Grubun örneklem büyüklüğü;

nj =j. Grubun örneklem büyüklüğü

HKO; Hata Kareler Ortalaması; 1.2.2 Bonferroni Testi

Test ilk defa 1961 yılında Dunn tarafından tanımlanmıĢtır. Test literatürde yaygın olarak planlı karĢılaĢtırma prosedürü olarak tanımlanır. Ancak, planlanmamıĢ karĢılaĢtırmalar için de kullanılır. Test, çoklu t testi olarak bilinen LSD testi ile aynıdır. Tip I hata oranı düĢüktür. Ancak, Bonferroni testi daima LSD testinden daha büyük bir kritik değer verir(Sheskin 2011).

Bu test eğer k tane H0 hipotezi varsa, hedeflenen genel tip I hata oranını en

çok α olacak Ģekilde belirlemek amacıyla, her bir H0 hipotezini α/k düzeyinde test

eder. Test tip I hatanın bölünmesi olarak da belirtilebilir. Eğer k adet karĢılaĢtırma belirli bir α düzeyinde yapılacaksa, olası en çok genel hata oranı kα olur. Bu sebeple her bir karĢılaĢtırma için düzey α/k olarak belirlenmelidir (Özkaya 2011).

Bonferroni testi yaygın olarak kullanılan bir testtir. Ancak sonuçların değerlendirilmesinde çok güçlü kabul edilmeyen bir test olarak bilinir (Anonim 2014).

Student t istatistiği üzerine kurulu olan Bonferroni testi, “eĢit örneklem sayısı” ilkesini gerektirmemektedir (Kayri 2009). Tukey HSD testi grup ortalamaları

(15)

6

arasında anlamlı fark belirlemiĢse, Scheffe ve Bonferroni de aynı Ģekilde belirlemektedir. F testinin önemli olmasına bakılmadan kullanılabilir. Diğer taraftan, Tukey’in HSD testinden daha güçlü bir test olduğu bildirilmektedir (ÜçkardeĢ 2006).

Testin iĢlemleri;

t= 𝑦 i−𝑦 j

𝐻𝐾𝑂(𝑛 𝑖1+1

𝑛 𝑗 )) ;

Eğer; |t|>tα*/c;N-k ise H0 hipotezi reddedilir.

Ancak hipotezin sonucuna karar verilirken karĢılaĢtırma sayısına bağlı olarak uygun düzeltilmiĢ α değeri α*=α/k düzeyi belirlenmelidir.

1.2.3 Sidak Testi

Sidak testi Bonferroni testinin modifiye edilmiĢ halidir. Bonferroni testine göre güven aralığı daha dar ve daha güçlüdür (ÜçkardeĢ 2006). Test çoklu karĢılaĢtırmalarda kritik değer olarak t tablo değerini kullanır. Sidak testi Bonferroni testinden az da olsa daha güçlü bir test olarak bildirilmektedir (Conagin ve Barbin 2006). Sidak testi tüm olası ikili karĢılaĢtırmaları düzeltilmiĢ α değeri (α =1-(1-α)1/c; c karĢılaĢtırma sayısı) kullanarak yapar. Test Bonferroni testinin ikizi gibi de ifade edilmektedir (Anonim 2015a).

Testin iĢlemleri;

t= 𝑦 i−𝑦 j

𝐻𝐾𝑂(𝑛 𝑖1+𝑛 𝑗 )1 )

;

Eğer; |t|>tα*/c;N-k ise H0 hipotezi reddedilir.

*α; α=1-(1-α)1/k

1.2.4 Scheffe Testi;

Scheffe tarafından 1953 yılında geliĢtirilen test, F testinden sonra çoklu karĢılaĢtırmalarda en sık kullanılan testlerdendir. Gruplar arasında mümkün olan bütün doğrusal kombinasyonların karĢılaĢtırması için Scheffe metodu geliĢtirilmiĢ

(16)

7

olup; bu metot genel itibariyle, en esnek ve karĢılaĢtırılacak grup sayılarının çok olması durumunda α hata payını kontrol altında tutabilen (conservative) ve gruplardaki gözlem sayılarının eĢit olması varsayımını dikkate almayan bir post hoc türü olarak ele alınmaktadır (Howell 2013).

AraĢtırmalarda bazen denemeye baĢlamadan önce hangi grup ortalamalarının karĢılaĢtırılması gerektiğine karar verilemeyebilir. AraĢtırma sonucu elde edilen bazı önemli bulgulara göre, karĢılaĢtırılacak gruplara karar verilebilir. Bu test, grup ortalamaları arasındaki mümkün tüm karĢılaĢtırmaların yapılmasına imkan verirken her karĢılaĢtırmadaki α anlamlılık düzeyinin değiĢmez kalmasını sağlamaktadır (Çömlekçi 2003).

Scheffe testi en düĢük deneysel hata oranına sahip testtir. Grup sayısının değiĢiminden etkilenmediği bildirilmektedir (Özkaya 2011). Eğer bir grubun ortalamasını diğer grup ailesinin ortalamasına göre ağırlıklı olarak test etmek gerekiyor ise Scheffe testini tercih etmek uygundur (Özdamar 2013).

Kısaca test bütün ortalamalar arasındaki olası bütün kombinasyonların karĢılaĢtırılması amaçlandığında kullanılır. Örneğin; üç ortalama var ise olası 6 kombinasyon karĢılaĢtırılabilir (1- 2, 1- 3, 2-3, 1+2 ile 3, 1+3 ile 2, ve 2+3 ile 1). Bu durumda da düzeltilmiĢ α değeri 0,0083 (0,05/6) olur (Anonim 2015a).

Testin iĢlemleri; Cm=c1m𝑦 1+ c2m𝑦 2+ ….+ ckmm𝑦 k m=1,2,….u 𝐴 = k − 1 F; Scm= 𝐻𝐾𝑂 𝑐𝑖 𝑖𝑚2/𝑛𝑖 m: bağıntı sayısı, k :grup sayısı;

u: maksimum bağıntı sayısı; c karĢılaĢtırma sayısı

(17)

8

1.2.5 R E G W (Ryan-Einot-Gabriel-Welsh) Q Testi

Ryan, Einot, Gabriel ve Welshtarafından geliĢtirilmiĢ bir testtir. Ortalamaları küçükten büyüğe doğru sıralayarak adım adım karĢılaĢtırma iĢlevini gerçekleĢtirir. SAS paket programında yaygın olarak kullanılır. Test eĢ zamanlı güven aralığı oluĢturularak kullanılamaz (Anonim 2015) Test, Tukey testi gibi, Q kritik tablo değerini kullanır.

Keselman ve arkadaĢlarına göre; karĢılaĢtırılmak istenen grup sayısı 4 veya 5 olduğunda ortalama çiftlerin karĢılaĢtırılmasında bu testin kullanılması önerilmektedir (Özkaya 2011). Testin iĢlemleri; t= 𝑦𝑖−𝑦𝑗 𝐻𝐾𝑂 1 𝑛 𝑖+ 1 𝑛 𝑗 ≥ 𝑄𝛼𝑝(𝑝,𝑣) 2 ;

koĢulu sağlanırsa H0 hipotezi reddedilir. H1 kabul edilir gruplar arası fark önemlidir.

v= Hata kareler ortalamasının serbestlik derecesi;

p= k ortalamanın küçükten büyüğe doğru sıralaması sonrası karĢılaĢtırılmak istenen sıralı ortalama çiftlerin içerdiği ortalama sayısı,

1.2.6 R E G W (Ryan-Einot-Gabriel-Welsh) F Testi

Yukarıda bildirilen testin F tablo değeri esas alınarak oluĢturulan bir çoklu aralık testidir (Anonim 2015 ).

Testin iĢlemleri;

F= ( 𝑛𝑖𝑦𝑖 2

𝑖∈𝑅 −( 𝑖∈𝑅𝑛𝑖𝑦𝑖)2/ 𝑖∈𝑅𝑛𝑖

𝑝−1 𝐻𝐾𝑂 ≥Fαp;p-1;v ise; H0 hipotezi reddedilir.

Gruplar arasındaki farkın önemli olduğu Ģeklinde yorumlanır. Fαp;p;v:αp düzeyinde p ve v serbestlik derecesiyle F tablo değeri

(18)

9

1.2.7 Student Newman Keuls (SNK) Testi

Duncan testine benzeyen çoklu aralık testidir. Tukey ile aynı karĢılaĢtırma çizelgesini kullanır. SNK’nın en son hesaplanan kritik değeri Tukey testindeki kritik değeri ile aynıdır. Varyans analizinin önemli olup olmamasına bakılmadan kullanılabilir. Burada herhangi iki ortalama arasındaki fark kademe sayısına göre değiĢen bir değerle karĢılaĢtırılır (Everitt 2001’den aktaran ÜçkardeĢ 2006). Bu testin Duncan ve LSD testi kadar güçlü bir test olduğu bildirilmektedir (Özkaya ve Ercan 2012).

SNK testi student t istatistiğini kullanmaktadır. Ġkili grup karĢılaĢtırmalarında tek bir anlamlılık düzeyi yerine her aĢamada değiĢen bir anlamlılık düzeyini tercih etmektedir (Koca 2013). SNK testi Tukey HSD testinden daha güçlü olmasına rağmen karĢılaĢtırmalarda Tip I hatanın kontrolüne olanak sağlamaz (Sheskin 2011). Aksine Tip II hatayı önlemede etkilidir.

Testin iĢlemleri; Kp=qα(p,v)Syi

S𝑦𝑖 =

𝐻𝐾𝑂 𝑛

|y(k)- y(1)|>Kp ise H0 hipotezi reddedilir ve gruplar arasındaki fark önemlidir diye

yorumlanır.

yk: k grubun ortalamaları büyükten küçüğe doğru sıralandığında en büyük ortalama

değeri gösterir.

Y1: k grubun ortalamaları büyükten küçüğe doğru sıralandığında en küçük ortalama

değeri gösterir.

1.2.8 Tukey HSD Testi

Tukey HSD (Honestly Significant Difference) araĢtırmacıların olası bütün ikili karĢılaĢtırmaları yapılmasını olanaklı kılan testtir. Test,Tip I hatayı baĢlangıçta belirlenen kritik düzeyi aĢmadığı için kontrol altında tutar. Yöntem planlı olmayan

(19)

10

karĢılaĢtırmalar arasından literatürde en yaygın olarak tavsiye edilenlerindendir (Sheskin 2011, Özkaya 2011). Testin iĢlemleri; q = 𝑦 max − 𝑦 min 𝐻𝐾𝑂 𝑛 Tα = qα(p,v) 𝐻𝐾𝑂𝑛 Tα = qα(p,v) 2 𝐻𝐾𝑂 1 𝑛𝑖+ 1 𝑛𝑗

Örneklem ortalamaları arasındaki fark hesaplanan t değerinden büyük ise aradaki fark önemlidir. H0 hipotezi reddedilir. Gruplar arasındaki farkın önemli

olduğuna karar verilir.

1.2.9 Tukey’s B Testi (Tukey WSD Testi)

Eğer k grup ortalaması, ortak bir hata yaklaĢımı ile aynı zamanda ikili olarak karĢılaĢtırmak isteniyorsa Tukey HSD testi ya da Tukey WSD testi uygun testler olarak değerlendirilebilir. Tukey HSD testi özellikle karĢılaĢtırılacak grup sayısı 8 ve daha fazla ise ve eĢanlı ikili karĢılaĢtırma yapılmak isteniyorsa Tukey WSD testine tercih edilmelidir (Özdamar 2013). Test, gruplar arasında karĢılaĢtırma yaparken t testi dağılımı ile ikili karĢılaĢtırmalara olanak sağlar. Kritik değeri Tukey HSD ve SNK değerleri arasındadır (Anonim 2015a).

Testin iĢlemleri;

𝐹𝑖𝑗 =

𝑛

𝑖 𝑥 𝑖−𝑥 𝑗 |

2𝑥 𝐻𝐾𝑂 SDi-j = 2 𝑥 𝐹𝑖𝑗; WSDi-j > qα;k;n-k ise H0 hipotezi reddedilir. Gruplar

arasındaki farkın önemli olduğuna karar verilir. 1.2.10 Duncan Testi

Duncan tarafından 1955 yılında bütün ortalama çiftlerinin karĢılaĢtırıldığı bir test geliĢtirilmiĢtir. Duncan testi standartlaĢtırılmıĢ aralık istatistiğini kullanan çoklu aralık testidir. Bu sebeple Duncan çoklu aralık testi olarak da adlandırılmaktadır. Örneklem büyüklükleri eĢit olan k adet ortalamaya Duncan çoklu aralık testi

(20)

11

uygulanmasında, ortalamalar artan bir Ģekilde sıralanır ve her bir ortalamaya ait standart hatalar hesaplanarak yürütülür (Özkaya 2011).

Duncan testi ile örnek ortalamaları arasındaki farkın tespit edilmesi amaçlanır. Duncan, SNK’ya benzeyen ancak kendine has özel bir çizelge kullanan çoklu aralık testidir (Doğan ve Doğan 2014).

Bu test F testine bağlı değildir. F testi önemli çıkmasa bile bu test kullanılabilir. Duncan testinde karĢılaĢtırılacak ortalama sayısı arttığında testin koruma seviyesi azalacağı için, test iĢleminde ortalamalar arasında bir farklılık tespit edilme olasılığı artacaktır (Atil ve Ünver 2001). Bu ise ortalamalar arasında küçük farklılıkların bile önemli bulunma ihtimalini artıracaktır (ÜçkardeĢ 2006).

Duncan testi grup ortalamalarının büyüklüklerine göre sıralanıĢını dikkate alır. Grup ortalamaları büyüklüklerine göre sıralandığından birbirlerine uzaklıklarına göre değerlendirilir ve en sık kullanılan testlerden biridir (Özdamar 2013, Özkaya 2011).

Testin iĢlemleri;

Dp = Qα, p, v HKO/n Qα,p,v= kritik tablo değeri,

p=büyüklük sırasına göre dizilmiĢ ortalamalar arasındaki kademe sayısını, HKO=hata kareler ortalaması,

V=hata kareler ortalamasının serbestlik derecesi, α= önem düzeyi,

Duncan testinde en büyük ortalama ile en küçük ortalama arasındaki fark en küçük anlamlı fark ile karĢılaĢtırılır. Bir sonraki adımda en büyük ortalama ile ikinci en küçük ortalama arasındaki farklar benzer Ģeklinde karĢılaĢtırılır. Bu karĢılaĢtırma en büyük ortalama ile diğer tüm ortalamaların karĢılaĢtırması yapılıncaya kadar devam edilir. Eğer gözlenen fark onun karĢılığı olan en küçük anlamlı fark değerinden büyükse ortalama çiftler arasındaki farkın anlamlı olduğu yorumu yapılır.

(21)

12

1.2.11 Hochberg GT2 Testi

Hochberg GT2 istatistiği Tukey’e benzeyen, ancak geniĢletilmiĢ t modulus tablo değerini kullanan bir post hoc testidir. Tukey kadar güçlü olmadığı kabul edilmektedir (IBM SPSS). Veri sayısı farklı olan denemelerde daha çok tercih edilir (ÜçkardeĢ 2006). Testin iĢlemleri; 𝐻𝑜𝑐ℎ𝑏𝑒𝑟𝑔 𝐺𝑇 = 𝐻𝐾𝑂 𝑥 1 𝑛𝑖+ 1 𝑛𝑗𝑥|𝑚|𝛼,𝑐(𝑛−𝑘)

Eğer; yi−xj> Hochberg GTi-j ise H0 hipotezi reddedilir. Gruplar arasındaki

farkın önemli olduğuna karar verilir. c: karĢılaĢtırma sayısı

m: modulus tablo değerini kullanır. 1.2.12 Gabriel Testi

Student maximum modulus tablo değerini kullanan ve Hochberg GT2 testine benzeyen ancak veri sayısı farklı olduğunda ondan daha güçlü bir testtir. Veri sayısı büyük ölçüde değiĢiklik gösterdiği zaman Gabriel testi daha liberal bir hal alır (Anonim 2015). Testin iĢlemleri; Gabrieli-j= 𝐻𝐾𝑂 1 2𝑛𝑖+ 1 2𝑛𝑗 x |m|α;c,(n-k) ;

Eğer yi−xj> Gabrieli-j ise H0 hipotezi reddedilir. Gruplar arasındaki farkın

önemli olduğuna karar verilir. 1.2.13 Waller-Duncan Testi

Waller-Duncan testi t istatistiği üzerine kurulu Bayesian yaklaĢım sunan testtir. Gruplardaki veri sayıları farklı olduğunda Bancroft’un önerdiği grup sayılarının harmonik ortalamasını kullanan bir test istatistiğidir (Kayri 2009, Anonim 2015).

(22)

13

Testin iĢlemleri;

Waller Duncan = tc x SH

SH= 2𝑥 𝐻𝐾𝑂

𝑛𝑖

tc:α hata düzeyinde, serbestlik derecesi =(k-1) ve (n-k) olan ve F değeri varyans

analizinden elde edilen F değeri olmak üzere, Waller-Duncan tablo değeri,

yvi,j= | yi−xj | ≥Waller Duncan ise H0 hipotezi reddedilir. Gruplar arasındaki

farkın önemli olduğuna karar verilir. 1.2.14 Dunnett Testi

Bu test araĢtırma veri setinde, kontrol grubu ile diğer grupları karĢılaĢtırma amacı ile kullanılan bir testtir. Kontrol grubunu deneme grupları ile, grup sayısının bir eksiği (k-1) kadar karĢılaĢtırma yapar. Bu özelliği ile test Bonferroni, Tukey HSD ve Scheffe testinden daha güçlü bir testtir. Dunnett testi; daha az karĢılaĢtırma yapılarak Tip I hatanın belirlenen oranı aĢmayacağı varsayımı üzerine dayalıdır (Sheskin 2011).

F testinin önemli olup olmadığına bakılmaksızın uygulanabilir. Dunnett testi tek bir kritik değer kullanır (ÜçkardeĢ 2006).

1.3 Varyansların Homojen Olmaması Durumunda Kullanılan Çoklu KarĢılaĢtırma Testleri

1.3.1 Tamhane T2 Testi;

Grup varyansları farklı ise k grup ortalamasını ikili olarak farklı varyans yaklaĢımı ile eĢ zamanlı olarak karĢılaĢtırmak için Tamhane T2 testini tercih etmek uygundur (Özdamar, 2013). Test t testi üzerine dayalı ve konservatif ikili karĢılaĢtırma testidir (Anonim 2015a). α hata düzeyinin belirlenmesinde Sidak testi ile aynı iĢlemleri uygular. Games Howell testinden az da olsa daha konservatiftir (Anonim 2015a). Testin iĢlemleri; SHi-j= 𝑆𝑖2 𝑛𝑖 + 𝑆𝑖2 𝑛𝑗; Vi-j= 𝑆𝑖 2 𝑛𝑖+ 𝑆𝑖 2 𝑛𝑗 2 𝑆𝑖 2 𝑛𝑖 −1)( 𝑆𝑖 2 𝑛𝑗 −1 2 αyeni= 1 − (1 − 𝛼) 1 𝑐 ;

(23)

14

Tamhane T2 i-j= t α yeni; v i-j x SH i-j

1.3.2 Dunnett T3 Testi;

Bu test Tamhane tarafından geliĢtirilmiĢ olmasına rağmen Dunnett tarafından modifiye edilmiĢtir. Dolayısıyla kaynaklarda bazen Tamhane T3 bazen de Dunnet T3 isimleri ile anılmaktadır (Doğan ve Doğan 2014).

Dunnett T3 testi student maksimum modulus tablo değerini kullanan ve Games Howell testine göre daha küçük örneklem büyüklüklerinde tercih edilmesi önerilen bir testtir (Anonim 2015).

Test değeri aĢağıda verilen Ģekilde elde edilir,

|m|α;c,(n-k): α hata düzeyinde, serbestlik derecesi =c ve n-k olan studentized

Maximum Modulus tablo değeri olmak üzere seçilen α ve c değerlerine karĢılık gelen |m| değeri belirlenir . Fark değerleri ile Dunnet T3 değerleri karĢılaĢtırılır. Eğer G i-j> Dunnet T3 i-j ise H0 hipotezi reddedilir.

Dunnet T3 i-j=|m|α;c,(n-k) x SHi-j

1.3.3 Games-Howell Testi;

Games-Howell testi, eĢit olmayan varyanslar ve eĢit olmayan örnek boyutları için tasarlanmıĢ bir istatistik testidir. Q istatistik dağılımını temel alır ve Dunnett T3 testine benzerdir (Anonim 2015).

1.3.4 Dunnett’s C Testi;

Varyansların eĢit olmadığı durumlarda kullanılan ağırlıklı ortalama kullanan ve Q dağılımı üzerine kurgulanmıĢ bir testtir. Modelde birden fazla faktör olduğu zaman bu test kullanılamaz (Anonim 2015).

Dunnett’s C testi Q tablo değerini kullanırken, Dunnett T3 testi student maksimum modulus tablo değerini kullanmaktadır.

Testin iĢlemleri; SH= 𝑆𝑖2 𝑛𝑖 + 𝑆𝑗2 𝑛𝑗 ; qα,k,vi-j= 𝑞𝛼 ;𝑘,𝑣𝑖∗𝑆𝑖2/𝑛𝑖 𝑆𝑖2/𝑛𝑖 + 𝑞𝛼 ;𝑘,𝑣𝑖∗𝑆𝑗2/𝑛𝑗 𝑆𝑗2/𝑛𝑗 Dunnett Ci-j = qα,k,vi / 2 ∗ SHi

(24)

15

1.4 Çoklu KarĢılaĢtırma Yönteminin Belirlenmesi

Çoklu karĢılaĢtırma testlerinde yararlanılacak prosedürün seçiminde amaç ve grupların varyanslarının eĢit veya farklı olması önemlidir. Bu testlerden bazıları ikili karĢılaĢtırmalar hata oranını kullanırken, bazıları eĢ zamanlı olarak karĢılaĢtırmalar yapmaktadır. Bazı çoklu karĢılaĢtırma testleri ortalamalar arasındaki farkları ikili olarak, bazıları ise diziliĢ sırasını esas alarak değerlendirmelerde bulunur (Özdamar 2013).

Çoklu karĢılaĢtırmalarda yaygın olarak kullanılan bazı testlerin üstünlük ve zayıf yanları Çizelge 1.2.’de düzenlenmiĢtir (Anonim 2014).

Çizelge 1.2: Yaygın kullanılan bazı çoklu karĢılaĢtırma testleri ve değerlendirilmesi

Test Veri Sayısının

EĢitliğine Duyarlılığı Tip I Hata Oranı Tip II Hata Oranı Yorum

Bonferroni Hayır DüĢük Yüksek DüzeltilmiĢ t tablo değeri

kullanır

LSD Hayır Yüksek DüĢük En yaygın kullanılan testtir

Duncan Evet Orta Orta Yaygın olarak tavsiye edilmez

SNK Evet Orta Orta

GT2 Hayır DüĢük Orta

Scheffe Hayır DüĢük Yüksek En konservatif olanıdır

Dunnet Hayır DüĢük Orta Deneme Gruplarını Kontrol

grubuna göre karĢılaĢtırır

Çizelgeden görüleceği üzere çoklu karĢılaĢtırma yöntemlerinde var olan en önemli problem Tip I ve Tip II hata oranları ve örneklem büyüklüğü olduğu anlaĢılmaktadır. Eğer gruplardaki veri sayısı eĢit ise Duncan ve SNK ile çoklu karĢılaĢtırma yapılabilir. Eğer veri sayıları eĢit değil ise diğer testlerin kullanılması daha uygun olabilecektir.

1.5 Çoklu KarĢılaĢtırma ĠĢlemlerinin Değerlendirilmesi

Bilimsel araĢtırmalarda yaygın olarak kullanılan çoklu karĢılaĢtırma testlerinin uygun varsayımlar altında kullanılması önem arz etmektedir. Çoklu karĢılaĢtırma testleri temel aldığı istatistik ve varsayımları göz önüne alındığında birbirlerinden önemli oranda farklılıklar içermektedir. AraĢtırıcıların bu durumu göz

(25)

16

ardı etmeleri veya bilmemeleri çoklu karĢılaĢtırma testlerinin hatalı kullanımına sebep olmaktadır (Özkaya 2011). AraĢtırıcılar bu durumu göz önüne alarak konu hakkında bazı bilimsel çalıĢmalar yürütmüĢlerdir. Özellikle hayvansal üretimle ilgili bazı değerlendirmeler konunun önemi açısından aĢağıda verilmiĢtir.

Lowry (1992) hayvan deneylerinde çoklu karĢılaĢtırma testlerinin doğru ve hatalı kullanımını Journal of Animal Science (1981 cilt 52 ve 53) dergisinde yayınlanan ve hayvan besleme ile ilgili makaleleri incelemiĢtir. AraĢtırmada incelenen 123 makalenin 74 adedinde çoklu karĢılaĢtırma testlerinin kullanıldığını ve bu kullanımların % 41’inin uygun kullanım olduğunu bildirmiĢtir. Aynı derginin 1987 yılı 64-65 ciltlerinde yayınlanan ve incelenen 141 makalenin 48’inde çoklu karĢılaĢtırma testi kullanılmıĢ ve uygun kullanımın % 52 olduğunu bildirmiĢtir.

Pizarro ve ark (2002) gerçek ve simülasyon ile elde edilen verilerle farklı çoklu karĢılaĢtırma testlerini (Fisher LSD, Tukey, Bonferroni, Scheffe, Sidak, Dunnet) değerlendirmiĢlerdir. AraĢtırıcılar Fisher LSD testinin en düĢük güven aralığında sonuç verdiğini ve deneysel hata oranının kontrolü bakımından zayıf, Scheffe testi en güçlü test olarak bildirilmiĢtir. Diğer testlerin benzer sonuçlar verdiğini ortaya koymuĢlardır.

Cabral (2008) farelerde yapılan bir deneysel araĢtırmada değiĢik düzeyde egzersiz yaptırılan farelerde kalp ağırlığı/vücut ağırlığı oranını farklı çoklu karĢılaĢtırma testleri ile karĢılaĢtırmıĢtır. ÇalıĢmada Tukey, Scheffe, Bonferroni ve Fisher LSD çoklu karĢılaĢtırma prosedürleri kullanılmıĢtır. LSD testi diğer çoklu karĢılaĢtırma testlerinden daha farklı sonuçlar ortaya koyarken diğer testler karĢılaĢtırılan gruplarda birbirilerine oldukça benzer sonuçlar ortaya koyduğu belirlenmiĢtir. AraĢtırıcı hangi testin kullanılacağı konusunda net bir bulgu bildirmemiĢtir. AraĢtırıcı çoklu karĢılaĢtırma iĢlemlerinde veri sayısı ve grup sayısının göz önüne alınmasının önemini vurgulamıĢtır.

Yossa ve Verdegem (2015) su ürünleri yetiĢtiriciliği ile ilgili 2013 yılında yayınlanan 10 adet dergide yayınlanan makaleleri kullandıkları istatistiksel metotlar ve çoklu karĢılaĢtırma metotlarının hatalı kullanımı bakımından değerlendirmiĢlerdir. ÇalıĢmalarda kullanılan istatistik yöntemler arasında çoklu karĢılaĢtırma yöntemlerinin oransal payı yaklaĢık % 60’lar düzeyindedir. AraĢtırıcılar yayınlanan

(26)

17

makalelerin % 65’inde kullanılan istatistik yöntemlerin deney düzeneği ve verilerin özelliklerine göre hatalı kullanıldığını bildirmiĢlerdir.

Archives of Veterinary Science dergisinin 2000-2010 yılları arasında yayınlanan (cilt 5-15) makaleler kullanılan istatistik metotlar açısından değerlendirilmiĢtir. AraĢtırıcılar incelenen makalelerin %33,6’sında istatistik metot kullanılmadığını, %29,3’ünde ortalamaların karĢılaĢtırıldığını, % 6,5’inde varyans analizinin kullanıldığını bildirmiĢlerdir. Ġncelenen makalelerin ileri sürdüğü sonuçların %34,3’ünün istatistiksel dayanağının yetersiz, % 33,5’inin istatistiksel bir desteğinin olmadığı, ancak %32.2’sinin yeterli ve uygun istatistiksel dayanağının olduğu bildirilmiĢtir. Makalelerde uygulanan varyans analizleri % 81,2 oranında, ortalamaların karĢılaĢtırıldığı makalelerde ise %86,7 oranında yetersizlik ve hatalı kullanım olduğu ileri sürülmüĢtür (Neto ve Ostrensky 2013)

Bezerro ve ark. (2002) Horticulture Brasilaria dergisinde 1983-2000 yılları arasında yayınlanan ve çoklu karĢılaĢtırma testi kullanılan 294 makalenin %65,6’sında çoklu karĢılaĢtırma testinin uygun olarak kullanıldığını, %22,8’inin kısmen doğru, %11,6’sının ise uygun olarak kullanılmadığını tespit etmiĢlerdir. AraĢtırıcılar makalelerde Tukey, LSD ve Duncan testinin yaygın olarak kullanıldığını bildirmiĢlerdir.

Koshi ve ark. (2002) Journal of Institue Agriculture and Animal Sicence dergisinin 1995 yılına kadar yayınlanan 16 sayısını kullanılan istatistik metotlar açısından incelemiĢlerdir. AraĢtırıcılar çoklu karĢılaĢtırma testlerinden 40 araĢtırmada kullanılan LSD testinin %40,31 çalıĢmada kullanılan Duncan testinin %22.58 oranında hatalı kullanım olduğunu, 2 çalıĢmada kullanılan HSD testinde ise hatalı kullanım olmadığını bildirmiĢlerdir. Sudan Journal of Agricultural Research (SJAR) dergisinde 2005-2010 yılları arasında yayınlanan 200 makale çoklu karĢılaĢtırma testlerinin doğru ve hatalı kullanımı bakımından değerlendirilmiĢtir. Yayınlanan 150 makaleden 15’inde LSD ve Duncan testi ile çoklu karĢılaĢtırma analizi gerçekleĢtirildiği bildirilmiĢtir. ÇalıĢmalarda LSD testinin doğru kullanımı %100 iken Duncan testinde doğru kullanım %30, yanlıĢ ve eksik kullanım ise %70 olarak bildirilmiĢtir (Siraj ve Abdellah 2014).

(27)

18

Yapılan literatür taramasında Veterinerlik alanında varyans analizi ve çoklu karĢılaĢtırma testlerinin doğru veya hatalı kullanımına ait bir literatür çalıĢmasına rastlanmamıĢtır. Türkiye’de çoklu karĢılaĢtırma testlerinin kullanımı ile ilgili olarak, Açıkgöz ve Açıkgöz (2001) tarımsal araĢtırmalarda konunun önemini ortaya koymak için aynı örnekte değiĢik test yöntemlerinin kullanılması ile yapılan hataları belirlemeye yönelik bir çalıĢma yürütmüĢtür. AraĢtırıcılar LSD, Tukey ve Duncan testini detaylı olarak incelemiĢler ve yapılan hatalı kullanım durumlarını ortaya koymaya çalıĢmıĢlardır. AraĢtırıcılar tekrarlı denemelerde seviye sayısına bakılmadan LSD testinin kullanımının yaygın olarak rastlanan bir hata olduğunu, tek faktörlü denemelerde ikiden fazla ortalamanın karĢılaĢtırılması durumunda LSD’nin dıĢında araĢtırıcı Duncan veya Tukey testinden birini tercih edebileceğini ortaya koymuĢlardır. AraĢtırıcılar Amerikan ekolünde Duncan’ın Avrupa ekolünde ise Tukey veya Tukey ile Duncan arasında sonuç veren SNK testinin kullanıldığını bildirmiĢlerdir (Açıkgöz ve Açıkgöz 2001).

Öntürk ve Özbek (2007) deneysel diyabet oluĢturulması ve kan Ģekeri ölçülmesi ve tıp araĢtırmalarında yapılan bazı istatistiksel hataları incelemiĢlerdir. AraĢtırıcılar yapılan hataları ortalamaların gösteriminden kaynaklananlar, normal dağılım ve grup homojenliğine yani varyans analizinin koĢullarına dikkat edilmemesinden kaynaklananlar olarak bildirmiĢlerdir. AraĢtırıcılar özellikle deneysel çalıĢmalarda deneysel etik kurulu kararları ve uygulamaları nedeniyle n sayısının sınırlı tutulması çoklu karĢılaĢtırmalarda yöntem seçilirken göz önüne alınmalarının önemi bildirilmiĢtir.

Kabaca ve Erdoğan (2002) Ġstanbul, Ankara ve Ġzmir’deki üç devlet üniversitesinde fen bilgisi ve matematik alanında yapılan yüksek lisans ve doktora tezlerini kullanılan istatistiksel metotlar açısından incelemiĢlerdir. AraĢtırıcılar tezlerde Tek yönlü varyans analizinin kullanım oranının %45,7 oranında kullanıldığını bildirmiĢlerdir. AraĢtırıcılar ANOVA ile yapılan analizlerin hiç birisinde homojenlik testinin yapılmadığını tespit etmiĢlerdir. AraĢtırmalarda çoklu karĢılaĢtırmalarda yaygın olarak LSD, Tukey ve Scheffe testleri kullanılmıĢtır.

Tozlu (2006) Saanen x Kıl (F1) melezi ve Kıl keçi oğlaklarında yürüttüğü çalıĢmada, Saanen x Kıl (F1) melezi ile Kıl keçi oğlakların incelenen her iki dönemdeki canlı ağırlık artıĢları üzerine ana yaĢı etkisinin önemli (P<0.05) olduğu

(28)

19

bildirilmiĢtir. AraĢtırıcı çalıĢmasında 2 x 2 x 2 x 6 tesadüf bloklarında faktöriyel deneme düzenine göre analiz edilmiĢtir. ÇalıĢmada hangi çoklu karĢılaĢtırma testinin kullanıldığına yer verilmemiĢtir.

Aydın ilinde yetiĢtirici Ģartlarında iki farklı iĢletmede yetiĢtirilen 2, 3, 4, 5, 6+ yaĢ grubu analardan doğan toplam 146 adet Saanen x Kıl keçisi (F1) (SK), Alpin x Kıl keçisi (F1) (AK) ve Kıl keçisi (K) oğlaklarında doğum ve farklı dönem canlı ağırlıklara iĢletme ve ana yaĢının etkisi önemli (P<0.01) olarak bildirilmiĢtir. ÇalıĢmada GLM ile değerlendirilmiĢ ve çoklu karĢılaĢtırmalarda Duncan testi kullanılmıĢtır (Özdal ve ark 2013).

Yapılan literatür araĢtırmasında Türkiye’de Veteriner Hekimlik ve hayvan yetiĢtiriciliği alanında, farklı çoklu karĢılaĢtırma testlerinin araĢtırma sonuçları üzerine etkisi bakımından karĢılaĢtırılmasının yapıldığını gösteren bir çalıĢmaya rastlanmamıĢtır. Benzer Ģekilde, çoklu karĢılaĢtırma testlerinin bilimsel yayınlarda uygun biçimde kullanılıp kullanılmadığına yönelik bir araĢtırmaya rastlanmamıĢtır.

Bu tez çalıĢmasında, Kıl Keçisi oğlaklarının süt emme dönemi büyüme hızına, ikiden fazla alt grubu bulunan ana yaĢı ve iĢletme faktörü etkisini araĢtırmada, istatistik analizlerde yaygın olarak kullanılmakta olan bazı çoklu karĢılaĢtırma testlerinin (post hoc testler), verilecek karara etkisi bakımından karĢılaĢtırılması amaçlanmıĢtır.

(29)

20

2

GEREÇ ve YÖNTEM

2.1 Gereç

Bu çalıĢmada, Karaman Ġli Damızlık Koyun Keçi YetiĢtiricileri Birliği’ne kayıtlı, Kıl Keçisi yetiĢtiren 6 iĢletmeye ait 2015 yılında doğan 1189 baĢ oğlağın süt emme dönemindeki büyüme hızı (günlük canlı ağırlık artıĢı, GCAA) verileri kullanılmıĢtır.

2.2 Yöntem

AraĢtırmada kullanılan oğlakların doğum ağırlığı ve sütten kesim ağırlığı değerleri Microsoft Excel programına aktarılarak, her bir oğlağın büyüme hızı (GCAA) hesaplanmıĢtır. Bu amaçla, oğlakların günlük canlı ağırlık artıĢları (Tekin 2009 ) nın bildirdiği yöntemle aĢağıda verilen formülle hesaplanmıĢtır.

GCAA =B−A

𝐶

Bu formülasyonda GCAA; günlük canlı ağırlık artıĢı, A; doğum ağırlığı,

B; sütten kesim ağırlığı

C; doğum ve sütten kesim arasındaki süre.

Sonra GCAA verileri için; 6 düzeyli (2, 3, 4, 5, 6 ve 7+ yaĢlı analardan doğan oğlaklar) ana yaĢı faktörü ve 6 düzeyli (her biri yaklaĢık 200 baĢ anaç kıl keçisi olan 6 iĢletme) iĢletme faktörüne göre oluĢturulan modelle, yine aynı düzeyli olmak üzere 6 iĢletmeden de yararlanılmıĢtır.

AraĢtırmada öncelikle oğlakların büyüme hızı (GCAA) bireysel olarak hesaplanmıĢtır. Hesaplanan GCAA üzerine ana yaĢı ve iĢletme faktörünün etkisi, içine doğum tipi ve cinsiyet faktörlerinin de dahil edildiği aĢağıdaki model ile varyans analizine tabi tutulmuĢtur (Tekin 2010). Varyans analizinden önce veriler normal dağılım gösterip göstermedikleri ve varyansların homojenliği açısından incelenmiĢtir. Varyans analizinin ardından yukarıda listesi verilen çoklu karĢılaĢtırma testleri yapılmıĢ ve ele edilen benzer ve farklı sonuçlar tablo edilmiĢtir. Ġstatistik analizler SPSS (V21) programında yapılmıĢtır.

(30)

21

Ġstatistik analizde kullanılan model:

Yijklm = U + ai + bj + ck + dl + f(Zijklm – Z)+ eijklm

Yijkl : i yaĢındaki anadan doğmuĢ, j iĢletmesindeki, k doğum tipinden ve l

cinsiyetinden m kuzusunun GCAA değeridir.

U: Ara değer (intercept), Populasyon ortalamasının hesaplanmasında kullanılır (= U + f(Zijklm – Z)),

ai: i. yaĢ grubundaki ananın etki miktarı,

bj: J. iĢletmenin etki miktarı,

ck: k. doğum tipinin etki miktarı,

dl: l. Cinsiyetin etki miktarı,

f: doğum ağırlığının etkisi. Zijklm: i yaĢlı anadan doğan, j iĢletmesinden, k

doğum tipinden ve l cinsiyetinden m kuzusunun doğum ağırlığı, Z doğum ağırlığı ortalaması)

eijkl: Hata veya geriye kalan (remainder) olarak kabul edilen ve i yaĢlı anadan

doğan, j iĢletmesinden, k doğum tipinden ve l cinsiyetinden m kuzusunun GCAA’na, ana yaĢı, iĢletme, doğum tipi ve cinsiyetten baĢka faktörlerin etki miktarıdır.

(31)

22

3

BULGULAR

Veriler, iĢletme ve ana yaĢı faktörlerine göre, her alt grupta ayrı ayrı olmak üzere normal dağılım açısından incelenmiĢtir. Kolmogorov-Smirnov testi ile yapılan normallik kontrolü ve Levene testi ile yapılan varyansların homojenliği kontrolü sonuçları, P değerleri olarak Çizelge 3.1’de verilmiĢtir. Çizelge incelendiğinde, 6 yaĢ grubu dıĢında, bütün gruplarda normallik ve homojenlik P değerleri 0.05’ten büyük olduğu için alt grupların normal dağılım gösterdiği ve gruplardaki varyasyonun homojen olduğu kabul edilmiĢtir.

Çizelge 3.1 ĠĢletme ve ana yaĢı faktörlerinin normallik ve varyansların homojenliği testi sonuçları

İşletme Normallik P

Ana yaşı Normallik P 1 0,200 2 yaş 0,200 2 0,200 3 yaş 0,200 3 0,200 4 yaş 0,200 4 0,200 5 yaş 0,200 5 0,200 6 yaş 0,007 6 0,200 7 yaş 0,200 Homojenlik P=0,054 Homojenlik P=0,054

Varyans analizi yöntemi genel doğrusal model yaklaĢımı kullanılarak yapılmıĢ olup, iĢletme, ana yaĢı, cinsiyet ve doğum tipi faktörleri sabit etkili faktörler olarak, doğum ağırlığı ise kovaryet (sürekli değiĢken) olarak modele dahil edilmiĢtir. Ancak kovaryetli modelde, çoklu karĢılaĢtırma testleri yapılamadığı için, çoklu karĢılaĢtırma aĢamasında bu etki modelden çıkartılmıĢtır. Varyans analizi sonuçları Çizelge 3.2’de verilmiĢtir.

Çizelge 3.2: Oğlakların günlük canlı ağırlık artıĢı ile ilgili varyans analizi tablosu

Varyasyon kaynağı SD KT KO F P Genel 1188 2603045,373 - - - İşletme 5 751531,603 150306,321 103,474 0,000 Ana yaşı 5 11549,001 2309,800 1,590 0,160 Cinsiyet 1 103938,99 103938,990 71,554 0,000 Doğum tipi 1 9967,971 9967,971 6,862 0,009 Doğum ağırlığı 1 19254,925 19254,925 13,256 0,000 Hata 1175 1706802,883 1452,598 - -

(32)

23

Çizelge 3.2 incelendiğinde, oğlakların GCAA üzerine cinsiyet (P<0,001) ve doğum tipinin (P<0,01) etkisi önemli bulunmuĢtur. Bu iki faktörle ilgili çoklu karĢılaĢtırma testi yapılmayacağından üzerinde durulmamıĢtır. Çoklu karĢılaĢtırma testine konu olan ĠĢletme faktörünün etkisi önemli (P<0,001) olup gerekli çoklu karĢılaĢtırmalar yapılmıĢ ve Çizelge 3.3’te verilmiĢtir. Ana yaĢı faktörünün etkisi önemsiz (P>0,05) bulunmuĢ olup çoklu karĢılaĢtırmaya ihtiyaç duyulmamaktadır. Ancak, bu durumlarda bile bazı çoklu karĢılaĢtırma testlerinin gruplar arasında önemli fark bulduğunu göstermek için ana yaĢı faktörü için de çoklu karĢılaĢtırma testleri yapılmıĢtır. Ayrıca, Bonferroni ve SNK gibi bazı çoklu karĢılaĢtırma testleri F testinden bağımsız olarak çoklu karĢılaĢtırma yaptığından onları göstermek bakımından yapılmıĢtır.

Çizelge 3.3 incelendiğinde, yedi farklı test, 2-3 ve 2-4 karĢılaĢtırmaları dıĢında bütün ikiĢerli karĢılaĢtırmalarda aynı sonucu vermiĢlerdir. 2-3 karĢılaĢtırmasında LSD testi iki grup arasındaki farkı önemli (P=0.02) bulurken diğerleri önemsiz bulmuĢtur. 2-4 karĢılaĢtırmasında da Scheffe testi iki grup arasındaki farkı önemsiz(P

=

0,076) bulurken diğerleri önemli bulmuĢtur.

Bu sonuca göre; LSD testinin ikili karĢılaĢtırma testleri arasında istatistiksel olarak anlamlı farklılıkları yakalamada, yani beta hatası (II. Tip hata) yapmamada en iyi test olduğu, Scheffe testinin ise en kötü test olduğu söylenebilir.

Çizelge 3.3’te P değerleri ile farklılıkları belirlenen grupların harflendirme ile gösterimi Çizelge 3.4’te verilmiĢtir. Bu sonuçların aralık testi sonuçları ile karĢılaĢtırılması iki yöntem (çoklu karĢılaĢtırma testi ve aralık testi) arasında, farklı grupları belirlemek bakımından bir farklılığın veya uyumun olup olmadığını kontrol etmeyi sağlamaktadır.

(33)

24

Çizelge 3.3: Çoklu karĢılaĢtırma testleri ile iĢletmelerin ikili karĢılaĢtırılması (P değerleri).

Kullanılan çoklu karĢılaĢtırma testleri KarĢılaĢtırılan

gruplar

TUKEY HSD

SCHEFFE LSD BONFERRONĠ SĠDAK GABRĠEL HOCHBERG

1-2 0,549 0,730 0,094 1,000 0,774 0,770 0,773 1-3 0,000 0,003 0,000 0,000 0,000 0,000 0,000 1-4 0,000 0,000 0,000 0,000 0,000 0,000 0,000 1-5 0,000 0,000 0,000 0,000 0,000 0,000 0,000 1-6 0,000 0,000 0,000 0,000 0,000 0,000 0,000 2-3 0,180 0,363 0,020 0,294 0,257 0,256 0,256 2-4 0,020 0,076 0,002 0,024 0,024 0,024 0,024 2-5 0,000 0,000 0,000 0,000 0,000 0,000 0,000 2-6 0,000 0,000 0,000 0,000 0,000 0,000 0,000 3-4 0,954 0,980 0,385 1,000 0,999 0,999 0,999 3-5 0,000 0,000 0,000 0,000 0,000 0,000 0,000 3-6 0,000 0,000 0,000 0,000 0,000 0,000 0,000 4-5 0,000 0,000 0,000 0,000 0,000 0,000 0,000 4-6 0,000 0,000 0,000 0,000 0,000 0,000 0,000 5-6 0,000 0,000 0,000 0,000 0,000 0,000 0,000

Çizelge 3.4: Farklı testlere göre iĢletmeler arası farklılıkların harflendirme ile gösterilmesi (Çizelge 3.3’e göre).

ĠĢletmeler ve aritmetik ortalamalar

Testin Adı 1 148,1 2 154,2 3 163,1 4 166,4 5 204,6 6 105,1 Alt grup Sayısı TUKEY HSD b bc cd d e a 5 SCHEFFE b bc c c d a 4 LSD b b c c d a 4 BONFERRONİ b bc cd d e a 5 SİDAK b bc cd d e a 5 GABRİEL b bc cd d e a 5 HOCHBERG b bc cd d e a 5

Farklı iĢletmelerde doğan oğlaklarının GCAA’nın aralık testleri ile karĢılaĢtırılması ve homojen alt gruplara ayırması sonuçları Çizelge 3.5’te verilmiĢtir. Aynı harfi alan ortalamalar homojen olup aynı grupta yer almaktadır.

(34)

25

Çizelge 3. 5: Oğlakların GCAA’nın ĠĢletme faktörüne göre homojen alt grupları (çoklu aralık testleri).

ĠĢletmeler ve aritmetik ortalamalar

Testin Adı 1 148,1 2 154,2 3 163,1 4 166,4 5 204,6 6 105,1 Alt grup Sayısı SNK b b c c d a 4 Tukey HSD b bc cd d e a 5 Tukey B b bc cd d e a 5 Duncan b b c c d a 4 Scheffe b bc c c d a 4 Gabriel b bc cd d e a 5 REGW-F b bc cd d e a 5 REGW-Q b bc cd d e a 5 Waller Duncan b bc cd d e a 5 Hochberg GT b bc cd d e a 5

Çizelge 3.5 incelendiğinde SNK, Duncan ve Scheffe testleri iĢletme faktörünün düzeylerini 4 homojen alt gruba ayırırken, diğer testlerin 5 homojen alt gruba ayırdığı görülmektedir. Bir anlamda bu üç test var olan anlamlı farkı görmemekte ve II. tip hataya neden olmaktadır. Bütün testlere göre, en iyi iĢletme olarak 5. en kötü iĢletme ise 6. ĠĢletme olduğu görülmektedir.

Oğlakların büyüme hızına ana yaĢının etkisinin farklı çoklu karĢılaĢtırma testleri ile değerlendirilmesine ait bulgular Çizelge 3.6’da verilmiĢtir.

Varyans analizi sonuçlarına göre oğlakların GCAA’na ana yaĢının etkisinin önemsiz olduğu, yani ana yaĢı grupları arasındaki farkın önemsiz olduğu daha önce görülmüĢtü. Ancak, varyans analizi sonucuna bakmaksızın yapılan çoklu karĢılaĢtırma testleri sonucunda bazı ana yaĢı grupları arasındaki farkların önemli çıktığı Çizelge 3.6’dan görülmektedir. Çizelgenin detaylı incelenmesinde, Scheffe testi 2-7 yaĢ grupları ile 4-5 yaĢ grupları arasındaki farklılığı istatistik olarak önemsiz (P>0,05) bulurken, diğer çoklu karĢılaĢtırma testleri önemli bulmuĢtur. LSD testi ise 4-6, 5-7 ve 6-7 yaĢ grupları arasındaki farklılığı önemli bulurken diğer

(35)

26

testler ilgili yaĢ grupları arasındaki farkı önemsiz bulmuĢlardır. 2 yaĢlı analardan doğanlar, 5 yaĢ grubu hariç, diğerlerinden farklı bulunmuĢtur. Bütün testler 3-5 arası farkı önemli bulmuĢtur. 5 arası fark da, Scheffe testi hariç, önemli bulunmuĢtur. 4-6 arasını sadece LSD önemli bulmuĢtur. 5-7 ve 4-6-7 arasındaki farkları bütün testler önemsiz bulurken, LSD önemli bulmuĢtur. Bu sonuçlardan LSD testinin beta hatasına karĢı duyarlı olduğu ve beta hatası yapmadığı, buna karĢılık Scheffe testinin ise beta hatası yapmaya daha eğilimli olduğu görülmektedir.

Çizelge 3.6: Oğlakların GCAA’na ana yaĢının etkisine ait çoklu karĢılaĢtırma testi sonuçları (P değerleri)

Kullanılan çoklu karĢılaĢtırma testleri KarĢılaĢtırılan

gruplar

TUKEY HSD

SCHEFFE LSD BONFERRONĠ SĠDAK GABRĠEL HOCHBERG

2-3 0,000 0,000 0,000 0,000 0,000 0,000 0,000 2-4 0,000 0,002 0,000 0,000 0,000 0,000 0,000 2-5 0,987 0,995 0,517 1,000 1,000 1,000 1,000 2-6 0,000 0,000 0,000 0,000 0,000 0,000 0,000 2-7 0,011 0,050 0,001 0,013 0,013 0,009 0,013 3-4 0,741 0,863 0,169 1,000 0,937 0,936 0,937 3-5 0,000 0,003 0,000 0,000 0,000 0,000 0,000 3-6 0,894 0,951 0,286 1,000 0,994 0,990 0,993 3-7 0,718 0,849 0,758 1,000 0,924 0,914 0,923 4-5 0,037 0,120 0,003 0,047 0,046 0,045 0,046 4-6 0,374 0,554 0,047 0,698 0,511 0,455 0,510 4-7 1,000 1,000 0,810 1,000 1,000 1,000 1,000 5-6 0,001 0,005 0,000 0,001 0,001 0,000 0,001 5-7 0,167 0,346 0,018 0,269 0,237 0,235 0,237 6-7 0,335 0,542 0,044 0,664 0,493 0,478 0,492

Farklı ana yaĢı gruplarının harflendirme ile gösterilmesi Çizelge 3.7’de verilmiĢtir. Buradan çıkan sonuçlar ile aralık testi sonucunda ortaya çıkan homojen alt grupların benzeĢikliği testler arasındaki uyumu, farklılığı da tutarsızlığı ya da farkı ortaya koyacaktır.

(36)

27

Çizelge 3.7.: Farklı testlere göre ana yaĢı grupları arası farklılıkların harflendirme ile gösterilmesi (Çizelge 3.6’ya göre).

Ana yaşı grupları ve ortalamaları TESTİN ADI 2y 166,7 3y 147,7 4y 152,5 5y 164,3 6y 142,4 7y 153,5 Alt grup Sayısı TUKEY HSD c a a bc a ab 3 SCHEFFE c a ab bc a ab 3 LSD c ab b c a b 3 BONFERRONİ c a a bc a ab 3 SİDAK c a a bc a ab 3 GABRİEL c a a bc a ab 3 HOCHBERG c a a bc a ab 3

Farklı yaĢlı analardan doğan oğlakların GCAA ortalamalarına ait aralık testi sonuçlarına göre oluĢan homojen alt gruplar Çizelge 3.8’de verilmiĢtir. Aynı harfi alan ortalamalar homojen olup aynı grupta yer almaktadır. Buradaki sonuçlar Çizelge 3.7’deki sonuçlar ile karĢılaĢtırıldığında Tukey testi bakımından aynı sonucun bulunduğu ancak Scheffe testinde farklılık ortaya çıktığı görülmektedir. Scheffe testi çoklu karĢılaĢtırmada 3 homojen alt grup oluĢtururken aralık testinde 2 homojen alt grup oluĢturmuĢtur. Diğer testler her iki yöntemde de yer almadığı için bir karĢılaĢtırma yapılmamıĢtır.

Oğlakların GCAA’na ana yaĢının etkisi bakımından oluĢan homojen alt gruplar incelendiğinde, SNK ve Tukey B tamamen aynı, Scheffe testi ise bunlara benzer sonuç verdiği, her üç testin grupları iki homojen alt gruba ayırdığı görülmektedir. SNK ve Tukey B testleri 2 ve 5 yaĢlı analardan doğan oğlakların diğerlerine göre daha yüksek canlı ağırlığa sahip olduğunu tespit etmiĢtir. Diğer testler grupları 3 homojen alt gruba ayırmıĢtır. REGWF, REGWQ ve Waller Duncan testleri homojen alt grup sayısı bakımından birbirleri ile aynı sonucu ortaya koyarken diğerleri de az farkla bunlara yakın sonuçlar vermiĢtir.

(37)

28

Çizelge 3.8: Çoklu aralık testi sonuçlarına göre ana yaĢına ait homojen alt gruplar (çoklu aralık testleri).

Ana yaşı grupları ve ortalamaları TESTİN ADI 2y 166,7 3y 147,7 4y 152,5 5y 164,3 6y 142,4 7y 153,5 Alt Grup Sayısı SNK b a a b a a 2 TUKEY B b a a b a a 2 SCHEFFE b a ab b a ab 2 TUKEY HSD c a ab bc a ab 3 DUNCAN c ab b c a b 3 REGWQ c a a bc a ab 3 REGWF c a a bc a ab 3 HOCHBERG c a ab bc a a 3 WALLER DUNCAN c a a bc a ab 3

Tukey HSD ve Scheffe testleri hem çoklu karĢılaĢtırma testi hem de çoklu aralık testi olarak sonuç vermektedirler. Ġki sonuç karĢılaĢtırıldığında, çoklu karĢılaĢtırma testinde Tukey HSD 4-5 arası farkı önemli bulurken (P=0,037), çoklu aralık testinde bu iki grubu benzer sayarak aynı alt gruba (B grubu) yerleĢtirdiği; Scheffe testi çoklu karĢılaĢtırmada 2-7 arası farkı önemsiz bularak (P=0.05), aralık testinde benzer saymıĢ ve aynı gruba (B grubu) atamıĢtır.

(38)

29

4

TARTIġMA

Yapılan çalıĢmalarda araĢtırıcılar aynı konuda farklı çoklu karĢılaĢtırma testlerini tercih edebilmektedirler. Özellikle bilgisayar teknolojisinde yaĢanan hızlı geliĢme, farklı yazılım programlarının geliĢtirilmesi, çoklu karĢılaĢtırma testlerinin daha hızlı ve kolaylıkla yapılabilmesini sağlamaktadır. Bu çalıĢmada, kullanımı oldukça yaygın olan SPSS paket programında yer alan çoklu karĢılaĢtırma testleri ile analizler gerçekleĢtirilmiĢtir. Böylelikle aynı verilere uygulanan farklı çoklu karĢılaĢtırma testlerinin sonuçları bir arada değerlendirilmiĢtir.

Varyans analizi ve çoklu karĢılaĢtırma yöntemleri bilimsel çalıĢmalarda kullanırken öncelikli olarak örneklem verilerinin varyans analizi ile değerlendirilebilmesi için, normal dağılım ve varyansların homojenliği gibi, gerekli ön Ģartların sağlanmıĢ olmasına dikkat edilmelidir. ÇalıĢmada kullanılan verilerde varyanslar homojendir (Çizelge 3.1). Çoklu karĢılaĢtırma testlerinde öncelikle varyansların homojenliğine bakılmalıdır. Çünkü varyansların eĢit olması veya olmaması durumunda kullanılacak olan çoklu karĢılaĢtırma ve aralık testleri değiĢmektedir (Anonim 2015a). Dolayısı ile ön Ģartları yerine getirmeden yapılacak çoklu karĢılaĢtırma testleri hatalı sonuç elde edilmesine ve hatalı genelleme yapılmasına neden olacaktır. Bu durum doğru analize baĢlamanın ilk aĢamasını oluĢturmaktadır.

AraĢtırmada kullanılan testlerin bir kısmı (Tukey HSD, Hochberg, Gabriel ve Scheffe) hem aralık hem de çoklu karĢılaĢtırma (SPSS help) testleridir. Bu çalıĢmada farklı iĢletmelerin çoklu karĢılaĢtırma ve aralık testleri ile yapılan karĢılaĢtırılmalarında, testler arasında önemli oranda birbirine benzerlikler elde edilmiĢtir.

Bu çalıĢmada farklı iĢletmelerde doğan oğlaklarının GCAA karĢılaĢtırmasında Scheffe ve LSD testi hem çoklu karĢılaĢtırma hem de aralık testi olarak diğer tüm testlerden farklı sonuçlar ortaya koymuĢtur. Özellikle LSD testi karĢılaĢtırılacak grup sayısının 3’ten fazla olduğu durumlarda tercih edilmesi Tip-I hataya neden olabileceği gözden kaçırılmamalıdır.

SNK testi; hem farklı iĢletmelerde doğan oğlakların hem de farklı ana yaĢındaki oğlakların GCAA bakımından homojen alt grup oluĢturma bakımından

(39)

30

diğer testlerden farklı sonuçlar ortaya koymuĢtur. SNK ve Duncan testleri 2 ve 3 numaralı iĢletmelerde doğan oğlakların GCAA’nı birbirlerinden farklı olarak tespit ederken, diğer testler bu gruplar arasında farklılık göstermemektedir. Farklı yaĢtaki analardan doğan oğlakların GCAA’nı SNK testi Tukey’B ile aynı benzerlik ve farklılıklar belirlemektedir. Bu durum SNK testinin örneklem sayısının eĢitliğine olan duyarlılığı (Anonim 2015a) ve Tukey B ile SNK testinin aynı kritik tablo değerini kullanması ile açıklanabilir (ÜçkardeĢ 2006).

Çoklu karĢılaĢtırma testlerinde karĢılaĢtırılacak grup sayısı ve gruplardaki veri sayısı önemlidir (Çınar 2007). Gruplardaki denek sayısının artması kullanılan testin gücünü ve güvenilirliğini artırmaktadır (Sümbüloğlu ve Sümbüloğlu 2010). Benzer Ģekilde grup sayısının artması da önemli bir faktördür. Bu çalıĢmada çoklu karĢılaĢtırmalar 6 grup üzerinden yapılmıĢtır (Çizelge 3.1). ÇalıĢmada LSD testi diğer testlerden farklı sonuçlar göstermektedir. LSD testi 2 ve 3 numaralı iĢletmeler arasındaki farklılığı önemli bulurken diğer tüm ikili karĢılaĢtırma testleri önemsiz bulmuĢtur. Bu sonucun elde edilmesi LSD testi ile yapılan çoklu karĢılaĢtırmalarda grup sayısının artması ile birlikte artan deneysel hata oranı ile izah edilebilir (Atil ve Ünver 2001, Özkaya 2011). Çoklu karĢılaĢtırma testlerinde grup sayısının artması P değerinin küçülmesine neden olmaktadır (Koca 2013). Bu da LSD testinin daha fazla grup veya gruplar arasında istatistiki olarak farklılık tespit edilmesine neden olmaktadır (Çizelge 3.3). Çoklu karĢılaĢtırma yöntemleri arasında yer alan LSD testinin grup sayısına ve grup sayısındaki artıĢa bağlı olarak farklı sonuç verebileceği bildirilmektedir. Özellikle grup sayısının 3’ten fazla olduğu durumlarda LSD testinin kullanılması çok fazla önerilmemektedir (Cabral, 2008).

LSD testi liberal bir test olarak belirtilmektedir (Anonim 2016). Literatürde H0 hipotezini çok fazla reddeden testler liberal olarak adlandırılmaktadır. Dolayısıyla

liberal testlerin istatistik olarak gruplar arasında anlamlı sonuçlar bulma ve Tip I hataya neden olma olasılıkları daha yüksektir (BaĢol 2014). Çizelge 3.3 incelendiğinde oğlakların GCAA’nda 2-3 nolu iĢletmeler arasındaki farklılık sadece LSD testi tarafından önemli (P=0,020) bulunmuĢtur. Bu durum testin diğer testlere göre daha liberal olması ile açıklanabilir. Benzer durum ana yaĢı gruplarında 4-6 (P=0,047), 5-7 (0,018) ve 6-7 yaĢ (P=0,044) gruplarında da (Çizelge 3.6) söz

Şekil

Çizelge  1.1’den  anlaĢılacağı  üzere,  ilgili  programda  analizler  varyansların  homojenliğini  gerektiren  14  adet  çoklu  karĢılaĢtırma  testi  ve  varyansların  eĢit  olmaması  durumunda  kullanılan  4  adet  olmak  üzere  toplam  18  çoklu  karĢıla
Çizelge 1.2:  Yaygın kullanılan bazı çoklu karĢılaĢtırma testleri ve değerlendirilmesi
Çizelge 3.2: Oğlakların günlük canlı ağırlık artıĢı ile ilgili varyans analizi tablosu
Çizelge  3.4:  Farklı  testlere  göre  iĢletmeler  arası  farklılıkların  harflendirme  ile  gösterilmesi (Çizelge 3.3’e göre)
+3

Referanslar

Benzer Belgeler

Çatı örtüsü ve kaplamalardan gelen yükleri homojen olarak aşıklara ileten, genellikle eşit aralıklarla konulan ahşap kirişlerdir. Mertek aralıklaraı akstan aksa 40-60

Eğitim ve teknoloji ilişkisi; temel kavramlar; öğretim teknolojisinin tarihsel gelişimi; Türkiye’de 1980 ve sonrası öğretim teknolojilerinin gelişimi

Zeka, öğrencileri belli seviyelere göre sınıflandırmak ve onların gelecekteki başarılarını tahmin etmek

Ortalama sayısının az veya sadece belirli bazı ortalama çiftlerinin karşılaştırmak istenmesi halinde LSD testi, ortalama sayısı fazla olduğu durumlarda

Sonuç olarak, bu çalışmada ekstansif koşullarda yetiştirilen Kıl keçisi oğlaklarının yaşama gücü ve büyüme performanslarının, Kıl keçisi oğlaklarında yapılmış

Sonuç olarak, doğrudan klinik örnekler veya ASK’de MRSA saptanması için kullanılan hızlı moleküler testlerin önündeki en önemli engel, gerçek MRSA varlığı ile,

The artificial UV lights (UV torches, UV lamps or high-intensity UV spotlights) are larger in size, and the emission of UV radiation has to be directed either to the

Sosyal zekası güçlü olan kişiler, sözlü ve sözsüz iletişim kurma , işbirliği yapma, onlarla uyum içerisinde çalışma gibi yetenekleri yüksektir.. Sosyal zekası