• Sonuç bulunamadı

Başlık: Farklı Örnek Büyüklükleri için DFREML ve R Regresyon Yöntemleri Kullanılarak Elde Edilen Parametre Tahminlerinin KarşılaştırılmasıYazar(lar):ARSLAN, Serhat;MİRTAGİOĞLU, Hamit;KESİCİ,Tahsin Cilt: 10 Sayı: 3 Sayfa: 291-296 DOI: 10.1501/Tarimbil_0000

N/A
N/A
Protected

Academic year: 2021

Share "Başlık: Farklı Örnek Büyüklükleri için DFREML ve R Regresyon Yöntemleri Kullanılarak Elde Edilen Parametre Tahminlerinin KarşılaştırılmasıYazar(lar):ARSLAN, Serhat;MİRTAGİOĞLU, Hamit;KESİCİ,Tahsin Cilt: 10 Sayı: 3 Sayfa: 291-296 DOI: 10.1501/Tarimbil_0000"

Copied!
6
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

TARIM BILIMLERI DERGISI 2004, 10 (3) 291-296

Farkl

ı

Örnek Büyüklükleri için DFREML ve R Regresyon Yöntemleri

Kullan

ı

larak Elde Edilen Parametre Tahminlerinin Kar

şı

la

ş

t

ı

r

ı

lmas

ı

Serhat ARSLAN'

Hamit M

İ

RTAG

İO

Ğ

LU 1

Tahsin KES

İ

C

İ

2

Geliş Tarihi : 15.09 2003

Özet: Bu çalışmada, katsayı matrisinin tersini kullanmayan yeni bir regresyon yaklaşımı olan R yöntemi ile türevden bağımsız en yüksek olabilirlik yöntemi (DFREML) kullanılarak elde edilen tahminler, tahmin edicilerin özellikleri bakımından karşılaştırılmıştır. Çalışmada 1200 ana ile şansa bağlı olarak çiftleşen 100 babaya ait toplam 10.000 hayvan için verim özellikleri simülasyonla elde edilmiştir. Farklı örnek büyüklükleri belirlenerek örnekler çekilmiştir. Bu

şekilde oluşturulan alt gruplar, tamamen şansa bağlı örnekleme yapılarak toplam gözlem sayısının %10'u, %30'u, %50'si, %70'i ve %95'inin seçimi esasına göre beş farklı örnekten oluşan 5 alt grup oluşturulmuştur. Alt gruplar arası

tahminlenen hata unsurlarına ayrılarak Levene testi ile hatalar için heterojenlik testi yapılmıştır. Alt gruplar arası

varyansların homojen olduğu kararına varılmıştır. Farklı örnek büyüklüklerinde her iki yöntemin de örnek sayısının %50 ve üstü olduğu durumlarda küçük varyanslı ve gerçek değere yakın tahminler verdiği; Ancak, h 2 tahminlerin başlangıç değeri atamalarının gerçek değer olan 0.33'ten uzaklaşan değerlerde atanması durumunda R yönteminin DFREML'a göre daha az etkilendiği belirlenmiştir. Farklı örnek büyüklüklerinde ve farklı h2 başlangıç değerleri için R yönteminin başlangıç değerlerinin bilinmediği durumlarda seçenek oluşturabileceği sonucuna varılmıştır.

Anahtar Kelimeler: DFREML, R regresyonu, karışık doğrusal model, varyans unsur tahmini

Comparison of Estimating Parameters Using with DFREML and Method R

Regression Procedures for Different Sample Size

Abstract: In this study, a new approach of regression, Method R and derivative free restricted maximum

likelihood (DFREML) were used for estimation and comparison of estimation values. AH data were obtain simulating of 10000 animals for their yield traits. In the simulation progress all animals were thought to be from 1200 dams randomly mated with 100 sire. Subgroups were completely randomized, selected based on total observation numbers 10%, 30%, 50%, 70% and 95% respectively resulting in 5 sub-classes groups. Residual effects of between sub-groups were divided in to components and tested for heterogeneity using with Levene's heterogeneity tests. As a result variances from subgroups were homogeny. According to two methods, when different sample densities were 50% and higher, estimations were with minimum variances and close to the true value (0.33). However, estimation of starting value of h 2 , R method had lower influence than DFREML when the real value was higher than 0.33 with regards to different sample size and different starting value of h 2 , observed results were that R method was a potential approach when the starting values were unknown.

Key Words: DFREML, R regression, mixed linear model, estimation of variance component

Giriş

Hayvan ıslahında genetik değerlendirmelerde çoğunlukla damızlık değer tahminleri için çoğunlukla en iyi doğrusal yansız tahminleyici (Best Linear Unbiased Predictor=BLUP) tercih edilmektedir. Karışık model eşitliklerinin çözümleri sabit etkilerde BLUE (Best Linear Unbiased Estimator) ve şansa bağlı etkilerde BLUP tahminlerini vermektedir. Bu çözümlerin elde edilmesinde en çok olabilirlik esasına dayalı (ML) yöntemler uzun yıllar tek başına kullanılmıştır. ML yaklaşımlı yöntemler için alt grup sayılarının eşit olmadığı durumlarda genetik ve deneysel hata varyanslarının homojenliği varsayımı geçerlidir. Ancak, hayvan ıslahı alanında çok sayıda çevresel etki nedeniyle alt grup sayıları da artmaktadır. Bu nedenle farklı alt gruplar için hesaplanan grup içi varyansların homojenliği her zaman sağlanamamaktadırr. Bu durum, ML kullanımı için bir sakıncadır. ML yaklaşımlı yöntemlerde en büyük sorunlardan biri de başlangıç değeri olarak atanan

ki

değerlerinin (o-2 /(7 2 = k) ne

'Yüzüncü Yıl Üniv. Ziraat Fak. Zootekni Bölümü-Van 2 Ankara Üniv. Ziraat Fak. Zootekni Bölümü-Ankara

olacağıdır. Birçok literatürde bunun için varyans analizi (ANOVA tahminlerinin kullanışlı olacağı yaklaşımı savunulmuştur (Henderson 1975; Anderson ve ark. 1984; Golden ve ark. 1992). Eğer başlangıç değerleri bilinmiyorsa k değerinin 1 olarak atanmasının yeterli olacağını savunan araştırıcılar da mevcuttur (Gianola ve ark. 1986; Graser ve ark. 1987; Meyer 1989; Van Tassel ve ark. 1994). Ancak, dengeli veri setleri dışında ANOVA'ya göre ML'den tahminlenen genetik varyans ( oa ) ve hata varyansı ( o-2 ) tahminleri oldukça farklı olmaktadır. Ayrıca ANOVA tahminlerinin büyük veri setlerinde kullanışsız olması ve negatif tahmin verebilmesi başlıca sorunlardan biridir. Swallow ve Monahan (1984), ANOVA ve ML yaklaşımil yöntemleri ayrıntılı olarak karşılaştırdıkları çalışmada, ML için başlangıç değerlerinin farklı seçilmesinin tahminlenen parametrenin varyans büyüklüğüne (hassasiyetine) etkili olduğunu bildirmişlerdir. Corbeil ve Searle (1976) ANOVA tahminleri

(2)

292 TARIM BİLİMLERİ DERGISI 2004, Cilt 10, Sayı 3

ile MIVQUE(0) ve REML çözümlerinin alt grup sayıları eşit (dengeli) desenlerden elde edilen tahminlerle aynı çözümleri verdiğini bildirmiştir.Anderson ve ark. (1984), MIVQUE(0) ve REML'da birinci iterasyon sonuçlarından başlangıç değerinin tayin edilmesinin daha uygun olacağını bildirmiştir. Ancak, Reverter ve ark. (1994) yaptıkları çalışmada bu kabulün doğru olmadığını göstermişlerdir. Araştırıcılar regresyon yaklaşımı ile R yöntemi adıyla yeni bir yöntem önermişlerdir. Tanıtılan bu yöntemin en büyük avantajı katsayı matrisinin tersine ihtiyaç duymamasıdır.

Bu çalışmada simülasyonla elde edilen bir veri seti üzerinde Reverter ve ark. (1994) tarafından önerilen R ve DFREML çözümleri karşılaştı rılmıştır.

Materyal ve Yöntem

Çalışmada 1200 ana ile şansa bağlı olarak çiftleşen 100 babaya ait toplam 10.000 hayvan için verim özellikleri simülasyonla elde edilmiştir. Her hayvan için gözlem değerleri;

yii = ,u+Cj +u i - (1)

matematik modeli esas alınarak oluşturulmuştur. Burada yu, i. babadan j. cinsiyette doğan yavrunun verim değeri Ci. cinsiyetin etkisi; Ili; normal dağılış fonksiyonunu içeren = çbcrb eşitliğine göre oluşturulmuş i. babaya ait şansa bağlı etki miktarı olmaktadır. Tüm Ili değerleri:

ui = -1

2(u b +u,)+ 0-,/0.50-b (2) eşitliğinde düzenlenerek elde edilmiştir. Burada ub ve ua

baba ve analara ait dam ızlık değerler olmaktadır. Bu şekilde oluşturulan veri setine Henderson (1975) tarafından tanımlanan karışık modelin uyumu yapılmıştır. Modelin matris yazılımında gösterilişi;

Y =Xfi+Zu+e ( 3 )

şeklindedir. Burada Y, /3 , u ve e sırasıyla gözlem değerleri, sabit ve genetik etkiler ve şansa bağlı hatalara ait vektörlerdir. X ve Z sabit ve şansa bağlı etkiler için oluşturulan desen matrisleri olmaktadır. Birinci ve ikinci momentler E(Y) = X

fi

ve var(y)=V= +Z'AZo-

olarak elde edilmektedir. A matrisi akrabalı yetiştirme katsayılarından oluşmaktadır. Böylece V matrisi hata ve genetik varyansına ait tüm elemanları içermektedir. ,I ise matrislerle eş boyutlu birim matristir.

Henderson (1975) BLUP(u) değerleri için BLUP(u)= fı olduğunu ispatlayarak karışık model eşitliklerini tanımlamıştır. 3 numaralı karışık model için Henderson'un karışık model eşitlikleri;

XX X7 Z'X Z7 + 2A -1

şeklindedir. 4 numara ı eşitlikte

0

.2 / 1 - h 2 h2 olarak (k = 2 ) tanımlıdır.

Çalışmada 3 numaralı eşitliğin 4 numaralı eşitlikte çözümlerinin elde edilmesi için iki farklı yaklaşım kullanılmıştır. Bunlardan biri DFREML diğeri ise R regresyonudur. DFREML çözümleri Boldman ve ark. (1993), tarafından bildirilen algoritmaya göre DFREML'da işlem yapan aynı adlı DFREML Ver 1.01 istatistik paket programında yürütülmüştür.

R yönteminin ayrıntıları Reverter ve ark. (1994) tarafından verildiği gibidir. Buna göre u için herhangi bir tahminleme sapmasıyla beraber u +6 şeklinde yapılmaktadır. Burada S , tahminleme hatası; ıt tahmin

değeri; u ise gerçek değer olmaktadır. j tanımlamasıyla "iı j ve 'IS/ j, arası beklenen kovaryanslar: var( J) olacaktır. Hatalar için;

var(u) = var(â) + var(E) = var(ıi)+ Tri(Z'SZ)+ 2,11 -1) -1 0- 2 .1(5)

olmaktadır. Burada S =I - R-1X(X2:2-1X)- XI'?-1 olarak

REML yönteminde sabit etkilerin giderilmesini açıklayan absorbsiyon matrisi olarak tanımlıdır. İteratif olarak elde edilen çözümlerde n iterasyon sayısı olmak üzere max [e] =1/2" hatasıyla tahminleme yapmaktadır. X şans değişkenleri için varyanslar a<x<b olmak üzere

var(x) < (b - a)" /4 ve

-

var(x)

=

ERX - ,u,,)21.E[(X a 2b

= (X a - 2 b )2 dFx (x) f (b a - b dFx - (b - 4 a)2

olarak tahmin edilir. Çalışmada Reverter ve ark. (1994) tarafından ayrıntıları verilen algoritma simülasyonla elde edilen veri setine 3 numaralı eşitliğin uyumu yapılarak çözümler, Golden ve ark. (1992) tarafından yazılan SSBATK paket programında (Statistical Software of Breeding and Animal Tool Kit) elde edilmiştir. h2 için yaklaşım kriteri (convergence) olarak 0.001 kabul edilmiştir. DFREML yönteminde çözümlerin elde edilmesi için k katsayıları REML çözümlerinden elde edilmiştir.

Veri setinde SAS/STAT (1998) kullanılarak varyansların heterojenliği Levene'nin homojenlik testinden yararlanılarak araştırılmıştır. Burada, alt gruplarda farklı sayıda gözlem değeri içeren ve farklı h2 başlangıç değerlerinde gruplar arası tahminlerin doğruluğu ve hassasiyetinin araştırılması amaçlanmıştır. Farklı j. oranda oluşturulan alt gruplar (PCT;), tamamen şansa bağlı örnekleme yapılarak toplam gözlem sayısının %10'u, %30'u, %50'si, %70'i ve %95'inin seçimi esasa göre beş farklı yoğunlukta örnekten oluşan 5 alt grup oluşturulmuştur. Alt gruplar arası tahminlenen hatanın unsurlarına ayrılarak Levene testinde hatalar için

Hataijk = h? + PCT j + (h 2xPCT)ij + eijk (6)

u X7

(3)

Le vene Tes ti co o

ARSLAN, S., H. MİRTAGİOĞLU ve T. KESİCİ, "Farklı örnek büyüklükten' için DFREML ve R Regresyon yöntemleri 293 kullanılarak elde edilen parametre tahminlerinin karşılaştırılması"

modeli esas alınmıştır. Hatalar için unsurlarına ayrılarak varyansların homojenliğinin test edildiği bu modelde h 2; farklı alt gruplarda tahminlenen kalıtım derecesi, PCT], j. alt grup ve (h2xPCT)ij farklı gözlem sayılarına göre çapraz sınıflanmış alt gruplarda interaksiyon, ve eijk ise artık hatadır (residual error).

Farklı PCT; değerleri için sınıflar arasındaki korelasyonlar Pearson koreleasyonu ile incelenmiş ve farklı sınıflar arasındaki artık oranları için hesaplanan istatistik R, olarak ifade edilmiştir. R, test istatistiği:

Rc = var((ı j ) (7)

şeklinde hesaplanmaktadır. Eğer R, değeri 1'den büyük ise, bir önceki itarasyonda tahminlenen h 2 değerinin sonrakinden büyük olduğuna; bunun tersi durumda ise küçük olduğuna karar verilmektedir. Benzer bir yaklaşımla tahminlenen parametrelerin sapmalı olduğuna karar verilmektedir (Reverter ve ark. 1994).

Bulgular

Çalışmada yöntem kısmında anlatıldığı gibi 5 farklı yoğunlukta örnek seçimi ile oluşturulan alt gruplar arası hatalar 6 numaralı eşitlik kullanılarak Levene homojenlik testi uygulanmıştır. Sonuçlar Çizelge 1'de özetlenmiştir.

Çizelge l'e göre uyum için kurulan Ho hipotezi kabul edilmiştir. Belirleme katsayısının (R2) 0.36 olduğu bu modelde h 2 ve PCT interaksiyonu istatistik olarak önemli

bulunmuştur (p<0.05). h2 ve PCT tek başına incelendiğinde önemli değildir. Alt gruplarda farklı sayıda gözlemin yer alması ve farklı h2 değerlerinin başlangıç değeri olarak atanması nedeniyle burada gerçek h 2 tahmin edilmemiştir. Her alt grup için hata varyanslarının homojen olduğu belirlenmiştir.

R yöntemi kullanıldığında Rc değeri 1'den büyük olduğunda h2 gerçek değerinden daha büyük, 1'den daha küçük olduğunda ise bunun tersi olarak gerçek değerinden daha küçük tahmin edilmiştir (Çizelge 2).

Çizelge 2'de Beklenen h2 tahminlerinin gerçekleşmesi durumunda, Rc'nin hata varyansı ve Rc aras ındaki korelasyonlar incelenmiştir. Burada gözlem değeri toplamlarının çalışmada kullanılan toplam N sayısı ile uyuşmamasının sebebi, tabloya dahil edilemeyen gözlemlerin hatalarının 0 olarak tahmin edilmiş olmasıdır. Bu değerler için Rc 0.9921±0.0044 olmuştur. Bu farklılık istatistik olarak önemsiz bulunmuştur.

Tam şansa bağlı deneme planı esasına göre 2 faktörlü olarak oluşturulan faktöriyel düzenlemeye uygun veri setinde hiçbir gruplamaya gidilmeksizin yapılan analizde h 2, 0.33 olarak tahmin edilmiştir. h2 için uh değeri 0.001 olarak tahmin edilmiştir. Buna göre tahminlenen bu değerin altında ve üstünde başlangıç değerleri atanarak analiz ve tahminleme işlemleri tekrarlanmıştır. PCT; grupları için sadece 0.33 başlangıç değeri kullanılarak h 2 tahminleri elde edilmi ştir. Sonuçlar Çizelge 3'de özetlenmiştir.

Çizelge 1. Veri setinde model uyumu ve varyansların homojenliği için Levene'in homojenlik testi sonuçları

Varyasyon kaynağı Serbestlik derecesi Kareler ortalaması P<F

h2 4 0.006 0.146

PCT 4 0.004 0.254

h2x PCT 16 0.022 0.035

Model 28 0.016 0.117

Hata 9969 0.040

Çizelge 2. İki yönlü kategorik düzenlemede ortalama ( ) ve standart hata (S1 )değerleri ile hata ile R c değerleri arasındaki Pearson korelasyon katsayıları (r)

Durum Rc>1 Rc<1 N 464 183 Hata>0 X ± 0.046±0.007 0.029±0.001 Rc 1.048±0.002 0.999±0.006 R 0.338 0.009 N 198 543 Hata<0

I±S1

-0.00%0:001 -0.087±0.005 Rc 1.001±0.001 0.984±0.006 R 0.106 0.543

(4)

294 TARIM BİLİMLERİ DERGISI 2004, Cilt 10, Sayı 3

Çizelge 3. Veri setinin genelinde ve PCT örneklemelerinde hz başlangıç değeri için elde edilen tahminler

Kaynak En düşük En Yüksek h2 0.06 0.28 0.50 0.72 0.94 0.18±0.004 0.34±0.005 0.28±0.004 0.43±0.009 0.49±0.019 0.08 0.25 0.20 0.36 0.39 0.23 0.36 0.30 0.52 0.69 ıC1)

c

'0) P o (3 >- o_ aı E :O %10 %30 %50 %70 Ok 9 5 0.10±0.011 0.18±0.009 0.31±0.005 0.31±0.004 0.32±0.001 0.09 0.13 0.28 0.27 0.29 0.18 0.24 0.35 0.35 0.34

Çizelge 3 incelendiğinde farklı h2 başlangıç değerlerinin gerçek değere yaklaşan atamalarda tahminlerin gerçek değeri içine alan bir aralıkta olduğu gözlenebilir. h 2 atamasının en küçük ve en büyük başlangıç değerlerinde tahminler gerçek değeri kapsamamaktadı r. Farklı örnek yoğunlukları incelendiğinde örnek büyüklüğü arttıkça tahminler gerçek değere yaklaşmaktadır. %50 örnek büyüklüğüne ulaşıldığında tahminlerin gerçek değeri içine aldığı görülmektedir. Tahminlerin hassasiyeti bakımından gerçek değerden uzaklaşan ve örnek büyüklüğünün küçük olduğu yoğunluklarda tahminlenen parametrenin daha geniş bir aralıkta tahminlendiği söylenebilir.

DFREML ve R yönteminde çözümsel istatistikler Çizelge 4'de özetlenmiştir.

Parametre tahminlerinin hassasiyeti de dikkate alınmak şartıyla, seçenek olarak sunulacak olan yaklaşımların işlem zamanı ve yaklaşım sağlanana kadarki iterasyon sayısı bakımından karşılaştırılması bilgi verici olmaktadır. Bu yönden bir değerlendirme yapıldığında, DFREML, R yöntemine göre daha çok zaman dilimi kullanarak tahminleme yapmıştır. iterasyon sayısı bakımından R yöntemi daha az sayıda iterasyonda çözüme ulaşmıştır (Çizelge 4).

Farklı örnek büyüklüklerinde DFREML ve R yönteminde elde edilen parametre tahminleri Çizelge 5'te özetlenmiştir.

Çizelge 4. DFREML ve R yöntemleri için parametre başına ortalama CPU zamanı (sn/MHZ)ve iterasyon sayıları Yöntem CPU zamanı Iterasyon Sayısı

(sn)

DFREML 23 15

R 14 13

Çizelge 5 incelendiğinde örnek büyüklüğüne bağlı olarak, örnek büyüklüğü artıkça benzer şekilde her iki yöntemin de daha küçük varyanslı ve gerçek değere yakın tahminleme yaptığı gözlenmiştir. Ancak, gerçek değerinden büyük h 2 atamalarında örnek büyüklüğü artsa da DFREML'da doğru tahminler yapılamamıştır. DFREML'da h 2=0.94 değeri olarak atandığında, yaklaşım sağlanamamıştır. R yönteminde ise yaklaşım sağlanmıştır. Ancak, tahmin edilen değerler gerçek değerden sapma!' olmuştur.

Tartışma ve Sonuç

Elde edilen tahminler incelendiğinde bir regresyon algoritması olan R yönteminin yaklaşıma ulaşmada DFREML'dan daha hızlı olduğu söylenebilir. Ancak yöntemin büyük matris çözümlerini gerektiren çok değişkenli tanımlaması için yetersiz olacağı düşünülmelidir. Bu yönden yapılmış bir çalışma olmaması karşılaştırma imkanını ortadan kaldırmaktadır. Ancak Rc olarak elde edilen test istatisti ğinin hesaplanmasında tanımlanan matrislerin tek değişkenli modele göre daha büyük boyutlu olacağı görülebilir.

DFREML ve R yönteminin çözümleri karşılaştırıldığında sparse tekniğini kullanan DFREML hassas tahminler vermiştir. Çizelge 3 incelenirse, çalışmada h 2 'nin gerçek değeri 0.33 olarak tahmin edilmiştir. h 2 başlangıç değerleri için tüm gözlemler' içeren veri setinde 0.06, 0.28, 0.50, 0.72 ve 0.94 değerleri atanarak yapılan h2 tahminlerinde atanan değer 0.33 değerine yaklaştığında tahminler gerçek değeri içine almıştır. Gerçek değerden uzaklaşmalarda ise gerçek değeri içine almayan aralıklarda h2 tahminleri elde edilmiştir. Ancak 0.33 değerinden uzaklaşan başlangıç değeri atamalarında R yönteminin DFREML'dan daha az etkilendiği söylenebilir. Reverter ve ark. (1994) yöntemin bu özelliğinin ıslah çalışmaları için özellikle daha kullanışlı olduğunu bildirmiştir. Bu anlamda bir çok araştırıcı h2 ve

(5)

ARSLAN, S., H. MİRTAGİOĞLU ve T. KESİCİ, "Farklı örnek büyüklükleri için DFREML ve R Regresyon yöntemleri 295

kullanılarak elde edilen parametre tahminlerinin karşılaştırılması"

Çizelge 5. Farklı örnek yoğunluğu ve farklı h2 başlangıç değerlerinde DFREML ve R yönteminde tahminlenen parametreler*

H2 Tahmin Yöntem DFREML R %10 %30 %50 Ok 70 %95 %10 %30 %50 (O 0 0 ao o uı 0 c•ı ı•- ci rn 0 0-2 O"2 IL O'2 Il 0-2 P o-2 0.009 0.152 0.11 0.153 0.10 1.344 1.157 0.011 0.058 0.29 0.057 0.25 0.343 1.445 0.006 0.788 0.35 0.648 0.34 0.144 0.245 0.011 0.165 0.34 0.263 0.36 0.344 0.000 1.000 0.007 0.517 0.34 0.403 0.35 1.445 0.005 1.114 0.011 0.253 0.11 1.803 0.09 2.443 0.000 0.901 0.000 0.901 0.018 0.144 0.28 1.445 0.28 1.165 -0.000 0.144 0.000 0.064 0.007 0.649 0.27 0.957 0.29 1.284 -0.001 0.146 0.001 0.246

* "-" ile belirtilen tahminlerde yaklaşım (convergergence) sağlanmadığından 0 değeri tahmin edilmiştir.

Simülasyonda 1.1 =0.36 ve 62 =0.42 olarak alınmıştır. %70 %95 0.010 0.08 0.162 0.814 0.32 0.33 0.910 2.463 0.30 0.35 1.100 0.900 -0.000 0.004 0.465 0.264 0.010 0.0014 0.565 0.678

benzeri parametre tahminlerini elde ederken büyük veri setlerinden tahminleme yapmayı tercih etmiştir. Kendi parametre uzayında tahminleme yapan DFREML yönteminin sapmasız bir yöntem olmadığı ancak en küçük varyanslı tahminleme yapan bir yöntem olduğu bilinmektedir (Van der Werf 1992; Boldman ve ark. 1993).

Örnek yoğunluğunun farklı olduğu örneklemelerde beklendiği gibi örneklemede gözlem sayısı arttıkça tahminlerin hassasiyeti de artmıştır (Çizelge 3). Bu durum örneklemenin %50 olduğu noktada cevap yüzeyinin oluşmasıyla desteklemektedir. Örnek büyüklüğünün %50'den daha büyük olduğu durumlarda gerçek değere daha yakın ve hassas tahminler elde edilmiştir (Çizelge 4).

Farklı örnek yoğunluklarında farklı h2 atamalarının tahminlere etkisi incelendiğinde örnekleme hatasındaki artışa bağlı olarak tahminlerde sapmaların meydana geldiği gözlenmiştir (Çizelge 5). DFREML bu durumdan çok daha fazla etkilenmiştir. Her ne kadar şansa bağlı örnekleme yapılmışsa da küçük örneklemelerde gözlem sayısının da az olmasına bağlı olarak dağılıştaki değişmelerden DFREML olumsuz yönde etkilenmiştir. R yönteminde ise Reverter ve ark. (1994) benzer olarak, yöntemin bu tip değişmelerden çok fazla etkilenmediğini gözlemişlerdir. Her iki yöntem için de h 2=0.94 atamasında tahminlerin güvenirliği ve hassasiyeti ortadan kalkmıştır. DFREML bu değerde farklı örnekleme büyüklerinin hemen tamamında yaklaşıma ulaşamamış ve 0 tahminleri vermiştir. Her iki yöntemde de h 2=0.8 ve %50 ve daha fazla örnekleme yoğunluğunda ideal sonuçlara ulaşılmıştır. Mirtaghizadeh ve ark. (2002), ML türevi yöntemlerde farklı başlangıç değerlerinde yöntemlerin tahminledikleri parametrelerin hassasiyetini inceledikleri çalışmada k başlangıç değerlerinin bilinmediği durumlarda

1 atamasının yapılmasının sonuçları ve tahminlerin hassasiyetinde önemli kayıpların olduğunu bildirmiştir. Buna karşın Henderson (1975), babalar arasındaki akrabalığın yüksek olduğu durumlarda ANOVA veya MIVQU(0) tahminlerinin ön değer olarak ataması ile sonuçların istenen hassasiyette tahminlendiğini bildirmiştir. Golden ve ark. (1992), DFREML yönteminin ön değer atamalarından daha çok veri setinin dağılışına ve alt gruplar arası varyansların heterojenliğine hassas bir yöntem olduğunu bildirmiştir. Swallow ve Monohan (1984) benzer bildirişte bulunmuştur. Bu çalışmada, alt gruplar arası varyansların homojen olduğu belirlenmiştir. Ayrıca varsayılan modelin model uyumu sonuçlarına göre geçerli olduğu düşünülürse veri setinin simülasyonla elde edilmesinden dolayı dağılış probleminin ancak küçük örneklerde mümkün olabileceği düşünülebilir. Buna rağmen, örnekleme yoğunluğunun %94 olduğu durumlarda yada verilerin tamamının kullanıldığı durumlarda bile h 2=0.94 için yaklaşım sorunu yaşanmıştır. Boldman ve ark. (1993), DFREML için bu bulguları destekleyen yönde bildirişte bulunmaktadır.

R yönteminin yoğun olarak katsayı matrislerinin tersi ile işlem yapan REML ve türevi yöntemlere göre çok daha kullanışlı olduğunu bildirilmektedir (Mitsztal ve ark 1997). Çalışmanın bulguları ışığında çok uzun yıllardan beri yaygın olarak kullanım alanı bulan REML ve türevi yöntemlerin her zaman en küçük varyanslı tahminler verdiği söylenebilir. Başlangıç değerlerinin bilinmediği ve bu nedenle yaklaşık olarak atandığı durumlarda araştırıcılar, daha küçük değerleri tercih etmelidir. Sonuç olarak R yöntemi, başlangıç değerlerinden daha az etkilenmesi nedeniyle, başlangıç değerleri bilinmediği durumlarda, araştırıcılara bir seçenek olabilir.

(6)

296 TARIM BILIMLERI DERGISI 2004, Cilt 10, Sayı 3

Kaynaklar

Anderson, R. D., H. V. Henderson, F. Pukelsheim and S. R. Searle, 1984. Best estimation of variance components from balanced data, with arbitrary kurtosis. Math. Operationsforsch. Stat., Ser. Stat. 15, 163-174.

Boldman, K. G., L. A., Kriese, L. D., Van Vleck and S. D. Kachman, 1993. A Manuan for use of MTDFREML. A set of programs to obtain estimates of variances and covariances (Draft). U. S. Dep. Agric., Agric. Res. Serv.

Gianola, D., J. L. Foulley and R. L. Fernando, 1986. Prediction of breeding values when variances are not known. Genet. Sel.Evol. 18 (4) 485-493.

Golden, B.L. and M. W. Snelling, Mallinckrodt, 1992. kıimal breeders Tool-Kit: User's Guide. Colorado State Univ. Exp. Sta. Tech. Bull. LTB92-2.

Graser, H. U., S. P. Smith and B. Tier, 1987. A DF approach for estimating variance components in animal models by REML. J. Anim. Sci. 64, 1362-1374.

Henderson, C. R. 1975. Use of relationships among sires to increase accuracy of sire evaluation. J. Dairy Sci.,58, 1731- 1742.

Meyer, K. 1989. REML to estimate variance components for animal models with several random effects using derivative free algoritm. Genet. Sel. Evol. 21, 317-329.

Mirtaghizadeh, H., S. Arslan ve T. Kesici, 2002. Varyansların Heterojen Olduğu Durumlarda Farklı Yaklaşımlarla Karışık Model Eşitlik Çözümlerinin Tahminlenen Parametrelerin Hassasiyetine Etkisi. T. J. Vet. Sci. (Basımda).

Mitsztal, I., T. J. Lawlor and R. L. Fernando, 1997.Dominance Models with Method R for Stature of Holsteins. J. Dairy Sci. 80, 975-978.

Reverter, A., B. L., Golden, R. M. Bourdon and J. S. Brinks, 1994. Method R variance components procedure: application on the simple breeding value model. J. Anim. Sci. 72, 2247- 2253.

SAS, 1998. SAS statistics software. SAS Inst. Inc. Cary. NC: Swallow, W. H. and J. F. Monohan, 1984. Monte Carlo

Comparison of ANOVA, MIVQUE, REML, and ML estimators of variance components. Technometrics.28 (1), 47-57.

Van der Werf, J. H. J. 1992. REML estimation of additive genetic variance when selected base animals are considered fixed. J. Anim. Sci. 70, 1068-1076.

Van Tassell, C. P., G. Casella and E. J. Pollak, 1994. Effects of selection on estimates of variance components and REML. J. Dairy Sci. 78, 678-692.

İletişim Adresi:

Serhat ARSLAN

Yüzüncü Yıl Only. Ziraat Fakültesi, Zootekni Bölümü-Van

Tel: 0-432-2251004/1601 Fax: 0-432-2251104 E-Mail: saslan@vyu.edu.tr

Şekil

Çizelge  2'de  Beklenen  h2  tahminlerinin  gerçekle ş mesi durumunda, Rc 'nin hata varyans ı   ve Rc   arasındaki korelasyonlar incelenmiş tir
Çizelge 3. Veri setinin genelinde ve PCT örneklemelerinde hz ba ş lang ı ç de ğ eri için elde edilen tahminler
Çizelge 5. Farkl ı   örnek yo ğ unlu ğ u ve farkl ı   h 2   ba ş lang ı ç de ğ erlerinde DFREML ve R yönteminde tahminlenen parametreler*

Referanslar

Benzer Belgeler

Terörist saldýrýlar nedeniyle TSSB geliþimi ile ilgili yapýlan çalýþmalarýn çoðunda kadýn olmanýn, etnik bir azýnlýktan olmanýn, düþük eðitim seviyesinde

Geleneksel kırsal konut tipolojileri üzerinden kültür-mekân ilişkilerini, mekânsal yapılanma ve örgütlenmedeki yansımalarını incelemeyi hedefleyen bu çalışmada,

Ýki grup arasýnda farklý olduðunu bul- duðumuz klinik özellikler, OKKB'nin eþlik ettiði OKB hastalarýnda, semptom daðýlýmý açýsýndan tekrarlama ve

(9); dişi Estonian Holstein ve Estonian Native ırklarında yaptığı araştırmada intermedier transversal çap ve vertikal çapların, cranial pelvis boşluğu

De novo serin biyosentezi, glikolizis, çoğu hücre türünde ATP ve enerji sağlar, fakat kanser hücreleri tümör gelişiminde önemli olan glikolizisi anabolizmayı

Bu olgu sunumu ile birlikte 3 aylık, dişi Montofon buzağıda bilateral hamartom olgusunun tanımlanması ve bu nedenle tıkanan dış kulak yolunun operatif tedavisinin

When looking at the results between AISI 1008, 1040 and 4140 materials; carbon ratio is more effective in tensile strength and % section contraction, while alloying

Proximal uçta radius ile eklem yapan daha kısa bir processus coronoideus medialis ile daha uzun ve geniş bir eklem yüzüne sahip processus coronoideus lateralis