Đst306 Đstatistik Deney Tasarımı

(1)

Đst306 Đstatistik Deney Tasarımı

DERSĐN ADI Đstatistik Deney Tasarımı

DERSĐN KODU ĐST306

DERSĐN TÜRÜ Zorunlu

DERSĐN DÖNEMĐ Bahar

DERSĐN KREDĐSĐ Ulusal Kredi: (2, 2, 0 ) 3 AKTS: 6 DERSĐN VERĐLDĐĞĐ Bölüm: Đstatistik 2006/2007 Öğretim Yılı

KAYNAKLAR

1 Düzgüneş, O., Kesici. T., Kavuncu, O., Gürbüz, F. (1987) Araştırma ve Deneme Metotları, Ankara Üniversitesi Ziraat Fakültesi Yayınları.

2 Dunn, J.D. and Clark, V.A. (1974) Applied Statistics:Analysis of Variance and Regression, John Wiley&Sons.

3 Hiks, C.R. (1973) Fundamental Concepts in the Design of Experiments, Holt-Rinehart-Wiston Inc.

4 Muluk, Z., Toktamış,Ö., Kurt, S. ve Karaağaoğlu, E. (1985) Deney Düzenlemede Đstatistiksel Yöntemler, Akademi Matbaası, Ankara. ( Fundamental Concepts in the Design of Experiments, Hiks(1973) Türkçe Tercümesi)

5 Oral Erbaş, S. ve Olmuş, H. (2005) Deney Düzenleri ve Đstatistik Analizleri, Gazi Kitabevi, Ankara.

6 Jobson, J.D. (1991) Applied Multivariate Data Analysis, Volume I: Regression and Experimental Design, Springer-Verlag.

7 Graybill, F.A. (1976) Theory and Application of the Linear Model, Duxbury Press.

8 Sengupta, D. And Jammalamadaka, S.R. (2003) Linear Models, World Scientific.

9 Akdeniz, F. ve Öztürk, F. (1996) Lineer Modeller, Ankara Üniversitesi Fen Fakültesi, Yayın No:38, Ankara.

10 Akdeniz, F. (1981/1982 Ders Yılı) M630 Varyans ve Kovaryans Analizi, Ders notu.

11 Montgomery, D.C. (2005) Design and Analysis of Experiments, John Wiley&Sons.

SINAVLAR En az bir ara sınav ve dönem sonu sınavı yazılı olarak yapılacaktır.

Dönem içi verilen ödevler ara sınav notu ile birlikte

değerlendirmeye alınıp vize notunu oluşturacaktır.

Geçme notu=0.4xVize notu+0.60xDönem sonu notu.

(2)

GĐRĐŞ

Bu derse girişi, Prof. Dr. Orhan Düzgüneş hocamızın aşağıdaki sözleri ile yapalım:

“Đnsanlar etraflarında cereyan eden olaylara ve oluşmuş varlıklara karşı muhakkak ilgi duyarlar. Bu ilgi devirden devire ve insandan insana değişen mahiyetlerde ve seviyelerdedir.

Bazıları bu ilginin esiri olurlar: Hayatlarını ilgi duydukları olayları ve varlıkları tasvir ve izah etmeğe, bunlar arasındaki ilişkileri tesbit ve formüle etmeğe, bunların tabi oldukları nizamları (kanunları) ortaya koymaya hasrederler. Bunlar giderek “Temel Araştırmacı” ve

“Filozof” olurlar. Bazıları temel araştırmacıların ortaya koydukları gerçeklerin, teori ve kanunların geçerlilik (Uygulanma) alan ve şartlarını belirtmeğe çalışırlar. Bunlar da

“Uygulamalı Araştırmacı” ‘lardır. Üçüncü bir grup insan daha vardır ki bunlar temel ve uygulamalı araştırmacıların sağladıkları bilgilerden yararlanarak mevcutlardan daha yararlı kullanma malları, araç ve gereçleri geliştirmeğe veya buna yarayacak yöntemleri bulmağa çalışırlar. Bunların yaptıklarına da “Geliştirme Araştırması” denmektedir. Diğer insanlar ise ilgilerini maddi bir menfaat sağlamak veya manevi bir haz duymak üzere değerlendirirler.

Hangi gruptan olursa olsunlar, insanlar deney yapmak veya deney sonuçlarından faydalanmak lüzumunu duyarlar. Bazı alanlar dışında bütün araştırmalar deneylere dayanırlar, öyleki “Deney yapmak” ile “Araştırma yapmak” ifadeleri aynı anlamda kullanılır. Bu, baştan itibaren böyle olagelmiştir. Ne var ki, ilk dönemlerdeki deneyler uzun süren pek geniş müşahedeleri gerektirmekte, buna rağmen sonuçların genelleştirilmelerinden çekinilmekte, sonuçlar “olabilir”, “mümkündür” şeklinde müphem olarak ifade edilebil- mekte idi.

Aslında deneyler öyle planlanıp yürütülmelidir ki, mümkün olan en kısa zamanda ve en az masrafla güvenilir (belirli ihtimallerle kesin) sonuçlara varılabilsin. Bu nitelikteki sonuçlar deneylerden sağlanan rakamların belirli istatistik metodları ile işlenmeleri ve yorumlanmaları ile elde edilebilmektedir. Sözkonusu metodlar da, ancak, belirli ilkelere göre tertiplenmiş ve yürütülmüş deneylerden belirli ilkelere göre toplanmış rakamlara uygulanabilmektedir.

Bu ilkelere uymayan rakamlar her hangi bir analitik işleme tabi tutulamayacağı için, yapılan işler boşa gitmiş olur. Bu gerçeğe rağmen böyle rakamlar bazen şu veya bu istatistik metodla işlenmekte ve sonuçlar yayınlanmaktadırlar. Buna tevessül edenler ilim adamı veya araştırmacı sayılmazlar, sayılmamalıdırlar.

Eskisi kadar olmasa bile, bize hala rakamları getirerek “Bunlardan şöyle veya böyle bir sonuç çıkarmak mümkün mü” diye soranlar olmaktadır. Bunların bir kısmı rakamların nasıl elde edildiğini dahi bilmemektedir.”

(3)

“Deney” sözcüğü, bir laboratuar ortamında ölçü aletleri ile donatılmış bir düzenekte gözlem yapma işlemini çağrıştırmaktadır. Bununla birlikte, “Đstatistik Deney Tasarımı”

dersinin adında geçen “Deney” sözcüğü; laboratuar dışında da, doğal veya yapay ortamlarda gözlem yapmak olup, biraz daha geniş kapsamlıdır. Đstatistik, rasgelelik olgusunu kendisine konu edinen bir bilim dalıdır. Đstatistiksel Deney Tasarımı (Düzenlemesi) belirlenmiş ve hipotez şeklinde ifade edilmiş bir araştırma probleminde söz konusu olan etkenleri (faktörleri) göz önüne alıp en az hata ile çözüme (karara) ulaşmak için yapılan işlemlerdir.

ARAŞTIRMA

DENEY DÜZENLEME ÇÖZÜMLEME

* Problemin ortaya konması

* Bağımlı (yanıt) değişkenin ya da değişkenlerin belirlenmesi

*Bağımsız değişkenlerin (etkenlerin, faktörlerin) belirlenmesi

* Etkenlerin düzeylerinin (seviyelerinin) tespiti.

Düzeyler:

Nitelik Nicelik





Özel seçilmiş

Düzeyler arasından rasgele seçilmiş





* Farklı etkenlerin düzeylerinin kombinasyonu

* Araştırılmak istenen hipotezlerin yazılması

* Gözlemlerin sayısının belirlenmesi

* Deney sırasının belirlenmesi

* Kullanılacak

rasgeleleştirme yönteminin belirlenmesi

* Matematiksel modelin yazılması

* Veri toplama ve işleme

* Đstatistiksel sonuç çıkarım

* Sonuçların yorumlanması

(Birimler üzerinde ölçmeler, yani gözlemler belli bir hassasiyetle yapılıp, kayıp gözlem olmamasına gayret ederek, veriler mevcut paket programların birinin veri tabanına alınabilir. Test etmek istediğimiz hipotez türü paket programın menüsünde bulunmadığında, ilgili test fonksiyonu teorik olarak elde edilip, istatistiksel hesaplama kısmını yapacak bilgisayar programının hazırlanması gerekebilir.)

Örnek 1. Belli bir dersin 4 saat teorik, 3 saat teorik + 1 saat uygulama veya 2 saat teorik + 2 saat uygulama şeklinde (üç farklı yöntemle) verilmesinin, dönem sonu notu ile ölçülen “bilgi” (başarı) üzerinde etkisi araştırılmak istensin. Böyle bir araştırmayı Đstatistiksel Deney Tasarımı

(Düzenlemesi) çerçevesinde ele alalım.

DENEY: Ders saatlerinin teorik-uygulama olarak paylaştırılmasının başarı üzerindeki etkisi incelenmek istenmektedir. Bunu, bu dersi alan N öğrenci üzerinde incelemek isteyelim.

Bağımlı değişken (Y) açık olarak dönem sonu notudur. Bu not 100 üzerinden verilsin. Y sürekli bir rasgele değişkendir. Etken (faktör), yani bağımsız değişken bir tanedir. Bağımsız değişkenin adına “uygulama saati” etkeni denebilir. Bu etken için belirlenmiş üç özel düzey (A A A ile gösterilsin) bulunmaktadır. Bu düzeyler nitelikseldir. Hipotezimiz, bu üç düzey ₁, ₂, ₃ için bağımlı değişkenin beklenen değerlerinin (ortalamaların) eşit olduğu, yani bu etkenin düzey etkilerinin aynı olduğudur.

DÜZENLEME: N öğrenci eşit veya farklı sayılarda rasgele olarak n n n₁, ₂, ₃ (n₁+ + =n₂ n₃ N) öğrenciden oluşan üç gruba ayrılabilir. Sınav yapmak için dershane sıkıntısı gibi bazı fiziksel kısıtlamalar olmadığında, öğrencilerin gruplara ayrılmaları, öğrenci listesinden sırayla her öğrenci için 1/3 olasılıkla A A A düzeylerinden birinin rasgele seçimi şeklinde olabilir. ₁, ₂, ₃

(4)

Dershane sıkıntısı, yani bazı dershanelerin küçük olması durumunda, n n n sayıları ₁, ₂, ₃ belirlenip sonra öğrenciler arasından rasgele çekim yapılabilir. Her iki durumda da hangi öğrencinin hangi gruba düşeceği tamamen rasgeledir. Y i_ij( =1, 2, 3ve j=1, 2,..., )n_i i. gruptaki j. öğrencinin notu olmak üzere, aşağıdaki gözlemler elde edilebilir.

Etken(faktör):Uygulama A1

(4saat teorik)

A2

(3 saat teorik + 1 saat uygulama)

A3

Y11

Y12

. . .

1n1

Y

Y21

Y22

. . .

2n2

Y

Y31

Y32

. . .

3n3

Y

1

1 1 1.

1 n

j j

Y

Y n

= ∑

= ² 2

1 2.

2 n

j j

Y

Y n

= ∑

= ³ 3

1 3.

3 n

j j

Y

Y n

= ∑

=

3

1 1

..

ni

ij

i j

Y

Y N

= =

= ∑∑

( _ij) _i , 1, 2, 3 1, 2,..., _i

E Y = +µ α i= j= n (

3

1 i 0

i

α

=

∑

= ⁾ olmak üzere, gözlemler

, 1, 2, 3 1, 2,...,

ij i ij i

Y = + +µ α ε i= j= n

modeli çerçevesinde ele alınabilir. i=1, 2, 3 ve j=1, 2,...,n_i için ε_ij ‘ler bağımsız ve ε_ij ^∼N(0,σ_α²) olduğu varsayılmaktadır. Bunu kısaca ε_ij ^∼BND(0,σ_ε²) biçiminde göstereceğiz. BND kısaltması, Bağımsız Normal Dağılımlı sözcüklerinin ilk harfleridir (Đngilizce karşılığı: Independently and Normally Distributed, IND, ε_ij ^∼IND(0,σ_ε²)). Burada, µ parametresi deneyin ortak etkisini,

1, 2, 3

i= ^içinαi parametresi i. düzeyin etkisini, ε_ij^terimii. düzeydeki j. biriminY _ij gözlemindeki rasgele hatayı ifade etmektedir. Bu tür deneylere (modellere) bir etkenli tamamen rasgeleleştirilmiş deneyler (modeller) denir.

ÇÖZÜMLEME (ANALĐZ): Gözlemler uygun bir veri tabanına alınıp,

0: 1 2 3

H α α= =α

1: 1 2 veya 1 3 veya 2 3

H α α≠ α α≠ α ≠α

hipotezini test etmek için bir yönlü varyans analizi (one-way analysis of variance) testi yapılabilir. Birçok bilgisayar paket programı bu test ile ilgili istatistiksel hesaplamaları yapmakta ve test ile ilgili kareler toplamlarını, serbestlik derecelerini, test istatistiğinin değerini, kritik değeri (veya p-değerini) Varyans Analizi (ANOVA) Tablosu içinde vermektedir.

Đstatistiksel çıkarım yapıldıktan sonra eğitimciler ile birlikte sonuçlar ele alınıp yorumlanmalıdır.

(5)

Bu örnekte ele alınan problem esasında eğitimcileri ilgilendiren bir problemdir. Kolay görünmesine kapılmamak gerekir. Bir kez daha: “Ne araştırılmak istenmektedir?” diye soralım. Cevap: Ders üzerinde uygulamanın etkisi. Hayır: Derste aktarılmak istenen bilgi üzerinde uygulama saatinin etkisi. Yok, hayır: Öğrencinin aldığı bilgi üzerinde uygulama saatinin etkisi. Bilgi ne demek? Nasıl ölçülecek? … En iyisi bir eğitimci (pedagog) ile görüşmek.

Örnek 2. Belli bir dersin 4 saat teorik, 3 saat teorik + 1 saat uygulama veya 2 saat teorik + 2 saat uygulama şeklinde verilmesinin “bilgi” ve “beceri” üzerindeki etkileri araştırılmak istenmektedir.

Bilgi, dönem sonu notu (Y) ile ölçülsün. Beceri, ödev notu (V) ile ölçülsün. Böyle bir araştırmayı Đstatistiksel Deney Tasarımı (Düzenlemesi) çerçevesinde ele aldığımızda izlenecek adımlar önceki örnektekinin aynısı olacaktır. Birimler üzerinde yapılan gözlemler iki değişkenli olacağından gözlemler,

Etken(faktör):Uygulama A1

(4saat teorik)

A2

A3

11

Y V

 

 

 

12

Y V

 

 

 

. . .

1

1 n

n

Y V

 

 

 

21

Y V

 

 

 

22

Y V

 

 

 

. . .

2

2 n

n

Y V

 

 

 

31

Y V

 

 

 

32

Y V

 

 

 

. . .

3

3 n

n

Y V

 

 

 

biçiminde olacaktır. Bu durumda çok (iki) değişkenli varyans analizi (MANOVA) sözkonusudur.

Örnek 3. Belli bir dersin:

a) 4 saat teorik ya da 2 saat teorik + 2 saat uygulama,

b) sınıfta not tutmak ya da not tutmamak (dersler ve uygulamalar projektör ile anlatılmakta) şeklinde anlatılmasının dönem sonu notu ile ölçülen “bilgi” (başarı) üzerindeki etkisi

araştırılmak istenmektedir. Böyle bir araştırmayı Đstatistiksel Deney Tasarımı çerçevesinde ele alalım.

DENEY: Ders saatlerinin teorik-uygulama olarak paylaştırılması ile derste not tutmanın başarı üzerindeki etkisi incelenmek istenmektedir. Bunu, bu dersi alan n öğrenci üzerinde incelemek isteyelim. Bağımlı değişken (Y) açık olarak dönem sonu notudur. Bu not 100 üzerinden verilsin. Y sürekli bir rasgele değişkendir. Etkenler (faktörler), yani bağımsız değişkenler iki tanedir. Birine “uygulama saati” etkeni, diğerine “not tutma” etkeni denebilir.

Birinci etken için iki düzey (A A ile gösterilsin) ve ikinci etken için iki düzey (₁, ₂ B -derste not ₁

(6)

tutmak, B -derste not tutmamak) bulunmaktadır. Her iki etkenin düzeyleri niteliksel ve özel ₂ seçilmiştir. Araştırılmak istenenler:

1. Uygulama saati etkeninin düzey etkilerinin aynı olup olmadığı, 2. Not tutma etkeninin düzey etkilerinin aynı olup olmadığı, 3. Uygulama saati ile not tutmanın birlikte bir etkisi olup olmadığı olabilir.

DÜZENLEME: Đkişer düzeyli, iki etkenli (faktörlü) olan bu deneyde N öğrenci eşit veya farklı sayılarda rasgele olarak n₁₁,n₁₂,n₂₁,n₂₂ (n₁₁+n₁₂ +n₂₁+n₂₂ =N) öğrenciden oluşan dört gruba ayrılabilir. Dershane sıkıntısı gibi bazı fiziksel kısıtlamalar olmadığında, öğrencilerin gruplara ayrılmaları, öğrenci listesindeki her öğrenci için 1/4 olasılıkla grup seçme şeklinde olabilir. Dershane sıkıntısı, yani bazı dershanelerin küçük olması durumunda, n₁₁,n₁₂,n₂₁,n ₂₂ sayıları belirlenip sonra öğrenciler arasından rasgele çekim yapılarak gruplar oluşturulabilir.

( 1, 2 1, 2 1, 2,..., )

ijk ij

Y i= j= k = n birinci etkenin i. düzeyi ile ikinci etkenin j. düzeyinin uygulandığı gruptaki k. öğrencinin notu olmak üzere, aşağıdaki gözlemler elde edilebilir.

Đkinci etken (not tutma) Birinci etken

(uygulama saati) B¹

(not tutmak)

B2

(not tutmamak)

A2

(4 saat teorik)

Y111

Y112

. . .

11n11

Y

Y121

Y122

. . .

12n12

Y

A2

Y211

Y212

. . .

21n21

Y

Y221

Y222

. . .

22n22

Y

( _ijk) _i _j _ij , 1, 2 1, 2 1, 2,..., _ij E Y = + +µ α β γ+ i= j= k= n (

2 2

1 1

0 , 0)

i j

α β

= =

∑ ∑

olmak üzere, gözlemler

, 1, 2 1, 2 1, 2,..., (0, 2)

ijk i j ij ijk ij ij

Y = + +µ α β γ+ +ε i= j= k = n ε ∼BND σ_ε

modeli çerçevesinde ele alınabilir.

ÇÖZÜMLEME (ANALĐZ): Gözlemler uygun bir veri tabanına alınıp, düşünülen hipotezleri test etmek için iki-yönlü varyans analizi (two-way analysis of variance) yapılabilir.

Deney tasarımındaki matematiksel modeli oluşturma safhasını pekiştirmek ve deney tasarımı modellerinden bazıları hakkında kulak dolgunluğu niteliğinde ön bilgimiz oluşması amacıyla aşağıdaki örnekleri göz önüne alalım.

(7)

Örnek 4 Yeni doğan civcivlerin ilk ayında uygulanan farklı iki beslenme rejiminin ağırlık üzerindeki etkileri karşılaştırılmak istensin. Böyle iki gıda rejimi ilk defa uygulanacak ve deney niteliğinde bir araştırma yapılacaktır. Birinci beslenme rejimi ile beslenen bir aylık civcivlerin ağırlıklarının beklenen değeri (ortalaması) µ₁, ikincisi ile beslenenlerin µ₂^ile gösterilsin.

DENEY: Civcivlerin yumurtadan çıktıktan sonra ilk ay içinde beslenmesi için önerilen yeni iki beslenme rejiminin ağırlık üzerindeki etkileri araştırılmak istenmektedir. Daha önce uygulanmamış olan iki beslenme rejiminin civcivler üzerinde denemesi yapılacaktır. Bağımlı değişken (Y) beslenmeye tabi tutulan civcivin gram cinsinden ağırlığı olsun. Y sürekli bir rasgele değişkendir. Etken (faktör), yani bağımsız değişken gıda rejimidir. Bu etken için iki belirlenmiş özel düzey bulunmaktadır. Bu düzeyler nitelikseldir. Etkenin her iki düzeyinin, yani her iki beslenme rejimi sonucu bir aylık civcivlerin ortalama ağırlıklarını (µ₁^,µ₂^{) tahmin} etmek (nokta tahmin ve aralık tahmini olarak) isteyelim. Ayrıca, iki beslenme rejimi sonucundaki ağırlık ortalamalarının eşit olup-olmadığı (H₀:µ µ₁= ₂ , H₁:µ µ₁≠ ₂) hipotezlerini test etmek ve farklılık durumunda ortalamalar arasındaki farkın ne kadar olduğunu tahmin etmek isteyebiliriz.

DÜZENLEME: Civcivlerin kitlesinden rasgele seçilen n tane civcive birinci ve m tane civcive ikinci gıda rejimi uygulansın. Y_{11 12},Y ,...,Y₁_n birinci ve Y_{21 22},Y ,...,Y₂_m ikinci beslenme rejimi ile beslenenlerin gözlenen ağırlıkları olmak üzere,

11 11

12 12

1 1 1

21 2 21

22 22

2 2

1 0

0 1

n n

m m

Y Y

Y Y Y

Y

ε ε ε µ

ε µ

ε ε

     

     

 

 =  + 

       

     

 

     

   

⋮ ⋮ ⋮ ⋮

gibi bir lineer model düşünülebilir. Gerekli istatistiksel sonuç çıkarımlar bu model çerçevesinde yapılabilir. Normal dağılım varsayımı yanında, hata vektörü için kitle varyanslarının eşit olması durumunda,

E( )ε =0 , Cov( )ε σ= ²I_{n m}₊ gibi bir varsayım, farklı olması durumunda,

2 1

2 2

( ) 0 , ( ) 0 0

n

m

E Cov I

I

ε ε σ

σ

 

= = 

 

gibi bir varsayım söz konusu olacaktır.

Gıda rejimi ortalamaları için

1 1

µ µ α= +

(8)

2 2

µ = +µ α (α α₁+ ₂ =0) gibi bir parametrelendirme yapıldığında,

1 2

2 µ = µ µ⁺

olmak üzere, yukarıdaki model,

11 11

12 12

1 1

1

21 21

2

22 22

2 2

1 1 0

1 0 1

n n

m m

Y Y

Y Y Y

Y

ε ε

µ ε

α ε

ε

     

     

 

     

 

 =  + 

     

 

       

     

 

     

   

⋮ ⋮ ⋮ ⋮ ⋮

Y_ij = +µ α ε_i+ _ij^,i=^{1 2}^, ^,j=^{1 2}^{, ,...,}n_i^,⁽i=¹için n_i =n i^, =²için n_i =m⁾

şeklinde de yazılabilir. Bu durumda tasarım matrisi X aşağıdaki gibi yazılabilir.

1 1 0

1 0 1

n m

X  

= 

 

ANALĐZ: Elimizde, n ve m hacimli iki veri kümesi bulunmaktadır. µ1 ile µ2 parametreleri için yansız en küçük varyanslı tahmin edicileri kullanarak tahminler elde edilebilir.

0: 1 2

H µ µ= , H₁:µ µ₁≠ ₂ hipotezlerini test etmek için lineer modellerdeki test işlemleri yapılabileceği gibi, iki kitle ortalamasının karşılaştırılmasında kullanılan t-test istatistiği de kullanılabilir.

Örnek 5 Civcivlerin ağırlıklarının ırklara göre farklı olması gerçeği de göz önünde tutularak, yeni doğan civcivlere uygulanan iki farklı beslenme rejiminin üç farklı ırk üzerinde denemesi yapılmak istensin. Gıda rejimlerinin etkileri α α₁, ₂ ve ırkların etkileri β β β₁, ₂, ₃ ile gösterilip etkilerin toplanabilir (eklemeli, additive), yani etkenlerin (faktörlerin, gıda rejimi ve ırk) ortak etkisi olmadığı gibi varsayımlar altında,

Y_ij = +µ α β_i + _j+ε_ij^,i=1 2, ^,j=1 2 3, , , k = 1, 2,...,n_ij

gibi bir model düşünülebilir. Bu durumda X tasarım matrisi,

(9)

X

n n

=

L

N M M M M M M M M

O

Q P P P P P P P P

1 1 0 1 0 0

1 1 0 0 1 0

1 1 0 0 0 1

1 0 1 1 0 0

1 0 1 0 1 0

1 0 1 0 0 1

11 11

12 12

13 13

21 21

22 22

23 23

biçimindedir. i=1 2, ve j=1 2 3, , için n_ij değerleri aynı olduğunda modele dengeli (balanced) denir. Tüm n_ij ler 1 olduğunda,

X I

=

L

I

NM

O

1 1 0

QP

1 0 1

3 3

ve tüm n_ij ler n olduğunda,

X

n n

=

L

N M M M M M M M M

O

Q P P P P P P P P

1 1 0 1 0 0

1 1 0 0 1 0

1 1 0 0 0 1

1 0 1 1 0 0

1 0 1 0 1 0

1 0 1 0 0 1

= I₆⊗1_n,I₂⊗1₃_n,I₃⊗1_n

biçiminde yazılabilir.

Ağırlık üzerinde etkenler (faktörler) olarak gıda rejimi ve civcivlerin ırkı göz önüne alındı. Gıda rejimi etkeninin 2 düzeyi, ırk etkeninin de 3 düzeyi göz önüne alındı. Đki etkenin birlikte etkisi de göz önüne alınırsa,

, 1, 2 , 1, 2, 3 , 1, 2,...,

ijk i j ij ijk ij

Y = +µ α +β +γ +ε i= j= k= n

gibi bir model yazılır. Bu modele 2 etkenli etkileşimli model veya 2 yönlü etkileşimli model denir. Dikkat edilirse etkenlerden birinin herbir düzeyi diğer etkenin herbir düzeyi ile ortaya çıkabilmektedir. Bu durumda tam çapraz bir tasarım söz konusudur denir. Bir etkenin bazı düzeyleri diğer etkenin bazı düzeyleri ile aynı anda ortaya çıkamıyorsa kısmi çapraz bir tasarım söz konusudur. Eğer etkenlerden birinin herhangi bir düzeyi ikinci etkenin birden çok düzeyi ile aynı anda ortaya çıkamıyorsa bu etkene ikinci etken içinde yuvalanmış (nested) denir.

Bu örnekte iki etkenli (faktörlü) tasarım modellerine değinildi. Đkiden fazla etkenli modeller benzer biçimde düşünülür. Dikkat edilirse, gıda rejimi etkeni için özel seçilmiş 2 düzey ve ırk etkeni için özel seçilmiş 3 düzey ele alındı. Böyle tasarımlara (modellere) sabit etkili tasarımlar (modeller) denir.

(10)

Örnek 6 Belli bir ürün ile ilgili, işleme zamanı üzerinde işçi faktörünün etkilerini göz önüne alalım. Ürünün üretim zamanı bir rasgele değişken olmak üzere değişkenlik üretimin doğasından ve işçiden (etken) kaynaklansın. Đşçi etkeninin (faktörün) sonsuz sayıda düzeyi söz konusudur. Rasgele seçilen bir işçi için ürünü üretme zamanı, tüm işçilerin ürünü üretme zamanlarının olasılık dağılımından bir gözlem olacaktır. Seçilen (göz önüne alınan) düzeyler rasgele bir örneklem oluşturacaktır.

Đşçiden işçiye fark eden ve bir rasgele değişken olan zamanı T ile gösterelim. Đşçiler arasındaki değişim Var T( ) ile anlatılsın. T rasgele değişkeni doğrudan gözlenememekte, çünkü üretimin kendisinden kaynaklanan bir rasgelelik daha söz konusudur. Bu ikinci rasgeleliği anlatan rasgele değişken ε olmak üzere T ile ε ‘nun bağımsız ve E ( )ε =0 olduğunu varsayalım. ε da tek başına gözlenememektedir. Rasgele seçilen i=1, 2,...,a tane işçinin herbiri için j =1 2, ,..., kez ürünü üretme zamanları Yn _ij gözlenmiş olsun. Ürünü üretme zamanı Y rasgele değişkenin ortalaması µ ve varyansı σ_Y²^olsun.

Y= +µ ⁽T−µ⁾+⁽Y−T⁾= +µ T^*+ε

düşüncesiyle,

Y_ij= +µ T_i^*+ε_ij , i=1, 2,..., , a j=1, 2,...,n a) E(ε_ij)=0 , Var(ε_ij)=σ_ε²

b)T_i^* =T_i −µ, E T( _i^*)=⁰^,Var T( _i^*)=Var T( )=σ_T² c) T_i^* ve ε_ij ‘ler bağımsız, gözlenemeyen rasgele değişkenler d)σ_Y² =σ_T² +σ_ε²

gibi bir model kurulabilir. Bu modele bir etkenli (faktörlü) varyans bileşenleri modeli denir.

Gözlenemeyen T^* ve ε rasgele değişkenlerinin sahip oldukları dağılımlar ile ilgili varsayımlar da modelde yer alabilir. Dikkat edilirse, doğrudan gözlenemeyen T rasgele değişkenin varyansı σ_T², Y nin varyansı içinde bir bileşen olarak yer aldı. Bu modellerde amaçlardan birisi de σ_T²ile σ_ε² varyans bileşenlerini tahmin etmektir.

Varyans bileşenleri modelleri, rasgele etkenli modeller olarak da isimlendirilmektedir.

Bir etkenin (faktörün) çok sayıda veya sonsuz sayıda düzeyi varsa ve seçilen (gözönüne alınan) düzeyler rasgele bir örneklem oluşturuyorsa bu etkene rasgele etken denir. Doğal olarak bir rasgele etken seçilen sonlu sayıdaki düzeyi ile temsil edilecektir. Seçilen bu sonlu sayıdaki düzey, büyük hacimli bir kitleden (düzeylerin kitlesinden) rasgele seçilmiş örneklem olarak düşünülmektedir.

Faktörlerden bazıları sabit etkili bazıları rasgele etkili olan modellere karma (mixed) model denir. Örneğin, üretim ile ilgili olarak yukarıda göz önüne alınan bir faktörlü varyans bileşenleri modelinde üretim ile ilgili üç farklı yöntem (düzey) söz konusu olsun. Bu üç düzey ile birlikte,

(11)

* , 1, 2,3 , 1, 2,..., , 1, 2,...,

ijk i j ijk

Y = +µ α +T +ε i= j= b k= n

gibi bir model söz konusu olacaktır. µ+α_i modelin deterministik kısmını, T_j^*+ε_ijk de stokastik kısmını oluşturmaktadır. T_j^*ile ε_ijk ‘ler 0 ortalamalı gözlenemeyen bağımsız rasgele değişkenler olmak üzere,

σ_Y² =σ_T² +σ²_ε dır.

Örnek 7 Rasgele Katsayılı Modeller (Bu örneği okumayabilirsiniz)

Rasgele seçilen m tane birimin her birinden n tane Y_ij (i =1 2, ,..., ,m j=1 2, ,..., ) n gözleminin alınması durumunda,

Y_ij =β_i1X_ij1+β_i2X_ij2+ +... β_ipX_ijp+ε_ij, i=1 2, ,..., ,m j =1 2, ,..., n gibi bir modelin geçerli olduğu varsayılsın. Bu model,

Y_ij = ′X _{ij i}β ε+ _ij^,i=^{1 2}^{, ,...,}m^,j=^{1 2}^{, ,...,}n

biçiminde yazılıp β_i =(β β_i₁, _i₂,...,β_ip) (′ i=1, 2,..., )m parametre vektörleri, rasgele seçilen m tane birim ile ilgili, m birimlik bir örneklem olarak düşünülebilir. β_i (i=1, 2,..., )m vektörleri, β ortalamalı, ∆varyans-kovaryans matrisli bir dağılımdan m birimlik bir örneklem olmak üzere, β_i^{ler ile}εij ler bağımsız olsun. Kısaca,

1)E(ε_ij)=0,Var(ε_ij)=σ ε², _ij ler (i=1 2, ,...,m , j=1 2, ,..., )n ilişkisiz, gözlene- meyen rasgele değişkenler,

2) E Cov

i i i

(β )=β , (β)=∆ , β ler (i=1 2, ,..., )m bağımsız rasgele değişkenler, 3) β_i^{ler ile}ε_ij^{ler (}ⁱ=1 2^{, ,...,}^m , ^j =1 2^{, ,..., )}ⁿ bağımsız,

4) X_ij:p×1 vektörü p tane açıklayıcı değişkenin, rasgele seçilmiş olan i . birimi üzerindej. gözlem vektörü,

11 12 1

21 22 2

1 2

i i i p

i

in in inp n p

x x x

X

x x x

×

 

 

=  

 

 

⋯

⋮ ⋮ ⋮

⋯

matrisi i .birim ile ilgili açıklayıcı değişkenlerin matrisi (sabitlerin matrisi)

5) Y_ij , i=1 2, ,...,m , j=1 2, ,..., , i .birim üzerinde j. gözlemi gösteren bir rasgele n değişken ve

1

2 i

i i

in

Y Y Y

Y

 

 

=  

 

 

⋮

(12)

i . birim üzerinde gözlemlerin rasgele vektörü olmak üzere;

Y_i = X_{i i}β ε+ _i^,i=^{1 2}^{, ,...,}m

modeline rasgele katsayılı lineer model denir. Bu modelde rasgele vektörler olan β_i ler kendi ortalamaları cinsinden,

β β δ_i = + _i , ⁱ=1 2, ,..., ^m olarak yazılıp modelde yerine konursa,

Y_i = X_{i i}β +X_iδ ε_i⁺ _i^,i=^{1 2}^{, ,...,}m

yazılır. Bu modelde X_{i i}β modelin deterministik kısmını X_iδ ε_i⁺ _i de stokastik kısmını oluşturmaktadır. i=1 2, ,..., için m δ_i ler bağımsız Cov( )δ_i = ∆ ve δ_i ‘ler ile ε_i^‘ler bağımsızdır.

E Y( _i)= X_iβ^{, ov}C (Y_i)= X_i∆X_i +σ²I_n

olmak üzere, modelde amaç β_i rasgele katsayılarının ortalaması olan β vektörünü tahmin etmek olabilir.

m tane vektörü alt alta yazıp bir sütun vektörü olarak ele alırsak, rasgele katsayılı bir lineer model, genel olarak

1 1 1 1 1

2 2 2 2 2

0 0

m m m m m

X X

Y

X X

Y

X X

Y

δ ε

β

δ ε

   

     

   

     

   

     

   

 =  +  + 

     

   

     

   

     

        

⋯

⋮ ⋮ ⋮ ⋮

⋮ ⋮ ⋮

⋯

biçiminde yazılabilir. Modelin stokastik kısmındaki gözlenemeyen rasgele vektörler ile ilgili bazı dağılım varsayımları da yapılabilir.

Bu örnekte sözü edilen “rasgele seçilen birim”, örneğin bir insan grubundan rasgele seçilen kişi olabilir. Rasgele seçilen kişi i indisi (i=1, 2,...,m) ile temsil edilip, bu kişi üzerinde gözlenen Y_ij değerleri zaman içinde (j=1 2, ,..., )n kişinin günlük harcamaları olabilir. Günlük harcama Y , gelir (X₁), kişinin bakmakla yükümlü olduğu birey sayısı (X₂), oturduğu yer (X₃) gibi açıklayıcı değişkenlerin bir lineer fonksiyonu olarak ifade edilebilir.

Bu lineer ifadedeki katsayılar kişiden kişiye değişebilir. Bu değişkenlik, katsayıları rasgele değişken olan rasgele katsayılı model ortaya çıkarmaktadır.

Bu örnek, rasgele katsayılı model ile rasgele etkenli model (varyans bileşenleri modeli) kavramlarını açıklığa kavuşturmak için verildi.

(13)

Deney tasarımında,

, ( ) 0 , ( ) 2 _N

Y= Xβ+ε E ε = Cov ε =σ_εI

biçiminde bir lineer model söz konusu olmaktadır. Bu modeldeki X matrisine tasarım matrisi veya açıklayıcı değişkenlerin (etkenlerin, faktörlerin) gözlem matrisi denir. X matrisinin satır vektörlerine karşılık gelen tasarım noktalarını (deneme noktalarını) seçmek uygulamacının elindedir. Bu tasarım noktalarında Y Y₁, ₂,...,Y gözlemleri alınmaktadır. Yürütülen istatistik _N sonuç çıkarım işlemlerinde doğal olarak bazı iyilik ölçütleri söz konusudur. Örneğin, belli bir

'βˆ

ℓ tahmin edicisinin varyansı,

2 1

( ' )ˆ '( )

Var ℓ β =σ_εℓ X X′ ⁻ ℓ

olmak üzere, X matrisinin ℓ'(X X′ )⁻¹ℓ değeri en küçük olacak şekilde seçilmesi istenebilir.

Bu tür problem optimal tasarım problemi olarak isimlendirilmektedir. Bu kısımda bu problemlerden bazılarına değinmeye çalışacağız.

, (0, 2 _N) , ( : )

Y= Xβ+ε ε∼N σ_εI rank X N×p = p

modelinde β parametre vektörünün belli ℓ'β lineer bileşimi ile ilgili istatistiksel sonuç çıkarıma sıkça rastlanır. ˆβ , β parametre vektörünün en çok olabilirlik tahmin edicisi olmak üzere:

1) 'ℓ β nın düzgün en küçük varyanslı (UMVU) tahmin edicisi ℓ'βˆ dır ve ˆ 1

( ' ) '( )

Var ℓ β =ℓ X X′ ⁻ ℓ dır.

2) 'ℓ β için 1−α lık güven aralığı,

1 1

1 / 2; 1 / 2;

ˆ ˆ ˆ ˆ

( 'ℓ β−t₋_α _{n p}₋ σ_ε ℓ'(X X′ )⁻ ℓ , 'ℓ β+t₋_α _{n p}₋ σ_ε ℓ'(X X′ )⁻ ℓ) olmak üzere, bu aralığın uzunluğunun beklenen değeri;

3/ 2

1 1

1 / 2; 1 / 2;

2 ( 1)

ˆ 2 ˆ

(2 '( ) ) '( )

( )

2

n p n p

n p

E t X X X X t

n p

α σε ⁻ σε ⁻ α

− − − −

Γ − +

′ = ′

− Γ −

ℓ ℓ ℓ ℓ

dır.

3) H₀: 'ℓ β=ℓ₀ , H₁: 'ℓ β≠ℓ hipotezleri için ₀

1 1

0 0

2

ˆ ˆ

( ' ) '( ) ( ' )

( ) ˆ

W Y β X X β

σ

− −

 ′ 

−   −

=

ℓ ℓ ℓ ℓ ℓ ℓ

test fonksiyonunun α anlam düzeyindeki güç fonksiyonu

1 1

0 0

2

1 ( ' ˆ ) '( ) ( ' ˆ )

2 X X

λ β β

σ

− −

 ′ 

= ℓ −ℓ ℓ ℓ ℓ −ℓ

merkezi olmama parametresinin monoton artan bir fonksiyonudur.

Bu üç durumda da X matrisi ℓ'(X X′ )⁻¹ℓ küçük olacak şekilde seçilirse istatistiksel sonuçlar daha iyi olacaktır. Ancak problem her zaman bu kadar basit değildir. Örneğin, aynı anda iki tane

1 2

'β , 'β

ℓ ℓ lineer bileşimi için yukarıdaki istatistiksel sonuç çıkarımlar istense lineer bileşimlerden birisi için iyi olan matris diğeri için iyi olmayabilir.

(14)

Optimal tasarım konusunda genellikle yapılan şey, X matrisinin elemanlarının bir fonksiyonunu alıp bu fonksiyon minimum olacak şekilde X matrisini seçmektir. Minimize edilecek olan fonksiyon bazen istatistiksel sonuç çıkarımdaki iyilik ölçütünün kendisidir.

Optimal tasarım problemlerinden bir kaç tanesine kısaca değinelim.

1) β vektörünün ˆβ tahmin edicisinin hata kareleri ortalaması

ˆ ˆ ˆ

( ) ( ) ( )

MSE β =E β−β ′ β−β =σ_ε²tr X X( ′ )⁻¹

olmak üzere, tr X X( ′ )⁻¹ fonksiyonunu minimize eden X matrisi MSE β yı da minimize ( )ˆ edecektir.

2) ˆβ tahmin edicisinin genelleştirilmiş varyansı olarak isimlendirilen det(σ_ε²(X X′ ) )⁻¹ değerinin minimizasyonu başka bir optimal tasarım problemidir.

3) Var( ' )ℓ βˆ =σ_ε²ℓ'(X X′ )⁻¹ℓ ve λp , (X X′ )⁻¹ matrisinin en büyük özdeğeri olmak üzere,

{ }

1 : ' 1

max '( X X )

⁻

λ

_p

=

′ =

ℓ ℓ ℓ

ℓ ℓ

dır. Buna göre (X X′ )⁻¹ matrisinin en büyük özdeğeri λ_p yi minimize edecek şekilde seçilen X matrisi aynı zamanda ℓ ℓ' =1 olan tüm ℓ'βˆ tahmin edicilerinin varyanslarının maksimumunu minimize etmektedir.

Bu üç tasarım problemi genel olarak aynı optimal X matrisi ile sonuçlanmamaktadır.

Ancak model basit lineer model olduğunda her üç optimal tasarım problemi de aynı sonucu vermektedir. Bu derste optimal deney tasarımı problemi ele alınmayacaktır.

Đstatistiksel Deney Tasarımının üç temel ilkesi vardır. Bunlar: rasgeleleştirme (randomization), tekrar (tekerrür, replication) ve bloklama (blocking) dır. Rasgeleleştirme ilkesi, gözlem birimine uygulanacak işlemlerin ve sırasının rasgele yapılmasını ya da işlemlerin uygulanması için seçilecek birimlerin ve uygulanacak işlemlerin sırasının rasgele olmasını vurgulamaktadır. Bazı tasarımlarda, rasgeleleştirme ilkesine tam olarak uymak mümkün olmamaktadır, yani rasgeleleştirme üzerinde bazı kısıtlamalar söz konusudur.

Kısıtlama olmadığında tasarıma tamamen rasgele tasarım (completely randomized design) denir. Tekrar ilkesi, denemelerin (aynı koşullar altında gözlem almanın) tekrarlanabilir olmasını vurgulamaktadır. Tekrar ilkesindeki tekrarı, tekrarlı ölçümler (repeated measurements) ile karıştırmamak gerekir. Tekrarlı ölçümlerde, koşullar değişmiş olup aynı birim üzerinde gözlemler yapılmaktadır. Tekrar ilkesine uyulması durumunda, tahmilerin varyansı küçülmekte ve istatistiksel sonuç çıkarım iyileşmektedir. Đstatistiksel sonuç çıkarımın sağlıklı olması için deney tasarımında uyulması gereken bloklama ilkesi, birimleri bizim ilgi sahamızda olmayan ve yardımcı etkenler (nuisance factors) denen etkenlere göre

(15)

gruplara ayırmak olup, bloklar içindeki gözlemlerin homojenliğini sağlamaktadır. Bu, ilgilendiğimiz etkenin düzey etkilerinin ortaya çıkarılmasında yardımcı olmaktadır.

Đstatistiksel Deney Tasarımı R.A.Fisher’in 1920 ‘li yıllarda ziraat alanında yaptığı öncü çalışmalarla başlamıştır. !930 ‘lu yıllarda endüstri alanında uygulamaları yapılmış olup, 1950 ‘li yıllarda Box ve Wilson’un Tepki Yüzeyleri (Responce Surface) metodolojisini geliştirdikten sonra çok geniş uygulama dönemi başlamıştır. Ziraat alanından farklı olarak bazı endüstri uygulamalarında deneylerin yapılması ve gözlemlerin alınması çok kısa sürmektedir. Endüstri deneylerindeki çabukluk (immediacy) sonraki deney tasarımına geçilmesini ve bir dizi deney tasarımının yapılmasını (sequentiality) sağlamaktadır. !970 ‘li yıllarda ve sonrasında yaptığı çalışmalarla, G. Taguchi: a) çevre ve kontrolü güç olan etkenlere karşı süreci duyarsız hale getirme, b) bileşenlerden aktarılan değişimlere karşı ürünleri duyarsız hale getirme, c) ortalamanın arzu edilen değere gitmesini zorlayacak ve bu değer etrafında değişkenliğini azaltacak süreç değişkenleri düzeylerini bulmak, şeklinde olan ve robust parameter design ismini verdiği bir deney tasarımı önermiştir. Her alanda uygulanmakta olan Đstatistiksel Deney Tasarımı ile ilgili yayınlanmış çok sayıda kitap ve makale bulunmaktadır. Đstatistiksel Deney Tasarımı, Đstatistikte en çok ilgi gören ve çalışılan konulardan birisidir.

Bu bölümü, D.C. Montgomery’nin “Design and Analysis of Experiments” (2005) isimli kitabından alınan aşağıdaki özetle sonlandıralım.

Guidelines For Designing Experiments

1. Recognition of and statement of the problem.

2. Selection of the response variable.

3. Choice of factors, levels and range.

4. Choice of experimental design.

5. Performing the experiment.

6. Statistical analysis of the data.

7. Conclusions and recommendations.

SUMMARY: USING STATISTICAL TECHNIQUES IN EXPERIMENTATION

Much of the research in engineering, science, and industry is empirical and makes extensive use of experimentation. Statistical methods can greatly increase the efficiency of these experiments and often strengthen the conslusions so obtained. The proper use of statistical techniques in experimentation requries that the experimenter keep the following points in mind.

1. Use your nonstatistical knowledge of the problem. Experimenters are usually highly knowledgeable in their fields. For example, a civil engineer working on a problem in

(16)

hydrology typically has considerable practical experince and formal academic training in this area. In some fields there is a large body of physical theory on which to draw in explaining relationships between factors and responses. This type of nonstatistical knowledge is invaluable in choosing factors, determining factor levels, deciding how many replicates to run, interpreting the results of the analysis, and so forth. Using a designed experiment is no substitute for thinking about the problem.

2. Keep the desing and analysis as simple as possible. Don’t be overzealous in the use of complex, sophisticated statistical techniques. Relatively simple desing and analysis methods are almost always best . This is a good place to reemphasize steps 1-3 of the procedure recommended above. If you do the pre-experiment planning carefully and select a reasonable desing, the analysis will almost always be relatively straightforward. In fact, a well-designed experiment will sometimes almost analyze itself! However, if you botch the pre-experimental planning and execute the experimental desing badly, it is unlikely that even the most complex and elegant statistics can save the situation.

3. Recognize the difference between practical and statistical significance. Just because two experimental conditions produce mean responses that are statistically different, there is no assurance that this difference is large enough to have any practical value. For example, an engineer may determine that a modification to an automobile fuel injection system may produce a true mean improvement in gasoline mileage of 0.1 mi/ gal and be able to determine that this is a statistically significant result. However, if the cost of the modification is $1000, the 0.1 mi/ gal difference is probably too small to be of any practical value.

4. Experiments are usually iterative. Remember that in most situation it is unwise to design too comprehensive an experiment at the start of a study. Successful desing requires knowledge of the important factors, the ranges over which these factors are varied, the appropriate number of levels for each factor and response. Generally, we are not well- equipped to answer these questions at the beginning of the experiment, but we learn the answers as we go along. This argues in favor of the iterative, or sequential, approach discussed previously. Of course, there are situations where comprehensive experiments are entirely appropriate, but as a general rule most experiments should be iterative.

Consequently, we usually should not invest more than about 25 percent of the resources of experimentation (runs, budget,, time, etc.) in the initial experiment. Often these first efforts are just learning experiences, and some resources must be available to accomplish the final objectives of the experiment.

(17)