Marmara Üniversitesi İ.İ.B.F. Dergisi, Yıl 19'87, Cilt iV, Sayı 1 -2
Varyans Analizine
GirişBülent AYYILDIZ (*)
1. GİRİŞ
İstatistiksel analizler bir tek istatistik serisine ait değerler üze-rinde yapılabildiği gibi bazı durumlarda, birden· fazla istatistik serisi-nin değerleri üzerinde de yapılabilmektedir. istatistiksel analizlerin bir veya birden fazla istatistik serisi üzerinde yapılması halinde çözül-mesi istenUen veya araştırılan konunun durumuna göre farklı analiz işlemleri uygulanmaktadır.
İki veya daha fazla istatistik serilerinin ortalamalarının arasında bulunan farkların bir anlamı olup olmadığı diğer bir deyişle iki veya daha fazla istatistik serilerinin ortalamalarının homojen olup
olma-dıklarının secilen belli bir hata payına göre incelenmesi «Varyans Ana-lizisi» yöntemi ile yapılmaktadır . .
Varyans analizi yöntemi; iki veya daha fazla istatistik serisine ait gözlem· sonuçlarındaki, toplam ,değişimin anlamlı kısımlara ayrıl ması ve. bu kısımlardaki değişim kaynağının ölçülmesi ile başlar. İlk ölçüm gözlem sapmalarındaki değişim üstünde yapılır. İkinci ölçüm ise gözlem sapmalarındaki değişim artı farklı guruplara bağlı olan de-ğişim {guruplar arası değişim) üstünde yapılır. Daha sonra ölçülen bu değişimlerin karşılaştırılması hipotez testleri kullanılarak yapılır. Burada bu iki değişimin karşılaştırılması .F dağılımı yoluyla _test edilir. Gözlem sonuçlarının tasnifi, bir tek kritere (özeiliğe) g0re yapı-
-lıyorsa buna tek kritere bağlı tasnif (tekH tasnif) denir'. Eğer gözlem
sonuçları iki ayn kritere göre tasnif ediliyorsa buna da iki kr.itere bağlı tasnif (ikili tasnif) adı verilir. Varyans analizi yöntemi bu iki ayrı tas-nife göre incelenecektir.
2. TEKLİ TASNİF
Her bir k nüfusundan,,.. n terimli örnekler çekilmiştir. Buradaki k
nüfuslarının ortalamaları µ1, µ2, ... , µk ve varyansları cr? ortak olup, bu
nüfusların bağımsız ve normal· olarak dağıldıkları varsayılmaktadır. Simdi hipotezlerin testi için uygun Xöntemleri oluşturalım. Ho : µı -:- µ2
= ..
..
::::::::
µkH1 ·: Ortalamalardan en az iki ·tanesi birbirine eşit değildir . .xij, i nüfusundan tell)in edilen j inci gözlem olsun ve tüm
göz-lem sonuçları aşağıdaki tablo 1 'de düzenlenmiştir. Burada Ti, i nü~ fusundan çekilen örnekteki gözlemler toplamı,
xj,
i nüfusundan çe-kilen örnekteki gözlemlerin ortalaması; T, tüm gözlemlerin (gözlem sayısı=
nk) toplamı; X ise tüm gözlemlerin ortalamasıdır.·Tablo c. 1 k c..clet tesadüfi örnek
nüfus. j_ 2 i k ·y x o xil .ı xkl· -·ıı 21 xl2 ·"22 (J r, xi2. o o
~
!"i C"<' o "" ~ 1) o o ti'•
:<:J,n x2ı1 :ı I>x.
•
•
xkn ın Toplam Tl T2 o ~ ·Ti Tk T_
_..._._.._______
....,.._....___________ _
Ortal~a o G X. ı oHer' bir gözlem sonucu aşağıdaki şekilde de yazılabilir. x .
Burada E'.ij; i inci örneğin j inci gözleminin karşıt nüfusun orta-lamasından olan sapmasıdır. Tercih edilen ve yukarıdaki denkleme
alternatif olan yeni· denklem,
µi
yerine µi==ıJ.+cxi eşitliğinin yazılmasıyla aşağıdaki şekilde elde edilir (Burada µ, µ/lerln ortalaması ola-rak tanımlanmıştır k ~
µ
1
i=l µ==
).
k k , 'Tabii bu ifade de ~ cxi =0 olma koşuluna bağlıdır. IXj genel olarak
i=l
inci nüfusun etkisi olarak bilinmektedir.
Bu açıklamalardan sonra; k nüfusları ortalamalarının eşit
oldu-ğunu öne ~üren sıfır hipotezi ve buna karşı en az iki ortalamanın eşit . olmadığını öne süren bir hipotezlerine eş değer olan hipotezleri şöyle
yazabiliriz : ·
Hı IXi lerden en az bir tanesi sıfıra eşit değildir.
Bizim testimiz, ortak nüfus varyansı cr2 nin bağımsız iki tahmi-ninin (SSE ve SSG) karşılastırılması üzerine kurulmustur. Test ko-nusu olan bu
değerler;
tüm' gözlemsonuçlarındaki d~ğişmeler
top-lamının iki kısma ayrılmasıyla elde edilir.·Tüm gözlem sonuçlarının nk terimli tek bir örnek olarak düzen-lenmesi halinde varyans f<?rmülü şu şekilde elde edilir :
k n
~ ~ (.x1j-x)2
i=l j=l .
52=---nk-1Çift toplam; j nin 1 den
n
ye kadar her bir değeri için, i nin 1 den k ya kadar değerler almasıyla elde edilen olası tüm terimlerintop-lamı antop-lamına gelmektedir. Yukarıdaki varyansı_n (s2) payına toplam
kareler toplamı (total sum of squares) adı verilir ve bu tüm gözlem sonuçlarındaki toplam değişimi ölç~r.
TEOREM 2.1 ( KARE"'ı.ER TOPLAY:I ÖZDBŞLİGİ)
~(-
..- 2~.k ~n
...:.. 2 n '---i~l ı x.-x) + ~ (x .. - x.) ~~l J 1J ı 1 İSPAT k n k rı r-ı~. 2 ~~·· - - - 2L
i:=l L .... j=lh=·
ıJ.-
i)=
L_ı L....,((:ı:.-x)+(x .. - :x. )] i:,,l j-1 . ı ıJ ı . =L
k . L~:ıc.-l1. fi- :x) - 2 + 2(x. -,_ -:ıc)(x ... - x. - .... 2J
)+(x .. - x.) i=::l j;l ı ı ıJ ı 1J . ıOrta. terimin to:plaıııı sıfırdır. Çünkü n
.
L::ıc..
n .... n . ·- n j=l ıJ n n
L(x .. . l 1J
-x.
ı)=I_} . .
. l -nx.=LX·
.-"1---='L.,x .. - L'x ..
:O1J ı . ı J:J J . l ı;ı . ı 1J
J; J= J= j'- J= J=
İlk toplam indis olarak j ye sahip deeildi1' ve bu
nedenle şu şekilde yazı-la.bilir.
:Bu sebebten
k , A -2 _k,_ 2~~ - 2
L
i-1L,:cx
j::;l ıJ..
-
x) .=
n L(x.- x) + Lı l__Jx .. - x.)i;:::l ,ı i:ıl j .. l ıJ ı
Kareler toplamı özdeşliğinin· terimlerini
aşağıdaki notasyonlarla ifade etmek daha uygun olacaktır.
k n
SST
=
2:: 2:: (xij-x)2 =Toplam karelertoplamı
i=l j=l
-k
SSC = n 2:: (xi-x)2 =Sütun ortalamaları
için kareler toplamı
i=l
k n
SSE
=
~ ~ (xij-5<)2 =Sapmalar için karelertoplamı
Kareler toplamı özdeşliği, aşağıdaki denklem tarafından sembol-lerle şu şekilde ifade edilir:
SST
=
SSC + SSENüfus varyansının ( 02), (k-1) serbestlik derecesine göre bir tah-mini aşağıdaki şekildedir ..
s 2
1=
ssc
(k-1)
. Eğer H0 doğru ise, s1
2
, (02) nin tarafsız bir tahminidir. Buna
kar-şılık, eğer H.1 doğru ise, SSC daha büyük nümerik bir
değere sahip
olmakta ve s1 2
, (02) yi fazla olarak tahmin etmektedir. Nüfus varyansı
( d
2) · nin k (n-1) serbestlik derecesine göre ikinci bagimsız
tahmini şu şekildedir :
s
2=
2SSE
k (n-1)Sıfır hipotezinin doğru veya yanlış olmasına bağlı olmaksızın, s2
2
tarafsız bir tahmindir. Halihazırda tüm terimlerin bir tek seri olarak düzenlenmesi halinde bu_ serinin nk-1 serbestlik derecesine göre varyansının,
52
=
SST
nk-1
olduğunu biliyoruz. Bu da H0 .. doğru olduğunda
a2
nin tarafsız birtah-minidir. Görüldüğü gibi kareler toplamı, tüm gözlem sonuçlarındaki toplam değişimi kısımlara ayırmaktadır. Önemli olan bir nokta da, kareler toplamı aynı zamanda serbestlik derecesini de kısımlara eyır maktadır. Şöyle ki,
nk-1
=
k-1 +k (n-1)Hipotezler belli bir a. hata payına göre tertip edilmekte ve her-hangi bir hipotezin kabul veya red edilmesi a. hata payına gö"re ol-maktadır.
Hipotezlerin tesbit· edilmesinden sonra ·test kriteri (hesap·
k-1 ve k (n-1) serbestlik dereceli F dağılımına ait tesadüfi de-ğişken F · nin değeridir. f c değerinin, F dağılımı tablosundan temin
edilen fa: değeri ile karşılaştırılması ile
H
0 veya Hı hipotezlerindenbir tanesi kabul edilece~tir. Yani, f o: ~ f c olması halinde Ho hipotezi
f o:
<
f c olması halinde H1 hipotezi kabul edilecektir.Uygulamada, ilk önce SST ve SSC hesaplanır. Sonra kareler
top-lamı· özdeşliği kullanılarak SSE elde edilir.
SSE
=
SST - SSCSST ve SSC için daha önce verilen formüller hesaplamalar iç;n en uygun formlar olarak kabul edilemez. Bu nedenle SST ve SSC için daha uygun ve eş değerde formül.ler aşağıdaki gibidir.
k n
r2
SST=
~ 2:x
2 ij - - -· i=ı j=ı nk SSÇ= -n nkVaryans :analizi problemlerinde genellikle yapılan hesaplamalar
aşağıda tablo· 2'de görüldüğü şekilde özetlenebilir.
Tablo.2 Tekli Tisnif İçin Vary~ns Analizi
De,~işiır: Kareler Serbestlik Krırc~cr Hesaplanan Zaynağ,ı Toplarr.ı Derecesi Ort.o-.lLıJ:ıas ı f
'Sütun
k-1 2 ssc 2
o~talar.ıalc..rı ssc 8
1= k-1 sl
-
-2-Sapır.alar SSE k(n-1) s.2 ·-'- SSE s2
:ktn-1)
2.1 TEKLİ TASNİF İCİN VARYANS ANALİZİ UVGULAMASI
İstatistiksel analiz yöntemlerinden bir tanesi olan varyans ana-lizi çeşitli alanlardaki problemlerin çözümlerinde kullanılabilmektedir.
Örneğimizde varyans analizinin, üretim yönetimi aı'anındaki bir
uygu-lamasını göreceğiz.
Dayanıklı tüketim mamulleri üretimi yapan bir fabrikanın yöne-ticileri mevcut mamullere ilave olarak yeni bir mamulü piyasaya ç:ı
karmayı planlamaktadırlar. Piyasaya çıkarılması planlanan bu yeni
mamul altı değiş,ik sistemde imal edilebilmektedir. Yeni mamulün üre-tilebileceği sistemlerin maliyetleri birbirlerinden farklıdır. Piyasaya çı
karılması planlanan mamul bir defada on adet olmak üzere beş ayrı
dönemde ve değişik şartlarda bütün sistemlerde imal edilmiştir. İmal edilen mamuller üzerinde yapılan kalite kontrolünde aşağıda tablo 3'de verilen değerde kusurlu mal saptanmıştır. Sistemlerin kusurlu mamul üretme oranları yönünden birbirlerinden farklı olup olmadık-. larını tesbit ediniz. Diğer bir deyişle, bu mamulün üretimi için
mev-cut üretim ·sistemlerinden herhangi bir tanesi seçilebilir mi?
TÇ:ı.blo ~3
sis.temler
:Dönemler '---,...~--+
A
:a
c
.
D ·E F1
l3ol
121)8
l2o7 1306 13.5 ıo.,('.o 2 ıı.o 12~913o7
14o7·14o5
13 ..
7
.
3 ı2~a ıı.5
,
14·1
·
13o514.2
14a04 12o3
l2o3
14.5
14c0 15.014.1
5
14.0
l4o0
14,0 14c014.7
14o7
Toplam 403.9 Cözüm: 525 t ..Yani sistemler arasında kusurlu üretim oranı yönünden fark yoktur.
2.
H.ı
: Ortalamalarda en az iki tanesi birbirlerineeşit değildir.
Yani sistemler arasında kusurlu üretim oranı yönünden fark
vardır. 3. Hata payı : d = 0.05 4. Kritik Bölge: F
>
2.62 [k-1 =6-1 =5, k(n-1)=6(5-1)=24] 5. Hesaplamalar : k. nT
2 SST=
L
L
x~\j -i=ı j=ı nk = 13.12 + 112+
12.82+
12.32+
142+
12.82+
12.92 +11.52 +12.32+
14~ + 12.72+
13.72+
14.12+
14.52+
142+
13.62 + 14.72 +2 13.52 +142+142 + 13.52+
14.52+
14.22+
152+
14.72+
102 +13.72 +142 + 14.12 + 14.7-(403'.9).2/'30=5476.69 - 163135.21 /30 = 5476.69-5437,84 = 38.85 ~ SST = 38.85 k i=lLTi
2 T2ssc
=
-n nk 63.22 + 63.52
+
692+
69.8:>.+
71.92+
66.52=
5 27251.39 163135.21-
- · ·----· - ·----·-- -- - ·-- -5 30 _(1_Q_Ş_'.~ 30 = 5450.278 .- 5437.84 = 12.438 ~ssc
= 12.438 SSE = SST - SSC = 38.85 - 12.438 = 26.412 ~ SEE = 26.412Bulduğumuz sonuçları tablo 4'de yerine koyup diğer
:Ka:r:eleı~ ' .Kareler · \
Deği~iın 5.eı-be~Uil:
l
HesaplananK?.yn~ı Topla!llı Dcr~celer! Ortalaması
"
r
.
Tablo.4 Sü.tım 12r:438 5
1si=2.~876
:f _2.4876 Ortalamaları c 101005 ot"\ Sapmalar 26,412 24s;==
101005 f =2.26 c Toplam 38 .. 8529
, 6. Sonuç:fc
<
fa {2.26<
2.62} H0 kabul edilir. Sistemlerin kusurlu mamulüretme oranları yönünden farklı olmadıkları
anlaşılır.
2.2 FARKLI SAYIDA TERİMDEN OLUŞAN ÖRNEKLER
Uygulamada çoğu kez arzu edilen gözlemler temin
edilememek-tedir. Bazı nedenlerle, gözlemler çeşitli alanlarda eşit olmayan· sayı
da gerçekleşmektedir. Eşit sayıda terimden oluşan örn,ekler için
yap-mış olduğumuz analizde kullanılan kareler toplamı formülleri küçük
· bir değişiklikle, farklı sayıda terimden oluşan örneklerin analizinde
de geçerlidir. k adet tesadüfi örneklerin terim sayısı sırasıyla; n1 , n2 ,
' k
... , nk olsun. Bu örneklerdeki terim sayıları toplamı da N
=
i==~ lni
dir.. SST ve SSC nin hesaplanması için gerekli formüller şu şekildedir :
k n
T2
SST=
~ ~x2 ij-- ij--. i==ı j==.ı N k T2 T2SSG==~-
1 -i==ıni
NDaha önce olduğu gibi S$E değerini yine SST'den SSC'yi çıka
rarak buluruz. Serbestlik dereceleri ise SST için N-1, SSC için k-1
ve SSE için N-1-(k-1)
=
N-k dır.3. İKİLİ TASNİF
Bir gözlemler kümesi iki kritere göre bir defada tasnif edilebilir. 527
Bu da, sütunların birinci kritere göre tasnifi, satırların ise- ikinci kri·
tere göre tasnifi belirlediği bir dikdörtgen tablo vasıtasıyla gerçekleş
tirilir. Elde etmiş olduğumuz herhangi bir gözlem için, her bir ele alış tarzının birleştirilmesi bizim tertip düzenimiz içinde bir ünitey belir-ler. Bu bölümde gözlem değerlerirıdeki değişimin; birinci kriter nede·
.niyle mi, ikinci kriter nedeniyle mi, yoksa her ikisi nedeniyle mi
oldu-ğunu test edebilmek için formüller çıkaracağız.
Şimdi bir genelleştirme yapalım. Aşağıda r adet satır ve c adet sütundan oluşan Tablo 5'de her bir .xii değerinin i inci sıra ve j inci sütundaki gözlemi temsil ettiğini göz önüne alalım.
Tablo.5 Jkili Tasnif
Satırlar Sütunlar Toplam ört alama
1 ? 3
.
.
j.
.
o -1 xll xl2 xl3.
.
xij.
.
.
xlc Tl. xı. ·· ·2 x21 x22 x23. .
:x:2j.
.
x 2c ır2. x 2. 1 •.
•
•
.
•
.
•
. . .
•
.
i T. -xil xi2''ü
.
.
x ...
.
::ı.: x . ıJ ıc ı • ·ı .•.
~•
.
•
•
-xr2 x T rxrl
:ıc:r3•
.
xrj•
•
re :t: r. r. Tep lanı ır.ı ır.2 T.~•
.
T ej..
.
'l' .c T..
-Ortalama. x.ı-
-
-
-x.2 x.3. .
:x: .j. .
;ıc-
x .c..
Buradaki .xjj değerleri, ortalamaları µİj ve ortak varyansları 02
olan noı:mal dağılımların bağı.msız tesadüfi değişkenleri olduğu varsayı!-.
mıştır. Tablo 5'deki TL ve
xi.
sırasıyla her ·i satırındaki tüm gözlemle-·rin toplam ve ortalamasıdır. T.; ve
x.i
de j sütunu!'ldaki tüm gözlem-lerin toplam ve ortalamasıdır.T..
ve X.. ise tüm re gözlemlerinintop-lam ve orta·ıamasıdır.
·i inci satırdaki tüm nüfus ortalamalarının ortalaması,
µi
.
şu şe kilde tanımlanır :c
Benzer olarak, j inci sütundaki nüfus ortalamalarının ortalaması,
µ.j şu şekilde tanımlanır :
µ , j =
-r
ve re nüfus ortalamalarının ortalaması µ, şu şekilde tanımlanır: r c·
L; L; µjj
i=l j=l µ =
-re
Gözlemlerimizdeki değişimin bir kısmının, satırlar arasındaki de-ğişim nedeniyle olup olmadığını belirliyebilmek için yapacağımız teste pişkin hipotezleri aşağıdaki ·gibi tertip ediyoruz.
H0' : µı.
=
µ2.=
~13=
·
·
·
=
µ,.=
µ •· H1 ' : Tüm µL ler birbirlerine eşit değildir .
. Benzer olarak, gözlemlerimizdeki değişimin bir kısmının, sütun-lar orasındaki değişim nedeniyle olup olmadığını b~lirliyebilmek için yapacağımız teste ilişkin hipotezleri aşağıdaki gibi tertip ederiz.
Ho"
:
µ,ı=
ı-t.2=
.
. . =
µ.c=
µ ,Hı" : Tüm µ.j ler birbirlerine eşit değildir. Her bir gözlem şu formda yazılabilir :
Buradaki eij; gözlenmiş xij değerinin, nüfus ortalaması ıtij den
olan sapmasını ölçmektedir. Bu denklemin tercih edilen hali ise µİj yerine,
µij eşitliğindeki; cx.i, i inci satırın etkisi ve (3j ise j inci sütunun etkisidir. Satır ve sütun etkileri toplamsal olarak kabul edilmiştir. Eğer yukarıda elde ettiğimiz x.ij eşitliğinin üstüne
r c . 2:cx.i=0, '2,f3j=O i=l j=l şartlarını getirirsek; c
z;
(µ+cx.i+f3j) j=l µi.=
=
µ+cx.i,c
rz;
(p.+cx.i+f3j) i=l µ,j=
= µ+(3j. rr satırı ortalamaları
P·i
.
!erin birbirine eşit olduğu ve bu nedenleµ ya eşit olduklarını .öne süren sıfır hipotezine eşdeğer olan hipotez
aşağıdaki şekilde tertiplenebilir :
·Hı' : En az bir cx. i sıfıra eşit değildir.
Benzer olarak, c sütunu ortalamaları ı-t.j !erin birbirlerine eşit
ol-duğunu öne süren sıfır hipotezine eşdeğer o~an hipotez aşağıdaki şekilde tertiplenebilir :
Ho" : f3ı
=
f32 == .. ·. == /3_c == O ,Hı" : En az bir (3j sıfıra eşit değildir.
Bu testlerin her biri, ortak varyans cr2
için yapılan bağımsız .. i:ah-minlerin karşılaştırılması üzerine kurulmuştur. Bu .tahminler, tüm
göz-lem sonuçlarına ait toplam kareler toplamının aşağıdaki özdeşlik
TEôREi'1 3 .ı
(
KARELER TOPLAIH ÖZDEŞLİOİ ) ':r c r c r t '
L
L(x .. -x )
2=
c=(~.
_:;:
)~
+ rL.CX
.-
x
)
2~
L
L.Jx . .
-i=l j=l lJ •• i=l ı. •• j:l •J •• i=l j:l ıJ
x.
-
x
.+x )
2 ı. • J •• İSF.A':i:' r c r -c -2L
L)x .. -
~
)
2=
C
L[(;z. -
x )+(x
.-i )+(x .. -x. - x .+
x )]
i=l j=l lJ -·· i=l j=l ı. ·: ·. •J •• l J ı. •J •• :r ~c
:rc
rL
·
- - 2 \ ' - ..;._ 2 - - - 2;:: L
L_,(x. - x .--} +L
~(x
.- x ) +L
(x .. - :x:. -:ıc
.+ x ) -i .. 1 j=l ı._ ,,t.~ i .. l J:;-:l •J H i:=l j;_l l J l • •J •• r c r c / +2L
L_.c;. -
x:
)(~
.... ;:
)+2C L(x;
-
x
)(x .. -x. - x
.+x: ),
,
- 1 . • . ı • • • • J ·-· . ı . -'l ı. • • ı J ı. -· J • • . 1;:;: J=..L, ı::: . J.= r c+2L L(x .- x
)(x .. - ~. - ;; .Tx
·
)
i=l j=l •J •• 1J le oJ ••Kros-çarpım terimlerinin hepsi sıfırdır. Bundan dolayı,
r c
~~( - - - 2
~ t__. x .. - x. - x .+ x )
i=-:l j=l ıJ ı. ' •J ••
Kareler toplamı özdeşliği semboller kullanarak aşağıdaki gibi
ya-zılabilir:
SST
=
SSR+
·
SSC+
SSE Buradar c
SST = L L (xi.i-x..)2 =Toplam kareler toplamı i=l j=l
r
SSR = c L (Xı. -X..)2 = Satır ortalamaları için kareler toplamı
c
SSC = r.~ (X.j-x..)2 =Sütün ortalamaları
için kareler toplamı
J=l
r c
SSE
=
ı; ı; (.xdj-xi.-X.j+x..)2
=
Sapmalar için kareler toplamıi=l j=l . . .
(cr2
) nin, (r-1) serbestlik derecesine göre bir tahmini aşağıdaki
gibidir: ·
SSR
S12
=
-r-1
Eğer satır etkileri a 1
=
a
2= ... =
ar=
O ise S/, cr2 nin tarafsız bir tahminidir. Bunun yanında eğer satır etkilerinin hepsi sıfıra eşit değilse, SSR şişirilmiş bir nümerik değere sahip olmakta ve S/, cr2yi fazla olarak tahmin etmektedir. 02 nin c;_ 1 serbestlik derecesine
gö-re ikinci tahmini şu şekildedir : .
ssc
S22=
---c-1
S
2
2 tahmini, sütun etkileri13
1 =/32
= ...
=
f3c=
O olduğu zaman,02 nin tarafsız bir tahmini olmaktadır. Eğer tüm sütun etkileri sıfıra ·eşit değilse, SSC şişirilmiş bir değere sahip olur ve S22
, · 02yi fazla
olarak tahmin etmektedir. 02 nin; (r-1) (c-1) serbestlik. dereceli, 812 ve
82
2 den bağımsızüçüncü tahmini ise şöyledir : SSE
832
=
-(r-1) (c-1) .Sıfır hipotezinin doğru veya yanlış olmasına bağlı olmaksızın, S32 tarafsız bir tahmindir.
,Tüm satır etkilerinin sıfır olduğunu öne süren sıfır hipotezini test etmek için şu oranı (test kriterini) hesaplarız :
S
2:ı
fı=-
s2
3dereceli F dqğılımının tesadüfi değişkeni F1 in değeridir (sıfır hipotezi,
f1 ~ f°' olduğunda kabul edilir). Sıfır hipotezi f1 >fa [r-1, (r-1) (c-1 )]
olduğunda cx. hata payına göre reddedilir.
Benzer olarak tüm sütun etkilerinin sıfıra eşit olduğunu öne süren
sıfır hipotezini test etmek için şu oranı hesaplarız :
S22
f2 ;:=::
-S32
Sıfır hipotezi doğru olduğunda, f2 , (c--1) ve (r-1) (c-1)
serbest-lik dereceli
F
dağılımının tesadüfi değişkeniFz
nin değeridir. (Sıfırhipotezi, f2 ~fa olduğunda kabul edilir). Sıfır hipotezi f2 >fa [c-1,
(r-1) (c-1)] olduğunda cx. hata payına göre reddedilir.
Pratikte, ilk önce SST, SSR ve SSC yi hesaplarız. Sonra SST
öz-deşliğini kullanarak SSE yi aşağıdaki gibi buluruz:
-SSE
==
SST L SSR - SSCSSE ye ilişkin serbestlik derecesi çoğu kez yine çıkarma işlemi
ile elde edilir. Serbestlik derecesine ilişkin özdeşliği gerçeklemek hiç
de güç değildir. Şöyle ki :
(r-1) (c-1)
==
(rc-1} - (r-1}- (c-1}.Kareler toplamı için tercih edilen hesaplama formülleri aşağıda
verildiği gibidir: r c
T2
SST=
~ ~ X2ıi - _ _ .. , ı=ı j=l reT2
.
.
S S R =-e
c ~ T2.j j=l rer2
S S E = -r reİki kritere göre yapılan tasniflerde, -varyans analizi problemi için·
yapılan hesaplamalar, aşağıda Tablo. 6'da görüldüğü gibi
özetlene-bilir.
Tablo.o
:De,3J ;;im J!a»mı,ı.eı. l~.c:.i·eler 'I'cpl amı Serbestlik Derecesi Y.areler :
ltesapla.-Orta~aınası nan f Sahr crtalam a-S2= ,Şg ln .!. SSR r - 1 s2 1 r-1 f = - 1
or
hla
rna
-ı
l 2 Sı:it1m ; - 1 s 2 = .§2.Ç_ s3 ssc l:;ır·:. 2 c-1 s2 2~
S::ıt-r.rt"ılar SSE (r - 1)( c - 1) s 2=
SSE } (r-1) ( Toplam SST re - 13.1 İKİLİ TASNİF İÇİN VARYANS ANALİZİ
UVGULAMASI
Bu bölümdeki uygulamamız yine üretim yönetimine ilişkin
bir
problemdir. Bir tarım işletmesinde üç cins buğday, dört ayrı çeşit
kim-yasal gübre kullanılarak ekilmiştir. Mevsim sonunda
. eşit
büyüklük-teki her bir ekim alanında, üretilen buğday miktarları tablo 7'de
gö-rüldüğü gibi tesbit edilmiştir.
Tablo.7
-'BuğdayCinsleri
Gübre
Toplam
vl
.
v2
v
3 ..
.
: __
tl
64
72
74
210
-t2
55
57
47
159
t3
59
• 66
58
183
t
•
58
57
53
168
·
4
-Toplam
236
252
232720
Yukarıdaki
gözlemsonuçlarını
inceliyerek;kullanıl~n değişik
ya-pı~aki
kimyevi gübrelerin, ortalamabuğday
üretimini etkileyip·etkile~
madiğini
ve ·ortalamabuğday
üretiminde,değişik
cinsbuğdayların
bir etkisi olup olmadığını araştırınız. Çözüm:
1. (a) Ho' : o~ 1 ::::: ~~
=
~ 3=
~4=
O (Satır etkileri sıfırdır.)Yani
kullanılan çeşitli yapıdaki
gübrelerin, bir .etkisi yoktur. (b) Ho" :/31
=
/3z
=
/33
=
O (Sütun etkileri' sıfırdır.)Yani. ortalama üretimde, buğday cinslerinin bir etkisi yok -tur.
2. (b) H1' :
En
az bir ~i sıfıra eşit değildir.Ycini kullanıla~ çeşitli yapıdaki gübrelerin, ortalama üre-.
tim üstünde etkisi vardır.
r c 2 ~ ~· 2 T.. 2 2 2 2 2 2 . 2 2 2
2
SST =~
Lx .. - - =64 +55 +59 +58 +72 +57 +66 +57 +74;.47
. 1 . 1 ıJ l-= J= re 2 .+58
2+532-c~:~) =43862~3200;;662
SS'I=
662 r~=iT~.
SSR=
c131094
=
3 .ssn :;: 498 c 2LT
.
2 T ••---=
re518400
. 12 2 T 2102+1592+1832+1682 3 ::: 43698-43200=498· j::l • J ••ssc
= - - - - -
= (720) 2 - - - ;: 43256-43200 r ressc
=
56
SSE = SST - SSR - SSG - 662 - 498 - 56=
108 SSE=
108~u
sonuçlar vediğer h~saplamalar, tablo.8'de
.
verilmiştir.
Hı" : En az bir
f3j
sıfıra eşit değildir.Yani ortalama üretimde, değişik buğday cinslerinin etkisi
vardır. 3. Hata payı :
=
0,054. Kritik bölge: (a) Fı
>
4,76, (b)F2
>
5,145. Hesaplamalar :
Tablo.8
l).:;ğişim Kareler serbestlik Kareler
Hesaplanan '
Kayna,€ı Toplamı Dereoeıeri Orta.laması f
Satı:r 498 Orta.lamaları
.
3
lôô
-
· -Sütull·'
f ı--9,22 Ortalamaları, · 5~ 22S
·
-
... .. .. f 211111,56 sapniala.r ıoe 5 ış; ,. -·- -··· -'I'o p0lt;Un. 6'62 .11 -·-ô.-SOll\19 : (a.)_
:t
01)~ {9
1
2~
4
916}.
H0 red edilir. Kimyevi gübrelerin
ortalama. üretim üstünde etkisivardır. (b) t
02
(~ [ı,56
'
5,14}
-
~~
'
kabul
edilir. Yani ortalama.ü-retimae·r· ~ oinslerinin bir etkisi yoktur. 4. SONUC
Varyans analizi tekniği, istatistiğin çok önemli bir alanı olarak
bilinen deney (gözlem sonuçları) planı ve deneyin (gözlem
sonuçla-rının) analizinde kullanılır.
Deney planı; istatistik yöntemleri kullanan bir araştırıcı önce ba
-ğımsız ve bağımlı olmak. üzere değişkenleri iki guruba ayırır. Değiş
kenlere bazen faktör adı da verilir. Bu faktörler, bir deney_
çerçeve-sine sokulabiliyorsa, «kontrol edilen faktörler» adını alırlar.
Değişkenleri seçip, açık~seçik . tanımlıyan araştırıcı bunları
ölç-meğe ya da başka bir yolla gözlem içine sokmağa çalışacaktır. Bu
Değişkenlerdeki bütün hareketler deney planı konusu olmaz. Şan sa bağlı, ihtimal kanunlarına uygun değişiklikler deney planı dışında kalır.
Örneğin belli bir buğday türünün üretimi üstünde çeşitli gübre-lerin ne gibi bir etkisi olduğunu öğrenmeye yönelmiş bir araştırmaya girişirsek; gübre çeşidi, miktarı, toprak çeşidi~ iklim, haşarat, parazit bitkiler gözönüne alınması gereken değişkenlerdir.
Bunları şöyle iki guruba ayırabiliriz :
- Kontrol edilen. değişk.enler: Gübre· çeşidi ve miktarı,
- Kontrol edilemeyen değişkenler : Toprak çeşidi, iklim, haşa-rat, parazit bitkiler.
Deney planımız sadece birinci tip değişkenleri içine alacaktır. Kontrol dışı değişkenlerin e.tkisini 0,01 - 0,05 arasında tutabilecek bir plan hazırlamağa, başka bir deyişle deneyimizi, ikinci tip değişken lerin etkili olabileceği ortamdan uzak bulundurmağa çalışırız.
Çalışmamızda, varyans analizi kavram ve tekniğini basit olarak açıklamak temel gayeı:niz oldu.
Varyans analizi tekniği; bir gözlemler kümesine ilişkin kareler
toplamını bir takım anlamlı kısımlara ayırmaktadır. Bu kareler toplamı da bazı tahm,inler elde etmek veya bazı testlerin yapılabilmesi için uygun değerlerin hesaplanması ola.nağını verir.
KAYNAKLAR
Bağırkan ŞEMSETTİN, «Varyans Analizinin Bazı Uygulama Alanları», İktisadi ve . Ticari İlimler Dergisi, İ.İ.T.İ.A. Yayını, Sayı 2, İstanbul, 1975.
Lee H. SMITH, Donald R. WILLIAMS, «Statistical Analysis for Business»,
Wad-·
sworth Publishing Company, ine. Belmont. California, 1971.
Ronal'd E. WALPOLE. «lntroduction To Statistics», The Macmillan Company, New York, 1968.