• Sonuç bulunamadı

Varyans Analizine Giriş

N/A
N/A
Protected

Academic year: 2021

Share "Varyans Analizine Giriş"

Copied!
20
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

Marmara Üniversitesi İ.İ.B.F. Dergisi, Yıl 19'87, Cilt iV, Sayı 1 -2

Varyans Analizine

Giriş

Bülent AYYILDIZ (*)

1. GİRİŞ

İstatistiksel analizler bir tek istatistik serisine ait değerler üze-rinde yapılabildiği gibi bazı durumlarda, birden· fazla istatistik serisi-nin değerleri üzerinde de yapılabilmektedir. istatistiksel analizlerin bir veya birden fazla istatistik serisi üzerinde yapılması halinde çözül-mesi istenUen veya araştırılan konunun durumuna göre farklı analiz işlemleri uygulanmaktadır.

İki veya daha fazla istatistik serilerinin ortalamalarının arasında bulunan farkların bir anlamı olup olmadığı diğer bir deyişle iki veya daha fazla istatistik serilerinin ortalamalarının homojen olup

olma-dıklarının secilen belli bir hata payına göre incelenmesi «Varyans Ana-lizisi» yöntemi ile yapılmaktadır . .

Varyans analizi yöntemi; iki veya daha fazla istatistik serisine ait gözlem· sonuçlarındaki, toplam ,değişimin anlamlı kısımlara ayrıl­ ması ve. bu kısımlardaki değişim kaynağının ölçülmesi ile başlar. İlk ölçüm gözlem sapmalarındaki değişim üstünde yapılır. İkinci ölçüm ise gözlem sapmalarındaki değişim artı farklı guruplara bağlı olan de-ğişim {guruplar arası değişim) üstünde yapılır. Daha sonra ölçülen bu değişimlerin karşılaştırılması hipotez testleri kullanılarak yapılır. Burada bu iki değişimin karşılaştırılması .F dağılımı yoluyla _test edilir. Gözlem sonuçlarının tasnifi, bir tek kritere (özeiliğe) g0re yapı-

-lıyorsa buna tek kritere bağlı tasnif (tekH tasnif) denir'. Eğer gözlem

sonuçları iki ayn kritere göre tasnif ediliyorsa buna da iki kr.itere bağlı tasnif (ikili tasnif) adı verilir. Varyans analizi yöntemi bu iki ayrı tas-nife göre incelenecektir.

2. TEKLİ TASNİF

Her bir k nüfusundan,,.. n terimli örnekler çekilmiştir. Buradaki k

(2)

nüfuslarının ortalamaları µ1, µ2, ... , µk ve varyansları cr? ortak olup, bu

nüfusların bağımsız ve normal· olarak dağıldıkları varsayılmaktadır. Simdi hipotezlerin testi için uygun Xöntemleri oluşturalım. Ho : µı -:- µ2

= ..

..

::::::::

µk

H1 ·: Ortalamalardan en az iki ·tanesi birbirine eşit değildir . .xij, i nüfusundan tell)in edilen j inci gözlem olsun ve tüm

göz-lem sonuçları aşağıdaki tablo 1 'de düzenlenmiştir. Burada Ti, i nü~ fusundan çekilen örnekteki gözlemler toplamı,

xj,

i nüfusundan çe-kilen örnekteki gözlemlerin ortalaması; T, tüm gözlemlerin (gözlem sayısı

=

nk) toplamı; X ise tüm gözlemlerin ortalamasıdır.

·Tablo c. 1 k c..clet tesadüfi örnek

nüfus. j_ 2 i k ·y x o xil .ı xkl· -·ıı 21 xl2 ·"22 (J r, xi2. o o

~

!"i C"<' o "" ~ 1) o o ti'

:<:J,n x2ı1 :ı I>

x.

xkn ın Toplam Tl T2 o ~ ·Ti Tk T

_

_..._._..

_______

....,.._....

___________ _

Ortal~a o G X. ı o

Her' bir gözlem sonucu aşağıdaki şekilde de yazılabilir. x .

Burada E'.ij; i inci örneğin j inci gözleminin karşıt nüfusun orta-lamasından olan sapmasıdır. Tercih edilen ve yukarıdaki denkleme

(3)

alternatif olan yeni· denklem,

µi

yerine µi==ıJ.+cxi eşitliğinin yazılma­

sıyla aşağıdaki şekilde elde edilir (Burada µ, µ/lerln ortalaması ola-rak tanımlanmıştır k ~

µ

1

i=l µ

==

)

.

k k , '

Tabii bu ifade de ~ cxi =0 olma koşuluna bağlıdır. IXj genel olarak

i=l

inci nüfusun etkisi olarak bilinmektedir.

Bu açıklamalardan sonra; k nüfusları ortalamalarının eşit

oldu-ğunu öne ~üren sıfır hipotezi ve buna karşı en az iki ortalamanın eşit . olmadığını öne süren bir hipotezlerine eş değer olan hipotezleri şöyle

yazabiliriz : ·

Hı IXi lerden en az bir tanesi sıfıra eşit değildir.

Bizim testimiz, ortak nüfus varyansı cr2 nin bağımsız iki tahmi-ninin (SSE ve SSG) karşılastırılması üzerine kurulmustur. Test ko-nusu olan bu

değerler;

tüm' gözlem

sonuçlarındaki d~ğişmeler

top-lamının iki kısma ayrılmasıyla elde edilir.

·Tüm gözlem sonuçlarının nk terimli tek bir örnek olarak düzen-lenmesi halinde varyans f<?rmülü şu şekilde elde edilir :

k n

~ ~ (.x1j-x)2

i=l j=l .

52=---nk-1

Çift toplam; j nin 1 den

n

ye kadar her bir değeri için, i nin 1 den k ya kadar değerler almasıyla elde edilen olası tüm terimlerin

top-lamı antop-lamına gelmektedir. Yukarıdaki varyansı_n (s2) payına toplam

kareler toplamı (total sum of squares) adı verilir ve bu tüm gözlem sonuçlarındaki toplam değişimi ölç~r.

(4)

TEOREM 2.1 ( KARE"'ı.ER TOPLAY:I ÖZDBŞLİGİ)

~(-

..- 2

~.k ~n

...:.. 2 n '---i~l ı x.-x) + ~ (x .. - x.) ~~l J 1J ı 1 İSPAT k n k r-ı~. 2 ~~·· - - - 2

L

i:=l L .... j=l

h=·

ıJ

.-

i)

=

L_ı L....,((:ı:.-x)+(x .. - :x. )] i:,,l j-1 . ı ıJ ı . =

L

k . L~:ıc.-l1. fi- :x) - 2 + 2(x. -,_ -:ıc)(x ... - x. - .... 2

J

)+(x .. - x.) i=::l j;l ı ı ıJ ı 1J . ı

Orta. terimin to:plaıııı sıfırdır. Çünkü n

.

L::ıc

..

n .... n . ·- n j=l ıJ n n

L(x .. . l 1J

-x.

ı

)=I_} . .

. l -nx.

=LX·

.-"1---='L.,x .. - L'x ..

:O

1J ı . ı J:J J . l ı;ı . ı 1J

J; J= J= j'- J= J=

İlk toplam indis olarak j ye sahip deeildi1' ve bu

nedenle şu şekilde yazı-la.bilir.

:Bu sebebten

k , A -2 _k,_ 2~~ - 2

L

i-1

L,:cx

j::;l ıJ

..

-

x) .

=

n L(x.- x) + Lı l__Jx .. - x.)

i;:::l ,ı i:ıl j .. l ıJ ı

Kareler toplamı özdeşliğinin· terimlerini

aşağıdaki notasyonlarla ifade etmek daha uygun olacaktır.

k n

SST

=

2:: 2:: (xij-x)2 =Toplam kareler

toplamı

i=l j=l

-k

SSC = n 2:: (xi-x)2 =Sütun ortalamaları

için kareler toplamı

i=l

k n

SSE

=

~ ~ (xij-5<)2 =Sapmalar için kareler

toplamı

(5)

Kareler toplamı özdeşliği, aşağıdaki denklem tarafından sembol-lerle şu şekilde ifade edilir:

SST

=

SSC + SSE

Nüfus varyansının ( 02), (k-1) serbestlik derecesine göre bir tah-mini aşağıdaki şekildedir ..

s 2

1

=

ssc

(k-1)

. Eğer H0 doğru ise, s1

2

, (02) nin tarafsız bir tahminidir. Buna

kar-şılık, eğer H.1 doğru ise, SSC daha büyük nümerik bir

değere sahip

olmakta ve s1 2

, (02) yi fazla olarak tahmin etmektedir. Nüfus varyansı

( d

2

) · nin k (n-1) serbestlik derecesine göre ikinci bagimsız

tahmini şu şekildedir :

s

2

=

2

SSE

k (n-1)

Sıfır hipotezinin doğru veya yanlış olmasına bağlı olmaksızın, s2

2

tarafsız bir tahmindir. Halihazırda tüm terimlerin bir tek seri olarak düzenlenmesi halinde bu_ serinin nk-1 serbestlik derecesine göre varyansının,

52

=

SST

nk-1

olduğunu biliyoruz. Bu da H0 .. doğru olduğunda

a2

nin tarafsız bir

tah-minidir. Görüldüğü gibi kareler toplamı, tüm gözlem sonuçlarındaki toplam değişimi kısımlara ayırmaktadır. Önemli olan bir nokta da, kareler toplamı aynı zamanda serbestlik derecesini de kısımlara eyır­ maktadır. Şöyle ki,

nk-1

=

k-1 +k (n-1)

Hipotezler belli bir a. hata payına göre tertip edilmekte ve her-hangi bir hipotezin kabul veya red edilmesi a. hata payına gö"re ol-maktadır.

Hipotezlerin tesbit· edilmesinden sonra ·test kriteri (hesap·

(6)

k-1 ve k (n-1) serbestlik dereceli F dağılımına ait tesadüfi de-ğişken F · nin değeridir. f c değerinin, F dağılımı tablosundan temin

edilen fa: değeri ile karşılaştırılması ile

H

0 veya Hı hipotezlerinden

bir tanesi kabul edilece~tir. Yani, f o: ~ f c olması halinde Ho hipotezi

f o:

<

f c olması halinde H1 hipotezi kabul edilecektir.

Uygulamada, ilk önce SST ve SSC hesaplanır. Sonra kareler

top-lamı· özdeşliği kullanılarak SSE elde edilir.

SSE

=

SST - SSC

SST ve SSC için daha önce verilen formüller hesaplamalar iç;n en uygun formlar olarak kabul edilemez. Bu nedenle SST ve SSC için daha uygun ve eş değerde formül.ler aşağıdaki gibidir.

k n

r2

SST

=

~ 2:

x

2 ij - - -· i=ı j=ı nk SSÇ= -n nk

Varyans :analizi problemlerinde genellikle yapılan hesaplamalar

aşağıda tablo· 2'de görüldüğü şekilde özetlenebilir.

Tablo.2 Tekli Tisnif İçin Vary~ns Analizi

De,~işiır: Kareler Serbestlik Krırc~cr Hesaplanan Zaynağ,ı Toplarr.ı Derecesi Ort.o-.lLıJ:ıas ı f

'Sütun

k-1 2 ssc 2

o~talar.ıalc..rı ssc 8

1= k-1 sl

-

-2-Sapır.alar SSE k(n-1) s.2 ·-'- SSE s2

:ktn-1)

(7)

2.1 TEKLİ TASNİF İCİN VARYANS ANALİZİ UVGULAMASI

İstatistiksel analiz yöntemlerinden bir tanesi olan varyans ana-lizi çeşitli alanlardaki problemlerin çözümlerinde kullanılabilmektedir.

Örneğimizde varyans analizinin, üretim yönetimi aı'anındaki bir

uygu-lamasını göreceğiz.

Dayanıklı tüketim mamulleri üretimi yapan bir fabrikanın yöne-ticileri mevcut mamullere ilave olarak yeni bir mamulü piyasaya ç:ı­

karmayı planlamaktadırlar. Piyasaya çıkarılması planlanan bu yeni

mamul altı değiş,ik sistemde imal edilebilmektedir. Yeni mamulün üre-tilebileceği sistemlerin maliyetleri birbirlerinden farklıdır. Piyasaya çı­

karılması planlanan mamul bir defada on adet olmak üzere beş ayrı

dönemde ve değişik şartlarda bütün sistemlerde imal edilmiştir. İmal edilen mamuller üzerinde yapılan kalite kontrolünde aşağıda tablo 3'de verilen değerde kusurlu mal saptanmıştır. Sistemlerin kusurlu mamul üretme oranları yönünden birbirlerinden farklı olup olmadık-. larını tesbit ediniz. Diğer bir deyişle, bu mamulün üretimi için

mev-cut üretim ·sistemlerinden herhangi bir tanesi seçilebilir mi?

TÇ:ı.blo ~3

sis.temler

:Dönemler '---,...~--+

A

:a

c

.

D ·E F

1

l3ol

121)8

l2o7 1306 13.5 ıo.,('.o 2 ıı.o 12~9

13o7

14o7·

14o5

13 ..

7

.

3 ı2~a ıı.5

,

14·1

·

13o5

14.2

14a0

4 12o3

l2o3

14.5

14c0 15.0

14.1

5

14.0

l4o0

14,0 14c0

14.7

14o7

Toplam 403.9 Cözüm: 525 t ..

(8)

Yani sistemler arasında kusurlu üretim oranı yönünden fark yoktur.

2.

H.ı

: Ortalamalarda en az iki tanesi birbirlerine

eşit değildir.

Yani sistemler arasında kusurlu üretim oranı yönünden fark

vardır. 3. Hata payı : d = 0.05 4. Kritik Bölge: F

>

2.62 [k-1 =6-1 =5, k(n-1)=6(5-1)=24] 5. Hesaplamalar : k. n

T

2 SST

=

L

L

x~\j -i=ı j=ı nk = 13.12 + 112

+

12.82

+

12.32

+

142

+

12.82

+

12.92 +11.52 +12.32

+

14~ + 12.72

+

13.72

+

14.12

+

14.52

+

142

+

13.62 + 14.72 +2 13.52 +142+142 + 13.52

+

14.52

+

14.22

+

152

+

14.72

+

102 +13.72 +142 + 14.12 + 14.7-(403'.9).2/'30=5476.69 - 163135.21 /30 = 5476.69-5437,84 = 38.85 ~ SST = 38.85 k i=l

LTi

2 T2

ssc

=

-n nk 63.22 + 63.52

+

692

+

69.8:>.

+

71.92

+

66.52

=

5 27251.39 163135.21

-

- · ·----· - ·----·-- -- - ·-- -5 30 _(1_Q_Ş_'.~ 30 = 5450.278 .- 5437.84 = 12.438 ~

ssc

= 12.438 SSE = SST - SSC = 38.85 - 12.438 = 26.412 ~ SEE = 26.412

Bulduğumuz sonuçları tablo 4'de yerine koyup diğer

(9)

:Ka:r:eleı~ ' .Kareler · \

Deği~iın 5.eı-be~Uil:

l

Hesaplanan

K?.yn~ı Topla!llı Dcr~celer! Ortalaması

"

r

.

Tablo.4 Sü.tım 12r:438 5

1si=2.~876

:f _2.4876 Ortalamaları c 101005 ot"\ Sapmalar 26,412 24

s;==

101005 f =2.26 c Toplam 38 .. 85

29

, 6. Sonuç:

fc

<

fa {2.26

<

2.62} H0 kabul edilir. Sistemlerin kusurlu mamul

üretme oranları yönünden farklı olmadıkları

anlaşılır.

2.2 FARKLI SAYIDA TERİMDEN OLUŞAN ÖRNEKLER

Uygulamada çoğu kez arzu edilen gözlemler temin

edilememek-tedir. Bazı nedenlerle, gözlemler çeşitli alanlarda eşit olmayan· sayı­

da gerçekleşmektedir. Eşit sayıda terimden oluşan örn,ekler için

yap-mış olduğumuz analizde kullanılan kareler toplamı formülleri küçük

· bir değişiklikle, farklı sayıda terimden oluşan örneklerin analizinde

de geçerlidir. k adet tesadüfi örneklerin terim sayısı sırasıyla; n1 , n2 ,

' k

... , nk olsun. Bu örneklerdeki terim sayıları toplamı da N

=

i==~ l

ni

dir.

. SST ve SSC nin hesaplanması için gerekli formüller şu şekildedir :

k n

T2

SST

=

~ ~x2 ij-- ij--. i==ı j==.ı N k T2 T2

SSG==~-

1 -i==ı

ni

N

Daha önce olduğu gibi S$E değerini yine SST'den SSC'yi çıka­

rarak buluruz. Serbestlik dereceleri ise SST için N-1, SSC için k-1

ve SSE için N-1-(k-1)

=

N-k dır.

3. İKİLİ TASNİF

Bir gözlemler kümesi iki kritere göre bir defada tasnif edilebilir. 527

(10)

Bu da, sütunların birinci kritere göre tasnifi, satırların ise- ikinci kri·

tere göre tasnifi belirlediği bir dikdörtgen tablo vasıtasıyla gerçekleş­

tirilir. Elde etmiş olduğumuz herhangi bir gözlem için, her bir ele alış tarzının birleştirilmesi bizim tertip düzenimiz içinde bir ünitey belir-ler. Bu bölümde gözlem değerlerirıdeki değişimin; birinci kriter nede·

.niyle mi, ikinci kriter nedeniyle mi, yoksa her ikisi nedeniyle mi

oldu-ğunu test edebilmek için formüller çıkaracağız.

Şimdi bir genelleştirme yapalım. Aşağıda r adet satır ve c adet sütundan oluşan Tablo 5'de her bir .xii değerinin i inci sıra ve j inci sütundaki gözlemi temsil ettiğini göz önüne alalım.

Tablo.5 Jkili Tasnif

Satırlar Sütunlar Toplam ört alama

1 ? 3

.

.

j

.

.

o

-1 xll xl2 xl3

.

.

xij

.

.

.

xlc Tl. xı. ·· ·2 x21 x22 x23

. .

:x:2j

.

.

x 2c ır2. x 2. 1 •

.

.

.

. . .

.

i T.

-xil xi2

''ü

.

.

x ..

.

.

::ı.: x . ıJ ıc ı • ·ı .

.

~

.

-xr2 x T r

xrl

:ıc:r3

.

xrj

re :t: r. r. Tep lanı ır.ı ır.2 T.~

.

T ej

..

.

'l' .c T

..

-Ortalama. x.ı

-

-

-

-x.2 x.3

. .

:x: .j

. .

;ıc

-

x .c

..

Buradaki .xjj değerleri, ortalamaları µİj ve ortak varyansları 02

olan noı:mal dağılımların bağı.msız tesadüfi değişkenleri olduğu varsayı!-.

mıştır. Tablo 5'deki TL ve

xi.

sırasıyla her ·i satırındaki tüm gözlemle-·

rin toplam ve ortalamasıdır. T.; ve

x.i

de j sütunu!'ldaki tüm gözlem-lerin toplam ve ortalamasıdır.

T..

ve X.. ise tüm re gözlemlerinin

top-lam ve orta·ıamasıdır.

·i inci satırdaki tüm nüfus ortalamalarının ortalaması,

µi

.

şu şe­ kilde tanımlanır :

(11)

c

Benzer olarak, j inci sütundaki nüfus ortalamalarının ortalaması,

µ.j şu şekilde tanımlanır :

µ , j =

-r

ve re nüfus ortalamalarının ortalaması µ, şu şekilde tanımlanır: r c·

L; L; µjj

i=l j=l µ =

-re

Gözlemlerimizdeki değişimin bir kısmının, satırlar arasındaki de-ğişim nedeniyle olup olmadığını belirliyebilmek için yapacağımız teste pişkin hipotezleri aşağıdaki ·gibi tertip ediyoruz.

H0' : µı.

=

µ2.

=

~13

=

·

·

·

=

µ,.

=

µ •

· H1 ' : Tüm µL ler birbirlerine eşit değildir .

. Benzer olarak, gözlemlerimizdeki değişimin bir kısmının, sütun-lar orasındaki değişim nedeniyle olup olmadığını b~lirliyebilmek için yapacağımız teste ilişkin hipotezleri aşağıdaki gibi tertip ederiz.

Ho"

:

µ,ı

=

ı-t.2

=

.

. . =

µ.c

=

µ ,

Hı" : Tüm µ.j ler birbirlerine eşit değildir. Her bir gözlem şu formda yazılabilir :

Buradaki eij; gözlenmiş xij değerinin, nüfus ortalaması ıtij den

olan sapmasını ölçmektedir. Bu denklemin tercih edilen hali ise µİj yerine,

(12)

µij eşitliğindeki; cx.i, i inci satırın etkisi ve (3j ise j inci sütunun etkisidir. Satır ve sütun etkileri toplamsal olarak kabul edilmiştir. Eğer yukarıda elde ettiğimiz x.ij eşitliğinin üstüne

r c . 2:cx.i=0, '2,f3j=O i=l j=l şartlarını getirirsek; c

z;

(µ+cx.i+f3j) j=l µi.

=

=

µ+cx.i,

c

r

z;

(p.+cx.i+f3j) i=l µ,j

=

= µ+(3j. r

r satırı ortalamaları

P·i

.

!erin birbirine eşit olduğu ve bu nedenle

µ ya eşit olduklarını .öne süren sıfır hipotezine eşdeğer olan hipotez

aşağıdaki şekilde tertiplenebilir :

·Hı' : En az bir cx. i sıfıra eşit değildir.

Benzer olarak, c sütunu ortalamaları ı-t.j !erin birbirlerine eşit

ol-duğunu öne süren sıfır hipotezine eşdeğer o~an hipotez aşağıdaki şekilde tertiplenebilir :

Ho" : f3ı

=

f32 == .. ·. == /3_c == O ,

Hı" : En az bir (3j sıfıra eşit değildir.

Bu testlerin her biri, ortak varyans cr2

için yapılan bağımsız .. i:ah-minlerin karşılaştırılması üzerine kurulmuştur. Bu .tahminler, tüm

göz-lem sonuçlarına ait toplam kareler toplamının aşağıdaki özdeşlik

(13)

TEôREi'1 3 .ı

(

KARELER TOPLAIH ÖZDEŞLİOİ ) '

:r c r c r t '

L

L(x .. -

x )

2

=

c

=(~.

_:;:

)~

+ r

L.CX

.-

x

)

2

~

L

L.Jx . .

-i=l j=l lJ •• i=l ı. •• j:l •J •• i=l j:l ıJ

x.

-

x

.+

x )

2 ı. • J •• İSF.A':i:' r c r -c -2

L

L)x .. -

~

)

2

=

C

L[(;z. -

x )+(x

.-i )+(x .. -

x. - x .+

x )]

i=l j=l lJ -·· i=l j=l ı. ·: ·. •J •• l J ı. •J •• :r ~

c

:r

c

rL

·

- - 2 \ ' - ..;._ 2 - - - 2

;:: L

L_,(x. - x .--} +

L

~(x

.- x ) +

L

(x .. - :x:. -

:ıc

.+ x ) -i .. 1 j=l ı._ ,,t.~ i .. l J:;-:l •J H i:=l j;_l l J l • •J •• r c r c / +2

L

L_.c;. -

x:

)(~

.... ;:

)+2

C L(x;

-

x

)(x .. -

x. - x

.+

x: ),

,

- 1 . • . ı • • • • J ·-· . ı . -'l ı. • • ı J ı. -· J • • . 1;:;: J=..L, ı::: . J.= r c

+2L L(x .- x

)(x .. - ~. - ;; .T

x

·

)

i=l j=l •J •• 1J le oJ ••

Kros-çarpım terimlerinin hepsi sıfırdır. Bundan dolayı,

r c

~~( - - - 2

~ t__. x .. - x. - x .+ x )

i=-:l j=l ıJ ı. ' •J ••

Kareler toplamı özdeşliği semboller kullanarak aşağıdaki gibi

ya-zılabilir:

SST

=

SSR

+

·

SSC

+

SSE Burada

r c

SST = L L (xi.i-x..)2 =Toplam kareler toplamı i=l j=l

r

SSR = c L (Xı. -X..)2 = Satır ortalamaları için kareler toplamı

(14)

c

SSC = r.~ (X.j-x..)2 =Sütün ortalamaları

için kareler toplamı

J=l

r c

SSE

=

ı; ı; (.xdj-xi.-X.j

+x..)2

=

Sapmalar için kareler toplamı

i=l j=l . . .

(cr2

) nin, (r-1) serbestlik derecesine göre bir tahmini aşağıdaki

gibidir: ·

SSR

S12

=

-r-1

Eğer satır etkileri a 1

=

a

2

= ... =

ar

=

O ise S/, cr2 nin tarafsız bir tahminidir. Bunun yanında eğer satır etkilerinin hepsi sıfıra eşit değilse, SSR şişirilmiş bir nümerik değere sahip olmakta ve S/, cr2

yi fazla olarak tahmin etmektedir. 02 nin c;_ 1 serbestlik derecesine

gö-re ikinci tahmini şu şekildedir : .

ssc

S22

=

---c-1

S

2

2 tahmini, sütun etkileri

13

1 =

/32

= ...

=

f3c

=

O olduğu zaman,

02 nin tarafsız bir tahmini olmaktadır. Eğer tüm sütun etkileri sıfıra ·eşit değilse, SSC şişirilmiş bir değere sahip olur ve S22

, · 02yi fazla

olarak tahmin etmektedir. 02 nin; (r-1) (c-1) serbestlik. dereceli, 812 ve

82

2 den bağımsız

üçüncü tahmini ise şöyledir : SSE

832

=

-(r-1) (c-1) .

Sıfır hipotezinin doğru veya yanlış olmasına bağlı olmaksızın, S32 tarafsız bir tahmindir.

,Tüm satır etkilerinin sıfır olduğunu öne süren sıfır hipotezini test etmek için şu oranı (test kriterini) hesaplarız :

S

2

fı=-­

s2

3

(15)

dereceli F dqğılımının tesadüfi değişkeni F1 in değeridir (sıfır hipotezi,

f1 ~ f°' olduğunda kabul edilir). Sıfır hipotezi f1 >fa [r-1, (r-1) (c-1 )]

olduğunda cx. hata payına göre reddedilir.

Benzer olarak tüm sütun etkilerinin sıfıra eşit olduğunu öne süren

sıfır hipotezini test etmek için şu oranı hesaplarız :

S22

f2 ;:=::

-S32

Sıfır hipotezi doğru olduğunda, f2 , (c--1) ve (r-1) (c-1)

serbest-lik dereceli

F

dağılımının tesadüfi değişkeni

Fz

nin değeridir. (Sıfır

hipotezi, f2 ~fa olduğunda kabul edilir). Sıfır hipotezi f2 >fa [c-1,

(r-1) (c-1)] olduğunda cx. hata payına göre reddedilir.

Pratikte, ilk önce SST, SSR ve SSC yi hesaplarız. Sonra SST

öz-deşliğini kullanarak SSE yi aşağıdaki gibi buluruz:

-SSE

==

SST L SSR - SSC

SSE ye ilişkin serbestlik derecesi çoğu kez yine çıkarma işlemi

ile elde edilir. Serbestlik derecesine ilişkin özdeşliği gerçeklemek hiç

de güç değildir. Şöyle ki :

(r-1) (c-1)

==

(rc-1} - (r-1}- (c-1}.

Kareler toplamı için tercih edilen hesaplama formülleri aşağıda

verildiği gibidir: r c

T2

SST

=

~ ~ X2ıi - _ _ .. , ı=ı j=l re

T2

.

.

S S R =

-e

c ~ T2.j j=l re

r2

S S E = -r re

İki kritere göre yapılan tasniflerde, -varyans analizi problemi için·

yapılan hesaplamalar, aşağıda Tablo. 6'da görüldüğü gibi

özetlene-bilir.

(16)

Tablo.o

:De,3J ;;im J!a»mı,ı.eı. l~.c:.i·eler 'I'cpl amı Serbestlik Derecesi Y.areler :

ltesapla.-Orta~aınası nan f Sahr crtalam a-S2= ,Şg ln .!. SSR r - 1 s2 1 r-1 f = - 1

or

hla

rna

l 2 Sı:it1m ; - 1 s 2 = .§2.Ç_ s3 ssc l:;ır·:. 2 c-1 s2 2

~

S::ıt-r.rt"ılar SSE (r - 1)( c - 1) s 2

=

SSE } (r-1) ( Toplam SST re - 1

3.1 İKİLİ TASNİF İÇİN VARYANS ANALİZİ

UVGULAMASI

Bu bölümdeki uygulamamız yine üretim yönetimine ilişkin

bir

problemdir. Bir tarım işletmesinde üç cins buğday, dört ayrı çeşit

kim-yasal gübre kullanılarak ekilmiştir. Mevsim sonunda

. eşit

büyüklük-teki her bir ekim alanında, üretilen buğday miktarları tablo 7'de

gö-rüldüğü gibi tesbit edilmiştir.

Tablo.7

-'Buğday

Cinsleri

Gübre

Toplam

vl

.

v2

v

3 ..

.

: __

tl

64

72

74

210

-t2

55

57

47

159

t3

59

• 66

58

183

t

58

57

53

168

·

4

-Toplam

236

252

232

720

(17)

Yukarıdaki

gözlem

sonuçlarını

inceliyerek;

kullanıl~n değişik

ya-pı~aki

kimyevi gübrelerin, ortalama

buğday

üretimini etkileyip·

etkile~

madiğini

ve ·ortalama

buğday

üretiminde,

değişik

cins

buğdayların

bir etkisi olup olmadığını araştırınız. Çözüm:

1. (a) Ho' : o~ 1 ::::: ~~

=

~ 3

=

~4

=

O (Satır etkileri sıfırdır.)

Yani

kullanılan çeşitli yapıdaki

gübrelerin, bir .etkisi yoktur. (b) Ho" :

/31

=

/3z

=

/33

=

O (Sütun etkileri' sıfırdır.)

Yani. ortalama üretimde, buğday cinslerinin bir etkisi yok -tur.

2. (b) H1' :

En

az bir ~i sıfıra eşit değildir.

Ycini kullanıla~ çeşitli yapıdaki gübrelerin, ortalama üre-.

tim üstünde etkisi vardır.

r c 2 ~ ~· 2 T.. 2 2 2 2 2 2 . 2 2 2

2

SST =

~

Lx .. - - =64 +55 +59 +58 +72 +57 +66 +57 +74

;.47

. 1 . 1 ıJ l-= J= re 2 .

+58

2+532-

c~:~) =43862~3200;;662

SS'I

=

662 r

~=iT~.

SSR

=

c

131094

=

3 .ssn :;: 498 c 2

LT

.

2 T ••

---=

re

518400

. 12 2 T 2102+1592+1832+1682 3 ::: 43698-43200=498· j::l • J ••

ssc

= - - - - -

= (720) 2 - - - ;: 43256-43200 r re

ssc

=

56

SSE = SST - SSR - SSG - 662 - 498 - 56

=

108 SSE

=

108

~u

sonuçlar ve

diğer h~saplamalar, tablo.8'de

.

verilmiştir.

(18)

Hı" : En az bir

f3j

sıfıra eşit değildir.

Yani ortalama üretimde, değişik buğday cinslerinin etkisi

vardır. 3. Hata payı :

=

0,05

4. Kritik bölge: (a) Fı

>

4,76, (b)

F2

>

5,14

5. Hesaplamalar :

Tablo.8

l).:;ğişim Kareler serbestlik Kareler

Hesaplanan '

Kayna,€ı Toplamı Dereoeıeri Orta.laması f

Satı:r 498 Orta.lamaları

.

3

lôô

-

· -Sütull

·'

f ı--9,22 Ortalamaları, · 5~ 2

2S

·

-

... .. .. f 211111,56 sapniala.r ıoe 5 ış; ,. -·- -··· -'I'o p0lt;Un. 6'62 .11 -·-ô.-SOll\19 : (a.)

_

:t

01)

~ {9

1

2~

4

9

16}.

H

0 red edilir. Kimyevi gübrelerin

ortalama. üretim üstünde etkisivardır. (b) t

02

(~ [ı,56

'

5,14}

-

~~

'

kabul

edilir. Yani ortalama.

ü-retimae·r· ~ oinslerinin bir etkisi yoktur. 4. SONUC

Varyans analizi tekniği, istatistiğin çok önemli bir alanı olarak

bilinen deney (gözlem sonuçları) planı ve deneyin (gözlem

sonuçla-rının) analizinde kullanılır.

Deney planı; istatistik yöntemleri kullanan bir araştırıcı önce ba

-ğımsız ve bağımlı olmak. üzere değişkenleri iki guruba ayırır. Değiş­

kenlere bazen faktör adı da verilir. Bu faktörler, bir deney_

çerçeve-sine sokulabiliyorsa, «kontrol edilen faktörler» adını alırlar.

Değişkenleri seçip, açık~seçik . tanımlıyan araştırıcı bunları

ölç-meğe ya da başka bir yolla gözlem içine sokmağa çalışacaktır. Bu

(19)

Değişkenlerdeki bütün hareketler deney planı konusu olmaz. Şan­ sa bağlı, ihtimal kanunlarına uygun değişiklikler deney planı dışında kalır.

Örneğin belli bir buğday türünün üretimi üstünde çeşitli gübre-lerin ne gibi bir etkisi olduğunu öğrenmeye yönelmiş bir araştırmaya girişirsek; gübre çeşidi, miktarı, toprak çeşidi~ iklim, haşarat, parazit bitkiler gözönüne alınması gereken değişkenlerdir.

Bunları şöyle iki guruba ayırabiliriz :

- Kontrol edilen. değişk.enler: Gübre· çeşidi ve miktarı,

- Kontrol edilemeyen değişkenler : Toprak çeşidi, iklim, haşa-rat, parazit bitkiler.

Deney planımız sadece birinci tip değişkenleri içine alacaktır. Kontrol dışı değişkenlerin e.tkisini 0,01 - 0,05 arasında tutabilecek bir plan hazırlamağa, başka bir deyişle deneyimizi, ikinci tip değişken­ lerin etkili olabileceği ortamdan uzak bulundurmağa çalışırız.

Çalışmamızda, varyans analizi kavram ve tekniğini basit olarak açıklamak temel gayeı:niz oldu.

Varyans analizi tekniği; bir gözlemler kümesine ilişkin kareler

toplamını bir takım anlamlı kısımlara ayırmaktadır. Bu kareler toplamı da bazı tahm,inler elde etmek veya bazı testlerin yapılabilmesi için uygun değerlerin hesaplanması ola.nağını verir.

KAYNAKLAR

Bağırkan ŞEMSETTİN, «Varyans Analizinin Bazı Uygulama Alanları», İktisadi ve . Ticari İlimler Dergisi, İ.İ.T.İ.A. Yayını, Sayı 2, İstanbul, 1975.

Lee H. SMITH, Donald R. WILLIAMS, «Statistical Analysis for Business»,

Wad-·

sworth Publishing Company, ine. Belmont. California, 1971.

Ronal'd E. WALPOLE. «lntroduction To Statistics», The Macmillan Company, New York, 1968.

(20)

Referanslar

Benzer Belgeler

• Bu deneme deseninde en küçük parsel olan alt-alt parsel, sıklıkların yerleştirildiği ve denemenin tamamında 20 adet olan değerdir.. Bunlara ilişkin

• Daha sonra gruplararası kareler ortalaması grupiçi kareler ortalamasına bölünerek F değeri elde edilir. • Son olarak da hesaplanan F değeri ilgili serbestlik derecesi

'2 ~ stanbul, Bayezid Belediye Kütüphanesi, M.. Bunlardaki yaya ve yamaklar 18 nefer olup bu da be~er nüfusdan 90 nüfus demektir. Çe~me çevresindeki öteki köylenn Alaca-at

* Ortak  alıcı  modeline  imkan  veren  farklı  türlerde  servis  dağıtımı  için   alıcılarda  ortak  sinyal  sistemi  kullanımı.

[r]

Müşterilerin internet bankacılığı deneyimleri ile ilgili bulgular, - her ne kadar güvenilirlik, yanıt verme, güvence gibi geleneksel kavramların algılanan hizmet

Regresyon modelinin anlamlılığını test etmek için varyans analizi yaklaşımı da kullanılabilir. Bu yaklaşım, yanıt değişkenindeki toplam değişkenliğin

İki veya daha fazla örnek ortalaması arasındaki farkın anlamlı olup olmadığını test ederken varyans analizi kullanılır... En az bir