• Sonuç bulunamadı

İstatistiksel Karar Verme

N/A
N/A
Protected

Academic year: 2022

Share "İstatistiksel Karar Verme"

Copied!
34
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

Amaçlar

Bu üniteyi çalıştıktan sonra;

• istatistiksel hipotezlerin kurulmasında ve test edilmesinde kul- lanılan kavramların tanıtımı

• istatistiksel hipotezlerin test edilmesi sürecinde yapılan işlem- ler hakkında gerekli bilgi verilmesi

• istatistiksel karar verme konusunda nitelik kazandırılmış olur.

İçindekiler

• Giriş

• Hipotez Testi İle İlgili Kavramlar

• Hipotez Testi Sürecinde Adımlar

• Bazı Parametrelere İlişkin Test Uygulamaları

• Özet

• Değerlendirme Soruları

• Yararlanılan ve Başvurulabilecek Kaynaklar

ÜNİTE

8

İstatistiksel Karar Verme

Yazar

Doç.Dr. Ahmet ÖZMEN

(2)

• Bu üniteyi kolayca anlayabilmek için örnekleme teorisi ve ista- tistiksel tahmin isimli üniteleri özümsemiş olmanız gerekir.

• Bir istatistik kitabından "dağılımlar" konusunu gözden geçir-

menizde yarar vardır.

(3)

1. Giriş

Örnekleme teorisi, evren parametrelerinin tahmin edilmesinin yanında istatistik- sel hipotezlerin test edilmesine de imkan verir. Çünkü, günlük hayatımızda ve bi- limsel araştırmalarda bir örneklemin hasaplanan değerlerini kullanarak evren pa- rametreleri hakkında sık sık kararlar verilmeye çalışılmaktadır. Örneğin, üniversi- temizde öğrenim gören öğrenciler arasında sigara içenlerin oranının en az %65 ol- duğu; A öğretim yönteminin B öğretim yönteminden daha etkin olduğu; x ekmek fabrikasında üretilen ekmeklerin ortalama ağırlığının 450 gram olduğu iddiaları doğru mudur? Bu soruların yanıtlanabilmesi, başka bir deyişle bu hipotezlerin ör- neklem istatistiklerinden yararlanarak test edilmesi amacıyla geliştirilmiş ve uzun yıllar başarıyla uygulanan yöntem, istatistiksel Hipotezlerin Testi yöntemidir.

Bu yöntemde, üzerinde araştırma yapılacak olan evrenden rassal seçimle oluştu- rulmuş bir örneklemin birimleri üzerinden ilgilenilen değişken itibariyle bilgiler derlenir. Örneklem istatistikleri hesaplanır. Bu istatistiklerden yararlanarak araş- tırmaya başlamadan önce evren parametre değeri hakkında ileri sürülen hipotezin (iddianın) doğru, geçerli olup olmadığı konusunda karar verilmeye çalışılır. Veri- lecek karara istatistiksel karar adı verilmektedir. İstatistiksel kararın verilebilmesi, bir başka ifadeyle istatistiksel hipotezlerin testi sürecinde hipotezlerin kurulması, bu hipotezlerden birinin seçilmesi (kabul edilmesi) veya seçilmemesi (red edilme- si) için araştırmaya konu olan evren, bu evrenden alınan örneklem ve ilgilenilen evren parametre tahminleyicisinin dağılımı hakkında belirli varsayımların yapıl- ması gerekir. Bu kısımda önce konuyla ilgili kavramlar açıklanacak daha sonra uy- gulamada sıkça ilgilenilen evren parametreleri µ, π, µ 2 - µ 1 , π2 - π1 için hipo- tez sınamalarının nasıl yapıldığını göstermek suretiyle istatistiksel karar verme niteliği kazandırılmaya çalışılacaktır.

2. Hipotez Testi İle İlgili Kavramlar

2.1 İstatistiksel Hipotezler

Üzerinde alıştırma yapılacak bir evrenin, ilgilendiğimiz bir θ (µ, π, µ2 - µ1 , π2 - π1) parametresenin değeri hakkında ileri sürülen ve doğruluğu, geçerliliği olası- lık ilkelerine göre araştırılabilen hipotezlere (ön savlara) istatistiksel hipotezler, adı verilir. İstatistiksel hipotezlerde hipotez bir frekans dağılımını ifade eder.

Bir istatistiksel hipotez doğru ya da yanlış olabilir. Çünkü bu bir beyandır; deneyi- me ve/veya varsayıma dayanmaktadır. Gerçeği öğrenmek için tam sayım yapmak gerekir. Ancak örnekleme yapmayı gerekli kılan nedenlerden dolayı bu mümkün değildir. Bu durumda istatistiksel hipotezlerin geçerliliği, doğruluğu konusunda

(4)

karar verebilmek için bu hipotezlerin

q

örneklem istatistiklerinden ve onların bölümleriyle ilgili bilgilerden yararlanarak test edilmesi gerekir.

İstatistiksel hipotezlerin testinde iki hipotez sözkonusudur. Bunlar; sıfır hipotezi ve karşıt hipotez olarak isimlendirilirler.

2.1.1 Sıfır Hipotezi

Bu hipotez H0 sembolleriyle gösterilir ve hangi hipotezin test edileceğini ifade eder. H0 hipotezi evren parametre değeri θ hakkında ileri sürülen ön savı göster- mektedir. H0 hipotezinin kurulmasında esas, test süreci tamamlayıncaya kadar ör- neklem istatistiği

q

değeri ile θ parametresinin değeri hakkında ileri sürülen belli bir θ0 değeri arasındaki farkın örnekleme hatasından kaynaklanabileceği, bu iki değer arasında gerçekte bir fark bulunmadığı, farkın sıfır olduğu hususunun bir hipotez şeklinde doğru kabul edilmesidir. Bu açıklamaların ışığında H0 hipote- zi genel parametre θ için;

H0 : θ = θ0

şeklinde kurulur.

q

değeri ile θ0 değeri arasındaki farkın tam sayım yapılmamasından, örnekle- meye başvurulmasından kaynaklandığının tayini statistiksel bir testin uygulama- sını, yani H0 hipotezinin test edilmesini gerektirir. Bu test sonucunda sözkonusu fark seçilen bir anlamlılık düzeyinde örnekleme hatalarından kaynaklanabilecek kadar küçük yani anlamsız ise H0 hipotezi kabul edilir. Aksi halde H0 hipotezi reddedilir.

2.1.2. Karşıt Hipotez

H0 hipotezinin test edilebilmesi için, bu hipotezden farklı başka bir hipotezin daha ileri sürülmesi gerekir. H1 semboluyle gösterilen bu hipoteze karşıt hipotez adı ve- rilir. Karşıt hipotez H0 hipotezini çürüterek ve bu hipotezin reddedilmesi duru- munda kabul edilecek olan hipotezdir. H1 hipotezi, verilecek kararın niteliğine ve örneklem istatistiğinin değerine bağlı olarak çeşitli karar verme problemlerinde aşağıdaki üç farklı şekilden biri ile kurulur.

H1 : θ = θ0

H1 : θ > θ0

H1 : θ < θ0

Hipotez testlerinde H1 hipotezi, testin yönünü ve H0 hipotezinin red bölgesinin yerini belirleyen hipotezdir. Bu konuyla ilgili bilgileri "hipotezlerin ifade edilmesi"

başlığı altında görebilirsiniz.

(5)

Bir istatistiksel testte, H0 ve H1 hipotezleri θ parametresinin gerçek değeri ile ilgili birer hipotez olarak birlikte düşünüleceği için, bunlara hipotezler adı veril- mektedir. İzleyen kısımlarda "hipotezler" dendiğinde H0 ve H1 hipotez takımı anlaşılmış olacaktır.

2.2. İstatistiksel Hipotez Testi - İstatistiksel Karar Verme

İstatistiksel hipotez testi ile istatistiksel karar verme arasında teorik esaslar yönün- den bir fark yoktur; uygulamada istatistiksel testler istatistiksel karar verme ama- cıyla uygulanmaktadır.

Bir hipotez veya onu çürütecek bir başka hipotezden birinin

q

(X, P1 , X2 - X1 , P1 - P2) örneklem istatistiğinden yararlanmak suretiyle seçilmesine yönelik çalışmaya istatistiksel karar verme veya istatistik hipotez testi adı verilir.

Örneklem istatistikleri aynı hacimli farklı örneklemlerde farklı değerler alabildiği için,

q

- θ > 0 ,

q

- θ = 0 ve

q

- θ < 0 gibi farklar olabilir. Bu nedenle istatistiksel test sonucu verilecek kararın isabetli olduğu konusunda kesin bir karar verilemez.

Fakat olasılık teorisinden yararlanmak suretiyle, eğer hipotez doğru ise, örneklem istatistiklerinin hangi değerler arasında değer alabileceğini belirlemek mümkün olabileceği için, istatistiksel test ile hipotezin ne derece güvenle kabul veya reddedileceğini belirlemek olanaklı olmaktadır. Yani, burada önemli olan

q

- θ farklarının istatistiksel yönden anlamlı olup olmadığını belirlemektir. Başka bir anlatımla, farkların gerçek değişmeyi mi açıkladığı yoksa tesadüfi (rassal) olarak mı meydana geldiğini belirlemektir

2.3. I.Tip Hata ve II. Tip Hata

Aynı evrenden rassal olarak oluşturulan aynı hacimli olası örneklemlerde örnek- lem istatistiğinin farklı değerler aldığı daha önce açıklanmıştı. Bu açıklama nede- niyle, bir evren parametresi olan θ hakkında kurulan hipotezler test edilirken ör- neklem istatistiği

q

kullanıldığı zaman iki tür yanlış karar verme riski vardır. Bir istatistiksel hipotez testinde yanlış karar verme sonucu işlenen hataya çıkarsama hatası adı verilir. Çıkarsama hataları I.tip hata ve II.tip hata adlarıyla anılmaktadır.

H0 hipotezi gerçekte doğru iken, örneklem istatistiğini kullanarak yapılan test sonucunda H0 hipotezinin reddedilmesi durumunda işlenen hataya I.Tip hata adı verilir. I.Tip hata işleminin riskine (olasılığına) α riksi denir. Hipotez sınamala- rında yapılabilecek diğer hata, II.tip hata ise, H0 hipotezi gerçekte yanlış iken, H0 hipotezinin kabul edilmesi durumunda işlenen hatadır. II.tip hata işleminin olası- lığı β riski olarak isimlendirilir.

I.tip hata ve II.tip hata matematiksel olarak hesaplanabilir.

(6)

Bir hipotez testinde amaç, H0 hipotezini ya kabul etmek ya da reddetmektir. H1 hipotezinin kabul edilmesi veya reddedilmesi dolayısıyla ortaya çıkan karardır.

Bu nedenle aynı hipotez testinde I.tip ve II.tip hatadan yalnız biri söz konusu olabi- lir. Yani iki tür hatayı birlikte işlemek mümkün değildir.

Araştırmalarda hem α riskinin hem de β riskinin küçük olması istenir. α, β ve örneklem hacmi n arasında sıkı ilişki vardır. Genel olarak α büyüdüğünde β küçülür. Fakat n büyüdüğünde hem α hem de β küçülür. Ancak n araştırma- nın başlangıcında belirlendiği ve araştırmalarda I.tip hata daha çok kontrol edil- mek istendiği için α riski sabit tutulur. Yani test sonucu verilecek kararın etki- lenmemesi için araştırma başlamadan önce α'nın olasılık değeri araştırmacı ta- rafından belirlenir. α değerinin belirlenmesi konusu ile ilgili açıklamalar anlamlı- lık düzeyi kavramı açıklanırken ele alınacaktır.

I. tip hata, 2. tip hata ve örnek büyüklüğü arasında ne tür bir ilişki vardır?

2.4. Anlamlılık Düzeyi

I.tip hata yapmanın olasılığına (riskine) anlamlılık düzeyi adı verilir daha önce ifa- de edildiği gibi α simgesiyle gösterilir.

Test edilecek bir hipotez için, anlamlılık düzeyi α'nın olasılık değerini belirle- me konusunda çeşitli istatistiksel teknikler mevcuttur. Ancak araştırmacı I.tip ve II.tip hatalara vereceği önemi de dikkate alarak α anlamlılık düzeyini keyfi ola- rak belirler. Araştırma sonuçları bilindiğinde ortaya çıkabilecek yanlılıktan sakın- mak amacıyla α'nın değeri örneklem oluşturulmadan önce belirlenmelidir, uy- gulamada genellikle kullanılan anlamlılık düzeyleri 0.05 ve 0.01 dir. Bu düzeylerin anlamı kabul edilmesi gereken H0 hipotezinin reddedilmesi sansı sırasıyla %5 ve %1 dir. Başka bir deyişle test sonucu verilecek kararın güven düzeyi (1-α) sı- rasıyla %95 ve %99 dur. Araştırmanın konusuna bağlı olarak başka anlamlılık dü- zeyleri de kullanılabilir.

Evren parametresi değerinden daha küçük değerli ya da daha büyük değerli ör- neklem istatistiklerinin H0'ın kabul bölgesi içine alınması istenirse α'nın değeri- ni küçük seçmek gerekir.

Anlamlılık düzeyi α'nın belirlenmesi ile H0 hipotezinin red bölgesinin büyüklüğü alanı tesbit edilmiş olur.

2.5. İki ve Tek Yönlü Testler

H0 hipotezinin ve ona bağlı olarak kurulan H1 hipotezinin kuruluş şekline göre testler "İki yönlü test, tek yönlü üst kuyruk testi ve tek yönlü alt kuyruk testi olarak

?

(7)

uygulanırlar. Bu test uygulamalarında hipotezler aşağıda gösterildiği gibi formü- le edilirler:

İki yönlü hipotezleri:

H0 : θ = θ0

H1 : θ ≠ θ0

Tek yönlü üst-kuyruk hipotezleri:

H0 : θ = θ0

H1 : θ > θ0

Tek yönlü alt-kuyruk hipotezleri:

H0 : θ = θ0

H1 : θ < θ0

Yukarıdaki her hipotez takımı için kullanılan isim H1 hipotezinde θ için verilen değerler aralığını açıklamaktadır. Örneğin iki yönlü hipotezlerdeki H1 hipotezi θ0'dan hem büyük yöndeki hem de küçük yöndeki θ ile ilgili değerleri içerdiği için iki yönlü olarak isimlendirilir. Başka bir deyişle örneklem istatistiği

q

'nın belli bir A1 değerinden küçük veya A2 değerinden büyük olan değerleri H1 hipotezi yönünde, başka bir ifadeyle H0 hipotezinin red bölgesinde olan değer- lerdir.

Bu tür hipotezleri test ederken

q

'nın bölünmesinin her iki kuyruğu da kullanıldı- ğından bu testlere iki yönlü hipotezler adı verilir. İki yönlü hipotez testlerinde H0 doğru olduğundan onun reddetme olasılığı olan α,

q

'nın A1 'den küçük veya A2 'den büyük olma olasılığına eşit olduğundan A1 ve A2 'nin belirlenmesinde seçilen α değeri α /2 olarak alınır.

q

'nın bölünmesi normal olduğundan bu durum Şekil 8.1 de açıklanmıştır.

Tek yönlü üst kuyruk hipotezi formülündeki H1 hipotezi θ0 'dan büyük olan θ ile ilgili değerler içerdiği için, bu hipotez takımı tek yönlü üst-kuyruk hipotezi ola- rak isimlendirilmektedir. Tek yönlü üst kuyruk hipotezlerinde örneklem istatisti-

1- α

α/2 H0Kabul Bölgesi

A1 θ0 A2

0

θi

Zi Red Bölgesi

H0

Red Bölgesi H0

α/2

Şekil 8.1: İki Yönlü Testlerde Red Bölgeleri

(8)

ği

q

'nın θ0 'dan büyük olan değerleri H0 hipotezinin reddedilmesine yönelik değerlerdir. Bu durum Şekil 8.2 de gösterilmiştir.

Eğer H1 hipotezi H1 : θ < θ0

şeklinde ise, yani tek yönlü alt-kuyruk hipotezi kurulmuşsa uygulanacak test tek yönlü alt-kuyruk testi olacaktır. Bu durum Şekil 8.3 de gösterilmiştir. Bu test türün- de

q

'nın hipotezini reddetmeye yönelik değerleri

q

'nin A'dan küçük olan değer- leri olacaktır. Çünkü

q

'nin A'dan küçük olan değerleri H1 'in kabul bölgesinde yer alan değerlerdir.

3. Hipotez Testi Sürecinde Adımlar

3.1. Hipotezlerin Kurulması

Bu adımda örneklem istatistiklerinden yararlanmak suretiyle aralarında seçim ya- pılacak H0 ve H1 hipotezleri kurulur; uygulanacak hipotez testinin tek yönlü

1-α

α H0Kabul Bölgesi

H0 Red Bölgesi

θ0 A

0

θi

Zi

Şekil 8.2: Tek Yönlü Üst Kuyruk Testlerinde Red Bölgesi

α

1-α

H0Kabul Bölgesi

H0Red Bölgesi

A θ0

0

θi

Zi

Şekil 8.3: Tek Yönlü Alt Kuyruk Testlerinde Red Bölgesi

(9)

mü iki yönlü mü olacağına karar verilmiş olur. Başka bir ifadeyle H0 hipotezinin red ve kabul bölgeleri belirlenmiş olur.

3.2. Anlamlılık Düzeyinin Seçilmesi

Hipotezler kurulup veri derlemeye başlamadan önce gerçekte doğru olan H0 hipotezinin reddedilmesi olasılığını ifade eden α için bir değer belirlenmeye ça- lışılır. α için genellikle %5 veya %1 değerleri seçilir. Yapılan bu seçimle birlikte H0 hipotezinin kabul bölgesinin büyüklü olan 1 - α değeri de saptanmış olur.

3.3. Olasılık Dağılımının Belirlenmesi

Bu adımda, N hacimli evrenden rassal olarak seçilen örneklem birimleri üzerin- den veriler derlenir, tasnif edilir, gerekli istatistikler (X, p, X2 - X1 , p2 - p1 , s) hesaplanır ve hesaplanan örneklem istatistiğinin örnekleme bölünmesinin özel- likleri ile örneklem istatistiği ve sıfır hipotezinde ifade edilmiş olan evren paramet- re değeri arasındaki farkı standart hata birimi ile ifade eden test istatistiğinin özel- likleri belirlenir.

Hipotezlerin test edilmesi amacıyla çeşitli test istatistikleri kullanılmaktadır. Uy- gulamada üzerinde sıkça durulan evren parametreleriyle ilgili test uygulamaları- na ilişkin açıklamalar yapılırken bazı önemli test istatistikleri hakkında bilgi veri- lecektir.

3.4. Test İstatistiğinin Hesaplanması ve Uygun Kararın Verilmesi

Bir önceki adımda belirlenen test istatistiğinin değeri bu adımda hesaplanır. Bu test istatistiğinin hesaplanan değeri, büyüklüğü α ile belirlenen H0 hipotezinin red bölgesinde kalıyorsa H0 hipotezi red edilir. Kabul bölgesinde kalıyorsa H0 hipotezi kabul edilir. Kararın bu ifade ediliş biçimine İstatistiksel karar adı verilir.

Araştırmacı için istatistiksel kararın değil probleme ilişkin kararın önemi vardır.

Bu nedenle istatistiksel kararın H0 hipotezinde yüklü olan anlamla ilişkilendi- rilmesi gerekir. Bu ilişkilendirilmeye probleme ilişkin karar verme adı verilmekte- dir.

4. Bazı Parametrelere İlişkin Test Uygulamaları

4.1. Tek Evren Parametresine İlişkin Büyük Örneklem Testleri

Bu kısımda, tek evren ortalaması µ'ye ve tek evren oranını π'ye ilişkin testlerin nasıl yapılacağı örnekler üzerinden açıklamaya çalışılacaktır. Bu parametrelere ilişkin test sürecinde aşağıdaki varsayımlar kullanılır:

(10)

1. Örneklem rassal olarak oluşturulur.

2. Örneklem hacmi yeterli büyüklüktedir.

n ≥ 30 birimden oluşmaktadır.

3. Sırasıyla H0 : µ = µ0 ve H0 : π = π0 hipotezleri seçilecek bir α anlamlılık dü- zeyi için test edilir.

4.1.1. Tek Evren Ortalamasına İlişkin Test

Ortalamasının µ0 olduğu iddia edilen bir evrenden n hacimli bir örneklemin rassal olarak oluşturduğunu, sonra bu örneklem için aritmetik ortalama x, standart sapma s hesaplandığını varsayalım. x ve µ0 arasında belirli bir α anlamlılık düzeyinde anlamlı bir fark var mıdır? Başka bir deyişle x ile µ0

arasında ki fark sadece örnekleme hatalarından mı kaynaklanmaktadır? Soru- ların yanıtı tek evren ortalamasına ilişkin hipotez testi ile sağlanabilir.

x ve µ0 arasında α anlamlılık düzeyinde anlamlı bir farkın olup olmadığının test edilmesi için kurulabilecek hipotez takımları anımsanacağı gibi,

Çift yönlü test için;

H0 : µ = µ0

H1 : µ ≠ µ0

Tek yönlü üst-kuyruk testi için;

H0 : µ = µ0

H1 : µ > µ0

Tek yönlü alt-kuyruk testi için;

H0 : µ = µ0

H1 : µ < µ0

şeklinde ifade edilir.

Kurulacak bu hipotezlerdeki H0 hipotezinin kabul edilip edilmeyeceğinin tes- biti için kullanılacak test istatistiği

veya σ bilinmediğinde

förmülü ile ifade edilen Z istatistiğidir. Varsayım 1 ve 2'nin ve Merkezi Limit Teo- remi'nin sonucu olarak x 'ların örnekleme dağılımı ve bu dağılımın standart de- ğerlerinin dağılımı olan Z dağılımı normal dağılıma sahiptir. Z dağılımının ortala- ması

?

Z = x - µ0 σ / n

Z = x - µ0 s / n

Z = 0 varyansı σz2 = 1 dir (Bkz. Ek 1).

(11)

Örnek verelim:

A lisesi son sınıfta okuyan 1000 öğrenci özel dersaneler birliğinin düzenlediği sınava girmiştir. Okul yöneticileri sınav öncesinde öğrencilerinin bu sınavdaki;

1. Fen puanı ortalamasının 160 puan,

2. Sosyal puan ortalamasının en az 150 puan,

olacağını iddia etmişlerdir. Bu hipotezleri (iddiaları) test etmek amacıyla bu okulun sınava giren öğrencilerin arasında rassal olarak 36 öğrenci seçilmiş ve bunların fen puan ortalamasının 150 puan, standart sapmasının 15 puan; sosyal puan ortalamasının 145 puan ve standart sapmasının 22 puan, olduğu hesaplan- mıştır.

Yukarıdaki iki hipotezin doğruluğunu αα = 0.05 değerini seçmek suretiyle ayrıαα ayrı araştırınız.

Çözüm 1

Fen puanı ortalamasının 160 puan olduğu hipotezinin test edilmesi

Adım 1: Burada verilecek karar fen puanı ortalamasının 160 puan olduğudur. Bu kararı 160 puandan hem küçük hem de büyük yöndeki fen puanı ortalama değer- leri çürütecektir. Yani yapılacak test iki yönlü test olmalıdır ve hipotezler

H0 : µ = µ0 = 160 puan H1 : µ ≠ µ0 = 160 puan şeklinde kurulmalıdır.

Adım 2: Okul yöneticileri H0 : µ = µ0 = 160 puan hipotezinin doğru olması du- rumunda bunun reddedilmesi olasılığını; α'yı %5 olarak seçmişlerdir. Buna gö- re, red bölgesi bölünmenin her iki kuyruğunda tanımlanacak ve büyüklükleri α/2 değerinde olacaktır. Bu durum Şekil 8.4 de gösterilmiştir.

?

α/2 = 0,025 1-α =0,95 H0Kabul Bölgesi

H0 Red Bölgesi

A1 A2

0

Zi H0

Red Bölgesi

z = -4

= 155,1 µ0= 160

Z (0,0025) = - 1,96 z (0,975) = 1,96

Xi

α/2 = 0,025

X = 150

Şekil 8.4: X İçin İki Yönlü Test

(12)

Adım 3: Bu karar probleminde örneklem büyük örneklem; n = 36 öğrenci olduğundan, standartlaştırılmış z test istatistiğinin örnekleme dağılımı normal dağılıma sahiptir. Buna göre şekilde bu örnekleme dağılımın alt kuyruk bölgesi α/

2 = 0,025 olmakta ve bu red bölgesi sınır değeri A1 standart normal dağılımın 2,5'unun santiline karşı gelmektedir; bu da z(0,025) = -1,96 değeridir. Benzer şekil- de simetrik olarak üst-kuyruk sınır değeri A2 z(0,975) = 1,96 değerine karşı gel- mektedir. Böylece kabul bölgesi z(0,025) = -1,96 ve z(0,975) = 1,96 değerleri arasın- daki bütün z değerlerini kapsar. Başka bir ifadeyle bu öğrencilerden oluşturula- bilecek n = 36 öğrencilik olası örneklemlerin ortalamaları A1 ve A2 değerleri arasın- da yer alır. Bu bilgilere göre uygun karar hesaplanacak z test istatistiğinin değeri ile z (0,025) = -1,96 ve z (0,975) = 1,96 standart normal eğri tablo değerlerinin karşı- laştırılması suretiyle verilir. Eğer -1,96 ≤ z ≤ 1,96 ise H0 hipotezi kabul edilir.

Dolayısıyla H1 reddedilir. Eğer |z| > 1,96 ise H0 reddedilir, H1 kabul edilir.

Adım 4:

H0 hipotezi reddedilir, dolayısıyla H1 kabul edilir. Çünkü z = -4 değeri Şekil 8.4'de A1 solunda, red bölgesine düşmektedir. A1 'in değeri,

A1 = µ0 + z(α/2) sx

eşitliği kullanılarak hesaplanır.

A1 = 160 + (-1,96) 2,5 A1 = 160 - 4,9 = 155,1

Sözkonusu okulunun bu sınava giren öğrencilerinin fen puanı ortalaması 160 puan değildir, yöneticiler iddialarında yanılmışlardır, ortalama 160 puandan düşüktür.

n = 36 öğrenci X = 150 puan s = 15 puan sx = s

n = 15 36 sx = 2,5 puan µ = 160 puan

z = X - µ0

sx = 150 -160 2,5 = 4

|z| = 4 > 1,96 olduğundan

!

(13)

Çözüm 2

Sosyal puan ortalamasının en az 150 puan olduğu hipotezinin test edilmesi Adım 1: Bu örnekte test edilecek hipotez

H0 : µ = µ0 = 150 puan

şeklindedir. Bu hipotez için verilecek kararı sadece 150 sosyal puan ortalama değe- rinden küçük ortalama değerler çürütecektir. Buna göre yapılacak test için tek yön- lü alt-kuyruk testi uygulanmalıdır.

Tekyönlü alt kuyruk testi için hipotezler, H0 : µ = µ0 = 150 puan

H1 : µ < µ0 = 150 puan

şeklinde kurulur. Burada H0 hipotezi 150 ve daha büyük sosyal puan ortalama değerlerini kapsamaktadır.

Adım 2: α =0,05 alınmıştır. Bu problemde H0 hipotezinin red bölgesi bölünme- nin alt kuyruğunda tanımlanmıştır. Red bölgesinin büyüklüğü α = 0,05'tir. Bu durum Şekil 8.5 de gösterilmiştir.

Adım 3: Şekilde, standartlaştırılmış örnekleme dağılımının tanımlanan red bölge- sinin büyüklüğü 0,05 olacaktır. Bu red ve kabul bölgelerini birbirinden ayıran sınır değeri A standart normal dağılımının 5'inci santiline karşı gelir ve zi ekseninde z(0,05) = -1,645'tir. Bu test için uygun karar, hesaplanacak z test istatistiği;

eğer z ≥ -1,645 ise H0 kabul, H1 red eğer z < -1,645 ise H0 red, H1 kabul şeklinde olacaktır.

1-α =0,95 H0Kabul Bölgesi

A

0

θi

zi µ0= 150

z (0,05) = - 1,645 α = 0,05

Şekil 8.5: X İçin Tek Yönlü Alt Kuyruk Testi

(14)

Bu sonuca göre istatistiksel karar H0 hipotezinin kabuledilmesi yönündedir.

Bunun anlamı: Adı geçen okulun 1000 öğrencisinin sosyal puan ortalaması en az 150 puandır; Okul yöneticilerinin iddiası geçerlidir. Bu kararın güven düzeyi

(1- 0,05) = 0,95 'tir.

4.1.2. Tek Evren Oranına İlişkin Test

Bir evrenin hacmi N, araştırılan özelliğine sahip birimlerinin sayısı R olduğunda, evrinin bu özelliğe sahip birimlerinin oranının

eşitliği ile hesaplandığı daha önce ifade edilmişti.

Bu kısımda üzerinde araştırma yapılan ve ilgilenilen özelliğe sahip birimlerin ora- nının π0 olduğu iddia edilen bir evrenden n hacimli bir rassal örneklem alındığı ve bu örneklem için P oranının hesaplandığını varsayalım. P ve π0 arasında seçilen bir α değerinde anlamlı fark var mıdır sorusunun yanıtı tek evren oranına iliş- kin test ile sağlanabilir.

Burada açıklanacak prosedür evrenden alınan rassal örneklem hacminin büyük n ≥ 30 birim ve ayrıca π oranının 0 veya 1 değerine yakın bir değer almaması duru- munda uygulanabilir. Burada açıklanan varsayımlar altında evren oranı π 'ye iliş- kin testlerde hipotezler aşağıdaki şekillerden uygun gelen birisi ile kurulabilir.

İki yönlü test için;

H0 : π = π0 H1 : π ≠ π0 n = 36 öğrenci X = 145 puan s = 22 puan

sX = s n = 22

36 sx = 3,67 puan µ0 = 150 puan

z = x - µ0

sx = 145 - 150 3,67 = 1,36 z = 1,36 < z 0,05 = 1,645

!

π = R N

(15)

Tek yönlü üst-kuyruk testi için;

H0 : π = π0 H1 : π > π0

Tek yönlü alt-kuyruk testi için;

H0 : π = π0 H1 : π < π0

Örneklem hacminin yeterli büyüklükte olması ve ayrıca π'nin 0 veya 1 değerine çok yakın olmaması durumunda örneklem oranı p'nin örnekleme bölünmesi, orta- laması π, standart hatası olan normal bir dağılıma sahip olur.

Örneklem hacmi ve π oranıyla ilgili yukarıda açıklanan varsayımlar altında, π ora- nı ile ilgili testlerde kullanılan standartlaştırılmış test istatistiği

olur. Burada

π = π0 olduğunda, z test istatistiğinin örnekleme bölünmesi normal bölünme özel- liklerini taşır.

Tek evren ortalamasına ilişkin büyük örneklem testinde istatistiksel karar verilir- ken izlenen yöntem benzer şekilde π oranına ilişkin testlerde de uygulanır.

Örnek verelim:

Bilinen bir otomobil üreticisi işletme 1980 yılında ürettikleri otomobillerin

%40'ının 10 yıl sonra hala kullanılabilir özellikte olduğunun iddia etmektedir.

Bu iddiayı sınamak amacıyla bu firmanın ürettiği otomobillerden 1990 yılında 1000 otomobil rasssal olarak seçilmiş ve bunların 360'ının hala iyi kulllanılabi- lir koşullarda olduğu tespit edilmiştir. Bu iddiayı %1 anlam düzeyi seçmek su- retiyle test ediniz.

Çözüm Adım 1:

H0 : π = π0 = 0,40 H1 : π < π0 = 0,40

?

σp = π 1 - π n

z = p - π0

σp

σp = π0 1 - π0

n

(16)

Üretilen otomobillerin hala kullanılabilir olma özelliğine sahip olması oranının

%40 ve daha fazla olması hipotezini kapsayacağı iddiayı destekleyeceği için H1 hipotezi H1 = π < π0 şeklinde kurulmuştur. Bu hipotez tek yönlü alt kuyruk tes- ti ile test edilir. Hipotezin red bölgesi π0 'ın sol tarafında yer alacaktır. Bu du- rum Şekil 8.6 da gösterilmiştir.

Adım 2: α = 0,01 olarak seçildiği için H0 hipotezinin red bölgesinin büyüklüğü 0,01 dir. Şekil 8.6 da incelendiği zaman görülebileceği gibi p oranının örnekleme bölünmesi π0 = 0,40 değeri etrafında merkezleşme eğilimi göstermektedir.

Adım 3: 1000 otomobilin 360'ı on yıl sonra 1990 yılında hala kullanılabilir özellikte olduğundan örneklem için kullanılabilir özellikte otomobil oranı

olarak hesaplanır. Örneklem hacmi büyük olduğundan, (n = 1000 otomobil), p'nin örnekleme bölünmesi π = π0 = 0,40 olduğunda ortalaması π0 ve standart sapması σP

olan normal bölünmeye yaklaşır. Bu nedenle π = π0 olduğunda Pi'lerin standartlaş- tırılmasıyla oluşturulan bölünme standart normal dağılıma uyar. Buradan, istatis- tiksel karar için tanımlanan red bölgesinin sınır değeri A Şekil 8.6'da görüleceği gi- bi z(0,01) = -2,33 değerine karşı gelir. Böylece, test için uygun istatistiksel karar:

Eğer |z| ≥ |z (0,01)| = 2,33 ise H0 Reddedilir.

Eğer |z| < |z (0,01)| = 2,33 ise H0 Kabul edilir.

H0Kabul Bölgesi

A

0 p0= 0,40

Z (0,05) = - 2,33

α = 0,01 1 - α = 0,99 H0

Red Bölgesi

p z = p - π0 / σ { p } σp

Şekil 8.6: π İçin Tek Yönlü Alt Kuyruk Testi

p = r

n = 360

1000 = 0,36

σp = π0 1 - π0

n = 0,40 0,60 1000 σp = 0,155

(17)

Adım 4.

|z| = 0,26 < |z (0,01)| = 2,33

H0 hipotezi kabul edilir. Bu firmanın 1980 yılında ürettiği otomobillerin en az %40'ını 1990 yılında hala kullanılabilir özelliktedir. Firma iddiasında hak- lıdır.

4.1.3. İki Evren Ortalaması Arasındaki Farka ilişkin Test

Ortalamaları sırasıyla µ1 ve µ2 olan iki ayrı evrenden, örneklem ortalamaları X1 ve X2 olan n1 ve n2 hacimli birbirinden bağımsız rassal örneklemlerin oluş- turulduğunu varsayalım. İki evren ortalaması arasındaki farka ilişkin testlerde sı- fır hipotezi iki evren ortalaması arasında herhangi bir fark yoktur; ya da n1 ve n2 iki örneklem aynı evrenden çekilmiştir. Şeklinde ifade edilir. Bu ifade

H0 : µ1 = µ2

veya

H0 : µ1 - µ2 = 0

şeklinde formule edilir. Bu hipotezi çürütecek karşıt hipotez H1 ise;

H1 : µ1 - µ2 ≠ 0 H1 : µ1 - µ2 > 0 H1 : µ1 - µ2 < 0

formüllerinin uygun gelen birisi ile kurulur.

n1 ve n2 hacimli örneklemlerin dağılımı normal olan evrenlerden rassal olarak çe- kildikleri veya evrenler normal dağılıma sahip olmasa bile n1 ≥ 30, n2 ≥ 30 birim ol- ması halinde, X1 - X2 farklarının örnekleme dağılımı ortalaması µ1 - µ2 olan ve standart hatası

n = 1000 otomobil r = 360 otomobil p = r

n = 360 1000 = 0,36 π0 = 0,40 σp = π0 1 - π0

1000 = 0,4 0,6

1000 = 0,155 z = p - π0

σp = 0,36 - 0,40

0,155 = - 0,26

!

(18)

eşitliği ile hesaplanan normal dağılımdır. Standart hata hesaplanırken σ1 ve σ2

yerine örneklem standart sapmaları s1 ve s2 yazılarak da hesaplama yapılabi- lir. Bu durumda eşitlik;

gibi gösterilebilir.

Yukarıda verilen bilgilerin uzantısı olarak iki evren ortalaması arasındaki farka ilişkin H0 hipotezinin testi için kullanılacak test istatistiği µ1 - µ2 = 0 alındığından;

formülü kullanılarak hesaplanır. z test istatistiğinin dağılımı standart normal da- ğılımdır, yani ortalaması

İncelenen diğer testlerde olduğu gibi İstatistiksel karar, hesaplanan z test istatisti- ği ile seçilen α anlamlılık düzeyine karşı gelen standart normal eğri tablo değe- rinin karşılaştırılması suretiyle verilir. Örneğin α = 0,05 seçilmiş ve iki yönlü test söz konusu ise; eğer |z| ≥ 1,96 H0 hipotezi µ1 - µ2 = 0 reddedilir. Aksi durum- da H0 hipotezi kabul edilir.

Örnek verelim:

Bir araştırma birimi x ve y şehirlerindeki ev hanımlarının satın alma alışkanlık- larını araştırdı. Araştırma için x şehrinden 300 ev hanımı rassal olarak seçildi ve bunların haftalık gıda harcamalarının ortalamasının 30$ standart sapma ile 100$

olduğu hesaplandı. Aynı şekilde y şehrinden de 300 ev hanımı rassal olarak se- çildi ve bunların da haftalık gıda harcamaları ortalamasının 80$, standart sap- masının 20$ olduğu hesaplandı.

x ve y şehirlerindeki ev hanımlarının haftalık ortalama gıda harcamaları arasın- da fark var mıdır? αα = 0,01 anlamlılık düzeyinde karar veriniz.αα

Çözüm Adım 1:

H0 : µ1 - µ2 = 0 H1 : µ1 - µ2 ≠ 0

?

σ x 1 - x 2 = σ12 n1 + σ22

n2

sx 1 - x 2 = s12 n1 + s22

n2

z = X1 - X2

sx 1 - x 2

z = 0 ve σz2 = 1 dir.

(19)

Adım 2: α = 0,01 seçilmiştir. H0 hipotezinin red bölgeleri α/2 alınmak sure- tiyle X1 - X2 istatistiğinin örnekleme bölünmesinin her iki kuyruğunda tanım- lanmıştır. Bu durum Şekil 8.7 de gösterilmiştir. Burada µ1 - µ2 = 0 olduğunda α riski 0,01'de kontrol edilmektedir.

Adım 3: Şekil 8.7 de uygun karar kuralını göstermektedir. Test iki yönlü testtir ve X1 - X2 istatistiğinin örnekleme bölünmesi µ1 - µ2 = 0 noktasında merkezleşme eğilimi göstermektedir. Örneklem hacimleri büyük olduğu için karar verirken standart normal bölünme kullanılır. α olasılığı 0,01 seçildiği için red bölgesi sı- nırları z(α/2) = z(0,005) = -2,58 ve z(1 - α/2) = z(0,995) = 2,58. Bu durumda;

Eğer |z| ≤ 2,58 ise H0 kabul edilir.

Eğer |z| > 2,58 ise H0 reddedilir.

Adım 4:

n1 = 300 ev hanımı n2 = 300 ev hanımı

X1 = 100$ X2 = 80$

s1 = 30$ s2 = 20$

|z| = 9,6 > 2,58. Bu sonuca göre H0 hipotezi reddedilir dolayısıyla H1 hipote- zi kabul edilir. Bu istatistiksel karar x ve y şehirlerindeki ev hanımlarının haftalık ortalama gıda harcamaları arasında farklılık vardır. Bu fark anlamlı bir farktır.

H0Kabul Bölgesi

z = (0,005) = -2,58 0 α/2 = 0,005

1 - α = 0,99 H0

Red Bölgesi

α/2 = 0,005 H0 Red Bölgesi

A1 µ1 - µ2 = 0 A2

z (0,995) = 2,58

X2

- X1

z = X1 - X2

s x 1 - x 2

Şekil 8.7: µ1 - µ2 İçin İki Yönlü Test

X1 - X2 = 100 - 80 = 20$

sx 1 - x 2 = s12

n1 + s22 n2

sx 1 - x 2 = 900 300 + 400

300 = 2,08 z = 20

2,08 = 9,6

(20)

4.1.4. İki Evren Oranı Arasındaki Farka İlişkin Test

Şimdi de iki ayrı evrenden rassal olarak çekilen n1 ve n2 hacimli örnekler için sırasıyla p1 ve p2 oranlarının hesaplanmış olduğunu varsayalım. Bu durumda test problemi α anlamlılık düzeyinde n1 ve n2 hacimli öneklerin aynı evren- den gelip gelmediğinin araştırılmasıdır. Başka bir deyişle p1 ve p2 oranları arasındaki farkın anlamsız olup olmadığının veya farkın örneklemeye başvurul- muş olmasından ileri gelip gelmediğinin araştırılmasıdır.

İki evren oranı arasındaki farka ilişkin test iki evren ortalaması arasındaki farka ilişkin teste benzer hipotezler

İki yönlü test için;

H0 : π1 - π2 = 0 H1 : π1 - π2 ≠ 0

Tek yönlü üst-kuyruk testi için;

H0 : π1 - π2 = 0 H1 : π1 - π2 > 0

Tek yönlü alt-kuyruk testi için;

H0 : π1 - π2 = 0 H1 : π1 - π2 < 0 şeklinde bulunur.

n1 ≥ 30 ve n2 ≥ 30 hacimli örneklemler olduğu ve p1 ve p2 0 veya 1'e yakın değerler almadığı zaman p1 - p2 farklar istatistiğinin örnekleme dağılımı nor- mal dağılım özelliğine sahip olur. p1 - p2 'nin bu örnekleme bölünmesi α riski- nin kontrol edildiği yer olan p1 - p2 =0 etrafında merkezleşme eğilimi gösterir.

Bu test yaklaşımında kullanılan test istatistiğinin ifadesi

şeklindedir. Çoğu zaman π1 ve π2 evren oranları bilinmediği için z test istatisti- ğinde σp1-p2 yerine sp1-p2 yazılmıştır. p1 - p2 bölünmesinin standart sapması sp1-

p2 aşağıdaki eşitlik yardımıyla hesaplanır.

Bu test sürecinde adım 3 ve adım 4'te yapılacak işlemler, iki evren ortalaması ara- sındaki farka ilişkin testte olduğu gibidir.

z = p1 - p2

sP1 - P2

sp 1 - p

2 = p1 1 - p1

n1 + p2 1 - p2 n2

(21)

Örnek verelim:

Bir hastanenin kayıtları incelendiğinde, hastanede yatan 1000 erkekten 60, 800 kadından ise 20'si kalp hastası olduğu saptanmıştır. Acaba kalp hastalığı erkek- lerde daha çok görülen bir hastalık mıdır? αα =0,05αα

Çözüm

Kalp hastalığının erkkelerde daha sık rastlanıp rastlanılmadığı araştırıldığı için hi- potezler

Adım 1

H0 : π1 - π2 = 0 veya H0 : π1 = π2 H1 : π1 - π2 > 0 veya H1 : π1 > π2

şeklinde kurulur. Test için tek yönlü üst-kuyruk testi uygulanır.

Adım 2: Karşıt hipotez H1 : π1 - π2 > 0 şeklinde kurulduğundan H0 : π1 - π2 hipotezinin red bölgesi p1 - p2 örneklem istatistiği bölünmesinin üst-kuyru- ğunda yer almaktadır ve alanı 0,05 tir. Bu açıklamalar Şekil 8.8 de gösterilmiştir.

Adım 3: n1 = 1000 erkek hasta ve n2 = 800 kadın hasta olduğu için büyük ör- neklem söz konusudur. Bu durumda p1 - p2 istatistiğinin ve bu istatistiklerin standart değerlerinin dağılımları sırasıyla normal dağılım ve standart normal da- ğılım özelliğine sahiptir. Şekil 8.8 de gösterildiği gibi α olasılığı 0,05 seçildiği ve H1 hipotezi dağılımın üst-kuyruğunda tanımlandığı için red bölgesi sınırı z(1- α) = z(0,95) = 1,645 tir.

Buna göre;

Eğer z > z|0,95| = 1,645 ise, H0 reddedilir.

Eğer z < z|0,95| = 1,645 ise, H0 kabul edilir

?

0

1 - α = 0,95 α = 0,05

A z (0,95) = 4645

p2 - p1

H0Kabul Bölgesi H0 Red Bölgesi

π2 π1-

z = 3,76 zi

Şekil 8.8: π1 - π2 İçin Tek Yönlü Kuyruk Testi

(22)

Adım 4

z = 3,76 > z(0,95) = 1,645 H0 reddedilir dolayısıyla H1 kabul edilir. Şe- kil 8.8'de z = 3,76 değeri red bölgesinde yer almaktadır. Kalp hastalığına hasta- nede yatan erkeklerde daha sık raslandığı sonucuna varılır.

4.2. Küçük Örneklem Testi

Araştırmaların bir çoğunda örneklem büyüklüğü araştırmaya ayrılan para, za- man ve metaryalin sınırlı olduğu durumlarda örneklem hacmini daha önceki açık- lamalarımızda belirtilen büyüklükte (genellikle n ≥ 30 birim) sağlamak mümkün olmayabilir. Örneğin çok nadir görülen bir hastalıkla ilgili araştırmada vaka sayı- sını, uzun süren deneylere dayanan araştırmalarda, maliyeti yüksek olan labora- tuvar çalışmalarını gerektiren araştırmalarda örneklem hacmini arttırmak çok güçtür. Örneklem hacminin az olduğu bu gibi durumlarda, küçük örneklemler için geliştirilmiş test yöntemlerine başvurulur. Bu kısımda tek evren ortalamaları, iki evren ortalamaları arasındaki farklar için kurulan hipotezlerin küçük örnek- lemler (n < 30 birim) kullanılarak nasıl test edileceği konusu incelenecektir.

Küçük örneklem kullanılarak yapılan hipotez testleri, kullanılan test istatistiği dı- şında, büyük örneklem testlerine benzemektedir. Bu nedenle, bu kısımda ele alına- cak testlerde, sadece bu testlerin test istatistiklerine değinilerek, çözümlenecek ör- neklerle de bu testlerin uygulanış biçimleri test sürecinin adımları itibariyle açıkla- nacaktır.

Erkek Hasta n1 = 1000 Kişi r1 = 60 Kişi p1 = 60

1000 = 0,06 q1 = 1 - p1 = 0,94

Kadın Hasta n2 = 800 Kişi r2 = 20 Kişi p2 = 20

800 = 0,025 q2 = 1 - p2 = 0,975

p1 - p2 = 0,06 - 0,025 = 0,035 sp1 - p2 = p1q1

n1 + p2q2

n2 = 0,06 0,94

1000 + 0,025 0,975 800 sp1 - p2 = 0,0000564 + 0,0000304

sp1 - p2 = 0,0093 z = 0,035

0,0093 = 3,76

!

(23)

4.2.1. Tek Evren Ortalaması için Küçük Örneklem Testi

Araştırmacının örneklemi büyük olduğunda, evren standart sapması σ 'yı bil- memesi çok önemli olmayacak, büyük örneklemlerden hesaplanan standart sap- mayı, s'yi σ yerine kullanmakta çok büyük hata işlememiş olacaktır. Ancak, örneklem hacmi küçük olduğunda (n < 30 birim) σ yerine s'nin kullanılması ile el- de edilen istatistik (X - µ0) / sx standart normal dağılım göstermemekte, dola- yısı ile büyük örneklemlerde izlenen yöntem geçerli olmamaktadır.

Normal dağılıma sahip bir evrenden rassal olarak çekilen küçük hacimli bir örnek- lem için X hesaplandığını ve bu evrenin ortalamasının (µ) daha önceden belir- lenen bir (µ0) değerine eşit olup olmalığının test edilmesi için kurulan

H0 : µ = µ0

hipotezinin kurulduğunu varsayalım. H0 hipotezinin doğru olduğu hallerde

şeklinde hesaplanan test istatistiği v = n - 1 serbestlik dereceli t dağılımı gösterir.

Burada

eşitliği ile hesaplanır.

Örneklemin alındığı evren normal dağılım göstermediği durumlarda, yukarıda belirtildiği şekilde hesaplanan t değeri, t dağılımı göstermez. Araştırma yapılan evrenin dağılımı normal dağılımdan çok çok farklı şekil aldığında, araştırmanın yürütülmesi için örneklem hacmini arttırmak gerekir. Bunun yapılamadığı du- rumlarda ise gözlem değerine yapılacak logaritma almak, karekök almak, açı de- ğerine çevirmek gibi uygun dönüşümler ile normal dağılıma yaklaşılabilir. Bu ko- nular bu ünitenin kapsamı dışında tutulmuştur.

Örnek verelim:

Bir okuldan geçmiş yıllarda mezun olan öğrencilerin ortalama mezuniyet puanı 66 puandır. Bu yıl mezun olan öğrenciler arasından 26 öğrenci rassal olarak se- çilmiş ve bunların ortalama mezuniyet puanının 70 puan ve standart sapması- nın 10 puan olduğu hesaplanmıştır. Geçmiş yıllarda mezun olan öğrencilerin ortalama mezuniyet puanı ile bu yıl mezun olanların ortalama mezuniyet puanı arasında fark var mıdır; αααα = 0,01 için test ediniz.

?

t = x - µ0 sx

sx = s n - 1

(24)

Çözüm

Adım 1: Bu karar probleminde iki dönemdeki mezuniyet ortalamaları arasındaki hem büyük yöndeki hem de küçük yöndeki fark verilecek karar H0 : µ = µ0

üzerinde olduğu için hipotezler H0 : µ = µ0 = 66 puan H1 : µ ≠ µ0 = 66 puan

şeklinde ifade edilir. Bu durumda H0 hipotezi iki yönlü test ile test edilir. H0 hipotezinin red bölgeleri t bölünmesinin her iki kuyruğunda tanımlanır. Şekil 8.9 daki taralı alanlar H0 hipotezinin red bölgeleridir.

Adım 2: Bu probleme ilişkin test ile µ = µ0 = 66 puan olduğunda testin α olası- lığının 0,01 düzeyinde kontrol edilmesi düşünülmektedir.

Adım 3: Örneklem hacmi n = 26 öğrencidir ve geçmiş yıllardaki mezuniyet puan- larının bölünmesi normal bölünmeye sahiptir. 26 öğrencinin oluşturduğu örnek- lem küçük örneklemdir. H0 hipotezinin testi için, küçük örneklem testi uygula- ması istenir. Uygun karar kuralı Şekil 8.9 da gösterildiği gibi iki yönlüdür. α = 0,01 ve n = 26 öğrenci için t tablo değeri kritik değer;

t (1 - α/2; v = n - 1) = t (0,995; v = 25) = 2,787 olarak belirlenir. Bundan böyle karar kuralı

Eğer |t| ≤ 2,787 ise, H0 kabul edilir.

Eğer |t| > 2,787 ise, H0 reddedilir.

Burada t hesaplanan test istatistiğinin değeridir.

1-α = 0,99

α/2 = 0,005 H0Kabul Bölgesi

A1 µ0 A2

0

ti Red Bölgesi

H0

Red Bölgesi H0

α/2 = 0,005

t = -2,787 t = 2,787

Xi

Şekil 8.9: Küçük Örneklemde µ İçin İki Yönlü Test

(25)

Adım 4:

n = 26 X =70 puan s = 10 puan µ0 = 66 puan v = 26-1 = 25

|t| = 2 < |t(0,995) : v = 25| = 2,787

olduğu için H0 kabul edilir. Eski öğrencilerin ortalama mezuniyet puanı ara- sında anlamlı fark yoktur.

Not : Eğer problemde yeni mezunların ortalamasının daha yüksek olduğu söylenebilir mi denseydi tek yönlü üst kuyruk testi ile yapılacak, karşılaştırma yi- ne α = 0,01 ve v = n - 1 = 25 için |t| = 2 < |t(0,995; 25| = 2,485 şeklinde ola- caktı ve yine H0 kabul H1 red kararı verilecekti (t dağılımı değerleri için bkz.

Ek 2)

4.2.2. İki Evren Ortalaması Arasındaki Farka İlişkin Küçük Örneklem Testi Bölünmeleri normal veya normale yakın olan ve standart sapmaları bilinmeyen ve fakat birbirine eşit |σ1 = σ2| olduğu varsayılan iki evrenden n1 ve n2 hacimli küçük örneklemlerin oluşturulduğunu varsayalım. Bu örneklemler için sırasıyla, X1 , X2 ve s1 , s2 hesaplanmış olsun.

n1 < 30 ve n2 < 30 birimlik örneklemlerin aynı evrenden geldiklerine ilişkin H0 : µ1 - µ2 = 0 veya H0 : µ1 = µ2 hipotezini test etmek için,

test istatistiği kullanılır. Bu test istatistiği için H0 doğru olduğunda v =n1 + n2 - 2 serbestlik dereceli t dağılımı gerekir. Burada sx1-x2 iki ortalama arasındaki farkın standart hatasıdır.

Örnek verelim:

Bir orta öğretim okulunun sabahçı öğrencilerinden 18 öğlenci öğrencilerinden 12 rassal olarak seçilmiştir. Sabahçı öğrencilerin sınavlarındaki ortalama başa- rısı 70 puan, standart sapması 10 puan, öğlenci öğrencilerin ise aynı sınavlardaki ortalama başarısı 60 puan standart sapması 10 puan olduğu tespit edilmiştir.

Sabahçı öğrencilerin daha başarılı olduğu %5 anlamlık düzeyinde söylenebilir mi?

?

sx = s

n - 1 = 10 25 = 2 t = 70 - 66

2 = 2

t = X1 - X2

sx1 - x2

sx1 - x2 = n1 s1 2 + n2 s22 2 n1 + n2 - 2 . 1

n1 + 1 n2

(26)

Çözüm

Adım 1: Sabahçı öğrencilerin daha başarılı olup olmadığı araştırılacağı için H1 hipotezi tek yönlü olacak ve H1 t bölünmesinin üst-kuyruktaki değerleri kap- sayacaktır. Buna göre hipotezler;

H0 : µ1 = µ2

H1 : µ1 > µ2

şeklinde formüle edilir.

Adım 2: H1 hipoteziyle yönü tanımlanan H0 hipotezinin red bölgesinin alanı 0,05 dir. Başka bir anlatımla µ1 - µ2 olduğunda α riski 0,05'de kontrol edilecek- tir. Bu durum Şekil 8.10 da gösterilmiştir.

Adım 3: Örneklem hacmi küçük olduğu için, kararın verilebilmesi amacıyla n1 + n2 - 2 serbestlik dereceli t bölünmesi kullanılır. α = 0,05 ve n1 = 18, n2 = 12 olduğundan |t| α ; v = n1 + n2 - 2 = t(0,95; 28) = 1,701 tablodan belirlenir.

Bu durumda karar

Eğer t > 1,701 ise, H0 reddedilir.

Eğer t < 1,701 ise, H0 kabul edilir.

Adım 4:

1 - α = 0,95

α = 0,05 H0Kabul Bölgesi

µ1 A

0

ti Red Bölgesi

H0

t (0,95; 28) = 1,701

X - X2 µ2= 0 1

- t = 2,61

Şekil 8.10: Küçük Örneklemde µ1 - µ2 İçin Tek Yönlü Üst Kuyruk Testi

Sabahçı Öğrenciler n1 = 18 öğrenci X1 = 70 puan s1 = 10 puan

Öğlenci Öğrenciler n2 = 12 öğrenci X2 = 60 puan s2 = 10 puan

(27)

t = 2.61 > 1,701 H0 reddedilir. Dolayısıyla H1 kabul edilir. Sabahçı öğrenciler daha başarılıdır.

4.3. Khi-Kare Testi

Nitel değişkenler üzerinde yapılan gözlemler genellikle bu değişkenlerin ayrılabi- len nitelik sınıflarına (şıklarına) düşen birim sayıları (frekanslar) şeklindedir. Ör- neğin öğrencilerin başarı durumu değişkeni başarılı, başarısız nitelik sınıflarına ayrılsın, başarılı öğrenci sayıları, başarılı nitelik sınıfına karşı gelen birim sayılarını ifade eder.

Araştırmalarda ele alınan değişken nitel değişken ise ve gözlemler bu değişkenin belirli nitelik sınıflarına karşı gelen frekanslar olduğunda, kurulacak hipotezlerin test edilmesinde daha önce üzerinde durulan testlerin kullanılması uygun değil- dir. Bu gibi durumlarda Khi-Kare (χ2) testleri kullanılır.

Genellikle çok şıklı nitel bölünmelere uygulanan χ2 testinin esası, incelenen testlerde olduğu gibi, H0 hipotezinin red mi? kabul mü? edileceğini araştırmak- tır. Araştırmalarda χ2 dağılımı kullanılarak çeşitli hipotez testi uygulamaları ya- pılmaktadır. Bu testleri Khi-Kare bağımsızlık testi, Khi-Kare homojenlik testi ve Khi-Kare uygunluk testi olarak saymak mümkündür.

4.3.1. Khi-Kare Bağımsızlık Testi

Bu testte iki değişken arasında ilişki (bağımlılık) olup olmadığı araştırılır. Bu testte hipotezler;

H0 : İlişki yok (bağımsızlık var) H1 : İlişki var (bağımsızlık yok) şeklinde kurulmaktadır.

Frekansların iki farklı değişkene göre dağılımı söz konusu olduğundan, veriler iki yönlü tablolar ile sunulur. Tablo 8.1'de görüldüğü gibi, bu tabloların bir tarafı ilişki

X1 - X2 = 70 - 60 = 10

v = n1 + n2 - 2 = 18 + 12 - 2 = 28

sx 1 - x 2 = 18 102 + 12 102

18 + 12 - 2 . 1 18 + 1

12 sx 1 - x 2 = 3.83

t = 10

3.83 = 2,61

(28)

araştırılacak değişkenlerden birinin (başarı durumunun) şıklarını, diğer tarafı ise ikinci değişkenin (cinsiyetin) şıklarını gösterir. Bu iki değişkenin sınıflarının (şık- larının) oluşturduğu sıra ve sütunların kesiştikleri gözlerde bu değişkenler bakı- mından aynı özellikleri gösteren birimlerin sayıları bulunur.

Bağımsızlık testinde H0 hipotezinin test edilmesi için kullanılan χ2 test istatisti- ğinin ifadesi aşağıdaki gibi yazılır.

Burada; Gij, i'inci sıra ve j'inci sütunun kesiştiği gözdeki frekansı, Bij, H0 hipote- zinin doğru olduğu varsayımı altında, aynı gözdeki beklenen frekansı göstermek- tedir. r ve c ise sırasıyla tablodaki sıra ve sütun sayılarını belirtir. Herhangi bir göz- deki beklenen frekansı (Bij 'yi) hesaplamak için, o gözün yer aldığı sıra ve sütu- nun toplam frekanslarını çarpmak ve çarpımı genel frekans toplamına (örneklem hacmine) bölmek gerekir. Bu durum

eşitliği ilede ifade edilebilir. Burada;

dir.

χ2 test istatistiği, Ho hipotezi doğru olduğunda v = (r -1) (c-1) serbestlik dereceli χ2 dağılımı gösterir. Buna göre χ2 dağılımı tabloları kullanılarak Ho hipotezinin testi kolaylıkla yapılabilir.

Bu test sürecinde de, diğer test süreclerinde izlenen adımlar izlenir.

Başarı Durumu

Cinsiyet Başarılı Başarısız Toplam Kız

Erkek Toplam

Tablo 8.1: Cinsiyet ve Başarı Durumuna Göre İki Yönlü Tablo Örneği

χ2 = ∑

i = 1 r

j = 1

c Gij - Bij2

Bij

Bij = ni . n . j n..

ni. = ∑

j = 1 c Gij

n.j = ∑

i = 1 r Gij

n.. = ∑

i = 1 r

j = 1

c Gij

(29)

χ2 dağılımı sürekli bir dağılımdır. Oysa iki yönlü tablolardan hesaplanabilecek beklenen frekansların sayısı sınırlıdır. Bu nedenle kesikli bir dağılım daha uygun düşer. Örneklem hacmi yeterli büyüklükte olduğunda, kesikli bir dağılımın sürek- li bir dağılıma yaklaştığını kabul etmek, sonuçlarda büyük hata meydana getirme- mektedir. Ancak güvenilir yorumlar yapabilmek için, beklenen frekansların hiç ol- mazsa 5 olması gerekir. Beklenen frekanslar arasında 5'den küçük değer sözkonu- su olduğunda, birbirine yakın sınıflar birleştirilerek frekanslar büyütülür. Serbest- lik derecesi v > 2 olduğunda, tek bir beklenen frekansın 5'den küçük olması kabul edilebilir. Ancak bu durumda α = 0, 05 alınmalıdır.

Beklenen frekansların 5'den küçük olduğu ve sınıfların birleştirilmediği durum- larda yapılacak testler için χ2 eşitliğine "Yates Düzeltmesi" adı verilen bir dü- zeltme uygulanır. Bu, aşağıdaki eşitlikle sağlanır.

Örnek verelim:

Cinsiyet ile başarı durumu arasında ilişki olup olmadığını araştırmak amacıyla kız ve erkek öğrencilerden birbirinden bağımsız seçimde 100 öğrencilik bir ör- neklem oluşturulmuş ve aşağıdaki bilgiler elde edilmiştir. αααα = 0, 01 anlamlı- lık düzeyi kullanarak araştırmaya ilişkin çözümlemeyi yapınız.

Çözüm Adım 1

H0 : Cinsiyet ile başarı arasında ilişki yoktur.

H1 : Cinsiyet ile başarı arasında ilişki vardır.

Adım 2: α riski 0, 1'de kontrol edilecektir.

Adım 3: H0 hipotezi kabul edildiğinde χ2 dağılımı için serbestlik derecesi, r = 2 c = 2 olduğundan

v = (r -1) (c-1) = (2-1) (2-1) = 1 ve

?

χ2 = Gij - Bij - 0,52 Bij

j = 1

c i = 1 r

Başarı Durumu

Cinsiyet Başarılı Başarısız Toplam

Kız 12 8 20

Erkek 38 42 80

Toplam 50 50 100

(30)

χ2(1 - α); v = (r -1)(c-1)= χ2(0,99 , 1) = 6,64 χ2 tablosundan belirlenir.

Uygun karar kuralı Şekil 8.11'de gösterilmiştir.

Eğer χ2 ≤ χ2(0,99 , 1) = 6,64 Ho kabul edilir.

Eğer χ2 > χ2(0,99 , 1) = 6,64 Ho reddedilir.

Adım 4

χ2 = 1 < χ2(0,99; 1) = 6,64 olduğu için H0 kabul edilir, dolayısıyla H1 kabul edilir.

χ2 = 1 değeri Şekil 8.11'de kabul bölgesinde yer almaktadır. Bu istatistiksel kara- ra göre bu öğrencilerde cinsiyet ile başarı durumu arasında ilişki yoktur.

4.3.2. Khi-Kare Homojenlik Testi

Benzer nedenlerin ve olayların etkileri bakımından homojen olup olmadıkları;

gözlenen frekanslarla beklenen frekanslar arasındaki farkın anlamlı olup olmadı- ğı, bu farkların örnekleme hatalarından kaynaklanıp kaynaklanmadığı Khi-Kare homojenlik testi ile araştırılır. Bu test için hipotezler;

Başarı Durumu

Cinsiyet Başarılı Başarısız Toplam

Kız 12 (10) 8 (10) 20

Erkek 38 (40) 42 (40) 80

Toplam 50 50 100

χ2 = (12 - 10)2

10 + (8 - 10)2

10 + (38 - 40)2

40 + (42 - 40)2 40 = 1

1-α = 0,99

α = 0,01 H0Kabul Bölgesi

Red Bölgesi H0

v = 1 χ

(0,99 ; 1)

2 = 6,64 χ

i 2

Şekil 8.11: Khi-Kare Bağımsızlık Testi İçin İstatistiksel Karar Kuralı

Referanslar

Benzer Belgeler

Bu da, f nin bilinen ∂f ∂y kısmi t¨ urevi ile

Problemdeki hesaplardan da yararlanarak, Pappus’ ¨ un Teoremi ile de bulun-

Bu yönteme göre (1) denkleminin (2) biçiminde bir çözüme sahip oldu¼ gu kabul edilerek kuvvet serisi yöntemindekine benzer as¬mlar izlerinir.Daha sonra sabiti ve a n (n

Ortogonal Polinomlara Örnekler.

f (x) = cos x fonksiyonun grafi˘ gi π birim sa˘ ga kaydırılır, dikey olarak 5 katsayısı ile uzatılır, x−eksenine g¨ ore yansıtılır ve son olarak 1 birim a¸sa˘

˙Istanbul Ticaret ¨ Universitesi M¨ uhendislik Fak¨ ultesi MAT121-Matematiksel Analiz I. 2019 G¨ uz D¨ onemi Alı¸ stırma Soruları 3: T¨

f fonksiyonunun ve te˘ get do˘ grusunun grafi˘ gini ¸

Determine whether the statement is true or false. If it is true,