• Sonuç bulunamadı

9. BÖLÜM NORMAL DAĞILIMA UYUM İYİLİĞİ HİPOTEZ TESTLERİ 9. NORMAL DAĞILIMLA İLGİLİ TEST YÖNTEMLERİ

N/A
N/A
Protected

Academic year: 2022

Share "9. BÖLÜM NORMAL DAĞILIMA UYUM İYİLİĞİ HİPOTEZ TESTLERİ 9. NORMAL DAĞILIMLA İLGİLİ TEST YÖNTEMLERİ"

Copied!
85
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

9. BÖLÜM

NORMAL DAĞILIMA UYUM İYİLİĞİ HİPOTEZ TESTLERİ

9. NORMAL DAĞILIMLA İLGİLİ TEST YÖNTEMLERİ

Bir örnekleme sonucunda elde edilmiş rastgele değişkenler özellikleri gereği, farklı karakterlerde olabilirler. Buna rağmen, bütün jeodezik veriler nitel ve nicel karakterli veriler olmak üzere iki farklı şekilde olur ve ele alınabilirler.

Bunlardan, nicel özelliğe sahip jeodezik veriler herhangi bir dağılımda olabilecekleri gibi ancak sıralı biçimde tanımlanmış rastgele veriler için geliştirilmiş olan parametrik olmayan, (non-parametrik), hipotez testleri ile irdelenebilirler. Buna karşılık, nitel özellikli veriler her zaman normal dağılımda olacaklarından, bunlar parametrelere dayalı geliştirilmiş istatistik test yöntemleri ya da diğer bir ifade ile normal dağılımla ilgili parametrik hipotez test yöntemleri ile irdelenirler.

Ancak, birçok hipotez testi konularından hatırlanabileceği gibi, bazı veri analizi uygulamaları için nitel özelliğe sahip verilerin sayısı yeteri miktardan daha az sayıda olunca parametrik testler etkin bir irdeleme sonucu vermemektedir. Böyle durumlarda, daha etkin veri irdeleme sonuçları ancak parametrik olmayan yani non-parametrik test yöntemlerinin devreye sokulması ile elde edilmektedir.

Bu gibi durumlarda, nitel özellikli verilerin sonuçlarını parametrik hipotez testleriyle irdelemeden önce verilerin normal dağılımda olup olmadıklarının ayrıca irdelenmesi gerekmektedir. Bu amaçla, uygulamada konuyla ilgili ön görülen hedeflere uygun bir hipotez testinin uygulanmasına başlamadan önce bütün verilere bazı normal dağılım uyum iyiliği (normalite) hipotez testleri uygulanır. Böyle bir işlem sonucunda, farklı veri kümelerinin çeşitli yönleri ile irdelenmesinde, parametrik ya da non-parametrik test yöntemlerinden hangisinin uygulanmasının daha akılcı ve etkin olduğuna ancak karar verilebilir.

Matematik istatistikte, bu güne değin geliştirilmiş ve zamanla çeşitli konularda uygulama alanı bulmuş ve birçok istatistik hipotez testi yöntemlerinin uygulanmasında her biriyle ilgili belli kuramsal dağılım varsayımlarına dayalı normal, log-normal, weilbull, Binom, Bernoulli, Cauchy, üstel,....vs. gibi farklı

(2)

fonksiyonlarla ifade edilmiş birçok dağılım türleri mevcut olmaktadır. Bu gibi kuramsal dağılım varsayımları içinde en genel ve aynı zamanda nitel özellikli, jeodezik gözlemler için de en önemli olanı normal dağılım varsayımıdır. Buna karşılık, nicel ve yeteri sayıda olmayan nitel özellikli verilerin dağılımlarının incelenmesinde kullanılan işarete dayalı sıralı veriler, özel non-parametrik veya Roboustluk testleri böyle bir bilgiyi fazla gerektirmemektedir. Bu nedenle, bu gibi testler zayıf nitelikli testler olduklarından nitel özellikli jeodezik verilerin irdelenmesinde yaygın bir biçimde kullanılmazlar. Ancak, bu gibi testler sadece nicel özellikli jeodezik verilerin istatistik olarak irdelenebilmesi için kullanılabilirler.

Uygulamada bunların yerine çok daha güçlü testler olması nedeniyle, ekseriyetle yaygın bir biçimde parametrik testler kullanılır. Ancak, pratikte veri sayısının az olduğu bazı özel durumlar için bu gibi bir söylemin geçerli olamayacağı; daha etkin sonuçlar vermesi bakımından bütün nicel karakterlerdeki veriler gibi normal dağılıma sahip az sayıdaki nitel özellikli verilerin de istatistik olarak irdelenmesinde daha çok non-parametrik testlerin kullanılması ayrıca önerilmektedir.

Genel anlamda böyle bir bakış açısından, bir evrensel kümeden sonlu sayıda örneklemeler sonucunda elde edilmiş olan nitel özellikli sayısal verilerin normal dağılımda olup olmadıklarının belirlenmesinde kullanılan hipotez testleri, özellikleri gereği,

Momentlere dayalı 2- bazlı parametrik testler,

Ampirik dağılım fonksiyon bazlı non-parametrik testler,

 Regresyon-korelasyon bazlı testler

şeklinde üç farklı grup altında toplanıp ele alınabilirler.

Böyle bir gruplamaya göre, günümüze kadar geçen süre içerisinde, bunların her biriyle ilgili farklı matematik temellere dayanan birçok test yöntemleri geliştirilmiştir. Bunlardan en eski tarihli ve ilk bağımsız jeodezik verilerin normal dağılıma uyum iyiliği ile ilgili istatistik veri irdelemelerinde, 1900 yıllardan beri en yaygın biçimde kullanılmış olanı, momentlere dayalı

2bazlı hipotez testleridir. Bu amaçla geliştirilmiş bütün hipotez testlerinin hepsi, normal dağılımın birinci dereceden momentleri ile ikinci, üçüncü ve dördüncü dereceden merkezsel momentlerine bağımlı türetilmiş testler olduklarından aynı zamanda parametrik testler sınıfına da girmektedirler. Buna karşılık, ampirik dağılım fonksiyon bazlı testlerde; böyle bir önkoşulun hiçbir zaman ön görülmemiş

(3)

olması ve aynı zamanda herbirinin sergilemiş olduğu özellikleri gereği dağılım bazlı testler olmaları nedeniyle, non-parametrik testler sınıfında ele alınmalarına olanak sağlanmaktadır. Regresyon-korelasyon bazlı testler, ikinci grupta ele alınmış ampirik dağılım fonksiyon bazlı testler, yerine daha çok son yıllarda gündeme gelmiş parametrik olmayan bir ikinci normal dağılım uyum iyiliği testi grubunu oluşturmaktadır. Bunun temelinde, diğer mevcut hipotez testlerine karşılık farklı bir yaklaşım olan; örnekleme verilerinin bir regresyondan sapmaların irdelenmesi prensibi yatmaktadır. Neticede, bir jeodezik veri kümesinin normal dağılıma uyum iyiliğinin istatistik olarak irdelenebilmesi için pratikte bu testlerden hangisinin kullanılabilir ve daha etkin sonuçlar verdiği;

bunların nitel ya da nicel özellikli veriler içermeleri yanında veri sayısının çokluğu da büyük önem taşımaktadır.

Sonuçta burada tekrar özetle söylemek gerekirse, bir veri kümesinin normal dağılımda olup olmadığının belli bir anlamlılık seviyesine göre istatistik olarak irdelenmesinde kullanılan, yukarıda sözü edilmiş esaslara dayalı geliştirilmiş, normal dağılıma uyum iyiliği testleri konu edindikleri rastgele değişkenlerin dağılımlarının özelliklerine göre bazı değişiklikler gösterilirler.

Bu gibi değişiklikler, rastgele değişkenlerin istatistik dağılımlarının basıklığı ve çarpıklığı yanında verilerin deneysel olasılıklarının veya dağılımlarının kuramsal olasılık ve dağılımlarından veya sıralı veriler için de bir regresyondan sapmalarının irdelenmeleri şeklinde ele alınabilirler. Burada, sözü edilen bu farklı karakterdeki özellikler, aynı zamanda verilerin normal dağılımda olup olmadıklarının irdelenmesinde kullanılacak bütün istatistik testlerin esas veya temelini oluşturmaktadır.

Bu amaçlar doğrultusunda, günümüzde geliştirilmiş ve çeşitli şekillerde kullanılmakta olan deneysel verilerin normal dağılımda olup olmadıklarının istatistik olarak irdelenmesi için güncellenmiş normal dağılıma uyum iyiliği (normalite) testleri,

Her bir sınıf aralığının deneysel olasılık değeri ile buna karşılık gelen kuramsal olasılık değeri arasındaki farklılıkların,

Deneysel dağılım değerleri ile kuramsal dağılım değerleri arasındaki farklılıkların,

Deneysel verilerin basıklık ve çarpıklık değerleri ile kuramsal basıklık ve çarpıklık değerleri arasındaki farklılıkların

Sıralı örnekleme veri değerlerinin bir regresyondan sapmalarının

(4)

karşılaştırılması özelliklerine dayanan, momentlere dayalı 2bazlı ya da momentlere dayanmayan non-parametrik ve sıra sayılı regresyon bazlı hipotez testleri olarak ele alınabilirler. Burada böyle bir akış düzeni içerisinde konu;

uygun ölçmeler veya gözlemeler sonucunda elde edilmiş jeodezik ölçü değerlerinin normal dağılımda olup olmadıklarının, yukarıda sözü edilmiş genel özellikleri içeren bazı özel istatistik test yöntemlerini kullanarak, incelenmesi, irdelenmesi ve bu amaçla halen kullanılmakta olan bazı özel test yöntemlerinin kısa bir özeti verilecektir.

9.1. Grafik Test Yöntemi

Grafik test yönteminde, normal dağılıma uyum iyiliği test yaklaşımı olarak, sonlu sayıda denemeler ya da ölçmeler sonucunda elde edilmiş verilerin Şekil 1 ve Şekil 2 den de görüldüğü gibi, belli sınıf aralığına göre çizilmiş histogram dağılımlarının kuramsal normal dağılım eğrisine uygunluğu geometrik olarak incelenir. Bu nedenle, grafik yöntem daha çok veri sayısının fazla olması durumunda ancak uygulanabilir. Her şeyden önce, bunun grafik bir yöntem olması nedeniyle, gerçekçi sonuçları ne derece sergilemiş olmasındaki başarı şansı deneysel veriler için düzenlenecek histogram dağılımındaki,

k (x) d max(x)min

bağıntısından hesaplanan d sınıf aralığı değerinin seçimine bağımlıdır. Bir histogram çiziminde böyle bir değer, formülden de görüldüğü gibi, k sınıf sayısı ile yakın ilişkili olmaktadır. Sınıf sayısı fazla olduğunda d sınıf genişliği küçük olmakta, tersi durumda az olunca geniş olmaktadır. Sonuçta, bağıl frekans eğrisi sivri ya da basık olmaktadır. Bu haliyle, her bir frekans eğrisi, kuramsal anlamda olması gereken durumdan daha farklı bir durum sergilemektedir. Bu durum, çoğu pratik uygulamalarda arzulanmayan bir sonuç olmaktadır. Uygun bir sonuç;

yapılan birçok denemelerden, bir örnekleme veri kümesinde veri sayısı ne kadar fazla ya da az olursa olsun; sınıf sayısının genelde; 5 ile 20 arasında tutulmasını öngörmektedir. Böyle olmakla birlikte, az sayıda sınıf aralığı ile çalışıldığında örnekleme küme elemanlarından üretilecek genelleme amaçlı detay bilgilerinin büyük bir çoğunluğu bir araya sıkışmış ve birbirini gizleyen örtüşmüş bilgiler olacaklarından konunun bütün detay bilgileri açıkça fark edilemeyecektir. Buna karşılık, çok fazla sayıda sınıf aralığı ile çalışıldığında, arzulanandan fazla sayıda detay bilgileriyle uğraşılmış olunacağından gereksiz yere emek ve zaman kaybına neden olunacaktır. Bu nedenle de; örnekleme verilerle ilgili düzenlenecek

(5)

histogram dağılım grafiği düzensiz bir görünüm sergileyecektir. Bu amaçla;

uygulamada daha gerçekçi bir histogram çizimi için k sınıf sayısının nasıl seçileceği konusunda bazı yaklaşımlar verilmektedir. Bu gibi yaklaşımlar için önerilen ilgili formüller;

n: Örnek kümedeki veri sayısı, s: Deneysel standart sapma değeri olmak üzere,

13

5 . 3

n

ks Scott ‘in bağıntısı, 9-1 veya

13

) 2 (

n x

k IQR Freedman-Diaconis bağıntısı 9-2

biçiminde, jeodezik uygulamalarda ise; momentlere dayalı 2 bazlı uyum testi için

1

n

k 9-3

ampirik dağılım fonksiyon bazlı Mann-Wald, Kolmogorow-Smirnow, Lilliefors vs. testleri için de

3

n

k 9-4

farklı şekillerde verilmektedir.

Burada, Freedman-Diaconis bağıntısında (9-2)‘de geçen IQR(x) (Interquartle range) tanım istatistiğinde çeyrekler açıklığını göstermektedir. Böyle bir değer, en basit şekliyle; verilmiş bir örnekleme veri kümesinin tüm elemanları; 10, 15, 23, 38, 42, 55, 57, 59, 67, 71, 71, 75, 75, 79 şeklinde sıranmış kümede olduğu gibi büyüklük değerlerine göre sıralanır. Sonra, veri kümesindeki veri açıklığı (genliği),

veri açıklığımax(x)min(x)791069

olarak hesaplanır. Bu sıralı kümenin medyan (ortanca) değeri sıra numarası (½)(14+1)=7,5 yani 07 ve 08 sıra numaralı elemanların tam ortasında olup 58 değerinde olmaktadır. Daha sonra buradan, ilk (birinci) dörtte birlik (çeyrek değeri) (Q1); ¼ (14+1) = 3,75 sıra numaralı olup, bu değer 3 sıra numaralı veriye 3 ile 4 sıra numaralı veriler arasındaki aralığın 0,75 katının eklenmesi ile,

(6)

Q1 = 23 + 0,75 (38-23) = 34,25

olarak elde edilir. Benzer şekilde hareket edilerek, üçüncü dörtte birlik (çeyrek değeri) (Q3) ‘de; (3/4)(14+1)= 11,25 sıra numaralı olup 11 sıra numaralı veriye 11 ile 12 sıra numaralı veriler arasındaki aralığın 0,25‘in eklenmesi ile elde edilir ve

Q3 = 71 + 0,25 (75-71) = 72

şeklinde hesaplanır. Sonuçta bu veri kümesindeki çeyrekler açıklığı Q3- Q1 = 72 - 34,25 = 37,75

olarak bulunur. Bu formüllere karşılık, bazı pratik uygulamalar için, k sınıf sayısı, 2kn olmak üzere,

2 log log log

10 2 10

nn olmak üzere,

n n

k1log2 13.3219 log10 9-5 Sturges formülüne göre de hesaplanabilir. Ancak, çok pratik amaçlar için bazı uygulamalarda sınıf aralığı değeri;

s

d0.5 9-6

s deneysel standart sapma değerinin yarı değeri alınarak da doğrudan histogram çizilebilir.

9.2. 2-Uyum Testi

Momentlere dayalı parametrik ve 2bazlı normal dağılıma uyum iyiliği testlerinden biri olan ve aynı zamanda bir örnekleme veri kümesinin normal dağılıma uyum iyiliği amacıyla kullanılmakta olan 2-uyum testinde temel düşünce, örnekleme veri kümesi eleman değerlerinin deneysel olasılık dağılımı ile evrensel küme elemanlarının sahip olduğu kuramsal normal olasılık dağılımından olan sapmalarının incelenmesi ya da irdelenmesi esasına dayanır.

Uygulamada böyle bir işlem, evrensel kümeden denemeler sonunda elde edilmiş olan n sonlu sayıdaki bir veri kümesinin,

(7)

1

n k

sayıda sınıfa ayrılmış histogram dağılımında, her bir sınıf aralığına ilişkin standart dağılımlı rastgele değişkeni,

N(0,1) np

np n

i i

i

9-7

0

 kuramsal ortalama ve 21 varyans parametreli bir standart normal dağılımda olmaktadır. Bunların kareleri toplamı biçiminde,

k

i i

i k i

i np

np n Beklenen

Beklenen Gözlenen

1

2

1

2 2

0

) ) (

( 9-8

(9-8) formülünden hesaplanan bir diğer standart dağılımlı rastgele değişkenin veya test büyüklüğü de, bölüm 6.3.2‘de söylenenler gereği, 2- dağılımında bir rastgele değişken olduğu görülür.

Buna göre; (9-8) formülünden hesaplanan 02 test büyüklüğü, belli bir 1S yanılma olasılığına göre ilgili 2 dağılım tablolarından alınan 2f, sınır (kritik) değeri ile karşılaştırılması neticesinde arzulanan istatistik irdeleme aşağıda açıklanacağı gibi işlemlerin ardı sıra uygulanması neticesinde gerçekleştirilmiş olur.

Bu amaçla, n sonlu sayıda veriden oluşmuş bir örnekleme veri kümesinin 2- uyum testine göre normal dağılıma uyum iyiliğinin irdelemesinde gerçekleştirilecek bir hipotez testinin ilk işlem adımı olarak,

0:

H Deneysel veriler normal dağılımdadır,

s:

H Deneysel veriler normal dağılımda değildir şeklinde bir sıfır hipotezi kurulur.

Bu şekilde kurulmuş olan sıfır hipotezinin belli bir 1S yanılma olasılığına göre istatistik irdelenmesinde ikinci işlem adımı olarak, (9-8) formülüne dayanılarak bir standart dağılımlı rastgele değişken ya da özet ifadesi ile bir 02 test büyüklüğü hesaplanır.

(8)

Şekil 26: Bir sıfır hipotezinde H0 kabul, Hs:ret bölgeleri

Sonra, bu 02 test büyüklüğü n serbestlik dereceli ve 1S yanılma olasılığına göre ilgili 2- dağılım tablosundan alınmış kuramsal karşılığı olan

2 ,

f sınır değeri ile karşılaştırılır (Şekil 26). Bu iki değerin karşılaştırılması sonucunda eğer,

 02< 2f, olması halinde, H0 sıfır hipotezi kabul, Hs:seçenek hipotezi ret edilir. Bu durumda yorum; veriler f serbestlik dereceli ve 1S yanılma olasılığına göre normal dağılımdadır denebilir.

 02>2f, olması halinde ise, H0 sıfır hipotezi ret, Hs seçenek hipotezi kabul edilir. Bu durumda da yorum; verileri f serbestlik dereceli ve 1S yanılma olasılığına göre normal dağılımda değildir denebilir.

Örnek 1: Bir zar n90 kez ardı sıra atılarak üste gelen yüzlerindeki rakamların sayısı,

Tablo 13 : Bir zar atışından elde edilmiş sonuçlar Üste gelen sayılar 1 2 3 4 5 6 Tekrar sayıları 15 13 18 16 11 17

olarak elde edilmiştir. Bu verilerin 0,05 yanılma olasılığı ile bir normal dağılıma uyup uymadıklarının 2- uyum testi ile irdelenmeleri istenmektedir.

Sıfır Hipotezi kabul

H0 H0

Sıfır Hipotezi red

α

0

(9)

Çözüm 1: Böyle bir problemin çözümü için birinci işlem adımı olarak,

0:

H Bu veriler normal dağılımdadır,

s:

H Bu veriler normal dağılımda değildir.

şeklinde bir sıfır hipotezi kurulur. Bu sıfır hipotezine ilişkin standart dağılımlı rastgele değişken ya da test büyüklüğü, zarın herhangi bir yüzünün üste gelme olasılığı,

6

1 pi

alınarak buradan,

) 15

6 (1

90 

inp olmak üzere,

267 , 15 2

) 15 17 ( 15

) 15 11 ( 15

) 15 16 (

15 ) 15 18 ( 15

) 15 13 ( 15

) 15 15 ( ) (

2 2

2

2 2

16 2

1

2 2

0

 

 

 

 

 

 

 

i i

i i

np np

n

olarak hesaplanır.

Bu test büyüklüğüne karşılık gelen sınır değeri  0,05 yanılma olasılığı ve 3

3 6 3  

k

f serbestlik derecesine göre ilgili 2-dağılım tablosundan,

2 7,81

05 , 0 , 3 2

,

f olarak alınır. Bu iki değerin birbirleri ile karşılaştırılmasından, 02<2f, olduğu için, H0 hipotezi kabul ve H seçenek s hipotezi ret edilir.

Bu durumda yorum: veriler 0,05 yanılma olasılığı ve f 3 serbestlik derecesine göre; normal dağılmış oldukları kabul edilebilir.

Not: Bu örnek çözümde dikkat edilirse; her sınıfa ilişkin kuramsal olasılık değeri doğrudan,

6

1

pi bağıntısından hesaplanabilmektedir.

(10)

Örnek 2: Bir problemin farklı şekildeki çözümlerinden elde edilen n38 sayıdaki sonuçları eşit aralık değerli 6 farklı sınıfa ayrılarak tablo 14‘de verilmiştir.,

Tablo 14 : Sınıf sınırları ve sınıf yığılmaları

Sınıf sınır değerleri 20-30 30-40 40-50 50-60 60-70 70-80 Sınıf yığılmaları 4 6 9 12 5 2 Ayrıca, bu verilere ilişkin daha önce yapılmış çeşitli denemelerden elde edilmiş, kuramsal değerler olarak alınabilecek 49 ortalama ve  14 standart sapma değerleri de bilinmektedir.

Bu verilerin normal dağılımda olup olmadıklarının  0,05 yanılma olasılığı ile

2- uyum testine göre irdelenmesi istenmektedir.

Çözüm 2: Böyle bir problemin çözümünde, sınıf sayısı k6 alınarak, örnek 1‘de yapılmış çözüm işlemine benzer bir yol izleyerek, ilk işlem adımı olarak,

0:

H Bu veriler normal dağılımdadır,

s:

H Bu veriler normal dağılımda değildir şeklinde bir sıfır hipotezi kurulur.

Sonra, bu sıfır hipotezine ilişkin, test büyüklüğü, n sonlu sayıdaki örnekleme veri kümesinin elemanlarından,

6

1

2 2

0

) (

i i

i i

np np

n

bağıntısına göre hesaplanır.

Pratikte, böyle bir hesaplama işlemi için tablo 15’de verilmiş olan işlemler ardı sıra yapılır. Bu gibi ara işlemler sonucunda sıfır hipotezi ile ilgili test büyüklüğü

834 ,

2 0

0

 olarakhesaplanır (Tablo 15).

Daha sonra bu test büyüklüğüne karşılık gelen tablo sınır değeri, 3

3 6 3  

k

f serbestlik derecesine ve  0,05 yanılma olasılığına göre ilgili 2-dağılım tablosundan 2f, 32,0.057,815 olarak alınır. Her iki değerin karşılaştırılmasından, 02<2f, olması halinde H0 sıfır hipotezi kabul ve Hs

(11)

seçenek hipotezi ret edilir.

Tablo 15: 02 Rastgele değişkeninin tablo halinde hesabı Sınıf

No

Sınıf sınırları x z

F(z) n i p i np i ninpi 2

0i

  0,0000

1

20 -2,071 0,0192

4 0,0874 3,3212 0,6788 0,139 2

30 -1,357 0,0874

6 0,1727 6,5626 -0,5626 0,048 3

40 -0,643 0,2601

9 0,2642 10,0396 -1,0396 0,108 4

50 0,071 0,5243

12 0,2597 9,8686 2,1314 0,460 5

60 0,786 0,7840

5 0,1492 5,6696 -0,6696 0,079 6

70 1,500 0,9332

2 0,0534 2,0292 -0,0292 0,000 7

80 2,214 0,9866

 

38 020,834

Yorum: Bu verilerin 0,05 yanılma olasılığı ve f 3 serbestlik derecesine göre; normal dağılmış oldukları kabul edilebilir.

Burada tekrar hatırlanacağı gibi, jeodezik uygulamalarda böyle bir işlem, denemeler sonucunda evrensel kümenin n sonlu sayıda ölçmelerden bir alt kümesi olarak elde edilmiş olan örnekleme veri kümesine ilişkin evrensel kümenin  ve 2 kuramsal parametre değerleri hiçbir zaman bilinemez. Bu gibi durumlarda, bunların yerine ancak örnekleme veri kümesi elemanlarından özel olarak kestirilmiş deneysel ortalama ve s deneysel standart sapma (tahmin) değerleri bilinebilir.

Böyle durumlarda, bir uygulama olarak önceki paragraflarda olduğu gibi  ve

2 kuramsal dağılım parametrelerine göre yukarıda anlatılmış olan 2- uyum testine ilişkin türetilmiş bütün işlemler, deneysel ortalama ve s deneysel standart sapma parametreleri kullanılarak gerçekleştirilir. Bu durum, 2- uyum

(12)

testinin çoğu jeodezik uygulamalar için her zaman geçerliliğini koruyan ve aynı zamanda pratik bir anlam taşıyan bir diğer uygulanış biçimi olmaktadır.

Bu amaçla, jeodezik ölçmeler sonucunda elde edilmiş n sonlu sayıdaki ölçüden kurulu bir veri kümesinin 2-uyum testi kullanılarak belli bir 1S yanılma olasılığına göre normal dağılımda olup olmadığının irdelenebilmesi için yapılaması gereken işlemler aşağıdaki gibi sıralanabilir.

Önce konuyla ilgili bir sıfır hipotezi, ) ˆ, (

0:x N xs

H veriler normal dağılımdadır.

s:

H veriler normal dağılımda değildir şeklinde kurulur.

Sonra, bu şekilde kurulmuş olan bir hipotezin, 1S önceden seçilen yanılma olasılığına göre 2-uyum testini esas alınarak irdelenebilmesi için standart dağılıma sahip bir rastgele değişken ya da test büyüklüğü hesaplanır. Böylece, sıfır hipotezi ile ilgili standart dağılımlı rastgele değişken ya da diğer adıyla test büyüklüğünün elde edilmesinde aşağıdaki işlemler sırası ile gerçekleştirilir.

Standartlaştırılmış tüm örnek küme elemanları k sayıda sınıfa ayrılır (Şekil 27).

Şekil 27: Sınıf orta değerleri ve yığılmaları

Sonuçta her bir i numaralı sınıftaki eleman sayısı ni kadar olur. Böylece, bütün sınıflardaki eleman sayıları toplamı,

nn1n2...nk 9-9 örnekleme kümedeki toplam eleman sayısına eşit bir değer kadardır. Buna göre;

her sınıf aralığına düşen ni eleman sayısı, aynı zamanda o aralığın sınıf yığılmaları olarak adlandırılır.

0 z

(13)

261

Buna ilave olarak da her bir sınıfa düşen elemanların sınıf ortalaması zi, standart rastgele değişkenin umut değeri  ve standart sapması da  ile ifade edilebilir.

Böylece, her bir x rastgele değişkeni için standart normal dağılıma sahip z standartlaştırılmış rastgele değişken değeri, parametreler için tahmin değerleri kullanılarak,

s x x zx   ˆ

 9-10

bağıntısından hesaplanabilir.

Bu şekildeki bir x rastgele değişkenlerinin standartlaştırılmış bir z rastgele değişken haline dönüştürmede kullanılan bu (9-10) formülün de  parametresi yerine kullanılan deneysel ortalama tahmin değeri;

n x x

x x    n

 ...

ˆ 1 2 9-11

şeklinde örnek kümedeki toplam elemanların bir ortalaması olarak hesaplanmaktadır.

Benzer şekilde, deneysel standart sapması da,

2

12

1 ˆ) (





n

x

s x 9-12

bağıntısından elde edilen bir değer olmaktadır. Ayrıca, her bir sınıfın bağıl yığılması da,

n

fini 9-13

kadar olmaktadır.

f(z)

d

f(z):Kuramsal dağılım fonksiyonu eğrisi

(14)

npi

Şekil 28: Sınıf aralığı ve kuramsal sınıf yığılmaları

Burada her bir sınıf aralığı ve kuramsal sınıf yığılmalarına bir örnek olarak, f(z) : Normal dağılımın yoğunluk fonksiyonunu,

npi: Sınıf yığılmalarının kuramsal değerlerini, d : Sınıf aralığının genişliğini

göstermek üzere, Şekil 28 ‘deki grafikte görüldüğü gibi verilebilir. Neticede, n elemanlı bir örnekleme küme için, Bağıl sınıf yığılmalarının kuramsal değeri için de

Sınıf sayısı : k n1

Sınıf genişliği :

k x d xmax min

olmak üzere,

2) ( 2)

( d

d z z F

pii  i

formülü kullanılarak hesaplanabilir.

Bilindiği gibi, istatistik olarak irdelenecek bir örnekleme küme normal dağılımda ise, bu kümenin elemanlarından türetilen her bir PEARSON rastgele değişkeni de standartlaştırılmış normal dağılımda olur. Buna göre; standartlaştırılmış bir PEARSON rastgele değişkeni,

) 1 , 0 ( N np

np n

i i

i

olarak ifade edilebilir. Buradan görüldüğü gibi bu standart rastgele değişkenlerden her biri sıfır ortalama değerli ve bir varyanslı bir standart normal dağılımda olur. Toplam n elemanlı ve k sınıf sayılı bir örnekleme küme için, her bir sınıf aralığına ilişkin verileri temsil eden böyle bir rastgele değişkenin değeri; pozitif ve negatif işaretli olabilir.

(15)

Neticede, toplamları alındığında, toplamları sıfırdan farklı bir değer olabileceği gibi sıfır değerinde de olabilir. Sıfır olma durumu sonuçların elemanter istatistik veri analizi yönünden bir anlam taşımadığından, hata teorisi açısından da gerçeği tam yansıtmamaktadır. Bunun yerine daha gerçekçi bir yaklaşım; her bir sınıf aralığındaki farkların toplam olasılığını temsil eden alanlar farkı toplamı şeklindeki bir rastgele değişken tanımı esas alınır. Bu durumda, böyle bir rastgele değişkenin karesel biçimde, yani normal dağılımlı rastgele değişkenlerin kareleri toplamı biçiminde ifade edilmesine de olanak sağlamış olur. Buna göre de her bir sınıf aralığı için tanımlanan standart PEARSON rastgele değişkeninin karesi alınarak,

k

i i

i i

np np n

1

2 2

0

)

(

şeklinde yeni bir rastgele değişken tanımlanabilir. Bu rastgele değişken, asimtotik olarak f serbestlik derecesine göre tanımlı kılınmış bir 2 dağılımına uymaktadır. Bir çok uygulamalar için bu şekildeki bir 2 dağılımının f serbestlik derecesi aşağıdaki gibi verilmiş olan formüllerden hesaplanabilir.

Böyle bir işlem; xN(,2) rastgele değişkenin evrensel kümenin dağılım parametreleri olan,

  ve parametrelerinin bilinmesi durumunda normal dağılıma sahip standart rastgele değişken,

xz

ve serbestlik derecesi de fk1 formülünden hesaplanır. Böylece,2 dağılımı için de serbestlik derecesi aynı şekilde fk1 olarak alınır.

  ve dağılım parametrelerinin bilinmediği durumlarda, bunların yerine ve s kestirim değerleri kullanılır ve verilerin standartlaştırılması,

s x zxˆ

şeklinde yapılır. Burada serbestlik derecesi de f k3 olur. Buna göre 2- dağılımının serbestlik derecesi f k3 alınır. ve dağılım

(16)

parametrelerinin bilinmediği durumlarda, bunların yerine u sayıda bilinmeyeni içeren herhangi bir dengeleme probleminin çözümünden hesaplanan ve s ortalama ve standart sapma için kestirim değerleri kullanıldığında; 2- dağılımının serbestlik derecesi f ku1 alınarak işlemler yapılır.

1. Sonuçta, 1S yanılma olasılığına ve f serbestlik derecesine göre ilgili 2-dağılım tablosundan bir 2f, sınır değeri alınır.

2. Sonra bu değer test büyüklüğü ile karşılaştırılır. Bu karşılaştırma neticesinde eğer, 022f, ise H0 sıfır hipotezi kabul, Hs seçenek hipotezi ret edilir.

3. Yorum: 1S yanılma olasılığına ve f serbestlik derecesine göre veriler normal dağılımda oldukları kabul edilebilir.

4. Bu karşılaştırma neticesinde eğer, 2, 2

0

f ise; H0 sıfır hipotezi ret, H seçenek hipotezi kabul edilir. s

5. Yorum: 1S yanılma olasılığına ve f serbestlik derecesine göre veriler normal dağılımda olmadıkları kabul edilebilir.

Not: Yapılan birçok araştırmaların neticesinde, bir örnekleme kümesinin normal dağılımda olup olmadıklarının 2-uyum testi ile irdelenmesinde örnek veri kümesinin eleman sayısının 30 ‘dan daha fazla olması (n30) ve her bir sınıfla ilgili kuramsal sınıf yığılmaları sayısının da npi4 olduğunda, komşu sınıflar birleştirilerek işlemler yapılması önerilmektedir. Pratikte, böyle bir durumun gerçekleşmemesi halinde, 2-uyum testinin uygulanmasında hiçbir zaman arzu edilmeyen sonuçlar doğuran bazı bilgi kaybına neden olunmaktadır. Böyle bir çözüm 2-uyum testi matematiğinde hiç de arzu edilen bir durum olmamaktadır.

Uygulamada, bunun yerine hiç bir alt sınırlama gerektirmeyen Kolmogorow- Smirnow testi gibi diğer bazı test yöntemlerinin uygulanması önerilir.

Ayrıca, burada bir başka not olarak söylemek gerekirse; 02-test büyüklüğünün,

2 1 ,

f sınır (kritik) değerlerine yakın olduğu durumlarda test sonucu, sınıf sayısı

(17)

k ve sınıf sınırlarının seçimine bağımlı olmaktadır. Böyle durumlarda etkin bir test için sınıf aralıklarının uygun genişlikte seçilmiş olması sorunu giderebilir nitelikte bir çözüm olmaktadır.

Örnek: Bir problemin çözümüyle ilgili n50 adet ölçmeler sonucunda, x = i 17,5 18,4 18,5 18,6 19,2 19,2 19,4 19,5 19,6

19,7 19,8 20,2 20,3 20,4 20,6 20,7 20,8 21,1 21,2 21,3 21,4 21,5 21,6 21,7 21,8 21,9 22,1 22,2 22,3 22,4 22,6 22,7 22,8 22,9 23,2 23,3 23,4 23,5 23,6 23,7 23,8 24,1 24,3 24,5 24,7 24,9 25,2 25,5 25,8 26,5mm,

şeklinde verilmiş olan verniyer okuması değerlerinin S=0,95 güvenle 2- uyum testine göre normal dağılımda olup olmadıklarının istatistik olarak irdelenmesi istenmektedir.

Çözüm: Böyle bir hipotezin istatistik olarak irdelenebilmesi için daha önce konuyla ilgili kuramsal açıklamalar kısmında söylendiği gibi, önce

) ˆ, (

0:x N xs

H veriler normal dağılımdadır.

veriler normal dağılımda değildir

şeklinde bir hipotez kurulur. “Böyle bir durumda sıfır hipotezi ile ilgili hesaplamalar açısından büyük kolaylıklar sağlaması nedeniyle, böyle problemlerin çözümünde ilk şekliyle verilmiş olan veri kümesi elemanları işaretleri de dahil bir büyüklük sırasına göre sıraya dizilir. Bu örnekte, verniyer okuması değerleri küçükten büyüğe doğru sıralanmış biçimde verildiklerinden bu gibi bir işleme gerek duyulmamaktadır.”

İkinci işlem adımında test büyüklüğünü hesaplamak amacıyla, örnek veri kümesinin istatistik dağılım parametreleri örnekleme veri kümesi elemanlarından kestirilir. Bu amaçla; ölçü sayısı n=50 olduğu verilerin sayılmasından hemen fark edilmektedir. Daha sonra, bu örnekleme ölçü kümesinin,

Ortalama değeri :

 

n mm

x x 21,918 21,9 50

9 ,

ˆ 1095  

Sınıf sayısı : k n1 5018

s: H

(18)

Deneysel standart sapması:

 

. 12

12 2

14 , 49 2

3538 , 225 1

ˆ) (

n mm

x

s x





Sınıf aralığı : mm

k x

d x 1

8 5 , 17 5 ,

min 26

max  

 

olarak hesaplanır

Tablo 16: 02 Rastgele değişkeninin tablo halinde hesabı

Sınıf No Sınıf sınırları x z

F(z)

ni pi npi ninpii2

1   0.0000

2

17.9 -1.87 0.0307

4 0.0808 4.04 -0.04 0.0004

3

18.9 -1.40 0.0808

7 0.0954 4.77 2.23 1.0425

4

19.9 -0.93 0.1762

6 0.1430 7.15 -1.15 0.1850

5

20.9 -0.47 0.3192

9 0.1808 9.04 -0.04 0.0002

6

21.9 0.00 0.5000

8 0.1808 9.04 -1.04 0.1196

7

22.9 0.47 0.6808

7 0.1430 7.15 -0.15 0.0003

8

23.9 0.93 0.8238

5 0.0954 4.77 0.23 0.0111

9

24.9 1.40 0.9192

4 0.0808 4.04 -0.04 0.0004

10

25.9 1.87 0.9693

  1.0000

50 50

02 1.3595 Böyle bir işlem pratiklik açısından burada anlatılmış olanlara göre, bir arada, Tablo 16 ‘deki gibi hesaplanarak, ilgili test büyüklüğü 021,3595 olarak elde edilir. Üçüncü işlem adımı olarak, hesaplanan bu test büyüklüğüne karşılık gelen standart dağılımlı 2-tablo değeri, f k3835 serbestlik derecesi ve

05 .

0

 yanılma olasılığına göre ilgili 2-dağılım tablosundan, 07

,

2 11

95 . 0 1 , 5 2

1

,

f olarak alınır.

(19)

Dördüncü işlem adımında bu iki değer karşılaştırılır. Sonuçta, 022f, olduğundan H0 sıfır hipotezi kabul, Hs seçenek hipotezi ret edilir.

Yorum: Bu x verniyer okuması değerleri i0,05 yanılma olasılığı ile )

14 , 2 , 9 , 21

( 2

N

xi parametrelerine göre normal dağılımda oldukları kabul edilebilir.

9.3. Mann-Wald Uyum Testi

Günümüzde, sonlu sayıda bir örnekleme küme elemanlarının normal dağılıma uyum iyiliği ile ilgili kullanılan bir diğer 2 bazlı istatistik hipotez testi de Mann-Wald uyum testidir. Bu hipotez testinde, bir evrensel kümeyle ilgili n adet örnekleme veriden oluşan bir örnekleme veri kümesinin Mann-Wald uyum testi kullanılarak normal dağılımda olup olmadığının istatistik olarak irdelenebilmesi için, öncelikle bu problemle ilgili,

0:

H xN(xˆ,s2) Bu veriler ortalama ve s standart sapma değerlerine göre normal dağılımdadır.

Normal dağılımda değildir.

biçiminde bir sıfır hipotezi kurulur. Sonra, böyle bir sıfır hipotezinin istatistik olarak irdelenebilmesi için önce, örnekleme kümenin elemanları, her bir sınıf aralığına düşen sınıf bağıl yığılmaları sabit ve n örnek kümedeki eleman sayısı olmak üzere,

3

n k

formülünden hesaplanan sınıf sayısından faydalanılarak, k

nin 9-14

bağıntısından hesaplanacak değere eşit olacak biçimde, farklı genişlikteki sınıf aralıklarına ayrılır. Bu durumda,  0,05 yanılma olasılığı için testin gücü maksimum seviyeye ulaşmış olmaktadır. Aynı şekilde, sınıfların bağıl yığılmalarının kuramsal değerleri de eşit olur. Bu değerler,

pk1 ve n p=sabit 9-15

s: H

(20)

bağıntısından kolayca hesaplanabilir. Burada i histogram dağılımındaki sınıf aralıklarının en soldan sağa doğru ya da en küçük değerliden en büyük değerliye doğru sınıf numarasını göstermektedir. Buna göre, her bir sınıfa ilişkin dağılım fonksiyonunun F(zi) değeri,

p i z

F( i) . …..;…i1,2,..,k 9-16 formülünden hesaplandıktan sonra bunlara karşılık gelen standartlaştırılmış rastgele değişkenin elemanları standart normal dağılım tablosundan alınır. Sonra sınıf sınırları, s deneysel standart sapma değerine göre,

xixˆszi 9-17

bağıntısından hesaplanabilir. Böylece, her bir aralığa ilişkin kuramsal sınıf yığılmaları np=sabit olduğundan test büyüklüğü,

 

np np n np

np

n i

k i

i

2

1

2 2

0

) ( )

(

 olarak elde edilir.

Daha sonra, bu şekilde hesaplanmış olan test büyüklüğü, f k3 serbestlik derecesine ve seçilen 1S yanılma olasılığına göre ilgili 2-dağılım tablolarından alınan 2f, tablo sınır (kritik) değeri ile karşılaştırılır.

Bu karşılaştırma sonucunda; eğer 022f, ise; H0 sıfır hipotezi kabul, Hs seçenek hipotezi ret edilir.

Yorum: sıfır hipotezinin kabul edildiği bu durumda; örnek küme elemanlarının

S

1

 yanılma olasılığına ve ortalama, s standart sapma değerlerine göre normal dağılımdadır denir.

Tersi durumda, eğer 02 2f, olursa; o zaman H0 sıfır hipotezi ret, Hs seçenek hipotezi kabul edilir.

Yorum: seçenek hipotezinin kabul edildiği bu durumda; örnek küme elemanlarının 1S yanılma olasılığına, ortalama ve s standart sapma değerlerine göre normal dağılımda olmadıkları söylenebilir.

(21)

Örnek: Bir problemin çözümüyle ilgili n50 adet ölçmeler sonucunda, xi= 17,5 18,4 18,5 18,6 19,2 19,2 19,4 19,5 19,6

19,7 19,8 20,2 20,3 20,4 20,6 20,7 20,8 21,1 21,2 21,3 21,4 21,5 21,6 21,7 21,8 21,9 22,1 22,2 22,3 22,4 22,6 22,7 22,8 22,9 23,2 23,3 23,4 23,5 23,6 23,7 23,8 24,1 24,3 24,5 24,7 24,9 25,2 25,5 25,8 26,5mm,

olarak verilmiş olan verniyer okuması değerlerinin S=0,95 güvenle Mann-Wald Uyum Testine göre normal dağılımda olup olmadıklarının istatistik olarak irdelenmesi istenmektedir.

Çözüm: Böyle bir problemin verilen yanılma olasılık değerine göre istatistik irdelenmesinde ilk işlem adımı olarak,

0:

H xN(xˆ,s) Bu veriler ortalama ve s standart sapma değerlerine göre normal dağılımdadır.

s:

H Normal dağılımda değildir.

şeklinde bir sıfır hipotez testi kurulur.

Böyle bir istatistik problemin bu yöntemle test edilmesinde standart dağılıma sahip test büyüklüğü değeri; bu verniyer okumaları için n=50 ölçüden kurulu örnekleme kümenin ilgili hipotez irdeleme değerleri,

Sınıf Sayısı : k n3 50310 Ortalama değeri :

 

n mm

x x 21.918 21.9 50

9 .

ˆ 1095  

Deneysel standart sapması : s2.14mm. Sınıf bağıl yığılmaları :  10.1

p k

Sınıf yığılması : np50*0.15

olarak hesaplanır. Sonra, sıfır hipoteziyle ilgili standart rastgele değişken değeri ya da diğer adıyla test büyüklüğü değeri; daha önce 9.3 bölümünde anlatılan Mann-Wald Uyum Testi işlem algoritmasına uygun olarak Tablo 17 ‘deki gibi hesaplanarak, 02 test büyüklüğü, 02 1.6 olarak elde edilir.

(22)

Tablo 17: 02 Rastgele değişkeninin tablo halinde hesabı

Sınıf No

sınıf sınırları ni ninp (ninp)2 F(z) z x

1

0,0  

4 -1 1

2

0,1 -1,28 19,1608

7 2 4

3

0,2 -0,84 20,1024

5 0 0

4

0,3 -0,52 20,7872

4 -1 1

5

0,4 -0,25 21,3650

5 0 0

6

0,5 0,00 21,9000

5 0 0

7

0,6 0,25 22,4350

4 -1 1

8

0,7 0,52 23,0128

5 0 0

9

0,8 0,84 23,6976

5 0 0

10

0,9 1,28 24,6392

6 1 1

11 1,0  

Toplam Ölçü sayısı : n50

(ninp)2

8

Test büyüklüğü değeri :

 

1,6

5 8 )

( 2

2

0

np np ni

Böyle bir tablo değerlerinin hesaplanmasında önce her aralığa düşen sınıf bağıl yığılmaları, ikinci sütunda görüldüğü gibi, p0,1 sınıf bağıl yığılması değerine göre hesaplanır. Sonra bu değerleri karşılık gelen z standart normal dağılımlı rastgele değişken değerleri normal dağılım tablolarından alınır. Buradan x rastgele değişken değeri hesaplanır. Nihayet, gerekli değerlerin kullanılmasından, diğer bütün sütun bilgileri de elde edilir.

Daha sonra, buna karşılık gelen standart tablo değeri; 1S0,05 yanılma olasılığı ve f=k-3=10-3=7 serbestlik derecesine göre 2-dağılım tablosundan

Referanslar

Benzer Belgeler

We herein report an adult case with two neighboring congenital anterior scleral staphylomas confirmed with ultrasound biomicroscopic imaging, with no associated ocular

• IV.EVRE:Plasenta ve zarların atılmasından sonra geçen 2-4 saatlik süredir... DOĞUM EYLEMİNDE EVRELERİN SÜRESİ ANNENİN PRİMİPAR YA DA MULTİPAR OLMASINA

 Yenidoğanın kan basıncı doğumdan hemen Yenidoğanın kan basıncı doğumdan hemen sonra çok yüksekken, 3 saat içinde düşer ve sonra çok yüksekken, 3 saat içinde

 Cantor normal

Beyin parankiminde, özellikle periventriküler beyaz cevherde ve inferior frontal girusda, gadobutrol kontrast tutulumunun iNBH grubunda daha yüksek oranda olduğu

PTS semptomlar› olan bafl a¤r›s›, bulan›k görme, vizüel kay›p ve disk ödemi olmas› nedeniyle klasik PTS tedavisi uygulanan hastan›n yak›nmalar›nda düzelme

 arasında, malzemenin elastisite modülüne bağlı Deneysel olarak, normal gerilme ile uzama oranı olarak doğrusal bir ilişki vardır..  Elastisite modülü

Malokluzyon ‘‘Aynı dental ark içindeki ya da karşıklıklı dental arklar arasındaki dişlerin normal ilişkisinden sapma durumu,,... molar dişin mesiobukkal tüberkülünün