• Sonuç bulunamadı

Fizik Anabilim Dalı Ocak 2013 YÜKSEK LİSANS TEZİ şıcı Radon Gazı Yoğunluğu Ölçümlerinin Detaylı İstatistiksel Analizleri Celal A

N/A
N/A
Protected

Academic year: 2022

Share "Fizik Anabilim Dalı Ocak 2013 YÜKSEK LİSANS TEZİ şıcı Radon Gazı Yoğunluğu Ölçümlerinin Detaylı İstatistiksel Analizleri Celal A"

Copied!
156
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

Radon Gazı Yoğunluğu Ölçümlerinin Detaylı İstatistiksel Analizleri Celal Aşıcı

YÜKSEK LİSANS TEZİ Fizik Anabilim Dalı

Ocak 2013

(2)

Detailed Statistical Analysis for The Measurements of Radon Gas Concentration Celal Aşıcı

MASTER OF SCIENCE THESIS Department of Physics

January 2013

(3)

Radon Gazı Yoğunluğu Ölçümlerinin Detaylı İstatistiksel Analizleri

Celal Aşıcı

Eskişehir Osmangazi Üniversitesi Fen Bilimleri Enstitüsü Lisansüstü Yönetmeliği Uyarınca

Fizik Anabilim Dalı Nükleer Fizik Bilim Dalında

YÜKSEK LİSANS TEZİ Olarak Hazırlanmıştır.

Danışman: Prof. Dr. Emel ALĞIN

OCAK 2013

(4)

Fizik Anabilim Dalı Yüksek Lisans öğrencisi Celal AŞICI’nın YÜKSEK LİSANS tezi olarak hazırladığı “Radon Gazı Yoğunluğu Ölçümlerinin Detaylı İstatistiksel Analizleri” başlıklı bu çalışma, jürimizce lisansüstü yönetmeliğin ilgili maddeleri uyarınca değerlendirilerek kabul edilmiştir.

Danışman : Prof. Dr. Emel ALĞIN

İkinci Danışman : -

Yüksek Lisans Tez Savunma Jürisi:

Üye : Prof. Dr. Emel ALĞIN

Üye : Prof Dr. Atalay KÜÇÜKBURSA

Üye : Doç. Dr. Kıvanç AKSOY

Üye : Yrd. Doç. Dr. Derya PEKER

Üye : Yrd. Doç. Dr. Sertaç EROĞLU

Fen Bilimleri Enstitüsü Yönetim Kurulu’nun ... tarih ve ... sayılı kararıyla onaylanmıştır.

Prof. Dr. Nimetullah BURNAK Enstitü Müdürü

(5)

ÖZET

Yaşadığımız çevreden aldığımız radyasyonun %85’i doğal radyasyon kaynaklarından gelmektedir. Doğal radyasyon kaynakları; kozmik radyasyon, gama ışınları, vücut içi ışınlanma ve radon gazı olarak sıralanır. Doğal radyasyon kaynaklarından alınan dozun %50’lik bir kısmı radon gazı ve ürünlerinin sebep olduğu radyasyondur. Radyoaktif radon gazı; renksiz, kokusuz ve tatsız bir gazdır. Bundan dolayı varlığı sadece ölçümler ile ispatlanabilir. Radon gazı ölçümlerinin en yaygın metodu pasif detektörler olan katıhal nükleer iz kazıma detektörleridir. Bu tez çalışmasında, Eskişehir il merkezindeki evlerde LR-115 detektörleriyle yapılan ölçümler kullanılmıştır. Ölçümler dört mevsim (kış, ilkbahar, yaz, sonbahar) için ayrı ayrı yapılmıştır.

Radon yoğunluğu ile ilgili birçok çalışmada istatistiksel metotlardan faydalanılır.

Bu metotlardan yararlanabilmek için veri setinin belirli bir dağılıma uyması gerekmektedir. Kapalı alan radon yoğunlukları log-normal dağılıma uyarlar. Yani radon yoğunluğu verileri logaritmik dönüşüm ile normal dağılım gösterirler.

Radon yoğunluğu verilerinin normal dağılım gösterip göstermediğini test etmek için normallik testleri uygulanır. Bu çalışmada; Kolmogorov-Smirnov, Lilliefors, Shapiro-Wilk, Anderson-Darling ve χ2 normallik testleri incelenmiştir. Radon yoğunluğu verilerinin normal dağıldıkları, uygulanan bütün testlerde görülmüştür.

Ortalama radon yoğunluğunun mevsimsel farklılıkları t-testi ve tek-yönlü ANOVA ile gösterilmiştir.

Anahtar Kelimeler: Radon, z-testi, t-testi, Kolmogorov-Smirnov, Lilliefors, Shapiro- Wilk, Anderson-Darling , χ2, ANOVA.

(6)

85% of radiation we receive from environment we live in comes from natural sources. The natural radiation sources can be listed as cosmic radiation, terrestrial gamma rays, inner body irradiation, and radon gas. Around 50% of the dose received from natural radiation sources is caused by radon gas and its daughters. Radioactive radon gas is a colorless, odorless, and tasteless gas. Therefore, its presence can only be proved by measurement. The most common method to measure radon gas employs solid-state nuclear track detectors or passive detectors. In this study, we used radon concentration measurements performed with LR-115 passive detectors in the dwellings of Eskişehir city center. The measurements were taken for four seasons (winter, spring, summer, and autumn).

Many studies related to radon concentrations utilize statistical methods. To benefit from these methods, the data set must conform to a specific distribution. Indoor radon concentrations follow a log-normal distribution. In other words, log-transformed radon concentration data follow normal distribution.

Normality tests are applied to test whether the radon concentration data show normal distribution. In this study, Kolmogorov-Smirnov, Lilliefors, Shapiro-Wilk, Anderson-Darling and χ2 normality tests were investigated. All of these tests showed that radon concentration data follow normal distribution. Seasonal variation in the average radon concentration data is shown by the t-test and one-way ANOVA.

Keywords: Radon, z-test, t-test, Kolmogorov-Smirnov, Lilliefors, Shapiro-Wilk, Anderson-Darling , χ2, ANOVA

(7)

TEŞEKKÜR

Yüksek lisans çalışmalarım boyunca bilgilerini benden esirgemeyen ve öğütleriyle yol gösteren değerli hocam ve tez danışmanım Sayın Prof. Dr. Emel ALĞIN hocama teşekkür ediyorum.

Radon yoğunluğu ölçüm çalışmalarında birlikte çalıştığımız değerli arkadaşlarım Sayın Hacı SOĞUKPINAR’a ve Melekşah ALTINSÖZ’e emek ve gayretlerinden dolayı teşekkürlerimi sunuyorum. Ayrıca bu çalışmalar süresince yardımlarını bizden esirgemeyen Arş. Gör. Hakan ÇETİNKAYA’ya ve Atacan KILIÇGEDİK'e teşekkür ediyorum.

Bu çalışmadaki istatistik analiz yöntemlerinin uygulanmasına yönelik değerli katkılarından dolayı Sayın Doç. Dr. Kıvanç AKSOY hocama ve tezdeki düzeltmelerinden dolayı Sayın Yrd. Doç. Dr. Sertaç EROĞLU, Prof. Dr. Atalay KÜÇÜKBURSA ve Yrd. Doç. Dr. Derya PEKER hocalarıma teşekkürlerimi bir borç biliyorum.

Çalışmalarım boyunca her zaman yanımda olan ve desteklerini hiçbir zaman esirgemeyen eşime ve aileme teşekkür ediyorum.

Bu çalışma; Eskişehir Osmangazi Üniversitesi Bilimsel Araştırma Projeleri:

2010/19014 nolu “Mevsimsel ve Yıllık Ortalama Radon Yoğunluğu Ölçümü ve Mevsimsel Düzeltme Faktörü Hesabı” isimli proje ile desteklenmiştir.

(8)

ÖZET ... v

SUMMARY ... vi

TEŞEKKÜR ... vii

ŞEKİLLER DİZİNİ ... xii

ÇİZELGELER DİZİNİ ... xiv

SİMGELER VE KISALTMALAR DİZİNİ ... xvii

1. GİRİŞ VE AMAÇ ... 1

2. İSTATİSTİKSEL KAVRAMLAR ... 6

2.1. Anakütle ... 6

2.2. Örneklem ... 6

2.3. Güven Aralığı ... 7

2.4. Serbestlik Derecesi (Degrees Of Freedom) ... 8

2.5. Tanımlayıcı İstatistikler ... 8

2.5.1. Merkezi eğilim ölçüleri ... 9

2.5.1.1. Aritmetik ortalama ... 9

2.5.1.2. Geometrik ortalama ... 10

2.5.1.3. Harmonik ortalama ... 11

2.5.1.4. Mod ... 12

2.5.1.5. Medyan ... 13

2.5.1.6. Kartiller ... 15

2.5.2. Değişkenlik ölçüleri ... 17

2.5.2.1. Değişim aralığı (range) ... 17

2.5.2.2. Ortalama mutlak sapma ... 17

2.5.2.3. Varyans (σ2) ... 19

2.5.2.4. Standart sapma (σ) ... 19

2.5.2.5. Varyasyon katsayısı ... 21

(9)

İÇİNDEKİLER DİZİNİ (devam)

Sayfa

2.5.3. Çarpıklık ölçüleri (skewness) ... 22

2.5.3.1. Pearson çarpıklık (asimetri) ölçüsü ... 24

2.5.3.2. Bowley çarpıklık (asimetri) ölçüsü ... 24

2.5.4. Basıklık ölçüleri (kurtosis) ... 24

3. İSTATİSTİKSEL DAĞILIMLAR (OLASILIK DAĞILIMLARI) ... 27

3.1. Poisson Dağılımı ... 27

3.2. Normal Dağılım (Gauss Dağılımı) ... 29

3.3. Standart Normal Dağılım ... 31

3.4. Log-Normal Dağılım ... 32

3.5. Binalardaki Radon Düzeylerinin Log-Normal Dağılımı ... 33

3.6. Box-Cox Veri Dönüşüm Metodu ... 35

4. NORMAL DAĞILIM TESTLERİ ... 38

4.1. Grafik Metotlar ... 39

4.1.1. Kutu grafiği ... 39

4.1.2. Kümülatif olasılık grafiği ... 40

4.1.3. Q-Q grafiği ... 41

4.2. Uygunluk Testleri ... 43

4.2.1. Kolmogorov-Smirnov ve Lilliefors testleri ... 43

4.2.1.1. Kolmogorov-Smirnov testi ... 44

4.2.1.2. Lilliefors testi ... 45

4.2.2. Ki-kare (χ2) uygunluk testi ... 46

4.2.3. Shapiro-Wilk testi ... 47

4.2.4. Anderson-Darling testi ... 49

(10)

5. HİPOTEZ KAVRAMI ... 51

5.1. Hipotezin Tanımı ... 51

5.1.1. Tek ve çift yönlü hipotez testleri ... 52

5.1.2. p-değeri ... 54

5.2. Hipotez Testleri ... 56

5.2.1. z-testi ... 56

5.2.2. t-testi ... 58

5.2.3. Varyans analizi (ANOVA) ... 63

5.2.3.1. Tek-yönlü ANOVA ... 64

5.2.3.2. İki-yönlü ANOVA ... 66

5.2.3.3. Varyans homojenlik testi ... 67

6. DENEYSEL VERİLERİN İSTATİSTİKSEL ANALİZLERİ ... 69

6.1. Grafik Metot Uygulamaları ... 76

6.1.1. Kutu grafiği ... 76

6.1.2. Q-Q grafiği ... 77

6.1.3. Grafik metot yardımı ile arkafon bulunması ... 80

6.2. Normallik Testleri Uygulamaları ... 83

6.2.1. Lilliefors düzeltmeli K-S testi uygulaması ... 84

6.2.2. χ2 uygunluk testi uygulaması ... 87

6.2.3. Shapiro-Wilk testi uygulaması ... 91

6.2.4. Anderson-Darling testi uygulaması ... 96

6.3. ANOVA uygulamaları ... 101

6.3.1. Tek yönlü ANOVA ... 101

(11)

İÇİNDEKİLER DİZİNİ (devam)

Sayfa

6.3.1.1. Farklı gözlemci sonuçları arasındaki farkların testi ... 101

6.3.1.2. Mevsimsel radon yoğunlukları arasındaki farkların testi ... 105

6.4. t-testi Uygulaması ... 106

7. SONUÇ VE TARTIŞMA ... 109

KAYNAKLAR DİZİNİ ... 112

EKLER ... 120

(12)

Şekil Sayfa

2.1 Dağılım fonksiyonu grafiğinde %95 güven aralığı gösterimi ... 7

2.2 Tanımlayıcı istatistikler ... 9

2.3 Simetrik dağılımlar için standart sapma uzaklıklarında verilerin yüzdelikleri ... 21

2.4 a) Negatif (Sola) çarpıklık b) Pozitif (Sağa) çarpıklık ... 23

2.5 Dağılımın sivrilik-basıklık gösterimi ... 25

3.1 Poisson dağılım örnekleri ... 29

3.2 Normal dağılım örnekleri ... 31

3.3 Log-normal dağılım grafikleri ... 32

3.4 λ değerinin hesaplanmasına bir örnek (Osborne’dan, 2010) ... 36

4.1 Kutu grafigi ... 39

4.2 Normal kümülatif dağılım grafiği ... 40

4.3 Verilerin gözlenen ve beklenen değerlerinin q-q grafiği ... 42

4.4 Standartlaştırılmış verilere göre q-q grafiği ... 43

5.1 Tek yönlü hipotez ... 53

5.2 Çift yönlü hipotez ... 53

5.3 p-değeri ... 55

5.4 Tek yönlü ve çift yönlü testlerde H0 hipotezinin kabul ve ret bölgeleri ... 56

6.1 Radon yoğunluğu ortalamalarının mevsimlere göre değişimi ... 71

6.2 Box-Cox dönüşümü için λ eğim değeri ... 74

6.3 Mevsimsel radon yoğunluklarının frekans dağılımları ... 75

6.4 Mevsimsel radon yoğunluklarının logaritmik dönüşüm yapıldıktan sonraki frekans dağılımları ... 75

6.5 Mevsimlere göre dönüştürülmüş radon yoğunluğu ölçüm değerlerinin kutu grafiği ... 76

6.6 Kış mevsimi dönüştürülmüş radon yoğunluğu verilerinin standart normal dağılıma göre q-q grafiği ... 77

(13)

ŞEKİLLER DİZİNİ (Devam)

Şekil Sayfa

6.7 İlkbahar mevsimi dönüştürülmüş radon yoğunluğu verilerinin standart normal dağılıma göre q-q grafiği ... 78 6.8 Yaz mevsimi dönüştürülmüş radon yoğunluğu verilerinin standart normal

dağılıma göre q-q grafiği ... 79 6.9 Sonbahar mevsimi dönüştürülmüş radon yoğunluğu verilerinin standart

normal dağılıma göre q-q grafiği ... 80 6.10 İngiltere ulusal arkafon düzeltmesiz radon yoğunlukları için normal olasılık

grafiği (Gunby’den, 1993) ... 81 6.11 İngiltere ulusal arkafon düzeltmeli radon yoğunlukları için normal olasılık

grafiği (Gunby’den, 1993) ... 81 6.12 İrlanda arkafon düzeltmesiz radon yoğunluğu değerlerinin logaritmik

dönüşümlü ve standartlaştırılmış q-q grafiği (Fennell’den, 2002) ... 82 6.13 İrlanda arkafon düzeltmeli radon yoğunluğu değerlerinin logaritmik

dönüşümlü ve standartlaştırılmış q-q grafiği (Fennell’den, 2002) ... 83 6.14 Eskişehir il merkezinin katlara göre yıllık ortalama radon yoğunlukları ... 108

(14)

Çizelge Sayfa

2.1 Örnek bir veri setinin frekans değerleri ... 12

2.2 Örnek bir veri setinin frekans değerleri ve kümülatif frekans değerleri ... 14

2.3 Örnek bir veri setinin kümülatif frekans değerleri ... 16

2.4 Ortalama mutlak sapma için hesaplamalar ... 18

3.1 Önerilen Box-Cox güç dönüşümleri ... 37

4.1 İstatistikte kullanılan simetrik çizim pozisyonları ... 41

4.2 Anderson-Darling testi kritik değerleri ... 50

5.1 Hipotez testi karar verme hata tipleri ... 52

5.2 H0 hipotezine karşı kanıt skalası ... 54

5.3 Mevsimlere göre katlardaki ölçüm ortalamaları ... 66

5.4 İki yönlü varyans hesaplamaları ... 67

6.1 Mevsimsel radon gazı ölçümlerinin geometrik ortalama, geometrik standart sapma ve standart hataları ... 70

6.2 Box-Cox dönüşümü için λ değeri hesaplamaları ... 73

6.3 Kış mevsimi dönüştürülmüş radon yoğunluğu ölçümlerinin Lilliefors testi uygulaması ... 84

6.4 İlkbahar mevsimi dönüştürülmüş radon yoğunluğu ölçümlerinin Lilliefors testi uygulaması ... 85

6.5 Yaz mevsimi dönüştürülmüş radon yoğunluğu ölçümlerinin Lilliefors testi uygulaması ... 86

6.6 Sonbahar mevsimi dönüştürülmüş radon yoğunluğu ölçümlerinin Lilliefors testi uygulaması ... 87

6.7 Kış mevsimi dönüştürülmüş radon yoğunluğu verilerine χ2 uygunluk testi uygulaması ... 88

(15)

ÇİZELGELER DİZİNİ (Devam)

Çizelge Sayfa

6.8 İlkbahar mevsimi dönüştürülmüş radon yoğunluğu verilerine χ2 uygunluk testi

uygulaması ... 89

6.9 Yaz mevsimi dönüştürülmüş radon yoğunluğu verilerine χ2 uygunluk testi uygulaması ... 90

6.10 Sonbahar mevsimi dönüştürülmüş radon yoğunluğu verilerine χ2 uygunluk testi uygulaması ... 91

6.11 Kış mevsimi dönüştürülmüş radon yoğunluğu verileri için S-W testi hesaplamaları ... 92

6.12 İlkbahar mevsimi dönüştürülmüş radon yoğunluğu verileri için S-W testi hesaplamaları ... 93

6.13 Yaz mevsimi dönüştürülmüş radon yoğunluğu verileri için S-W testi hesaplamaları ... 94

6.14 Sonbahar mevsimi dönüştürülmüş radon yoğunluğu verileri için S-W testi hesaplamaları ... 95

6.15 Sonbahar mevsimi radon yoğunlukları aykırı verileri çıkarılmış S-W testi hesaplamaları ... 96

6.17 Kış mevsimi dönüştürülmüş radon yoğunluğu verileri için A-D testi ... 97

6.18 İlkbahar mevsimi dönüştürülmüş radon yoğunluğu verileri için A-D testi ... 98

6.19 Yaz mevsimi dönüştürülmüş radon yoğunluğu verileri için A-D testi ... 99

6.20 Sonbahar mevsimi dönüştürülmüş radon yoğunluğu verileri için A-D testi ... 100

6.21 Kapalı ortamda üç ay boyunca radona maruz bırakılmış bir detektörün dört gözlemci tarafından gözlenen değerleri ... 101

6.22 Kalibrasyon odasında iki gün bekletilen bir detektörün dört gözlemci tarafından gözlenen değerleri ... 103

6.23 Kalibrasyon odasında bir gün bekletilmiş bir detektörün dört gözlemci tarafından gözlenen değerleri ... 104

(16)

Çizelge Sayfa 6.24 Mevsimsel radon yoğunluğu ortalamalarının tek yönlü ANOVA ile

karşılaştırılması ... 105 6.26 Yıllık ortalama radon yoğunlukları için t-testi ile kat analizi ... 107 A.1 Kolmogorov-Smirnov testi kritik değerleri (çift yönlü) ... 120

B.1 Lilliefors testi kritik değerleri 123

C.1 χ2 testi kritik değerleri 124

D.1 Shapiro-Wilk testi kritik değerleri 128

E.1 Shapiro-Wilk testi değerleri 130

F.1 z-testi kritik değerleri 133

G.1 t-testi kritik değerleri (çift yönlü) 135

G.2 t-testi kritik değerleri (tek yönlü) 136

H.1 F-testi kritik değerleri (α=0,10) 137

H.2 F-testi kritik değerleri (α=0,05) 138

H.3 F-testi kritik değerleri (α=0,01) 139

(17)

SİMGELER VE KISALTMALAR DİZİNİ

Simgeler Açıklama

A-D Anderson - Darling

ANOVA Analysis of variance

Bq Becquerel

GO Geometrik ortalama

GSS Geometrik standart sapma

IAEA-BSS International Atomic Energy Agency - International Basic Safety Standards

K-S Kolmogorov - Smirnov

NCRI National Cancer Research Institute

RPII Radiological Protection Institute of Ireland

S-W Shapiro - Wilk

WHO World Health Organization

(18)

Yaşayan her bir canlının günlük hayatta sürekli radyasyona maruz kaldığı bilinen bir gerçektir. Dünyanın oluşumu ile birlikte tabiatta yerini alan çok uzun ömürlü radyoaktif elementler yaşadığımız çevrede normal ve kaçınılmaz olarak kabul edilen doğal bir radyasyon düzeyi oluşturmuşlardır. Geçtiğimiz yüzyılda bu doğal düzey, nükleer bomba denemeleri ve bazı teknolojik ürünlerin kullanımı ile bir hayli artış göstermiştir. Maruz kalınan doğal radyasyon seviyesinin büyüklüğünü belirleyen birçok neden vardır. Yaşanılan yer, bu yerin toprak yapısı, barınılan binalarda kullanılan malzemeler, mevsimler, kutuplara olan uzaklık ve hava şartları bu nedenlerden bazılarıdır. Yağmur, kar, alçak basınç, yüksek basınç ve rüzgar yönü gibi etkenler de doğal radyasyon seviyesinin büyüklüğünü belirler. Genel olarak alınan radyasyon dozunun %15’lik bir dilimi, tıbbi uygulamalar, nükleer denemeler gibi yapay radyasyon kaynaklarından alınmakta, geriye kalan %85’lik dilim ise doğal radyasyon kaynaklarından alınmaktadır. Doğal radyasyon kaynakları genel olarak; kozmik radyasyon, gama ışınları, vücut içi ışınlanma ve radon gazı olarak sıralanabilir. Doğal radyasyon kaynaklarından alınan dozun %50’lik bir kısmı radon gazı ve ürünlerinin sebep olduğu radyasyondur.

Kozmik radyasyon; uzaydan gelen radyasyon ışınlarıdır. Bunların bir kısmı güneşin füzyon patlamalarında ortaya çıkar ve gelen ışınların büyük bir kısmı dünyamızın manyetik alanında saparak kutuplara doğru yönelir. Atmosfere giren kozmik ışınlar birtakım reaksiyonlara uğrayarak atmosfer tarafından tutulur. Bu nedenle yükseklik azaldıkça kozmik radyasyondan alınan doz miktarı da azalır.

Yerkabuğunun içindeki bütün maddeler radyoaktif atom içerir. Bu radyoaktif elementlerin en önemlileri uranyum, toryum ve potasyumdur. Uranyum kaya ve toprak katmanları boyunca düşük yoğunluklarda dağılmıştır. Uranyum-238 birçok elementin uzun radyonüklid bozunma serisinin başlangıç kaynağı olup, kararlı kurşun-206 haline gelinceye kadar bozunur. Oluşan ilk ürünler arasında yer alan ve radyoaktif gaz olan

(19)

radon radyoizotopu (Rn-222) atmosfere dağılır ve bozunmaya devam eder. Toryum da benzer şekilde yeryüzüne dağılmıştır ve Toryum-232, başka bir radyoaktif serinin başlangıç kaynağıdır. Yeryüzündeki radyonüklidlerin yaydığı gama ışınları nedeniyle tüm vücut radyasyona maruz kalır. Yapı malzemeleri taş ve topraktan üretildikleri için düşük oranda radyoaktivite içerebilirler. Böylece insanlar bina dışında olduğu gibi bina içinde de radyasyona maruz kalırlar. Alınan radyasyon dozu bölgenin taşına, toprağına ve yapı malzemesine bağlıdır (URL-1).

Uranyum bozunma serisinden gelen radon radyoizotopu diğer radyoizotoplardan farklı olarak doğada gaz halinde bulunur. Yarılanma ömrü 3,8 gün olan radon gazının bozunmasıyla oluşan ürünlerin alfa ışıması ile oluşan radyasyonun dozu, radonun bozunması nedeniyle oluşan radyasyondan 100 kat daha fazladır. Bu radyoaktif gaz renksiz, kokusuz ve tatsız bir gaz olmasından dolayı varlığı sadece test ile ispatlanabilir.

Diğer radyoaktif maddelere benzer olarak, radona maruz kalındığında etkileri hemen belli olmaz, ancak yıllar içinde etkileri görülebilir. Dünya Sağlık Örgütü (WHO)’nün belirlemelerine göre akciğer kanseri ölümlerinin %15’lik bir kısmı kapalı alanlarda solunan radon gazından kaynaklanmaktadır. Yapılan çalışmalara göre radon gazı sigaradan sonra kanser riskini arttıran ikinci önemli etkendir (WHO, 2009; RPII and NCRI, 2005).

Radon gazı havadan dokuz kat daha ağır bir gazdır. Bu özelliğinden dolayı yeryüzüne yakın yüksekliklerde belli bir yoğunluğa ulaşır. Toprak ve kayalardan sızarak toprak üstünde birikir. Duvar ve zemin çatlaklarından tesisat boşluklarından rahatlıklar bina içlerine sızarak sağlık açısından riskli yoğunluklara ulaşabilir. Kapalı ortamlarda radon gazı yoğunluğunun kontrolü amacıyla gerek ülkeler gerekse uluslararası kuruluşlar tarafından limit değerler belirlenmiştir. Söz konusu limit değerlerin aşılması halinde, radon yoğunluğunu düşürücü tedbirlerin alınması tavsiye edilmektedir.

Uluslararası Atom Enerji Ajansı Temel Güvenlik Standartları (IAEA-BSS) çerçevesinde, radon için tavsiye edilen düzeyler 200-600 Bq/m3 olarak belirlenmiştir.

Türkiye'de müsaade edilebilir radon yoğunluğu ise 400 Bq/m3’tür (URL-2).

Radonun insan sağlığına karşı risk oluşturacak yoğunluklara ulaşıp ulaşmadığının belirlenmesinde kullanılan en yaygın yöntem pasif detektörlerdir.

(20)

sonra alfa parçacıklarının bıraktıkları bu izler mikroskop altında sayılacak kadar büyür.

Sayılan izler bir takım hesaplama sonucunda ortamın radon yoğunluğu hakkında bilgi sağlar. Fakat bu veriler gelişigüzel olduklarından herhangi bir istatistiksel dağılıma uymadığı sürece anlaşılması ve karakterize edilmesi mümkün değildir. Olasılık dağılımları arasında en önemlisi ve en çok söz edileni normal (Gauss) dağılımdır.

Normal dağılımın bu kadar önemli oluşunun temel nedeni; doğada yapılan pek çok gözlem sonucunun normal dağılıma uyması ve ayrıca birçok olayın normal dağılımla açıklanabilmesidir (Freund and Walpole, 1980). Normal dağılıma uymayan gözlem sonuçları ise, bazı dönüşümler ile (karekök, logaritma gibi) normal dağılım haline dönüştürülebilmektedir (Lapp and Andrews, 1972). Bu dağılım gözlem hatalarını gayet iyi temsil ettiğinden dolayı hata eğrisi olarak ta adlandırılmaktadır. Radyoaktif bir çekirdek gelişi güzel bozunduğundan, nükleer sayımlarda ortalama bir değer ve bu değer etrafında meydana gelen istatistiksel bir dağılımdan bahsedilebilir. Radon yoğunluklarının da log-normal dağılıma uyduğu gözlenmiştir (Nero, et al., 1990).

Radon yoğunlukları verilerinin doğal logaritması alınarak normal dağılım elde edilebilir. Tabii ki elde edilen bu verilerin gerçekten normal dağılıma uyup uymadığı da bir takım istatistiksel test gerektirir. Bu testlere normal dağılım testleri veya uygunluk testleri denir. Radon araştırmalarında sıkça kullanılan normal dağılım testleri;

Kolmogorov-Smirnov, Lilliefors, Shapiro-Wilk, Anderson-Darling ve χ2 uygunluk testleridir. Bu testler, elde edilen verinin istatistiksel olarak incelenebilir olup olmadığının anlaşılmasında rol oynarlar.

Bu tez çalışmasının amacı, Eskişehir ili merkezinde, evlerde yapılmış olan radon yoğunluğu ölçümlerinin istatistiksel analiz metotlarıyla incelenmesidir. Bununla beraber, radon gazı yoğunluğu üzerine nükleer sayım istatistiği çalışacak araştırmacılara yol göstermek üzere, gerekli istatistiksel yöntemlerin kullanım şartları, amaçları, matematiksel olarak uygulanma tekniklerini incelenmek, bu sayede araştırmacılar için önemli bir kaynak oluşturmaktır. Bu yüzden, elde edilen verinin istatistiksel olarak incelenmesini ve anlaşılmasını kolaylaştırmak amaçlanmıştır. Ayrıca test

(21)

istatistiklerinin ve kritik değerlerinin herhangi bir istatistik paket programa ihtiyaç duymadan Microsoft Excel gibi bir hesaplama programı yardımı ile nasıl hesaplanacağının da gösterilmesi amaçlanmıştır. Böylece, fizikçilerin kendi çalışmalarına özel hesaplama programları oluşturabilmelerine de yol gösterilmiştir.

Literatürde radon gazı yoğunluğu ölçümleri ile ilgili makale çalışmalarında verilerin normal dağılıma en yakın biçimde oluşturulmaları için logaritmik dönüşümler ve q-q grafiği yardımı ile arkafon düzeltmeleri yapılmıştır. Fennell (2002) yaptığı düzeltmeler neticesinde verilerin normal dağıldığını anlayabilmek için q-q grafiği tekniğinden yararlanmıştır. Planinic (1993) farklı gözlemcilerin gözlemleri arasında anlamlı bir fark olup olmadığını araştırmak için varyans analizi (Analysis of Variance;

“ANOVA”) tekniğine başvurmuştur. Vukovic, et al. (2005) farklı tip detektörlerle yapılan ölçümler arasında anlamlı bir fark olup olmadığını araştırmak için ANOVA tekniğini kullanmış ve rastgele seçtiği bir örneklemden yararlanarak verilerin log- normal dağılıma uygunluğunu testi ile incelemiştir. Akciğer kanseri vakaları ile kontrol grubu ortalamaları arasında anlamlı fark olup olmadığını t-testi yardımıyla araştırmışlardır. Test sonucunda akciğer kanserli hastaların yüksek radon yoğunluğuna sahip evlerde yaşadıkları anlaşılmıştır. Vaka gruplarının frekanslarının kontrol grubu frekanslarına oranının bina içi radon yoğunluğuyla ilişkili olduğu yine bu çalışma sonucunda bulunmuştur (Vukovic, et al., 2005).

Bu tez çalışması; yedi bölüm ve sekiz ekten oluşmuştur. İkinci bölümde;

anakütle, örneklem, güven aralığı, serbestlik derecesi gibi temel istatistik kavramlara değinilmiştir. Merkezi eğilim ölçüleri olan; ortalama, mod, medyan, kartiller tanımlanmıştır. Ayrıca; değişim aralığı, ortalama mutlak sapma, varyans, standart sapma ve varyasyon katsayı değişkenlik ölçüleri ile çarpıklık-basıklık ölçüleri üzerinde durulmuştur. Üçüncü bölümde; Poisson dağılımı, normal dağılım, standart normal dağılım, log-normal dağılım incelenmiş ve Box-Cox dönüşümleri gösterilmiştir.

Dördüncü bölümde; normal dağılım testleri incelenmiştir. Grafik metotlar alt başlığı altında kutu grafiği ve q-q grafiği uygulama teknikleri üzerinde durulmuş, normallik testleri alt başlığı altında Kolmogorov-Smirnov, Lilliefors, Shapiro-Wilk, Anderson- Darling ve χ2 uygunluk testleri incelenmiştir. Beşinci bölümde hipotez kavramına değinilmiş ve parametrik z-testi ile t-testi anlatılmıştır. Varyans analizi (ANOVA) tek

(22)

Yoğunluğu Ölçümü ve Mevsimsel Düzeltme Faktörü Hesabı” isimli projede elde edilen dört mevsim radon yoğunluğu verileri üzerine uygulaması gerçekleştirilmiştir. Yedinci bölümde; elde edilen sonuçlar özetlenip tartışılmıştır. Ek bölümlerde; incelenen testlerin kritik değerleri ve kullanılan sabitler konu bütünlüğünün sağlanması açısından çizelgeler halinde verilmiştir.

(23)

BÖLÜM 2

İSTATİSTİKSEL KAVRAMLAR

Eskişehir ili merkezinde evlerde yapılan radon yoğunluğu ölçüm sonuçlarının istatistiksel analiz yöntemleri ile incelenmesi sırasında birçok istatistiksel kavram karşımıza çıkmaktadır. Öncelikle bu kavramların tanımlanması, konuların anlaşılmasını kolaylaştıracaktır. Bu kavramlar ilerleyen alt bölümlerde tanımlanmıştır.

2.1. Anakütle

Hakkında belirli bir veya daha fazla özellik (değişken) açısından araştırma yapılmak istenilen tüm elemanların içinde bulunduğu kümeye anakütle (popülasyon) adı verilir. İstatistiği yapılacak anakütlenin iki temel kavramı tanımlanmalıdır. Bunlardan birincisi, araştırılacak anakütlenin sınırları; ikincisi ise anakütle içindeki incelenecek değişkenlerdir (URL-3).

2.2. Örneklem

Belirli bir anakütleden çekilen alt kümeye örneklem adı verilir. Örneklem, anakütleden seçilen ve ilgilenilen değişken açısından anakütlenin özelliklerini yansıtma özelliğine sahiptir. Anakütleden alınacak örneklem veri elemanları uygun bir yolla seçilmelidir. Araştırma sonuçlarının geçerli, güvenilir ve kullanılabilir olması için verilerin toplandığı kaynağın özelliği çok önemlidir. En doğru sonuç aranan bilginin elde edileceği kaynağın tümünden elde edilen sonuçtur. Ancak her zaman bu olanaklı değildir. Özellikle kaynak çok büyük ve yaygın olduğunda bunu yapmak son derece zordur. Bunun için araştırmacılar kaynağın tümünü incelemek yerine belirli bir örnek üzerinde çalışmak zorundadırlar. Örneklem, anakütleyi iyi bir şekilde temsil ediyor olmalıdır. Eğer veri uygun yolla toplanmazsa, hiçbir istatistik yöntemle kurtarılamaz ve tamamen kullanışsız olur. (URL-4).

(24)

hesaplandığında veya ölçümleri alındığında anakütle parametresinin tahmini sağlanmış olur. Bununla birlikte, bu parametre tahminle sınırlı kalır ve farklı bir örneklem alındığında parametreler farklı bir değer aralığında elde edilebilir. Özellikle örneklem büyüklüğü fazla olmadığında bu değer aralığı her zaman anakütlenin gerçek değerini vermeyebilir. Ancak yapılan gözlemin dağılımı biliniyorsa, anakütle parametrelerinin alt ve üst sınırlarını verilen olasılık düzeyinde tahmin etmek mümkündür. Böyle sınırlara güven sınırı adı verilir. Bu aralık ve düzeylere de söz konusu parametre için güven aralığı adı verilir. Birçok durumda bu tür sınırlar ortalama değerin tahmini için ya da oranı için aranmaktadır. Genel olarak bir ortalama değer için güven aralıkları, veriler tamamen bu varsayıma uymasalar bile gözlemlerin normal dağıldığı varsayımına dayalı olarak elde edilir. Varyans gibi diğer parametrelerde güven sınırları dağılımın şeklinden daha çok etkilenir (URL-5).

Güven aralığını belirtmek, aynı zamanda α ile tanımlanan anlam düzeyini de tanımlamış olmak demektir. Güven aralığı 1-α olarak ifade edilebilir. Örneğin %95 güven aralığı tanımlanıyorsa anlam düzeyi burada %5, yani α=0,05 olduğu ifade edilmektedir. Şekil 2.1’de bir dağılım fonksiyonu grafiğinde %95 güven aralığı için örnek gösterilmiştir.

Şekil 2.1 Dağılım fonksiyonu grafiğinde %95 güven aralığı gösterimi

%95 %2,5

%2,5

(25)

Güven aralığının notasyon gösterimi, örneğin %95 güven aralığı için;

( ) şeklindedir.

2.4. Serbestlik Derecesi (Degrees Of Freedom)

Serbestlik derecesi (sd), ilk defa Fisher (1925) tarafından ortaya atılmış bir kavramdır. Bu kavramı anlayabilmenin en basit yolu, n pozitif tamsayılar kümesinin toplamı gibi basit bir aritmetik ifade düşünmektir. Eğer toplam veya aritmetik ortalama değer biliniyorsa, seçilen n-1 tamsayı bize kalan tamsayının ne olması gerektiğini söyleyecektir. Başka bir deyişle, bu sayılar n-1 seçilme özgürlüğüne sahiptir, yani serbestlik derecesi bu durumda n-1 olur. Eğer bir veri kümesi hakkında iki tür açıklayıcı terim biliniyorsa, serbestlik derecesi n-2 olacaktır. Bazı olasılık dağılımları (özellikle t- dağılımı, F-dağılımı ve χ2-dağılımı) için, serbestlik derecesinin değeri, dağılımın şeklini belirleyen bir parametredir. Bu nedenle, eğer bu dağılımlar hipotez testlerinde ve çıkarımlarda kullanılacaksa serbestlik derecesi değeri gerekli bir parametredir (URL-6).

2.5. Tanımlayıcı İstatistikler

Gözlenen verinin düzenlenerek çizelgelerle, grafiklerle sunulması çoğu kez yeterli olmaz. Genel durumu yansıtacak bir takım ölçülere gereksinim vardır. Bu ölçüler verileri yalnızca özlü bir biçimde belirtmekle kalmazlar aynı zamanda karşılaştırmalara, genellemelere, yorumlamalara olanak sağlarlar. Bir veya birden fazla dağılışı karşılaştırmak için kullanılan ve ayrıca örnek verilerinden hareket ile frekans dağılışlarını sayısal olarak özetleyen değerlere tanımlayıcı istatistikler denir.

İncelenecek tanımlayıcı istatistikler genel olarak Şekil 2.2’deki gibi sıralanabilir (URL- 7).

(26)

Şekil 2.2 Tanımlayıcı istatistikler

2.5.1. Merkezi eğilim ölçüleri 2.5.1.1. Aritmetik ortalama

Aritmetik ortalama, en yaygın olarak kullanılan merkezi eğilim ölçüsüdür.

Başlıca uygulaması, dönüştürülmemiş ve sürekli değer alan değişkenlerdir. Anakütle ortalaması genellikle μ ile gösterilir. Örneklem ortalaması anakütle ortalamasının iyi bir tahminidir ve ̅ şeklinde gösterilir. Aritmetik ortalamayı hesaplamak için her bir değerin ağırlığına, frekansına ya da olasılığına bağlı olarak bir dizi benzer formül kullanılır.

Aritmetik ortalama, her bir değer ağırlıksız olarak düşünüldüğünde en basit şekilde Denklem 2.1 ile hesaplanabilir:

Merkezi Eğilim Ölçüleri

1) Aritmetik Ortalama 2) Geometrik Ortalama 3) Harmonik Ortalama 4) Mod 5) Medyan 6) Kartiller (Quartiles)

Değişkenlik Ölçüleri

1) Değişim Aralığı (Range) 2) Ortalama Mutlak Sapma 3) Varyans 4) Standart Sapma 5) Varyasyon Katsayısı

Çarpıklık Ölçüleri (Skewness)

1) Pearson Asimetri Ölçüsü 2) Bowley Asimetri Ölçüsü

Basıklık Ölçüleri (Kurtosis)

(27)

̅ ∑

(2.1)

Aynı örneklemdeki her bir x değerine atanmış bir f frekans değeri var ise, frekans ağırlıklı ortalama;

̅ ∑

(2.2)

ile verilir. Burada bütün frekansların toplamı, toplam veri sayısına eşit olacağından

olmaktadır (URL-7).

2.5.1.2. Geometrik ortalama

Geometrik ortalama ( ), n tane veri değerlerinin çarpımlarının n. dereceden köküne eşittir. Geometrik ortalama yukarı eğilimlidir. Geometrik ortalaması alınacak tüm değerler sıfırdan büyük olmalıdır. Bir veri setinin geometrik ortalaması, harmonik ortalamasından büyük, aritmetik ortalamasından ise küçüktür. Geometrik ortalama;

(∏

) (2.3)

ile verilir. Geometrik ortalamanın frekans ağırlıklı formu;

(∏

) (2.4)

şeklindedir. Hesaplama kolaylığı açısından Denklem 2.3 ve 2.4’ün logaritmik ifadeleri;

(28)

ve

(2.6)

kullanılır. Geometrik ortalamanın orijinal verilerinin logaritmik sapmaları eşittir. Bu özelliğinden dolayı geometrik ortalama; ortalama oranlara, değişim oranlarına, logaritmik dağılım gösteren veri setlerine uygulanır. Örneğin; fiyat indekslerinde geometrik ortalama anlamlı sonuçlar verir. Logaritmik bir dağılımda tercih edilmesinin sebebi ise, böyle bir dağılımda mutlak sapmaların değil ancak merkezi eğilim tarafında nispi sapmaların simetrik olma eğilimidir. Geometrik ortalamanın bir diğer özelliği de, uç değerlerden aritmetik ortalama kadar etkilenmemesidir (URL-7).

2.5.1.3. Harmonik ortalama

Harmonik ortalama (H), veri değerlerinin terslerinin aritmetik ortalamasının tersidir. Harmonik ortalama aşağı eğilimlidir. Harmonik ortalaması alınacak veri değerleri sıfırdan büyük olmalıdır. Bir veri setinin harmonik ortalaması, geometrik ortalamasından ve aritmetik ortalamasından düşüktür:

( ∑

)

(2.7)

Harmonik ortalama genellikle belirli fiyat tipleri ve zaman serileri için kullanılır.

Örneğin ekonomik olaylarda 1 birim ile alınan ortalama miktara veya bir mamülün bir biriminin üretimi için harcanan ortalamaya gereksinim duyulduğunda kullanılır. Tipik olarak, verinin bir çeşit oran ölçümünde kullanılır (URL-7).

(29)

2.5.1.4. Mod

Bir veri setinde en çok tekrar eden değere, yani frekansı en büyük olan değere o veri setinin modu denir. Bir veri setinin modu olamayacağı gibi birden fazla moda da sahip olabilir. Örneğin; normal bir dağılımın modu, frekans grafiğinin tepe noktasını verir.

Kümülatif seriler için mod hesabı yapılırken öncelikle mod sınıfı belirlenir.

Frekansı en yüksek olan sınıf mod sınıfı olarak seçilir. Mod sınıfı içerisinde yer alan modun tam değeri, sınıf frekansı ve kendine komşu olan sınıf frekansları dikkate alınarak hesaplanır. Buradaki zorluk, alınan sınıf aralıklarının sonucu etkileyebilir olmasındadır. Mod hesabı;

(2.8)

formülüyle hesaplanır. Burada , mod sınıfının alt sınır değeri; , mod sınıfının frekansı ile bir önceki mod sınıfının frekansı arasındaki fark; , mod sınıfının frekansı ile bir sonraki mod sınıfının frekansı arasındaki fark ve , sınıfların üst sınır değeri ile alt sınır değeri arasındaki farktır (sınıf aralığı).

Basit bir örnekle mod hesaplamayı gösterelim. Çizelge 2.1’de örnek bir veri setinin frekans tablosu verilmiştir.

Çizelge 2.1 Örnek bir veri setinin frekans değerleri

Sınıflar Frekans (fi)

30 ≤ xi < 36 36 ≤ xi < 42 42 ≤ xi < 48 48 ≤ xi < 54 54 ≤ xi < 60 60 ≤ xi < 66

2 6

10  Mod Sınıfı 7

4 1

Toplam 30

(30)

( ) ( )

olarak hesaplanır (URL-7).

2.5.1.5. Medyan

Bir veri setini büyükten küçüğe veya küçükten büyüğe sıraladığımızda tam orta noktadan veri setini iki eşit parçaya ayıran değere medyan adı verilir. Veri setinde aykırı veriler olduğunda aritmetik ortalamaya göre daha güvenilirdir çünkü uç değerlerden etkilenmez. Medyan, veri setindeki elemanlardan etkilenmez, birim sayısındaki değişmelerden etkilenir. Medyanın standart hatası, aritmetik ortalamanınkinden daha büyüktür. Veri sayısı tek olduğunda medyan,

( ) (2.9)

veri sayısı çift sayı olduğunda medyan,

( (

)) (2.10)

ile verilir. Kümülatif veri serilerinde medyan değeri hesaplanırken veri setinin tam orta noktasının hangi gruba ait olduğunu belirlemek için kümülatif frekans sütunu (∑ ) oluşturulur. Sıra numarası belirlendikten sonra o sıra numarasına ait grup medyan sınıfı olarak ifade edilir. Medyan sınıfı belirlendikten sonra medyan sınıfından bir önceki sınıfın kümülatif frekansı ve medyan sınıfı frekansı dikkate alınarak hesaplanır:

(2.11)

(31)

Burada , medyan sınıfının alt sınır değeri; , medyan sınıfından bir önce sınıfın kümülatif frekansı; , medyan sınıfının frekansı ve , sınıf aralığıdır.

Çizelge 2.1’e kümülatif frekans sütununun eklenmiş hali Çizelge 2.2’de verilmiştir.

Çizelge 2.2 Örnek bir veri setinin frekans değerleri ve kümülatif frekans değerleri

Sınıflar Frekans (fi) Kümülatif Frekans (∑ ) 30 ≤ xi < 36

36 ≤ xi < 42 42 ≤ xi < 48 48 ≤ xi < 54 54 ≤ xi < 60 60 ≤ xi < 66

2 6 10

7 4 1

2 8

18 Medyan Sınıfı 25

29 30

Toplam 30

Çizelge 2.2’de verilen veri kümesinin medyanı;

olarak hesaplanır (URL-7).

(32)

adı verilir. Birinci kartil alt kartil olarak isimlendirilir ve Q1 ile temsil edilir. Alt kartil verilerin ilk %25 lik kısmını içinde bulundurur. Üst kartil olarak adlandırılan Q3 kartil ise %75 lik kısmını bulundurur. Eğriyi iki eşit parçaya bölen Q2 kartili %50 lik kısmını içine alır ve aynı zamanda veri setinin medyanıdır. Basit veriler için kartiller şu şekilde bulunur;

(2.12)

( ) (2.13)

( )

(2.14)

Görüleceği gibi verinin sıra numarası tamsayı olmayabilir. Bu durumda hesaplanan sıra numarasına karşılık gelen değerin hesaplanması gerekir. Örneğin; 30, 42, 56, 61, 68, 79, 82, 88, 90, 98 gibi sıralanmış basit bir dizi değer verilmiş olsun. Bu değerlere göre Q1 veQ3 kartilleri;

( )

( )

( )

olarak bulunur. Sınıflanmış veriler için kartiller hesaplanırken ilk olarak birikimli frekans sütunu oluşturulup kartil sınıfları belirlenmelidir. Veri sayısının tek veya çift olduğuna bakılmaksızın n/4 ve (3n)/4 üncü sıralardaki verilerin bulunduğu sınıflar kartil

(33)

sınıfları olarak adlandırılır. Kartil sınıfları belirlendikten sonra bu sınıflardan bir önceki sınıfın birikimli frekansı ve mevcut sınıf frekansı dikkate alınarak kartil değerleri hesaplanır (URL-7):

∑ (2.15)

∑ (2.16)

(2.17)

Örneğin, Çizelge 2.3’te verilen değerlerin kartillerini hesaplayalım.

Çizelge 2.3 Örnek bir veri setinin kümülatif frekans değerleri

Sınıflar fi Kümülatif Frekans(∑ )

150≤ xi < 157 5 5

157≤ xi < 164 7 12

164≤ xi < 171 14 26 1. Kartil Sınıfı

171≤ xi < 178 9 35

178≤ xi < 185 8 43 2. Kartil Sınıfı

185≤ xi < 192 4 47

192≤ xi < 199 3 50

Toplam 50

(34)

olarak bulunur.

2.5.2. Değişkenlik ölçüleri 2.5.2.1. Değişim aralığı (range)

Değişim aralığı veya değer aralığı, bir veri setindeki yayılımı ifade etmekte kullanılan en basit ölçüdür. Genel olarak az sayıda veri için kullanılır. Veri setinin en büyük değeri ile en küçük değeri arasındaki farka eşittir.

(2.18)

Değişim aralığı, veri setindeki tek bir verinin aşırı derecede büyük veya küçük olmasından etkilendiği için, başka bir ifadeyle sadece iki veriden hesaplandığı için tüm veri setinin değişkenliğini açıklamak için yetersizdir (URL-8).

2.5.2.2. Ortalama mutlak sapma

Bir veri setindeki her bir değerin aritmetik ortalamayla arasındaki farkın mutlak değerinin, veri sayısına bölünmesiyle elde edilir. Ortalamadan olan sapmaların ortalama bir değeri elde edilir:

| ̅|

(2.19)

(35)

Sınıflanmış veriler için,

| ̅|

(2.20)

ifadesi kullanılır. Burada , sınıfın alt sınır değeri ile üst sınır değerinin ortalamasıdır (URL-8). Örneğin Çizelge 2.4’teki gibi bir veri tablosunun ortalama mutlak sapma değeri hesaplanırsa,

Çizelge 2.4 Ortalama mutlak sapma için hesaplamalar

Sınıflar fi mi | ̅|

150≤ xi < 157 5 153,5 92,4

157≤ xi < 164 7 160,5 80,36

164≤ xi < 171 14 167,5 62,72

171≤ xi < 178 9 174,5 22,68

178≤ xi < 185 8 181,5 76,17

185≤ xi < 192 4 188,5 66,08

192≤ xi < 199 3 195,5 70,56

Toplam 50 470,96

̅ ∑

| ̅|

elde edilir.

(36)

zorluğundan, hatta bazı durumlarda imkansızlığından dolayı yeni bir değişkenlik ölçüsüne ihtiyaç duyulmuştur. Mutlak değerden dolayı oluşan bu zorluğu aşmak için verilerin aritmetik ortalamadan farklarının karelerinin alınması işlem kolaylığı sağlamaktadır.

Varyans, ortalama etrafındaki ikinci momenttir ve bir veri setindeki tüm veri değerlerinin, ortalamadan olan sapmaların karesinin aritmetik ortalaması alınarak elde edilir. Anakütlenin varyansı,

∑( )

(2.21)

bir örneklemin varyansı,

∑( ̅)

(2.22)

ve sınıflanmış verilerin varyansı,

( ̅)

(∑ ) (2.23)

ile hesaplanır. Burada , sınıfın alt sınır değeri ile üst sınır değerinin ortalamasıdır (URL-9).

2.5.2.4. Standart sapma (σ)

Bir veri setinin standart sapması, o veri setinin varyansının kareköküne eşittir.

Veri değerlerinin yayılımının özetlenmesi için kullanılan bir ölçüdür. Varyans yerine

(37)

ortalama etrafındaki değişimin ölçüsünü veren standart sapmayı kullanmak daha anlamlıdır. Anakütleun standart sapması,

√ ∑( )

(2.24)

örneklemin standart sapması,

∑( ̅)

(2.25)

sınıflanmış verilerin standart sapması,

(∑ ) ∑ ( ̅)

(2.26)

ile verilir. Varyans ve standart sapma, veri setindeki değerlerin dağılımı ile ilgili bilgi verir. Değerler arasındaki fark arttıkça standart sapma ve varyans büyür. Standart sapma değişken değerlerinin ortalamanın etrafındaki yayılmasını temsil eden bir yayılma ölçütüdür. Yani değerler arasında ne kadar yaygınlık olduğunu ifade eder.

Simetrik dağılımlarda değerlerin yaklaşık olarak %68’i 1 standart sapma uzaklığı içine yani ( ̅ ̅ ) aralığına düşer. Değerlerin %95’i ise 2 standart sapma uzaklık içinde ( ̅ ̅ ) aralığındadır. Genelde, neredeyse tüm veriler 3 standart sapma uzaklığı içine yani ( ̅ ̅ ) aralığına düşerler (Şekil 2.3).

(38)

Şekil 2.3 Simetrik dağılımlar için standart sapma uzaklıklarında verilerin yüzdelikleri

Bazı durumlarda bir dağılımı (örneğin log-normal dağılımı) geometrik standart sapma ile ifade etmek gerekir. Anakütlenin geometrik standart sapması,

√ ∑[ ( ) ( )]

(2.27)

örneklemin geometrik standart sapması,

√ ∑[ ( ) ( ̅ )]

(2.28)

ifadesi ile verilir (URL-8).

2.5.2.5. Varyasyon katsayısı

Standart sapma, dağılımın yaygınlığını gösteren bir ölçü olmasına rağmen bu standart sapma değerinin küçük mü yoksa büyük mü olduğuna karar vermek mümkün

(39)

olmayabilir. Varyasyon katsayısı, iki veya daha fazla anakütle üzerinde aynı değişkenler için değişkenliklerin karşılaştırılmasında kullanılan bir ölçüdür. Standart sapmayı ortalamanın bir yüzdesi olarak ifade eden ve iki veya daha fazla anakütledeki varyasyonu (değişkenliği) karşılaştırmada kullanılan ölçüye varyasyon (değişkenlik) katsayısı denir. Varyasyon katsayısı;

̅ (2.29)

formülü ile hesaplanır (URL-8).

2.5.3. Çarpıklık ölçüleri (skewness)

Çarpıklık, normal dağılım eğrisinin simetrikliğinin bozulma derecesi olarak tanımlanır. Dağılım eğrisi sağa doğru kuyruklu ise pozitif çarpık veya sağa çarpık, sola doğru kuyruklu ise negatif çarpık veya sola çarpık olarak adlandırılır.

Örneklem verilerinin modu, medyanı ve ortalamasına bakılarak, dağılımın sağa mı yoksa sola mı çarpıklık gösterdiği bulunabilir. Eğer “Mod<Medyan<Aritmetik Ortalama” şeklinde bir sıralama görülüyorsa dağılım sağa çarpık, “Aritmetik ortalama<Medyan<Mod” şeklinde bir sıralama görülüyorsa dağılım sola çarpık olduğu söylenir (Şekil 2.4). Simetrik dağılımlarda mod, medyan ve aritmetik ortalama birbirlerine eşittir.

(40)

Şekil 2.4 a) Negatif (Sola) çarpıklık b) Pozitif (Sağa) çarpıklık

Çarpıklık, ortalama etrafındaki üçüncü momentin bir fonksiyonudur ve çarpıklığın miktarı ise Denklem 2.30 ile hesaplanabilir:

( )

(2.30)

Ortalama ve varyans tahmin ediliyorsa, çarpıklık Denklem 2.31 formunda yazılabilir:

( ̅)

(2.31)

Fakat bu önyargılı bir tahmin olur. SPSS, Excel gibi yazılımlarda kullanılan formu Denklem 2.32’deki gibidir (URL-10):

̂ ( )( ) ∑( ̅)

(2.32)

Eğer;

=0 ise dağılım simetriktir,

<0 ise dağılım sola (negatif yöne) çarpıktır,

>0 ise dağılım sağa (pozitif yöne) çarpıktır.

(41)

2.5.3.1. Pearson çarpıklık (asimetri) ölçüsü

Pearson’un çarpıklık ölçüsü, veri setinin aritmetik ortalamasının moduna olan farkının standart sapmaya oranı ile hesaplanır. Eğer mod hesaplamada bir problem oluşursa, bu durumda asimetri ölçümü nispeten zayıf olacaktır.

̅

(2.33)

Denklem 2.33’e göre eğer < 0 ise negatif (sola) çarpık, > 0 ise pozitif (sağa) çarpık, = 0 ise dağılış simetriktir (URL-8).

2.5.3.2. Bowley çarpıklık (asimetri) ölçüsü

Bowley’in çarpıklık ölçüsü Q3 üst ve Q2 alt kartillerinin medyana göre uzaklıklarının farklarının, alt ve üst kartillerin arasındaki farka oranı ile bulunur ve [-1, +1] değer aralığındadır.

( ) ( )

( ) (2.34)

Denklem 2.34’e göre eğer < 0 ise negatif (sola) çarpık, > 0 ise pozitif (sağa) çarpık, = 0 ise dağılış simetriktir (URL-8)..

2.5.4. Basıklık ölçüleri (kurtosis)

Normal dağılım eğrisinin sivrilik veya basıklık (yaygınlık) derecesi olarak tanımlanır. Eğrinin tepesi sivri ise dağılım leptokurtiktir ve yüksek basıklık katsayısına sahiptir. Dağılım eğrisinin tepesi basık ise dağılım platikurtiktir ve basıklık katsayısı düşüktür (Şekil 2.5).

(42)

Şekil 2.5 Dağılımın sivrilik-basıklık gösterimi

Basıklık ortalama etrafındaki dördüncü momentin ( ) fonksiyonudur ve bir örneklem yeterince büyükse (örneğin >50) anlamlıdır. Basıklık değeri;

(2.35)

ifadesiyle bulunur. Denklem 2.35’teki -3 terimi basıklık tanımlama formülüne bir çeşit ayarlama olarak açıklanmaktadır. Bu ayarlama sayesinde normal dağılımın basıklık ölçüsü sıfır olur. Anakütlenin ortalaması ve varyansı biliniyorsa,

∑( )

(2.36)

ortalama ve varyans tahmin ediliyorsa,

∑( ̅)

(2.37)

formunda yazılabilir. Fakat bu da önyargılı bir tahmin olur. SPSS, Microsoft Excel gibi yazılımlarda kullanılan formu;

Basık Dağılım

Daha Basık Dağılım

(43)

̂ ∑( ̅)

(2.38)

şeklindedir. Burada ( )( )( ) ( ) ( )( ) ( ) dir. Buradan görüleceği gibi, n>50 olduğunda a terimi n sayısına ve b terimi 3’e yaklaşmaktadır. Büyük örneklemler için Denklem 2.38’in yanlış sonuç vermeyeceği görülmektedir (URL-10).

(44)

Bu bölümde Poisson ve Normal (Gauss) dağılımlarının başlıca karakteristiklerini ve nükleer istatiksel sayımlarla olan ilişkilerini inceleyeceğiz. Poisson dağılımı radyoaktif bozunmanın tüm süreçlerini kapsamasına rağmen, radyoaktif bozunmalarda normal dağılım daha sık kullanılmaktadır ve diğer tüm dağılımlardan daha iyi bilinmektedir. Sayım istatistiğinde toplam sayım sayısı büyüdüğünde iki dağılımın da aynı sonuçları verdiği dikkate alınırsa, sayım istatistiği için Poisson dağılımını uygulamak can sıkıcı ve zaman alıcı olabilir; bizim nihai hedefimiz Poisson dağılımını normal dağılım ile değiştirmeyi sağlayan bazı karakteristik parametrelerin belirlenmesi olacaktır.

3.1. Poisson Dağılımı

Poisson dağılımı, oluşma olasılığı küçük ve sabit olan rastgele bir sürecin tanımlanmasında kullanılır. Bu dağılım sadece radyoaktif sayım istatistikleri veya nükleer bozunmalar için değil, aynı zamanda bazı yaklaşımlar yoluyla diğer birçok süreci değerlendirmek için de uygulanır. Günlük yaşamdan Poisson dağılımının kullanımına birkaç örnek olarak; öğleden önce bir telefon santraline birkaç dakikada bir gelen çağrılar, bir fabrikanın yıllık grev sayısı, belli bir zaman içinde bir makinanın yaptığı arıza sayısı, bir kitap sayfasındaki baskı hataları, bir şehirde her hafta gerçekleşen ölümcül trafik kazalarının sayısı gibi olayların tanımlanmasında kullanılır.

Przyborowski ve Wilenski (1935), test ve örneklerdeki hataları minimize etmek için kurallar oluşturarak Poisson kanununun bir uygulamasını öne sürmüşlerdir (L'Annunziata, 2003).

Bir radyoaktif bozunmanın aşağıdaki dört maddeyi sağladığı varsayılır:

(i) Bütün radyoaktif çekirdeklerin belirli bir zaman aralığında bozunma olasılıkları aynıdır.

(45)

(ii) Bir çekirdeğin bozunması diğer çekirdeklerin bozunmasından etkilenmez.

(iii) Toplam çekirdek sayısı ve ölçüm zaman aralıkları yeterince büyüktür.

(iv) Çekirdek yarı ömrü detektörlerin algı süresiyle karşılaştırıldığında uzundur.

Bu nedenle radyoaktif bozunma (bu süreçte, olmayan rastgele bir değişken, sürekli bir t zaman periyodunda bir bozunma olayının kaç kere meydana geldiğiyle tanımlanır) rastgele bir süreçtir. Ayrıca bir bozunma olayının bir Δt zaman aralığında meydana gelme olasılığı önceki bütün bozunma olaylarından ve Δt zaman aralığının değerinden bağımsız, asimptotik olarak Δt ile orantılı olmalıdır. Bu koşullar altında Poisson dağılımı;

( ) ( )

(3.1) şeklinde ifade edilir. Burada ( ) bir dizi x bozunma sürecinin t zamanı içinde gerçekleşme ihtimalidir ve a belirlenmesi gereken bir sabittir. Denklem 3.1 üç farklı şekilde elde edilebilir: Binom dağılım yaklaşımıyla (Hoel, 1984; Eadie, et al. 1971), ilk ilkeler dikkate alınarak (Evans, 1972), yada tüm hesaplamaları bir Markov sürecine dayandırarak elde edilir (Feller, 1968; Rozanov, 1977).

Denklem 3.1’den elde edilen üç önemli özellik şunlardır:

(3.2)

(3.3)

∑( )

(3.4)

Normalizasyon koşulu, Denklem 3.2, Poisson dağılımının mümkün olan bütün olasılıklarının (Px) toplamının bire eşit olduğunu gösterir. Denklem 3.3, a

(46)

momentleri belirlememize olanak sağladığıdır (örneğin ∑ ve ∑ ). Bir t zamanındaki bozunmaların ortalama sayısı µ= at denklemiyle belirlenerek Poisson dağılımı Denklem 3.5 ile ifade edilebilir:

( )

(3.5)

Poisson dağılımı asimetriktir ve şekli de µ parametresine bağlıdır; µ değeri sıfırdan büyük gerçek bir değerdir. değeri büyüdükçe dağılım normal dağılıma yaklaşır (L'Annunziata, 2012). Şekil 3.1’de Poisson dağılımın örnekleri gösterilmiştir.

Şekil 3.1 Poisson dağılım örnekleri

3.2. Normal Dağılım (Gauss Dağılımı)

Poisson dağılımı, binom dağılımının limiti için matematiksel bir sadeleştirmedir. Buna ilaveten, dağılımın ortalama değeri büyükse ( ), daha başka basitleştirmeler de yapılabilir.

(47)

( )

√ ( ( )

) ( ) (3.6)

Rassal x değerleri için, ortalama değeri μ ve varyansı σ² olan bir normal dağılımın bulunduğu ( ) gösterimi ile ifade edilir. Normal dağılım, Poisson dağılımı gibi özelliklere sahiptir:

 Normal dağılım normalize bir dağılımdır.

∑ ( )

(3.7)

Sürekli rastgele x değişkenleri için normal dağılım,

∫ ( )

(3.8)

şeklindedir.

 Normal dağılım iki parametre ile karakterilize edilir: ortalama ( ) ve standart sapma (σ). değeri normal dağılımın yerini belirlemektedir ve rm d ı ım grafiğinin tepe noktasıdır.

 Tahmin edilen varyans σ2 ortalama değere eşittir ( ).

Şekil 3.2’de normal dağılımın örnekleri gösterilmiştir..

(48)

Şekil 3.2 Normal dağılım örnekleri

Normal dağılımla ilgili iki önemli tespit yapılabilir:

 Normal dağılım ortalama değerine göre simetrik bir dağılımdır. Bu nedenle P(x) sadece herhangi bir x değerinin ortalama değerden mutlak sapma değerine bağlıdır. Mutlak sapma değeri | | ile tanımlanır.

ortalama değeri büyüdüğünde, x bitişik değerleri için P(x) değerleri arasındaki fark büyük değildir. Diğer bir değişle dağılım yavaşça değişmektedir (Scheaffer, Mulekar, McClave, 2011).

3.3. Standart Normal Dağılım

Standart normal dağılım, ortalaması ve varyansı olan bir normal dağılımdır. Farklı aritmetik ortama ve varyanslara sahip bütün normal dağılımlar Denklem 3.9 dönüşümü sayesinde standart normal dağılıma dönüştürülebilir.

(3.9)

(49)

Burada x, normal dağılımın gerçek değerleridir ve ise normal dağılımın ortalamasıdır. z değişkenlerine standart normal değişken adı verilir ve z değerlerinin standart normal dağılım gösterdiği ( ) şeklinde belirtilir. Bu nedenle standart normal dağılıma z dağılımı da denilmektedir. Eğer x değişkenleri normal değilse, dönüştürülmüş hali de normal olmayacaktır. Standart normal dağılım fonksiyonu;

( )

√ ( ) (3.10)

ile verilir.

3.4. Log-Normal Dağılım

Log-normal dağılım, 10 veya e tabanına göre logaritmasının normal dağılım gösterdiği rastgele bir değişkenin olasılık dağılımıdır. Bu dağılım ileri derecede sağa eğimlidir. Sağa doğru eğimli bir veriye logaritmik dönüşüm uyguladığımızda ortaya çıkan veri normal dağılıma yaklaşıyorsa verimizin log-normal dağılıma sahip olduğunu söyleriz. Şekil 3.3‘de log-normal dağılıma birkaç örnek gösterilmiştir.

Şekil 3.3 Log-normal dağılım grafikleri

(50)

sebep olduğu gıda zehirlenmeleri (mesela salmonelloz), çocuk felci, amibik dizanteri gibi bazı hastalıkların latent dönemleri (mikrop kuluçka devreleri) log-normal dağılımlıdır. Bazı kimyevî maddelerin ve organizmaların çevredeki dağılımı yine log- normaldir. Meselâ yağan yağmurun miktarı, baldaki HMF (hidroksi metil furfurol) miktarı, hava kirliliği, atmosferdeki aerosolün büyüklük dağılımı yine log-normaldir.

Diatom (tek hücreli deniz algi), bitki, balık, kuş, güve gibi canlıların bir ortamdaki miktarları log-normaldir. Bir telefon konuşmasında kurulan cümlelerin kelime olarak uzunlukları ve kelimelerin harf olarak uzunlukları yine log-normal dağılıma sahiptir.

Evlenme yaşı, insanların sahip oldukları tarla büyüklükleri ve gelir seviyeleri gibi sosyal faktörler de log-normal dağılımlıdır (Limpert, et al., 2001).

Birçok nükleer sayım verileri log-normal dağılıma göre incelenir. Bu tür verilere logaritmik dönüşüm uyguladıktan sonra normal dağılımla ilgili bilgiler kullanılarak çıkarımlar yapılabilir.

x sürekli bir rastgele değişken olduğunda ve ln(x)~N(µ, σ2) dağılımına uyduğunda, x rastgele değişkeni de log-normal dağılıma uyar. Log-normal olasılık fonksiyonu,

( )

√ (

) (3.11)

formülü ile tanımlanır. Burada μ ve σ değişkenin logaritma değerleri için ortalama ve standart sapmasıdır (URL-12; Knoell, 1999).

3.5. Binalardaki Radon Düzeylerinin Log-Normal Dağılımı

Bir binanın radon düzeyini; topraktaki radyum içeriği, yeraltı toprak geçirgenliği ve yapının inşaat planı gibi pek çok faktör etkilemektedir. Radon düzeylerinin ölçümünde bu faktörlerin varyasyonuyla binaların radon yoğunluğu geniş

(51)

bir aralıkta dağılmaktadır. Binalardaki radon düzeylerinin dağılımı, ele alınan bir ülkenin tamamı veya küçük bir alan bile olsa, genellikle log-normal olarak dağılır.

Radon yoğunluklarının bu dağılımı izlemesinin sebepleri istatistiksel olarak düşünülünce anlaşılabilmiştir.

Bir parametre, çok sayıda bağımsız faktörün toplamına bağlı olduğunda, bu parametrenin ölçüm değerlerinin normal dağılımı izleyeceği gösterilebilir. Binalardaki radon yoğunluğu ölçümlerinde pek çok bağımsız faktör vardır, fakat bu faktörlerin toplamdan ziyade çarpımsal olduğu araştırmalar sonucunda belirlenmiştir (Gunby, et al., 1993). Kapalı alanlardaki radon yoğunluğu Denklem 3.12 ile temsil edilebilir:

(3.12)

Burada , kapalı alan radon yoğunluğu; , açık alan radon yoğunluğu veya arkafon radon yoğunluğu ve A, B, C,… ise zemindeki radyum miktarı, zemin geçirgenliği, radon gazı giriş yollarının sayısı ve boyutu, binadaki alçak basınç ve binanın havalandırması gibi faktörlerdir. Bu faktörler binaya ne kadar radon girdiğini ve binada ne kadar kaldığını belirler. Bu faktörlerin genellikle bağımsız ve çarpımsal olduğu varsayılır. Denklem 3.12 şu şekilde tekrar yazılabilir:

( ) (3.13)

Denklem 3.13, bağımsız koşulların bir toplamını içerdiğinden normal dağılım gereksinimlerine uyar. Bundan dolayı dağılımda ne kadar bağımsız faktör olursa olsun, ( ) normal dağılıma uymalıdır. Eşdeğer olarak log-normal dağılımlıdır denebilir. Bütün araştırmalar ele alındığında, bu dağılım binalardaki radon düzeyleri araştırmaları sonucunda yaygın olarak gözlenir (Örneğin, Gunby, et al., 1993).

Nero, et al. (1994), veriler Amerika eyaletlerine göre gruplandığında log-normal dağılıma sahip olduğunu göstermiştir. Miles (1994) benzer uygulamayı İngiltere’de 5 km'lik kare alanlara göre gruplandırarak göstermiştir. Bu şekilde uygun veriler göz önüne alındığında, doğal logaritma alarak ve ortalama ve standart sapma hesaplanırken, gerçek verilerden ortalama arkafon radon yoğunluğunu çıkararak her bir grup için geometrik ortalama (GO) ve geometrik standart sapma (GSS) hesaplanarak dağılım

(52)

3.6. Box-Cox Veri Dönüşüm Metodu

Birçok veri analizinde veri dönüşümler sıkça kullanılan bir araçtır. Veri dönüşümlerinde amaç; elde edilen verinin normal dağılmadığı durumlarda, normal dağılıma uymasını sağlayarak, veri setini istatistiksel analize uygun hale getirmeye çalışmaktır. Veri dönüşümlerinin birçok çeşidi olmakla beraber, en sık kullanılan dönüşümler; sabitler eklemek, karekök dönüşümü, logaritmik dönüşüm (doğal logaritmik veya 10 tabanında logaritmik dönüşüm), ters dönüşüm ve sinüs dönüşümleri gibi trigonometrik dönüşümlerdir. Bütün bu dönüşümleri üs dönüşümleri olarak göstermek mümkündür. Örneğin karekök dönüşümü x1/2, ters dönüşümü x-1 şeklinde karakterilize edilebilir. Tukey (1957) tarafından ortaya atılan, genel benzer dönüşümler matematiksel bir sınıf ya da aile olarak düşünülebilir fikri Box ve Cox (1964) tarafından düzenlenmiş ve Box-Cox dönüşümleri adını almıştır. Box-Cox dönüşümleri ( ):

{( )

( ) (3.14)

ile verilir. Burada değeri birkaç adımda elde edilebilir. Öncelikle veri değerleri en az 10 sınıfa ayrılır. Her sınıf için ayrı ayrı standart sapma ve ortalamalar bulunur. Bulunan standart sapma ve ortalamaların logaritmaları alınarak log(standart sapma)- log(ortalama) grafiği çizilir (Şekil 3.4).

Referanslar

Benzer Belgeler

Bundan sonra (4.1)-(4.4) eşitlikleriyle tanımlanan TD-bozon gazı modelinin bazı önemli istatistik mekaniksel özellikleri elde edilecek ve bulunan sonuçlar hem ideal Bose

Düzenek kurulumu, hedeflenen bir konu üzerinde çalışma imkânı sağlayacak elemanların uygun şekildeki konfigürasyonu ile gerçekleştirilir. Ancak zaman içerisinde

Artan elektrik alan şiddeti ile 2ns‟ lik simulasyon boyunca elektron daha fazla saçılmaya maruz kalır ve ortalama serbest zamanı kısalır bunun sonucunda

Reaktif RF saçtırma tekniği ile üretilen TiN ince filmlerin dalga boyuna göre geçirgenlik değerleri Spectroquest Unico UV-4802 ölçüm cihazı ile 190-1100nm

Bu çalışmada basit ve ekonomik bir üretim tekniği olan ultrasonik kimyasal püskürtme tekniği ile üretilen ZnO ince filmlerinin yapısal, optiksel, elektriksel

pyrex cam tüpün dış kısmına iki adet metal (bakır) elektrot sarılmıştır. Cam boru mika tutucuya monte edilip gaz girişi yapılmıştır. Şekil 4.7.’ de çift

TVA tekniği ile üretilen çift taraflı çok katmanlı ZnS-MgF 2 ince filmlerinin dalga boyuna göre geçirgenlik değerleri Spectroquest Unico UV-4802 ölçüm cihazı ile

Optiksel ikinci harmonik üretim, ω frekanslı iki fotonun ω 2 frekansındaki bir fotona dönüşümüdür. Elektrik dipol yaklaşımında, ara yüzey üzerinde