• Sonuç bulunamadı

Büyük Menderes Nehri üzerindeki akım gözlem istasyonlarında eksik verilerinin tamamlanması

N/A
N/A
Protected

Academic year: 2021

Share "Büyük Menderes Nehri üzerindeki akım gözlem istasyonlarında eksik verilerinin tamamlanması"

Copied!
68
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

Anabilim Dalı : İnşaat Mühendisliği Programı : Hidrolik

PAMUKKALE ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ

YÜKSEK LİSANS TEZİ Şahin ŞAHİN

MAYIS 2012

BÜYÜK MENDERES NEHRİ ÜZERİNDEKİ AKIM GÖZLEM İSTASYONLARINDA EKSİK VERİLERİNİN TAMAMLANMASI

(2)
(3)

Bu tezin tasarımı, hazırlanması, yürütülmesi, araştırmalarının yapılması ve bulgularının analizlerinde bilimsel etiğe ve akademik kurallara özenle riayet edildiğini; bu çalışmanın doğrudan birincil ürünü olmayan bulguların, verilerin ve materyallerin bilimsel etiğe uygun olarak kaynak gösterildiğini ve alıntı yapılan çalışmalara atfedildiğini beyan ederim.

İmza :

(4)

ÖNSÖZ

Bu çalışmada, Büyük Menderes Havsasındaki akım gözlem istasyonlarının eksik verilerinin SPSS programı aracılığıyla giderilmesi amaçlanmıştır. Çalışmamızda 21 ayrı gözlem istasyonu baz alınarak eksik veriler tamamlanmıştır. Bu çalışmanın gerçekleşmesinde katkıda bulunan danışmanım Yrd. Doç. Dr. Fatih DİKBAŞ’a teşekkür ederim.

Nisan 2012 Şahin ŞAHİN

(5)
(6)

İÇİNDEKİLER Sayfa ÖZET ... xi SUMMARY ... xii 1. GİRİŞ ... 1 1.1 Yöntem ... 2 1.2 Tezin Amacı ... 5 1.3 Literatür Özeti ... 5

2. EKSİK VERİ HAKKINDA GENEL BİLGİ ... 8

2.1 Eksik Veri Yapılarının Tarihsel Gelişimi ... 8

2.2 Eksik Veri Mekanizmaları ... 9

2.2.1 Tamamıyla Rassal Olarak Kayıp ... 9

2.2.2 Rassal Olarak Kayıp Veriler ... 9

2.2.3 İhmal Edilemez Kayıplar... 10

2.3 Kayıp Veri Sürecinde Rastgeleliğin Sorgulanması ... 10

3. GELENEKSEL EKSİK VERİ TAMAMLAMA YÖNTEMLERİ ... 11

3.1 Veri Silme Yöntemleri ... 11

3.1.1 Liste / Durum Düzeyinde Veri Silme ... 11

3.1.2 Çiftler Düzeyinde Veri Silme ... 12

3.2 Atama Yöntemleri ... 13

3.2.1 Yerine Ortalamayı Koyma ... 13

3.2.2 Regresyon Atfı ... 13

3.2.3 Hot / Cold Deck Atama ... 14

4. MAKSİMUM BENZERLİK TABANLI YÖNTEMLER... 16

4.1 Beklenti En Büyükleme Yöntemi ... 16

4.1.1 Beklenti En Büyükleme (EM) Algoritması ... 19

4.2 Çoklu Atama Yöntemi ... 21

5. ÇALIŞMA ALANINDA EKSİK VERİLERİN TAMAMLANMASI ... 23

5.1 Akarsu Debi Ölçümlerinde Eksik Verilerin Tamamlanması ... 19

5.2 Akım Gözlem İst. Karşılaştırılarak Eksik Verilerinin Tamamlanması ... 24

5.1.1 004 numaralı Akım Gözlem İstasyonunun 054 ile Tamamlanması ... 25

5.1.2 009 numaralı Akım Gözlem İstasyonunun 004 ile Tamamlanması ... 26

5.1.3 037 numaralı Akım Gözlem İstasyonunun 039 ile Tamamlanması ... 27

5.1.4 052 numaralı Akım Gözlem İstasyonunun 054 ile Tamamlanması ... 28

5.1.5 065 numaralı Akım Gözlem İstasyonunun 062 ile Tamamlanması ... 29

5.1.6 081 numaralı Akım Gözlem İstasyonunun 712 ile Tamamlanması ... 30

5.1.7 099 numaralı Akım Gözlem İstasyonunun 098 ile Tamamlanması ... 31

5.1.8 004 numaralı Akım Gözlem İstasyonunun 071 ile Tamamlanması ... 32

(7)

5.1.10 075 numaralı Akım Gözlem İstasyonunun 052 ile Tamamlanması ... 34

5.1.11 053 numaralı Akım Gözlem İstasyonunun 054 ile Tamamlanması ... 35

5.1.12 082 numaralı Akım Gözlem İstasyonunun 083 ile Tamamlanması ... 36

5.1.13 112 numaralı Akım Gözlem İstasyonunun 008 ile Tamamlanması ... 37

5.1.14 007 numaralı Akım Gözlem İstasyonunun 008 ile Tamamlanması ... 38

5.1.15 049 numaralı Akım Gözlem İstasyonunun 052 ile Tamamlanması ... 39

5.1.16 062 numaralı Akım Gözlem İstasyonunun 706 ile Tamamlanması ... 40

5.1.17 079 numaralı Akım Gözlem İstasyonunun 014 ile Tamamlanması ... 41

5.1.18 096 numaralı Akım Gözlem İstasyonunun 098 ile Tamamlanması ... 42

5.1.19 114 numaralı Akım Gözlem İstasyonunun 082 ile Tamamlanması ... 43

5.1.20 035 numaralı Akım Gözlem İstasyonunun 010 ile Tamamlanması ... 44

5.1.21 014 numaralı Akım Gözlem İstasyonunun 030 ile Tamamlanması ... 45

6. SONUÇ VE ÖNERİLER ... 47

KAYNAKLAR ... 48

(8)

KISALTMALAR

SPSS : Statistical Package for Social Sciences

TROK : Tamamen Rassal Olarak Kayıp

ROK : Rassal Olarak Kayıp

İEK : Backpropagation

SGİT : Common Gateway Interface

TOG : Tamamlanmış Olgular Analizi

MCAR : Missing Completely at Random

MAR : Missing at Random

NI : İhmal Edilemez (Non-ignorable) LD : Listwise Deletion CD : Casewise Deletion PD : Pairwise Deletion EM : Expectation Maximization BM : Beklenti Maksimizasyonu MI : Multiple Imputation DSİ : Devlet Su İşleri

(9)

TABLO LİSTESİ

Tablolar

3.1 : Sayısal örnek ... 12 3.2.3 : Hot deck atfı için örnek. ... 14

(10)

ŞEKİL LİSTESİ Şekiller

1.1 : Büyük Menderes Havzası Akım Ağı ... 3 1.2 : Büyük Menderes Havzası Akım Gözlem İstasyonları ... 4

4.1 : EM Algoritması İçin Akış Çizelgesi ... 20 5.1.1 : 004 ve 054 nolu akım gözlem istasyonlarının tamamlanmış verileri .... 25

5.1.2 : 009 ve 004 nolu akım gözlem istasyonlarının tamamlanmış verileri .... 26 5.1.3 : 037 ve 039 nolu akım gözlem istasyonlarının tamamlanmış verileri .... 27 5.1.4 : 052 ve 054 nolu akım gözlem istasyonlarının tamamlanmış verileri .... 28 5.1.5 : 065 ve 062 nolu akım gözlem istasyonlarının tamamlanmış verileri .... 29 5.1.6 : 081 ve 712 nolu akım gözlem istasyonlarının tamamlanmış verileri .... 30 5.1.7 : 099 ve 098 nolu akım gözlem istasyonlarının tamamlanmış verileri .... 31 5.1.8 : 004 ve 071 nolu akım gözlem istasyonlarının tamamlanmış verileri .... 32 5.1.9 : 039 ve 035 nolu akım gözlem istasyonlarının tamamlanmış verileri .... 33 5.1.10 : 075 ve 052 nolu akım gözlem istasyonlarının tamamlanmış verileri .... 34 5.1.11 : 053 ve 054 nolu akım gözlem istasyonlarının tamamlanmış verileri .... 35 5.1.12 : 082 ve 083 nolu akım gözlem istasyonlarının tamamlanmış verileri .... 36 5.1.13 : 112 ve 008 nolu akım gözlem istasyonlarının tamamlanmış verileri .... 37 5.1.14 : 007 ve 008 nolu akım gözlem istasyonlarının tamamlanmış verileri .... 38 5.1.15 : 049 ve 052 nolu akım gözlem istasyonlarının tamamlanmış verileri .... 39 5.1.16 : 062 ve 706 nolu akım gözlem istasyonlarının tamamlanmış verileri .... 40 5.1.17 : 079 ve 014 nolu akım gözlem istasyonlarının tamamlanmış verileri .... 41 5.1.18 : 096 ve 098 nolu akım gözlem istasyonlarının tamamlanmış verileri .... 42 5.1.19 : 114 ve 082 nolu akım gözlem istasyonlarının tamamlanmış verileri .... 43 5.1.20 : 035 ve 010 nolu akım gözlem istasyonlarının tamamlanmış verileri .... 45 5.1.21 : 014 ve 030 nolu akım gözlem istasyonlarının tamamlanmış verileri .... 46

(11)

SEMBOL LİSTESİ

σ Akış katsayısı

R2 Regresyon tahmininde elde edilen sayı

µ

Belli bir sayıya yaklaştıkça olasılık çarpımının büyümesini simgeleyen sayı tabanı ∑ Toplam

(12)

ÖZET

BÜYÜK MENDERES NEHRİ ÜZERİNDEKİ AKIM GÖZLEM İSTASYONLARINDA EKSİK VERİLERİNİN TAMAMLANMASI

Bu çalışmada Büyük Menderes Nehri üzerindeki akım gözlem istasyonları için DSİ’den alınan yıllara göre dağılım gösteren akım verilerinin çeşitli nedenlerle hiç tutulmamış veya eksik tutulmasından kaynaklanan kayıp verilerin tekrar elde edilmesi amaçlanmıştır. Kayıp veya eksik veriler araştırmalarda problemler yaratmaktadır. Bu problemi çözmek amacıyla kayıp değerlerin yerine atıf yapmaksızın geliştirilen çözüm teknikleri ile, kayıp değerlerin yerine uygun değerlerin atfedilmesini sağlayan atfetme teknikleri bulunmaktadır. Fakat hangi atıf tekniğinin kullanılması gerektiği büyük ölçüde kayıp değer mekanizmasına bağlıdır. Kayıp Veri Analizi araştırmacıların çok sık karşılaştığı kayıp değer sorununa çözüm getirmeyi amaçlayan yaklaşımlar içerir. Bu yaklaşımlar Silme (liste/durum düzeyli, çiftler düzeyinde) ve Atama (regresyon, hot / cold deck, beklenti maksimizasyonu, son gözlemi ileri taşıma, çoklu atma) olmak üzere farklı yöntemlerden oluşur. Büyük Menderes Nehri üzerindeki akım gözlem istasyonlarındaki eksik verilerin tamamlanması için, havza içerisinde bulunan ve eksik verisi olmayan veya tamamlayacağı akım gözlem istasyonunun o yıllardaki verisi tam olan akım gözlem istasyonlarından faydalanılarak eksik veriler tamamlanmıştır. Bu amaçla yapılan çalışmada geriye dönük olarak Büyük Menderes Nehri üzerindeki akım gözlem istasyonlarının eksik verileri giderilmeye çalışılmıştır. Sonuç olarak beklenti maksimizasyonu yöntemi veri setine uygun bir şekilde kulanıldığında anlamlı sonuçlar vermektedir.

Anahtar Kelimeler: Akım Gözlem Serileri, Eksik Verilerin Tamamlanması,

(13)

SUMMARY

THE COMPLETION OF THE MISSING DATA OF GREAT MENDERES RIVER STREAMFLOW OBSERVATION STATIONS

Aim of this study is to complete the current DSI data received over the years (not completed for various reasons) of stream observation stations on the Great Menderes

River. Missing or incomplete data creates problems in field studies. For solving this

problem, the solution techniques developed without referring to the missing values

and techniques that attribute the appropriate values instead of missing values. Reference technique depends on the the mechanism of missing value. Missing Data

Analysis aims to find solutions for researchers that frequently encounter missing

value problems. These approaches differ, including the deletion (list / situation level, couple level) and assignment (regression, hot / cold deck, expectation maximization,

last observation carry forward, multi-disposal) methods. For the completion of

missing data on the stream gauging stations located within Great Menderes River, the basin stream observation stations with complete data in those years are used. For this purpose, retrospectively missing data on Great Menderes River streamflow observation are completed. According to the data set analyzed, expectation maximization method gives meaningful results.

Key words: Streamflow Observation Series, Completing Missing Values,

(14)

1. GİRİŞ

Akarsular insanoğlu için en önemli tatlı su kaynaklarından birisidir. Geçmişte ve günümüzde sosyal, ekonomik ve politik gelişmeler başlıca tatlı su kaynaklarına erişebilecek ve bunların dağıtımına olanak sağlayacak nehir sistemleriyle ilişkilidir. Akarsular pek çok insani amaçlı kullanımlarının yanı sıra birçok canlı için de bir yaşam alanı olmaları açısından önemli bir habitat olma özelliği taşır. Akarsuların karakteristik özelliklerini daha iyi anlamak, bunları yapılacak çalışmalarda kullanabilmek ve gelecekteki durumları hakkında tahminde bulunabilmek için debi ölçüm çalışmaları yapılmaktadır. Akarsuları karakterize etmek ve yıllık değişimleri sınıflandırmak için kullanılan belirli karakteristik debi değerleri vardır. Bu sınıflandırma ortalama pik debi, aylık ya da yıllık ortalama debi ve ortalama düşük debi değerlerini içerir. Bu değerler, özellikle akarsu üzerine yapılacak bir su yapısının tasarlanması için oldukça önemlidir. Bu tasarım parametrelerinin içerisinde mevcut ekolojik yapının korunabilmesi için düşük debi değerlerinin iyi bir şekilde belirlenebilmesi gerekmektedir. Kurulacak su yapısının tasarımı ve işletilmesinde bu değerlerin gözönüne alınmaması durumunda doğal yapısının değişmesi ve mevcut biyolojik yaşama zarar verebilme ihtimali oldukça yüksektir. Bu düşük debi ölçümleri, hidroloji araştırmalarında önemli etken olarak rol almaktadır. Araştırmalarda kayıp değer problemine sıkça rastlanılmaktadır. Kayıp değerler analizlerde sorun yaratmaktadır. Çünkü istatistiksel analizler ve paket programları, verilerin tümünün var olduğu durumlar için geliştirilmiştir. Bu noktadan hareketle verilerimizin arasında kayıp değerler varsa, ki genellikle bu problemle yüz yüze gelinmektedir, ne yapmamız gerekir sorusundan hareketle böyle bir çalışma içerisine girilmiştir. Ayrıca kayıp değer analizine, kayıp değer içeren herhangi bir veri tabanı için diğer istatistiksel analizler uygulanmadan önce başvurulması gerekilen bir ön analiz olarak bakmakta yarar vardır. Kayıp değer analizi ile, kayıp değerler uygun değerlerle tamamlanır ve diğer analizler için uygun bir zemin hazırlanır. Nehir akımları ile ilgili araştırma çalışmalarında verilerin kayıp olması için üç ana neden vardır:

(15)

1. Dış etkenlere bağlı olarak ölçümler geçici süreyle durmuştur. 2. Ölçüm cihazı arızalanmıştır.

3. Ölçümler idarenin yetkisiyle durdurulmuştur.

Araştırmada yer alan ve kayıp değer veya değerleri içeren birimler, bir bilgi yokluğunu temsil ederler, dolayısıyla bir bilgi kaybına neden olurlar. Standart istatistiksel yöntemler ve paket programlar tam bilgi durumu için düzenlenmişlerdir ve bu kayıp değer içeren birimlere uygulandıklarında yanlı tahminlere sebep olurlar. Kayıp değer problemi için çeşitli çözüm ve atıf teknikleri geliştirilmiştir. İlerleyen bölümlerde bu çözüm ve tekniklere detaylı olarak değinilecektir. Daha öncesinde ise kayıp değer mekanizmalarından bahsetmek yerinde olacaktır. Çünkü hangi çözüm veya atıf tekniğinin uygulanması gerektiği, diğer bir deyişle hangi çözüm ve atıf tekniğinin uygun olabileceği kayıp değer mekanizmalarına bağlıdır.

1.1 Yöntem

Çalışma kapsamında Türkiye'de bulunan 26 ana akarsu havzalarından bir tanesi olan Büyük Menderes Havzasındaki akarsu akımları ele alınmıştır. Büyük Menderes

Havzası, Türkiye’nin orta batısında, 370 12’ - 380 40’ Kuzey enlemleri ile 27015’ –

30015’ Doğu boylamları arasında kalan, 24976 km2 büyüklüğü ile Türkiye

yüzölçümünün % 3,2 sini kapsayan, uzun yıllar ortalama yıllık toplam yağış yüksekliği 610 mm olan, ülkenin 7 no lu havzasıdır. Havzanın kuzeyinde İzmir, Manisa, Uşak; güneyinde Muğla; doğusunda Afyon ve Burdur illeri; batısında ise Ege Denizi yeralmaktadır. Havza doğu-batı yönünde uzanmakta, 584 km uzunluğundaki anakol oluşturan Büyük Menderes Nehri ile Bafa Gölü’nün batısındaki Ege Denizi’yle birleşmektedir.

(16)

Şekil 1.1 Büyük Menderes Havzası Akım Ağı (http://web.adu.edu.tr/user/odurdu/tmenderes.html)

(17)
(18)

1.2 Tezin Amacı

Bu çalışmada Büyük Menderes Havsasındaki gözlem istasyonlarından 21 tanesinde yıllara göre eksik veri bulunduğu tespit edilmiş ve bu eksik verilerin giderilmesi amaçlanmıştır. Havza içerisindeki akım gözlem istasyonlarının 2000 yılına kadar tutulan değerlerindeki eksiklikleri, aynı havza içerisinde bulunan akım gözlem istasyonlarının verilerinden faydalanılarak SPSS programı ile tamamlanmış ve elde edilen sonuçlar grafik üzerinde gösterilmiştir. Bu amaçla geçmişe yönelik elde edilen eksik veriler yerine konularak o yıllara ait eksiklilkler giderilip havzanın geleceğine yönelik tahminleri daha güvenilir yapılabilir.

1.3 Literatür Özeti

Hidroloji ve meteoroloji alanında yapılan akademik çalışmalara (tez ve diğer araştırma projeleri) bakıldığında kurulan ve geliştirilen model sonuçlarının doğruluğunun, kullanılan verilerin yapısına ve kalitesine doğrudan bağlı olduğu vurgulanmaktadır. Özellikle çok geniş alanları kapsayan bölgelerde yapılan çalışmalarda kullanılan istasyonların sayısı, konumu, verilerin kayıt uzunluğu ve kalitesi model sonuçları üzerinde oldukça etkilidir. Bu tür çalışmalardan önce bölgede yer alan istasyonlar detaylı bir şekilde ön analizlerden geçirilmeli ve kayıt değerlerinin kalitesi test edilmelidir. Ancak bu işlemler oldukça kapsamlı ve zaman alıcıdır.

Büyük Menderes Nehri üzerindeki akım gözlem istasyonlarında yapılmış kayıtlardaki eksik değerlerin belirlenerek modern istatistiksel yöntemlerle tamamlanması ve gözlemlerin kalite kontrolünün yapılarak aykırı değerlerin belirlenip düzeltilmesi bu çalışmanın konusunu oluşturmaktadır. Ülkemizde bulunan istasyonlarda gözlem kayıtları çoğunlukla (özellikle akım gözlem istasyonları) çok uzun süreli olmadığı için, sadece her istasyonun gözlem süresi boyunca oluşmuş eksik kayıtlar dikkate alınmış, geriye veya ileriye yönelik seri uzatımı çalışması yapılmamıştır. Tez çalışması süresince yapılan yeni gözlemler de değerlendirmeye alınmamıştır. Akım gözlem istasyonlarındaki tutulmuş olan veriler kullanılarak eksik veriler belirlenmiş olup grafikler halinde gösterilmiştir.

(19)

Hidrolojik bir veri serisindeki eksik değerler çeşitli istatistiksel yöntemler kullanılarak tamamlanabilmektedir. Bazı araştırmacılar, eksik verisi olan serileri ihmal edip sadece verisi tam olan serileri ele almayı tercih etmektedirler (Nie ve diğ, 1975). Hidrolojik serilerin tamamlanmasına yönelik diğer yöntemler arasında, incelenen serinin ortalaması veya medyanıyla tamamlama (Ford, 1983; Buck, 1960; Rubin 1978, 1980), komşu serilerin ağırlıklı ortalamaları ile tamamlama (Scheuren, 1983) gibi basit yöntemlerin yanında, tekli veya çoklu regresyon, zaman serisi modelleri, Markov türü modeller, en yakın k komşu (KN) algoritması (Batista ve Monard 2003) ve beklenti en büyükleme (EM) algoritması (Dempster ve diğ. 1977) gibi daha karmaşık modeller de uygulama alanı bulmuştur.

Güner ve diğ. (1996) yaptığı çalışmada Büyük Menderes Nehri üzerinde akım gözlem istasyonlarındaki eksik verilerin giderilmesini istasyonlar arasında regresyon analizi yaparak benzerliği en fazla olan istasyon çiftlerini kullanarak eksik verileri tamamlamıştır.

Karahan ve diğ. (2006) yaptıkları çalışmada aylık akış serilerinin içsel bağımlılıkları dikkate alınarak kendinden önceki aylar ve aynı ay için geçmiş yıllar ait gözlem değerleri kullanılmak suretiyle ilgili ayın akış değerini doğrusal olmayan optimizasyon tekniği (GRG2) ile tahmin eden bir model geliştirilmiştir. Model geliştirilirken gözlem değerlerinin %80’i ağırlık katsayıların tahmininde %20’si de modelin test edilmesinde kulanılmıştır. Geliştirilen model ve gözlem sonuçları arasındaki farkın istatistiksel dağılımı göz önünde bulundurularak modele bir hata terimi eklemek suratiyle akış serilerindeki eksik verilerin tamamlanmasında ve geleceğe yönelik tahminlerde GRG2 yöntemi farklı ve etkin bir çözüm yöntemi olarak önerilmektedir.

Karahan ve diğ. (2007) yaptığı çalışmada Büyük Menderes Nehri ile Çürüksu Çayı birleşim noktası içerisinde yer alan üç ayrı akım gözlem istasyonunun günlük ortalama akım değerleri kullanılarak; doğrusal üstel ve doğrusal olmayan beş ayrı model geliştirmiş ve bu modeller kullanılarak eksik akım değerleri Genetik Algoritma ve Yapay Sinir Ağları (YSA) kullanılarak belirlenmiş ayrıca, karşılaştırma amacıyla DSİ tarafından kullanılan doğrusal modellerin ağırlık kat sayıları regresyon tekniği kullanılarak belirlenmiştir.

Serdar GÖNCÜ (2011) yaptığı Çalışmada, Porsuk havzasında bulunan akarsu ve kollarındaki akım değerlerinin analizleri için ABD Çevre Koruma Ajansı (EPA)

(20)

tarafından geliştirilmiş DFLOW yazılımı kullanılmıştır. Eskişehir’in de içinde bulunduğu Porsuk Havzası içerisinde belirlenen istasyonlara ait debi verileri Devlet Su İşleri’nden temin edilmiştir. DFLOW yazılımı sayesinde 7Q10, 4B3 gibi hidrolojik ve biyolojik yapı esaslı düşük debi değerlerini dikkate alan hidrolojik veriler hesaplanarak son 45 yıllık süreçte akarsuların nasıl etkilendiği anlaşılmaya çalışılmıştır.

Yaşar (2004) yaptığı çalışmada, Adıyaman Bölgesine ait DSİ’nin 21-189 nolu akım gözlem istasyonlarından 1985-1988 yılları arası alınan veriler ile Devlet Meteoroloji Genel Müdürlüğü Adıyaman Gözlem İstasyonlarından alınan sıcaklık ve yağış verileri kullanılarak yıl içerisindeki eksik günlük akış değerlerinin tamamlanması ve Küçük Düşülü Hidroelektrik Santrallerin tasarımında genel girdiyi oluşturan akış değerlerindeki boşlukları, eksik veri tamamlama sürecinde Yapay Sinir Ağları (YSA) yöntemiyle doldurmaktadır. Yapılan çalışmada, geleceğe yönelik tahmin yapabilen bir YSA mimarisinin geliştirilmesi tasarım ve proje aşamasındaki pek çok su yapısının güvenilirliğine ışık tutmaktadır.

(21)

2. EKSİK VERİ HAKKINDA GENEL BİLGİ

2.1 Eksik Veri Analizinin Tarihsel Gelişimi

Kayıp verilerle ilgili ilk çalışmalar, araştırma tasarımının indirgenmiş denge yada sapma eksikliklerinin algoritmik ve hesaba dayalı çözümleriyle alakalıdır (Afifi ve Elashoff 1966, Hartley ve Hocking 1971). Sonraki dönemlerde Dempster, Laird ve Rubin’inin ilk olarak 1977’de ortaya attığı beklenti maksimizasyonu (BM) ve Rubin’in 1987’de bahsettiği veri ataması gibi algoritmalar güçlü hesaplama teknikleriyle kayıp veri sorununa sağlam çözümler sunmuştur. Günümüzde kullanılan kayıp veri terminolojisi ilk kez Little ve Rubin tarafından kullanılmıştır. Ayrıca Little ve Rubin diğer bölümlerde değineceğimiz gibi kayıp verileri birtakım özelliklerine göre ayırarak Tamamen Rassal Olarak Kayıp (TROK), Rassal Olarak Kayıp (ROK), İhmal Edilemez Kayıp (İEK) terimlerini kayıp veri analizi literatürüne eklemistir.

Özellikle plot çalışmalar söz konusu olduğunda, kayıp veri içeren uzunlamasına süreçli araştırmalarda Son Gözlemi İleri Taşıma (SGİT), Tamamlanmış Olgular Analizi (TOA) ya da çeşitli atama yöntemleri kullanılır. Birçok yazarın eleştirisine rağmen bu yöntemlerin varsayımları sonuca etkisi göz önünde bulundurulmadan kabul edilir. Bu konuyla ilgili göreceli olarak ilk çalışmalar Heyting, Tolboom ve Essers (1992) tarafından yapılmıstır. Lavori, Dawson ve Shera (1995) benzerlik ve çoklu atama yöntemlerini önermislerdir. Siddiqui ve Ali (1998) direkt-benzerlik ve SGİT yöntemlerini karşılaştırmıştır. Son dönemlerdeki uzunlamasına süreçli çalısmaları inceledigimizde tartışılabilir sonuçları olmasına rağmen Son Gözlemi ileri Taşıma ve Tamamlanmış Olgular Analizinin sıklıkla kullanıldığı

(22)

2.2 Eksik Veri Mekanizmaları

Kayıp veri mekanizmasının belirlenmesi kayıp veri sorununu giderecek doğru analizin seçilmesinde, doğru analizin seçilmesi de o verinin degerlendirilmesinde doğru sonucun elde edilmesinde etkin rol oynar. Kayıp değerler için çözüm ve atıf tekniklerinin doğru kullanımı, geçerli sonuçlara ulaşabilmek açısından oldukça önemlidir. Kayıp veriler ilk defa 1976 yılında Rubin tarafından sınıflandırılmıştır. Bu konudaki diger çalışmaların yine Little (1992) ve Rubin tarafından yapıldığı görülmüştür. Little ve Rubin bu mekanizmaları üç temel kategoriye ayırmaktadır: Tamamıyla rassal olarak kayıp (Missing Completely at Random, MCAR), rassal olarak kayıp, ihmal edilemez kayıp. Aşağıda açıklayacağımız kayıp veri mekanizmaları Tamamen Rassal Olarak Kayıp, Rassal Olarak Kayıp ve İhmal Edilemez Kayıptır (Baygül, 2007).

2.2.1 Tamamıyla Rassal Olarak Kayıp (TROK)

A ve B gibi iki değişken verildiğinde, yanıt olasılığı A ve B değişkenlerinden bağımsız ise, kayıp veri MCAR olarak ele alınır. Diğer deyişle ‘kayıp olma (missingness)’ analizde yer alan spesifik değişkenlerle ilişkili değildir. MCAR koşullarının sağlanıp sağlanmadığı yanıt verenler ile yanıt vermeyenler arasındaki gözlenen verilerin dağılımlarının karşılaştırılmasıyla sağlanabilir. Eğer veriler için MCAR sağlanıyorsa, Liste bazında silme (listwise deletion) veya diğer bir ifade ile durum bazında silme (casewise deletion) çözüm teknikleri iyi bir seçim oluşturacaktır. Bu teknikler pek çok istatistiksel paket programda mevcuttur. Avantajı ise basitliği ve hesaplama süresinin kısalığıdır. Eğer veriler MCAR değil ise, sonuçlar yanlı olacaktır ve bu sebepledir ki diğer daha güçlü teknikler bu durumda daha uygun olacaktır.

2.2.2 Rassal Olarak Kayıp (ROK)

A ve B gibi iki değişken ele alındığında, yanıt olasılığı A’ ya bağlı fakat B’ ye bağlı değil ise, kayıp veri MAR olarak düşünülür. Çok sayıda eksik veya kayıp veri atıf tekniği bu varsayıma uygun olarak geliştirilmiştir. EM, regresyon ve çoklu atıf (Multiple İmputation) tekniği MAR durumu için uygun atıf teknikleridir.

(23)

2.2.3 İhmal Edilemez (İE)

A ve B gibi iki değişken verildiğinde, yanıt olasılığı A ve B’ ye de bağlı olması mümkün ise, kayıp veri NI olarak düşünülebilir. Diğer bir deyişle ‘kayıp olma’ rassal değildir ve veri tabanındaki bir diğer değişkenden tahmin edilemez. Aşağıda söz edilecek atıf tekniklerinin tümü NI durumunda yanlı sonuçlara yol açacaktır.

2.3 Kayıp Veri Sürecinde Rastgeleliğin Sorgulanması

Kayıp veri analizinde kullanılacak yöntemin belirlenmesi için kayıp veri sürecinin rastgeleliğinin aşağıdaki yöntemlerle irdelenmesi gerekir (Baygül,2007).

1) Veri setindeki bir değişkene ilişkin gözlemler kayıp veri içerenler ve içermeyenler olarak iki gruba ayrılmalı ve ilgilenilen diğer değişkenlerin aldığı değerler açısından bu iki grup arasında anlamlı bir fark olup olmadığı araştırılmalıdır. Bu araştırma iki ortalama arasındaki farkın anlamlılığı test eden “t testi“ kullanılarak yapılabilir. Anlamlı fark, rastgele olmayan kayıp veri sürecinin varlığını gösterir.

2) Veri setindeki değişkenler kayıp değer içeren ve içermeyenler olmak üzere iki gruba ayrılır, tam veriler 1, kayıp veriler 0 olarak kodlanır ve bu değişkenler arasındaki Pearson korelasyon katsayısı hesaplanır. Bulunan korelasyon katsayıları herbir değişken çifti için kayıp veriler arasındaki ilişki miktarının derecesini belirtir. Küçük korelasyon katsayısı rastgeleliği işaret eder.

3) Little’ın TROK testi rastgeleliğin arastırılmasında sıklıkla kullanılan bir x2 testidir.

p <0,05 olması durumunda veri yapısının TROK olmadıgı sonucuna varılır. Bu test aşagıda formülle açıklanmıstır:

X2TROK=∑herbir tek yapı (birim sayısı*ortalamadan elde edilen Mahalanobis D2

(24)

3. GELENEKSEL EKSİK VERİ TAMAMLAMA YÖNTEMLERİ 3.1 Veri Silme Yöntemleri

Kayıp değer durumunda geçerli çözüm ve atıf tekniklerinin bulunduğundan daha önce bahsedilmişti. Bu başlık altında atıf tekniklerinin en temel olanları anlatılmaya çalışılacaktır. Bu atıf tekniklerinin yanında liste veya durum bazında veri silme (listwise veya casewise data deletion-LD veya CD) ve çiftler bazında veri silme (pairwise data deletion-PD) gibi atıf yapmadan kayıp değer problemini ortadan kaldıracak çözüm tekniklerinden de bahsedilmiştir. Yerine ortalamayı koyma (mean substitution), regresyon atfı (regression imputation), hot deck atfı (hot deck imputation), beklenen maksimizasyon yaklaşımı (expectation maximization (EM) approach), ve çoklu atıf (multiple imputation) en çok kullanılan atıf teknikleridir. İzleyen bölümlerde sırasıyla atıf yapmadan kayıp değer problemini çözmeye yönelik liste bazında veri silme veya durum bazında veri silme ile çiftler bazında veri silme ve yerine ortalamayı koyma tekniklerine ve atıf tekniklerine kısaca değinilmiş ve hangi durumlarda kullanılabileceğine yer verilmiştir. Ayrıca bu atıf yöntemlerinin kuvvetli ve zayıf yönlerine değinilmiştir.

3.1.1 Liste Bazında veya Durum Bazında Veri Silme

Bu çözüm tekniğine göre, eğer bir kayıt herhangi bir analizde kullanılan herhangi bir değişken için kayıp veri içeriyorsa, tüm kayıt analizden çıkarılır. Diğer bir deyişle tüm kayıtları olan yanıtlayıcı analizde yer alır ve diğerleri analiz dışı bırakılır. Bu yaklaşım kayıp veriler için kullanılan en temel yöntemdir ve SAS ve SPSS gibi sıkça kullanılan istatistiksel paket programlarında yer almaktadır. MCAR ve NI durumlarında kullanılması yanlı sonuçlara sebebiyet verecektir. MAR durumunda kullanılabilecek bir yöntemdir. Aşağıda görülen Tablo 3.1’ de sayısal bir örneğe yer verilmiştir.

(25)

Tablo 3.1 : Sayısal Örnek

(http://www.smallwaters.com/whitepapers/longmiss/.)

Durum Değişken 1 Değişken 2 Değişken 3

1 13 23 21 2 14 22 17 3 15 - 11 4 16 18 - 5 17 17 12 6 - 20 8 7 - 20 15

Bu tabloda 3 değişken ve 7 durum söz konusudur. 21 gözlem değerinin 4 tanesi kayıptır. Liste bazında veya durum bazında silme yöntemine göre kayıp değer içeren 3., 4., 6. ve 7. durumlar hesaplama dışı bırakılarak, kayıp değer içermeyen 1., 2. ve 5. durumlara dayanılarak hesaplamalar yapılacaktır.

3.1.2 Çiftler Düzeyinde Veri Silme

Bu yönteme göre her değişken çifti için tüm durumları tam olan gözlemlerden korelasyon/kovaryans tahminleri hesaplanır. PD her bir korelasyon için en iyi tahmini sağlar. Çünkü elde edilebilir tüm bilgiyi kullanmaktadır. PD verilere ilişkin daha fazla bilgiyi kullandığından, LD’ den daha etkin bir yöntemdir. Eğer veriler MAR koşulunu sağlıyorsa aynı LD’ de olduğu gibi tahminler yanlı olacaktır.

PD için özel bir problem, sonuç olarak elde edilen korelasyon matrisinin pozitif tanımlı olmayabilmesi problemidir. Bu korelasyon matrisinin tersinin kullanılması durumunda probleme yol açacaktır. PD yöntemi için bir diğer problem, uygun örneklem büyüklüğünün belirlenmesi için paket programların iyi bir yol sağlayamamasıdır. Örneğin SPSS, en küçük çiftler bazında korelasyonun örneklem büyüklüğünü N olarak kabul eder.

Bu örneklem büyüklüğü tahmini, korelasyonların çoğu yaklaşık olarak tam bilgiye dayandığı durumlarda doğru bir tahmin olmayacaktır.

LD ile PD kıyaslandığında PD daha iyi sonuçlar sağlamaktadır (matris pozitif tanımlı olduğunda) fakat aşağıda değinilecek diğer yöntemler PD’ den daha avantajlıdır (Oğuzlar, 2001).

(26)

3.2 Atama Yöntemleri

3.2.1 Yerine Ortalamayı Koyma

Kayıp değer için sıkça kullanılan bir strateji, kayıp değer içeren değişkenin ortalamasını kayıp değerin yerine kullanmaktır. Eğer ortalama gelir 500 dolar ise, gelirini beyan etmeyen bir kişi için gelir 500 dolar kabul edilir. Ortalamanın bu şekilde atanmasındaki mantık, kişiye ilişkin diğer her hangi bir bilgi olmadan, herhangi normal dağılımlı bir değişken için değerlerin en iyi tahmininin ortalama oluşudur (örneğin gelir gibi eğik değişkenler için en iyi yol medyan gelirin kayıp değerler için kullanılmasıdır).

Eğer veriler yaklaşık olarak normal dağılım göstermekteyse ve MAR koşulu sağlanıyorsa, bu yöntem standartlaştırılmamış yanlı parametre tahmini olmayacaktır. Diğer taraftan çok sayıda cevaplayıcı bir değişkene ilişkin benzer skorlara sahipse (örneğin gelirleri 500 dolar ise), kayıp değerli değişkenler arasındaki kovaryans ve

değişkenler arasındaki varyans daralacaktır. Varyansın daralması R2 ve β gibi

standardize olmuş katsayıların tahminlerini azaltacaktır. Azaltılmış varyans normal olarak standart hataları arttırmakta ve t oranlarını azaltmakla birlikte, yerine ortalamayı koyma yöntemi aynı zamanda örneklem büyüklüğünün artıracaktır. Bu yapay olarak şişirilmiş örneklem büyüklüğünün kullanılması sonucunda, bu yöntem t oranlarını daha anlamlı hale getirecektir.

Bu yöntemle bağlantılı diğer bir yöntem olan yerine grup ortalamasını koyma yaklaşımı daha anlamlı sonuçlara ulaşılmasını sağlayacaktır. Bu yönteme göre, kayıp değer içeren değişkene bağlı olarak daha homojen olan gruplar için ortalama kayıp değerlerin yerine kullanılır. Bu yaklaşım yerine ortalamayı koyma yaklaşımından daha iyi sonuçlar sağlar. Kayıp değerler için atıflar daha yerindedir ve varyans çok fazla daraltılmamış olur. Fakat yine de bu yaklaşım varyansı daraltır ve bu yolla kovaryanslar/korelasyonlar yanlı sonuç verir (Oğuzlar, 2001).

3.2.2 Regresyon Atfı

Çoklu regresyon kayıp değerlere atıf yapmak için kullanılan bir diğer yöntemdir. Bu yöntem, kayıp değer içeren her bir değişkeninin, diğer tüm değişkenler üzerine veya ilişkili değişkenler üzerine regresyon denkleminin kurulmasını içerir. Bu regresyon denkleminden elde edilecek tahmini değer, kayıp değerlere atıfta bulunmak için kullanılır. Regresyon atfı kullanıldığında bir rassal hatanın modele dahil edilmesi

(27)

önemlidir. Bu hata terimi ya rassal olarak belirlenir, ya bir rassal normal sapmadır veya kullanıcı tarafından belirlenecek serbestlik derecesine bağlı bir rassal t değeri olabilir. Bu atıf tekniği, bağımsız değişkenlerdeki kayıp değerlerin atfı için kullanıldığında, bu durum çoklu doğrusal bağlılığa katkıda bulunacaktır çünkü kayıp değerler için atıfta bulunulan değerler modeldeki diğer değişkenler ile ilişkili olacaktır. Regresyona dayalı atıf tekniğinde modele dahil edilmeyen diğer değişkenlerin kullanılması da mümkündür. Fakat bu durumda daha zayıf tahmin değerleri elde edilecektir.

Regresyon atfını kullanmanın bir avantajı, atıfta bulunulacak kayıp değer içeren değişkenin her bir kayıp değeri için farklı bir bağımsız değişkenler kümesini kullanmasıdır. Bu yaklaşımın yerine ortalamayı koyma yaklaşımından bir avantajı, kayıp değer içeren değişkenlerin varyans ve kovaryanslarını korumasıdır. Çünkü bir değişkenin kayıp her bir durumu, diğer değişkenlerin değerlerine bağlıdır ve her seferinde farklı bir tahmin değerini verecektir. Bu yöntemin aşağıda anlatılacak EM yaklaşımından dezavantajı ise daha sınırlı sayıda bilgiyi kullanmasıdır (Oğuzlar, 2001).

3.2.3 Hot Deck Atfı

Hot deck atfında, veri matrisindeki kayıp gözlemler benzer gözlemlerle doldurulur. Aşağıdaki Tablo 3.2 bu amaçla verilmiş bir örnek durumu içermektedir.

Tablo 3.2 : Hot deck atfı için örnek

(http://www.utexas.edu/cc/faqs/stat/general/gen25.html)

Durum Değişken1 Değişken2 Değişken3 Değişken4

1 4 1 2 3

2 5 4 2 5

3 3 4 2

Tablo 3.2 incelendiğinde, değişken 4 için 3. durum değerinin bir kayıp değer içerdiği görülebilir. Hot deck atfı, değerlerin tam olduğu durumları araştırır ve kayıp değer için, en çok benzer olduğuna inanılan gözlem değerini atfeder. Örnek için tam gözlem değerine sahip durumlar 1 ve 2’ dir. Bu 2 durum değerleri incelendiğinde, durum 2 için değerlerin, durum 3’ e daha benzer olduğu sonucuna ulaşmaktayız.

(28)

Dolayısıyla durum 3’ün Değişken 4 için kayıp olan değerini 5 olarak belirleyebiliriz. Hot deck atfı uzun bir kullanım tarihine sahiptir. Bu atıf, liste bazında veri silme, çiftler bazında veri silme, yerine ortalamayı koyma yöntemlerinden üstün bir tekniktir. Hot deck atfının avantajları arasında kavramsal basitliği, değişkenlerin ölçüm düzeylerini koruması (kategorik değişkenler kategorik olarak, sürekli değişkenler sürekli olarak kalır) ve tamamlanmış veri matrisi elde edilmesi sayılabilir. Tamamlanmış veri matrisi sayesinde de standart istatistiksel analizler uygulanabilir.

Hot deck atfının en önemli dezantajı, ‘benzerlik’ kavramının tanımlanmasındaki güçlüktür. Bu nedenle hot deck prosedürü kayıp veriler için standart bir yol sağlamamaktadır. Bu benzerliğin belirlenebilmesi için verici (donor) durumların seçimini başarabilecek bir yazılım gerekmektedir. Daha ileri bir hot deck algoritmasına göre, benzer bir kayıttan daha fazla sayıda kayıt belirlenir ve bu verici (donor) kayıtlardan biri kayıp değerlerin atfı için rassal olarak seçilir. Ayrıca eğer uygunsa, bu verici durumların ortalaması kayıp değerlerin atfı için kullanılır.

(29)

4. MAKSİMUM BENZERLİK TABANLI YÖNTEMLER

Beklenti Maksimizasyonu (BM) ve Çoklu Atama yöntemleri, Maksimum Benzerlik (Maximum Likelihood) yaklasımı tabanına dayanır. Bu birçok zor tahmin problemini ortadan kaldıran istatistiksel bir yaklaşımdır. Özellikle lojistik regresyon tahminlerinde sıklıkla kullanılır. Hata teriminin normal dağılıma uygunluğu varsayımı altında en küçük kareler lineer regresyonu, bir maksimum benzerlik yöntemidir. Maksimum Benzerliğin temel prensibi gözlenme olasılığının maksimum olduğu değerleri tahmin etmektir. Bunu doğrulamak için öncelikle veri ve bilinmeyen parametrelerin olasılıklarını belirleyen bir formüle ihtiyacımız vardır. Gözlemler bağımsız olduğunda örneklem için toplam olasılık (benzerlik) her bir gözlem için olasılıkların çarpımına eşittir. Başka bir deyişle örnek birimlerinin seçilme (ya da gerçekleşme) olasılığı her gözlemin tek tek seçilme olasılığının çarpımıdır. Bunu maksimum yapan parametre tahmini maksimum benzerlik tahmini olarak adlandırılır. Bu yöntem bir örnekle açıklanmıştır: Bir anakütleden seçilen bir örneklem 1,4,7,9 olsun. Bu örnekten yola çıkarak anakütlenin ortalaması hesaplanabilir. Ancak örnek ortalamasının anakütle ortalamasının iyi bir tahmincisi olduğu dikkate alınmazsa, anakütlenin normal dağıldığını varsayarak 1,4,7,9 un anakütleden seçilme olasılığı p(1)*p(4)*p(7)*p(9) olarak ifade edilir. Eger µ=10 ise bu olasılık çok küçük çıkacaktır. Ancak µ belli bir sayıya yaklaştıkça bu olasılık çarpımı büyür. Burada bu sayı µ=5.25 'tir. Bu değer µ nün maksimum likelihood tahminidir. İleriki bölümlerde inceleyecegimiz Beklenti Maksimizasyonu ve Çoklu Atama gibi yöntemler maksimum benzerlik mantığıyla ortaya atılmış yöntemlerdir.

4.1. Beklenti En Büyükleme (Expectation Maximization: EM) Yöntemi

Beklenti En Büyükleme (Expectation Maximization: EM) algoritması, DEMPSTER vd. (1977) tarafından en büyük benzerlik yöntemlerinin problemlerini çözmek için önerilmiştir. EM algoritması, istatistiksel metodolojiyi algoritmik uygulamalarla birleştirmekte ve çeşitli eksik veri problemlerinin çözümünde dikkat çekmektedir (DEMPSTER vd., 1977). EM yönteminin, tüm gözlemlerin kullanılması yöntemi,

(30)

gözlemlerin ya da değişkenlerin silinmesi yöntemi ve eksik gözlem ile ortalamanın yer değiştirmesi yöntemlerinden daha başarılı olduğu kanıtlanmıştır. EM algoritması, eksik veriler için genel bir yöntem olup, eksik veri ile bir veri modelinin bilinmeyen parametreleri arasındaki ilişkiyi arttırmaktadır.

Bu yöntemin uygulanışında, ilk önce tahmin edilen model parametreleri kullanılarak eksik değerler hesaplanmaktadır. Daha sonra bu tamamlanan eksik değerler, model parametrelerinin yeniden hesaplanmasında kullanılmakta ve bu işlem tekrarlanmaktadır. EM yöntemi, veri setinin rastgele olduklarını kabul eder. EM algoritmasında, ortalama ve kovaryans matrisinin tahminleri üç adımda düzeltilmektedir. İlk adımda, ortalama ve kovaryans matrisinin tahminleri kullanılarak eksik değerleri içeren verilerin regresyon parametreleri hesaplanmaktadır. İkinci olarak, eksik değerler, hesaplanan parametreler kullanılarak tamamlanmakta ve ortalama ve kovaryans matrisi tamamlanmış veri seti kullanılarak yeniden tahmin gerçekleştirilmektedir. Bu işlem, ortalama ve kovaryans matrisinin değerleri değişmeyene kadar devam etmektedir.

EM yöntemi, yinelemeli ve iki aşamalı bir yöntem olup E aşaması eksik veri için en iyi olası kestirimleri, M aşaması ise eksik veri atandığında ortalama, standart sapma ya da korelasyona ilişkin kestirimleri verir. Bu süreç, kestirilen değerlerdeki değişimin önemsenmeyecek derecede azalmasına kadar devam eder. EM yönteminde tekrarlı işlemler kullanılarak eksik veriler içeren nicel değişkenlerin ortalamaları, kovaryans matrisi ve korelasyonu tahmin edilir;

 

 

P jj P j

Diag

x

x

x

x

0

(

)

0 (1)

 

 

P jk P jk

C

c

c

C

0

0 (2)

Eğer xij gözlem değeri eksik değilse (tam ise): ij

m ij

x

x

, eğer xij eksikse m.

iterasyon sonucu tahmin edilen değer; x xil l J J

l m ij l m ij m ij  

    2 1 , 1 , 0

* ;

(1:xil kayıp değilse ve lj) formülü yardımıyla hesaplanır. Burada

, 1

1 , 0

,

  m ij l m ij

(31)

 

x

w

x

w

i

I

x

i i i m ij i m j m

*

/

;

 

 

                  

 



j s ve J s J i n w n c x x x x x w c C i i i i s m J s j m k m ik m j m ij m ij i m jk m 2 2 1 2 , , ; / * ) 1 ( * *

               ) /( ) ( 2 / * 1 exp * * -1 2 / * 1 exp * * -1 1 2 2 2 / 2 2 / 1 D sd p sd D D w p p i    

Burada ilk değer çok değişkenli normal dağılım için, ikinci ifade bozulmuş normal dağılım için ve son ifade student t dağılımı içindir. ; Bozulma oranı, λ; Standart sapma oranı, p; Bağımsız değişkenlerin sayısı, D2; Birimin ortalamadan olan Mahalanobis uzaklığının karesi olarak tanımlanabilir.

   

m

k m ik jk m jk m j m ij

x

c

x

x

x

D

2

*

1

*

Yukarıdaki formülde

 

m 1 jk

c ifadesi Cm-1‘in jk. elemanıdır. Algoritmanın sona ermesi

için belirli bir değer ile kontrol edilmesi gerekmektedir. Örneğin regresyon analizinde artık kareler toplamı arasındaki fark çok küçük bir değere eşit olursa iterasyona devam edilmez ve o andaki parametre tahminleri en iyi değerler olarak ele alınır. Analizde yakınsama için:

m jj m jj m jj

c

c

c

1

/

Veri atama:

   

ijm' E ij E i

x

x

X

burada m,mnin son değeridir. Ortalama ve

kovaryanslara ilişkin formüller aşağıdaki gibidir (BAL vd., 2004).

 

 

' ' m j m E j E x x x x   

(32)

 

 

' ' m jk m E jk E c C c C    Korelasyon ise;

  

/(

*

kkE

)

1/2

E jj E jk E jk E

r

c

c

c

R

4.1.2. Beklenti En Büyükleme (EM) Algoritması

EM algoritması, ilk defa Dempster ve diğ. (1977) tarafından eksik veriye sahip problemlerde bilinmeyen parametreleri tahmin etmek amacıyla önerilmiştir. EM algoritması, istatistiksel metodolojiyi algoritmik uygulamalarla birleştirmekte ve çeşitli eksik veri problemlerinin çözümünde uygulanmaktadır. Bu yöntemin uygulanışında ilk önce tahmin edilen model parametreleri kullanılarak eksik değerler hesaplanmaktadır. Daha sonra bu tamamlanan eksik değerler, model parametrelerinin yeniden hesaplanmasında kullanılmakta ve bu işlem tekrarlanmaktadır. Eksik veri tamamlamasında EM algoritması, veri setindeki boşlukların sebebi ile ilgilenmez ve tamamen rasgele olduklarını kabul eder. EM yönteminin en önemli avantajlarından birisi, serilerde karşılıklı olarak eksik değerler bulunmasına rağmen algoritmanın uygulanabilmesi ve ölçülmüş hiçbir değerin ihmal edilmemesidir. Çok değişkenli bir verinin Gauss olasılık dağılımı (Normal Dağılım), ortalama ve kovaryans matrisi ile temsil edilebilir. Yani ortalama ve kovaryans matrisi normal dağılımın uygun istatistikleridir. EM yöntemi iteratif bir algoritma kullanır ve eksik değerleri olan niceliksel değişkenlerin ortalamalarını, kovaryans matrisini ve korelasyonlarını tahmin eder. Bu yöntem, çeşitli eksik veri problemlerinde, maksimum olabilirlik (ML) tahminlerinin iteratif hesabına yönelik bir yaklaşımdır ve son yıllarda birçok alanda uygulanmıştır. EM algoritmasının her bir iterasyonunda iki adım bulunmaktadır: Birinci adım, beklenti adımı adı verilen E-adımı, ikinci adım ise en büyükleme adımı adı verilen M-adımıdır. E ya da beklenti adımında, verilen gözlem değerleri ile eksik verilerin ve model parametrelerinin tahmini yapılır. M ya da en büyükleme adımında ise, eksik veriler biliniyor kabul edilerek E adımında bulunan beklenen olasılık fonksiyonunu en büyükleyecek parametreler belirlenmektedir. Bu bir sonraki E adımında model parametrelerinin dağılımlarını belirlemek için kullanılır. Bu algoritma ile her bir iterasyon adımında olasılık arttığı için yakınsama sağlanmaktadır.

(33)

Verilen bir L(;x,z)olasılık fonksiyonunda, : parametre vektörü, x: gözlem verisi ve z ise eksik verileri temsil etmektedir. E-adımında, olasılık fonksiyonunun beklenen değeri denklem (1) yardımıyla hesaplanmaktadır. M adımında, olasılık fonksiyonunu maksimum yapan parametreler denklem (2) ile hesaplanmaktadır.

log ( ; , )

) ( 0 E , L x z Q n x Z n     (1) ) ( max arg * n Q    (2)

EM yönteminde ortalama ve kovaryans matrisinin tahminleri üç adımda düzeltilmektedir. İlk adımda, ortalama ve kovaryans matrisinin tahminleri kullanılarak eksik değerleri içeren verilerin regresyon parametreleri hesaplanmaktadır. İkinci olarak, eksik değerler, hesaplanan parametreler kullanılarak tamamlanmakta ve ortalama ve kovaryans matrisi tamamlanmış veri seti kullanılarak yeniden tahmin gerçekleştirilmektedir. İşlem bu şekilde yakınsama sağlanıncaya kadar sürdürülür ve sonuç olarak eksik veriler için en iyi tahmini değerler elde edilmiş olur. EM algoritmasının matematiksel alt yapısı ile ilgili detaylar Schafer (2000)’den elde edilebilir. EM algoritmasının işleyişini özetlemek amacıyla Şekil 1’de akış çizelgesi verilmektedir.

n = 0 θ0’ı Başlat Q(θ0| θ-1) = -∞ E - adımı: Q(θ0 | θn) değerini hesapla M - adımı: θ* = arg

θmax Q(θ | θn) değerini hesapla

θn+1 = θ* Q(θn+1 | θn) – Q(θn | θn-1) ≤ ξ θML = θn+1 E H n = n + 1

(34)

Türkiye’deki yağış serilerindeki eksik değerlerin tamamlanmasının amaçlandığı bu çalışmada, aylık serilerin oluşturulması ve eksik değerlerin belirlenmesinin ardından veri tamamlama işlemi için S.P.S.S. paket programının eksik veri analizi menüsünde yeralan EM algoritması kullanılmıştır. Bu amaçla öncelikle tamamlanacak olan ve tamamlayacak olan istasyona ait veriler bir tabloda yan yana gelecek şekilde birleştirilip S.P.S.S. programına yüklenmiştir. Her bir istasyon için aylık ortalama değerleri içeren bu tablolar aylara karşı gelen 12 sütundan oluşmaktadır. Örneğin Ocak ayı uzun yıllar ortalamalarında eksik veri bulunması durumunda, her iki istasyonun bu aya ait verileri EM yöntemi menüsü ile değerlendirilerek eksik veriler tamamlanmaktadır. Yılın her ayı için aynı işlem tekrarlanarak istasyondaki tüm eksik veriler elde edilmektedir.

4.2 Çoklu Atama yöntemleri

Çoklu atıf tekniği (MI), kayıp değerlerin yerine m tekrar sayısı ve m>1 olmak üzere simüle edilmiş versiyonlarının kullanıldığı bir Monte Carlo tekniğidir. Buradaki m sayısı oldukça küçüktür (3-10 arasında). Bu teknik üç temel adımı gerektirir: atfetme (imputation), analiz etme (analysis) ve bir araya getirme (pooling). Bu adımlar arasında başarması en zor olanı atfetme adımıdır. Bu adımda karşılaşılabilecek tipik problemler şunlardır:

a. Herhangi bir gözlemin kayıp olması, o gözlemin değerine bağlıdır. Örneğin yüksek veya düşük gelir düzeyine sahip kişiler gelir sorusunu atlama eğilimindedir. b. Kayıp değerler veriler kümesinin her hangi bir yerinde görülebilir.

c. Atfetme adımda kullanılan yöntem, daha sonra yapılması düşünülen tamamlanmış veriler ile analiz aşamasının öngörülmesini zorunlu kılar.

Atfedilen veriler için tekrar uygulanan analiz adımı, atfedilme uygulanmadan önce yapılan aynı analizden daha basittir. Çünkü kayıp değerlerin sıkıntısı ortadan kalkmıştır. Bir araya getirme adımı ise, m defa tekrarlanmış analizlerden, p değerleri, güven aralıkları, varyanslar ve ortalamaların hesaplanmasını içerir. Bu hesaplamalar da genel olarak basit hesaplamalardır. MI’ lar yaratacak yeni hesapsal yöntemlerin ve yazılımların oluşumuyla teknik, araştırmaları kayıp değerlerle engellenen biomedikal ve sosyal bilim araştırmacıları için artan bir biçimde çekici bir hal almaktadır. Çoklu atıf tekniğinin çok sayıda avantajlı yönü vardır. Her şeyden önce oldukça iyi

(35)

anlaşılabilecek bir tekniktir. Aynı zamanda analizde yer alan değişkenlerin normalliği ihlal ettiği durumda da başarılı sonuçlar verir. Liste bazında veri bozma, çiftler bazında veri bozma ve yerine ortalamayı koyma yöntemlerinden pek çok durumda üstündür. Dezavantajı ise üçten ona kadar veri kümesinde atıf işlemi yaparken yoğun zaman gerektirmesidir. Yukarıda sözü edilen atıf tekniklerinden başka tam bilgi en çok olabilirlik tahmini (full information maximum likelihood estimation), yapısal denklem modelleme yaklaşımı (structural equation modeling approach) ve örüntü karışımı model yaklaşımı (pattern mixture model approach) diğer atıf yöntemlerinden bazılarıdır. Bu yöntemler sık kullanılmadığından çalışmaya dahil edilmemiştir.

Ekler bölümünde yer alan Ek A.1’ de atıf yöntemlerinin uygulanmasını sağlayan belli başlı programlar, varsayımları ve programlar hakkındaki yorumlar belirtilmiştir. Ek A.2’ de ise atıf yöntemlerinin güçlü ve zayıf yönleri ele alınmıştır.

(36)

5. ÇALIŞMA ALANINDA EKSİK VERİLERİN TAMAMLANMASI

5.1 Akarsu Debi Ölçümlerinde Eksik Verilerin Tamamlanması

Su kaynaklarının planlanması ve yönetimine yönelik çalışmalarda, düzenli ve eksiksiz akım verileri gibi hidrolojik verilere ihtiyaç vardır. Fakat pek çok arazi çalışmasında farklı kurum/kuruluşlardan temin edilen akım gözlem değerlerinde, geçmiş tarihlere ait verilerde çeşitli nedenlerle eksik veriler olmaktadır. Benzer durum, spesifik olarak çalışmaya yönelik sürveyans gözlem çalışmalarında bile ortaya çıkabilmektedir (iklimsel zorluklar, ulaşım zorlukları, ölçüm cihazındaki sorunlar ve benzeri sebeplerle). Literatür incelendiğinde genel olarak hidrolojik veri setlerinde akış verilerinde %5-10 civarında, hatta bazı durumlarda %25’e varan oranlarda eksik veriler ile karşılaşılmaktadır (Elshorbagy ve ark. 2000, Panu ve ark. 2000). Özellikle ülkemizdeki hidrolojik verilerdeki eksiklikler hidrolojik modelleme çalışmalarında ve su kaynaklarının yönetimine yönelik çalışmalarda önemli engeller oluşturmaktadır. Bu verilerin tamamlanması için, interpolasyon, regresyon analizi, zaman serisi analizi, yapay sinir ağları ve hidrolojik modeller (Elshorbagy ve ark. 2000, Keskin ve Taylan 2009) gibi çeşitli teknikler kullanılmaktadır. Bunların yanı sıra bir havzadaki mevcut ölçüm istasyonu verileri kullanılarak, havzadaki akarsuyun başka bir noktasındaki debi değerlerinin tahmin edilmesi için alan oranı metodu yaygın bir şekilde kullanılmaktadır. İstatistiksel olarak da eksik verilerin tamamlanması için çeşitli istatistiksel analiz programlarının eksik veri analiz modülleri son yıllarda etkin bir şekilde kullanılmaya başlamıştır. Çalışma kapsamında SPSS istatistiksel yazılım programının kayıp veri analiz modülü kullanılmıştır. Bu modülde eksik verinin türüne göre kullanılabilecek çeşitli istatistiksel tekniklere göre eksik verilerin tamamlanması (atanması) gerçekleştirilmektedir. Bu modüldeki yöntemlerden EM (Expectation-Maximization) Yöntemi çalışma kapsamında kullanılmıştır. EM algoritması eksik verilere sahip birimlerin tahmininde kullanılan maksimum benzerlik tahminlerini içeren bir yöntemdir. EM yöntemi, yinelemeli (iterative) ve iki aşamalı bir yöntem olup E

(37)

aşaması eksik veri için en iyi olası kestirimleri, M aşaması ise eksik veri atandığında ortalama, standart sapma ya da korelasyona ilişkin kestirimleri verir. Bu süreç, kestirilen değerlerdeki değişimin önemsenmeyecek derecede azalmasına kadar devam eder (Anonim, 2009, Bal ve Özdamar, 2004). Çalışma kapsamında kullanılan bu yöntem ile günlük akım zaman serilerindeki eksik veriler tamamlanmıştır.

5.2. Akım Gözlem İstasyonlarının Karşılaştırılarak Eksik Verilerilerinin tamamlanması:

Çalışmada Devlet Su İşleri tarafından Büyük Menderes nehri üzerinde 2000 yılına kadar yapılmış olan akım gözlemleri kullanılmıştır (DSİ, 2000). Yapmış olduğumuz çalışmada Akım Gözlem İstasyonlarının havzadaki konumu, anakol uzerinde bulunmaları, ölçülen akım gözlemlerindeki değerlerin benzerliği, ardarda gelen (aynı akım kolu üzerindeki) akım gözlem istasyonlarının aralarındaki suyun çekilip çekilmediği, akım gözlem istasyonlarının kapalı veya açık olma süreleri baz alınarak istasyonlar seçilmiştir ve karşılıklı olarak eksik verilerinin tamamlanması için kullanılmıştır.

(38)

5.1.1 004 numaralı istasyonun eksik verilerinin 054 numaralı istasyonun verilerinden faydalanılarak tamamlanması:

004 Numaralı istasyonda 1960-2000 yılları arası gözlem yapılmıştır ve 1993, 1995 ve 1996 yılı verileri eksiktir. 054 Numaralı istasyonda 1968-2000 yılları arası gözlem yapılmıştır. 054 Numaralı istasyonun her yıl düzenli bir şekilde 1995 yılına kadar kayıtları tutulmuştur ve yıllara göre eksik verisi bulunmamaktadır. 1995 yılından 2000 yılına kadar değerler kapalıdır. 004 numaralı istasyonun eksik verileri, 054 numaralı istasyonun verilerinden faydalanılarak tamamlanmış ve aşağıdaki grafiklerde iki istasyonun ortak gözlem sürelerine ait grafiklerde karşılaştırmalı olarak verilmiştir. Sol değer ekseni 004, sağ değer ekseni 054 numaralı istasyona

aittir.(Grafikteki birimler hm3 tür) 0 10 20 30 40 50 60 70 80 90 100 1968 1969 1970 1971 1972 1973 1974 1975 0 1 2 3 4 5 6 7 8 9 10 004 004.Tamamlanan 054 054.Tamamlanan 0 10 20 30 40 50 60 70 80 90 100 1975 1976 1977 1978 1979 1980 1981 1982 0 1 2 3 4 5 6 7 8 9 10 004 004.Tamamlanan 054 054.Tamamlanan 0 10 20 30 40 50 60 70 80 90 100 1982 1983 1984 1985 1986 1987 1988 1989 0 1 2 3 4 5 6 7 8 9 10 004 054 054.Tamamlanan 0 10 20 30 40 50 60 70 80 90 100 1989 1990 1991 1992 1993 1994 1995 1996 0 1 2 3 4 5 6 7 8 9 10 004 004.Tamamlanan 054 054.Tamamlanan 0 10 20 30 40 50 60 70 80 90 100 1996 1997 1998 1999 2000 2001 2002 2003 0 1 2 3 4 5 6 7 8 9 10 004 004.Tamamlanan 054 054.Tamamlanan

(39)

5.1.2 009 numaralı istasyonun eksik verilerinin 004 numaralı istasyonun verilerinden faydalanılarak tamamlanması:

009 Numaralı istasyonda 1963-1986 yılları arası gözlem yapılmıştır ve 1964 yılına ait Temmuz, Ağustos, Eylül; 1965 yılında Ekim, Nisan, Mayıs ve 1966 yılı verileri eksiktir. 004 Numaralı istasyonda 1960-2000 yılları arası gözlem yapılmıştır ve 1993, 1995, 1996 yıllarına ait verileri eksiktir. 004 numaralı istasyona ait eksik veriler 071 numaralı istasyonun verilerinden faydalanılarak tamamlanmıştır. 009 numaralı istasyonun eksik verileri, 004 numaralı istasyonun eksiksiz hale getirilmiş verilerinden faydalanılarak tamamlanmış ve aşağıdaki grafiklerde iki istasyonun ortak gözlem sürelerine ait grafiklerde karşılaştırmalı olarak verilmiştir. Sol değer

ekseni 009, sağ değer ekseni 004 numaralı istasyona aittir. (Grafikteki birimler hm3

tür) 0 60 120 180 240 300 360 420 480 540 600 1963 1964 1965 1966 1967 1968 1969 1970 0 20 40 60 80 100 120 140 160 180 200 009 009.Eklenen 004 004.Eklenen 0 60 120 180 240 300 360 420 480 540 600 1970 1971 1972 1973 1974 1975 1976 1977 0 20 40 60 80 100 120 140 160 180 200 009 009.Eklenen 004 004.Eklenen 0 60 120 180 240 300 360 420 480 540 600 1977 1978 1979 1980 1981 1982 1983 1984 0 20 40 60 80 100 120 140 160 180 200 009 004 004.Eklenen 0 60 120 180 240 300 360 420 480 540 600 1984 1985 1986 1987 1988 1989 1990 1991 0 20 40 60 80 100 120 140 160 180 200 009 009.Eklenen 004 004.Eklenen

(40)

5.1.3 037 numaralı istasyonun eksik verilerinin 039 numaralı istasyonun verilerinden faydalanılarak tamamlanması:

037 Numaralı istasyonda 1965-2000 yılları arası gözlem yapılmıştır ve 1965 yılına ait Ekim, Kasım ayları ile 1968, 1992/2000 yılları arası verileri eksiktir. 039 Numaralı istasyonda 1965-2000 yılları arası gözlem yapılmıştır. 039 Numaralı istasyonun her yıl düzenli bir şekilde 2000 yılına kadar kayıtları tutulmuştur ve yıllara göre eksik verileri 035 numaralı istasyonun verileri kullanılarak giderilmiştir. 037 numaralı istasyonun eksik verileri, 039 numaralı istasyonun düzeltilmiş verilerinden faydalanılarak tamamlanmış ve aşağıdaki grafiklerde iki istasyonun ortak gözlem sürelerine ait grafiklerde karşılaştırmalı olarak verilmiştir. Sol değer

ekseni 037, sağ değer ekseni 039 numaralı istasyona aittir. (Grafikteki birimler hm3

tür) 0 15 30 45 60 75 90 105 120 135 150 1965 1966 1967 1968 1969 1970 1971 1972 0 4 8 12 16 20 24 28 32 36 40 037 037.Eklenen 039 039.Eklenen 0 15 30 45 60 75 90 105 120 135 150 1972 1973 1974 1975 1976 1977 1978 1979 0 4 8 12 16 20 24 28 32 36 40 037 037.Eklenen 039 039.Eklenen 0 15 30 45 60 75 90 105 120 135 150 1979 1980 1981 1982 1983 1984 1985 1986 0 4 8 12 16 20 24 28 32 36 40 037 039 039.Eklenen 0 15 30 45 60 75 90 105 120 135 150 1993 1994 1995 1996 1997 1998 1999 2000 0 4 8 12 16 20 24 28 32 36 40 037 037.Eklenen 039 039.Eklenen

(41)

5.1.4 052 numaralı istasyonun eksik verilerinin 054 numaralı istasyonun verilerinden faydalanılarak tamamlanması:

052 Numaralı istasyonda 1968-2000 yılları arası gözlem yapılmıştır ve 1968 yılının Ekim, Kasım ve Aralık ayına ait verileri ile 1989 yılı verileri eksiktir. 054 Numaralı istasyonda 1968-2000 yılları arası gözlem yapılmıştır. 054 Numaralı istasyonun her yıl düzenli bir şekilde 1995 yılına kadar kayıtları tutulmuştur ve yıllara göre eksik verisi bulunmamaktadır 1995 yılından 2000 yılına kadar değerler kapalıdır. 052 numaralı istasyonun eksik verileri, 054 numaralı istasyonun verilerinden faydalanılarak tamamlanmış ve aşağıdaki grafiklerde iki istasyonun ortak gözlem sürelerine ait grafiklerde karşılaştırmalı olarak verilmiştir. Sol değer ekseni 052, sağ

değer ekseni 054 numaralı istasyona aittir. (Grafikteki birimler hm3 tür)

0 2 4 6 8 10 12 14 16 18 20 1968 1969 1970 1971 1972 1973 1974 1975 0 2 4 6 8 10 052 052.Eklenen 054 054.Eklenen 0 2 4 6 8 10 12 14 16 18 20 1975 1976 1977 1978 1979 1980 1981 1982 0 2 4 6 8 10 052 052.Eklenen 054 054.Eklenen 0 2 4 6 8 10 12 14 16 18 20 1984 1985 1986 1987 1988 1989 1990 1991 0 2 4 6 8 10 052 054 054.Eklenen 0 2 4 6 8 10 12 14 16 18 20 1991 1992 1993 1994 1995 1996 1997 1998 0 2 4 6 8 10 052 052.Eklenen 054 054.Eklenen 0 2 4 6 8 10 12 14 16 18 20 1998 1999 2000 2001 2002 2003 2004 2005 0 2 4 6 8 10 052 052.Eklenen 054 054.Eklenen

(42)

5.1.5 065 numaralı istasyonun eksik verilerinin 062 numaralı istasyonun verilerinden faydalanılarak tamamlanması:

065 Numaralı istasyonda 1970-2000 yılları arası gözlem yapılmıştır, 1993, 1994, 1995 ve 1996 yıllarına ait verilerin tamamı eksiktir. 062 Numaralı istasyonda 1968-2000 yılları arası gözlem yapılmıştır. 062 Numaralı istasyonun eksik verileri 706 numaralı istasyonun verilerinden faydalanılarak tamamlanmıştır. 065 numaralı istasyonun eksik verileri, 062 numaralı istasyonun verilerinden faydalanılarak tamamlanmış ve aşağıdaki grafiklerde iki istasyonun ortak gözlem sürelerine ait grafiklerde karşılaştırmalı olarak verilmiştir. Sol değer ekseni 065, sağ değer ekseni

062 numaralı istasyona aittir. (Grafikteki birimler hm3 tür)

0 21 42 63 84 105 126 147 168 189 210 1970 1971 1972 1973 1974 1975 1976 1977 0 115 230 345 460 575 690 805 920 1035 1150 065 065.Eklenen 062 062.Eklenen 0 21 42 63 84 105 126 147 168 189 210 1977 1978 1979 1980 1981 1982 1983 1984 0 115 230 345 460 575 690 805 920 1035 1150 065 065.Eklenen 062 062.Eklenen 0 21 42 63 84 105 126 147 168 189 210 1984 1985 1986 1987 1988 1989 1990 1991 0 115 230 345 460 575 690 805 920 1035 1150 065 062 062.Eklenen 0 21 42 63 84 105 126 147 168 189 210 1991 1992 1993 1994 1995 1996 1997 1998 0 115 230 345 460 575 690 805 920 1035 1150 065 065.Eklenen 062 062.Eklenen 0 21 42 63 84 105 126 147 168 189 210 1998 1999 2000 2001 2002 2003 2004 2005 0 115 230 345 460 575 690 805 920 1035 1150 065 065.Eklenen 062 062.Eklenen

(43)

5.1.6 081 numaralı istasyonun eksik verilerinin 712 numaralı istasyonun verilerinden faydalanılarak tamamlanması:

081 Numaralı istasyonda 1981-2000 yılları arası gözlem yapılmıştır ve 1993, 2000 yılındaki verileri eksiktir.706 Numaralı istasyonda 1981-2000 yılları arası gözlem yapılmıştır ve eksik verileri bulunmamaktadır.081 numaralı istasyonun eksik verileri, 712 numaralı istasyonun verilerinden faydalanılarak tamamlanmış ve aşağıdaki grafiklerde iki istasyonun ortak gözlem sürelerine ait grafiklerde karşılaştırmalı olarak verilmiştir. Sol değer ekseni 081, sağ değer ekseni 712 numaralı istasyona

aittir. (Grafikteki birimler hm3 tür)

0 25 50 75 100 125 150 175 200 225 250 1981 1982 1983 1984 1985 1986 1987 1988 0 25 50 75 100 125 150 175 200 225 250 81 081.Eklenen 712 712.Eklenen 0 25 50 75 100 125 150 175 200 225 250 1988 1989 1990 1991 1992 1993 1994 1995 0 25 50 75 100 125 150 175 200 225 250 81 081.Eklenen 712 712.Eklenen 0 25 50 75 100 125 150 175 200 225 250 1995 1996 1997 1998 1999 2000 2001 2002 0 25 50 75 100 125 150 175 200 225 250 81 081.Eklenen 712 712.Eklenen

(44)

5.1.7 099 numaralı istasyonun eksik verilerinin 098 numaralı istasyonun verilerinden faydalanılarak tamamlanması:

099 Numaralı istasyonda 1988-2000 yılları arası gözlem yapılmıştır ve 1989 yılının Mayıs ,Haziran, Temmuz, Ağustos, Eylül ayına ait verileri ile 2000 yılı verileri eksiktir. 098 Numaralı istasyonda 1988-2000 yılları arası gözlem yapılmıştır. 098 Numaralı istasyonun her yıl düzenli bir şekilde kayıtları tutulmuştur ve yıllara göre eksik verisi bulunmamaktadır. 099 numaralı istasyonun eksik verileri, 098 numaralı istasyonun verilerinden faydalanılarak tamamlanmış ve aşağıdaki grafiklerde iki istasyonun ortak gözlem sürelerine ait grafiklerde karşılaştırmalı olarak verilmiştir. Sol değer ekseni 099, sağ değer ekseni 098 numaralı istasyona aittir. (Grafikteki birimler hm3 tür) 0 2 4 6 8 1988 1989 1990 1991 1992 1993 1994 1995 0 2 4 6 8 099 065.Eklenen 098 062.Eklenen 0 2 4 6 8 1995 1996 1997 1998 1999 2000 2001 2002 0 2 4 6 8 099 065.Eklenen 098 062.Eklenen

(45)

5.1.8 004 numaralı istasyonun eksik verilerinin 071 numaralı istasyonun verilerinden faydalanılarak tamamlanması:

004 Numaralı istasyonda 1968-2000 yılları arası gözlem yapılmıştır ve 1993, 1995 ve 1996 yılına ait veriler eksiktir. 071 Numaralı istasyonda 1970-2000 yılları arası gözlem yapılmıştır. 071 Numaralı istasyonun her yıl düzenli bir şekilde kayıtları tutulmuştur ve yıllara göre eksik verisi bulunmamaktadır. 004 numaralı istasyonun eksik verileri, 071 numaralı istasyonun verilerinden faydalanılarak tamamlanmış ve aşağıdaki grafiklerde iki istasyonun ortak gözlem sürelerine ait grafiklerde karşılaştırmalı olarak verilmiştir. Sol değer ekseni 004, sağ değer ekseni 071

numaralı istasyona aittir. (Grafikteki birimler hm3 tür)

0 10 20 30 40 50 60 70 80 90 100 1970 1971 1972 1973 1974 1975 1976 1977 0 10 20 30 40 50 60 70 80 90 100 004 071 0 10 20 30 40 50 60 70 80 90 100 1977 1978 1979 1980 1981 1982 1983 1984 0 10 20 30 40 50 60 70 80 90 100 004 071 0 10 20 30 40 50 60 70 80 90 100 1984 1985 1986 1987 1988 1989 1990 1991 0 10 20 30 40 50 60 70 80 90 100 004 071 071.Eklenen 0 10 20 30 40 50 60 70 80 90 100 1991 1992 1993 1994 1995 1996 1997 1998 0 10 20 30 40 50 60 70 80 90 100 004 004.Eklenen 071 071.Eklenen 0 10 20 30 40 50 60 70 80 90 100 1998 1999 2000 2001 2002 2003 2004 2005 0 10 20 30 40 50 60 70 80 90 100 004 004.Eklenen 071 071.Eklenen

(46)

5.1.9 039 numaralı istasyonun eksik verilerinin 035 numaralı istasyonun verilerinden faydalanılarak tamamlanması:

039 Numaralı istasyonda 1965-2000 yılları arası gözlem yapılmıştır ve 1965 yılına ait Ekim, Kasım, Aralık ayları ile 1973, 1998, 1999 ve 2000 yılı verileri eksiktir. 035 Numaralı istasyonda 1965-2000 yılları arası gözlem yapılmıştır. 035 Numaralı istasyonun her yıl düzenli bir şekilde 2000 yılına kadar kayıtları tutulmuştur ve yıllara göre eksik verileri 010 numaralı istasyonun verileri kullanılarak giderilmiştir. 039 numaralı istasyonun eksik verileri, 035 numaralı istasyonun düzeltilmiş verilerinden faydalanılarak tamamlanmış ve aşağıdaki grafiklerde iki istasyonun ortak gözlem sürelerine ait grafiklerde karşılaştırmalı olarak verilmiştir. Sol değer

ekseni 039, sağ değer ekseni 035 numaralı istasyona aittir. (Grf. birimler hm3 tür)

0 4 8 12 16 20 24 28 32 36 40 1965 1966 1967 1968 1969 1970 1971 1972 0 22 44 66 88 110 132 154 176 198 220 039 039.Eklenen 035 035.Eklenen 0 4 8 12 16 20 24 28 32 36 40 1972 1973 1974 1975 1976 1977 1978 1979 0 22 44 66 88 110 132 154 176 198 220 039 039.Eklenen 035 035.Eklenen 0 4 8 12 16 20 24 28 32 36 40 1979 1980 1981 1982 1983 1984 1985 1986 0 22 44 66 88 110 132 154 176 198 220 039 035 035.Eklenen 0 4 8 12 16 20 24 28 32 36 40 1986 1987 1988 1989 1990 1991 1992 1993 0 22 44 66 88 110 132 154 176 198 220 039 039.Eklenen 035 035.Eklenen 0 4 8 12 16 20 24 28 32 36 40 1993 1994 1995 1996 1997 1998 1999 2000 0 22 44 66 88 110 132 154 176 198 220 039 039.Eklenen 035 035.Eklenen

(47)

5.1.10 075 numaralı istasyonun eksik verilerinin 052 numaralı istasyonun verilerinden faydalanılarak tamamlanması:

075 Numaralı istasyonda 1977-2000 yılları arası gözlem yapılmıştır ve 1989, 1991, 1992, 1993 yılı verileri eksiktir.052 Numaralı istasyonda 1968-2000 yılları arası gözlem yapılmıştır. 052 Numaralı istasyonun her yıl düzenli bir şekilde 2000 yılına kadar kayıtları tutulmuştur ve yıllara göre eksik verisi 054 numaralı istasyonun verileri kullanılarak giderilmiştir.075 numaralı istasyonun eksik verileri, 052 numaralı istasyonun verilerinden faydalanılarak tamamlanmış ve aşağıdaki grafiklerde iki istasyonun ortak gözlem sürelerine ait grafiklerde karşılaştırmalı olarak verilmiştir. Sol değer ekseni 075, sağ değer ekseni 052 numaralı istasyona

aittir. (Grafikteki birimler hm3 tür)

0 1 2 3 4 5 1977 1978 1979 1980 1981 1982 1983 1984 0 3 6 9 12 15 075 075.Eklenen 052 052.Eklenen 0 1 2 3 4 5 1984 1985 1986 1987 1988 1989 1990 1991 0 3 6 9 12 15 075 075.Eklenen 052 052.Eklenen 0 1 2 3 4 5 1991 1992 1993 1994 1995 1996 1997 1998 0 3 6 9 12 15 075 075.Eklenen 052 052.Eklenen 0 1 2 3 4 5 1998 1999 2000 2001 2002 2003 2004 2005 0 3 6 9 12 15 075 075.Eklenen 052 052.Eklenen

Referanslar

Benzer Belgeler

Eksik tekrar; gösteren yanı aynı, gösterilen yanı farklı dil birimlerinin aynı dil gerçeğine gönderme yapması demektir.. Kimi zaman mesajların alıcıya iyice belletilmesi, eski

Bir aĢk hikâyesinin anlatıldığı “Leylâ vü Mecnûn”da Leylâ, karĢılıklı bir aĢkın taraflarından biri olması bakımından hem “âĢık” hem de “maĢuk” vasfını aynı

Germencik Tarım Kredi Yönetim Kurulu Üyesi Erol Önder ile Turanlar köyünden bir grup çiftçi, Büyük Menderes Nehri’nde yaşanan kuraklığı göstermek için kurayan alanda

They showed that the system exhibits different behaviors for different parameter values at the point (0, 0) and at this point the system has well defined dynamics. The above system

M ilyonlarca insan kulaklıkla yüksek sesle uzun süre müzik dinledikleri için işitme kaybı riskiyle karşı karşıya. Geliş- tirilen yeni kulaklık teknolojisi yüksek sevi-

Belki onun, sadece Türk musikisinin büyük bir ustası olmakla kalma­ dığını, Türk kültürünü de çok anlamlı bir açıdan değerlendirmiş bir kişi

Cantrell ve ark., (2003) öğretmen adaylarının fen öğretimi öz-yeterlik inançlarının; Mulholland ve ark., (2004) ve Yaman ve ark., (2004) fen bilimleri öğretmen adaylarının