• Sonuç bulunamadı

1. BÖLÜM

1.2. BU ÇALIŞMADA ELE ALINAN OLASILIK DAĞILIMLARI HAKKINDA

1.2.6. LN3, GED-2, VE P3 DAĞILIMLARI OLASILIK YOĞUNLUK

Yukarılarda, ilgili alt-bölümlerde, bu çalışmada ele alınan 3-parametreli dağılımların birçok farklı hallerinin olasılık yoğunluk fonksiyonlarının biçimleri kendi aralarında ölçekli olarak karşılaştırılmıştı. Bir fikir vermesi amacıyla, bunların birbirleriyle karşılaştırılması da yapılmıştır. Yine, hepsinin ortalama değerleri ve standart sapmaları: x = 10 ve x = 5 olan, fakat çarpıklık katsayıları: Gx = +1 olan, LN3, GED-3, ve P3 dağılımları olasılık yoğunluk fonksiyonları Şekil-1.6’da, çarpıklık katsayıları: Gx = +2 olanlar Şekil-1.7’de, çarpıklık katsayıları: Gx = +5 olanlar da Şekil-1.8’de sunulmaktadır.

Şekil 1.6. Ortalama değerleri : 10, standart sapmaları: 5 ve çarpıklık katsayıları: 1 olan GED-3, LN3 ve P3 dağılımları olasılık yoğunluk fonksiyonları.

Şekil 1.7. Ortalama değerleri: 10, standart sapmaları: 5 ve çarpıklık katsayıları: 2 olan GED-2, LN3 ve P3 dağılımları olasılık yoğunluk fonksiyonları.

Şekil 1.8. Ortalama değerleri : 10, standart sapmaları: 5 ve çarpıklık katsayıları: 5 olan GED-2, LN3 ve P3 dağılımları olasılık yoğunluk fonksiyonları.

 

 

 

2. BÖLÜM

1 MİLYON ELEMANLI SERİ ÜRETİMİ VE HESAPLAMALAR

2.1. ÇALIŞMADA KULLANILAN OLASILIK DAĞILIMLARININ, 2 YILDAN 10BİN YILA KADAR TEKERRÜRLÜ PİK DEĞERLERİN TAHMİNİNDEKİ UYGUNLUĞUNU UZUN SENTETİK DONE İLE DEĞERLENDİRME ÇALIŞMALARI

2.1.1. 1 Milyon Elemanlı Sentetik Seri Üretimi

Bu çalışmada ‘Numerical Recipes’ kitabında verilen rastgele sayı türeticisi programlarından RAN1 adlı program kullanılmıştır. Diğer birçok rastgele sayı türeticisi (random number generator) gibi, RAN1, 0 ile 1 aralığında üniform dağılımlı rastgele sayılar türetmektedir (Press ve ark., 1992, Bölüm: 7). Projenin son aşamasında, 4 (LN3 için 5) farklı parametre tahmin yönteminin 5 farklı olasılık dağılımına uygulanmasıyla ortaya çıkan toplam 21 farklı dağılım modelinin, ortalama tekerrür peryodu: T = 2, 5, 10, 25, 50, 100, 200, 500, 1000, 2Bin, 5Bin, ve 10Bin yıl olan değişken değerlerini tahmin etmesindeki bağıl hataların uzun sentetik done üzerinde hesaplanıp karşılaştırılması analizi gerçekleştirilmiştir. Bu amaçla, öncelikle 1Milyon elemanlı uzun bir sentetik seri üretilmiştir. 21 farklı dağılım modelinin yansız bir yaklaşımla ve objektif olarak karşılaştırılabilmesi amacıyla, sentetik seri türetilmesinde kullanılacak olasılık dağılımı için tek bir dağılım yerine, ayrı ayrı LN3, GED, ve P3 dağılımlarının denenmesi yoluna gidilmiştir. Dolayısıyla, RAN1 alt-programını kullanan üç farklı ana program kodlanmıştır. Yürütücünün yakın geçmişteki çalışmalarından edindiği tecrübeye göre, belirli bir olasılık dağılımı kullanılarak sentetik olarak türetilmiş uzun seriden çıkarılan 20 veya 30 elemanlı gibi kısa serilerden yapılan değişken değeri tahminlerinde, uzun sentetik serinin türetiminde kullanılan ana olasılık dağılımı daha başarılı olmaktadır (Örneğin: Haktanır, 1992; Haktanır & Horlacher, 1993). Dolayısıyla, bu çalışmada hedeflenen amaç, ‘eğer bir dağılım gerçekten iyi ise, sentetik serinin

türetildiği dağılımın türü ne olursa olsun, o dağılım kısa serilerle de değişkenlerin gerçek değerlerini daha yakın tahmin etmelidir.’ prensibini kontrol etmektir. Bu da, oldukça zahmetli ve günümüz hızlı bilgisayarlarında bile her bir koşturmanın birkaç saat gibi epeyce zaman aldığı işlemler gerektirir.

Uzun sentetik seri türetiminde takip edilen yol ağıda özetlenmektedir.

i) Önceki ilgili bölümlerde açıklandığı gibi, geçmiş tecrübelerden, ülkemiz donelerine

Gumbel, LN3, GED, P3, ve LP3 dağılımlarının uygun olacağı kanaatine varılarak, geliştirilmiş olan paket programda bu dağılımlar alınmıştır. Bilindiği gibi, Gumbel dağılımı, GED dağılımının özel bir biçimidir. LP3 te logaritması alınmış değerlere 3-parametrelei gama dağılımının uygulanmış biçimidir. Sentetik seri kombinezonlarını çok fazla arttırmamak amacıyla, sentetik serinin elemanlarının hesabında kullanılacak ana olasılık dağılımı (parent distribution) için bu çalışmada LN3, GED, ve P3 olmak üzere 3 farklı dağılım seçilmiştir.

ii) Kitleyi temsil eden uzun sentetik serinin ortalama değeri, standart sapması, ve

çarpıklık katsayısı verilmelidir. Bu adım, en az dağılımın seçimi kadar önemlidir; çünkü bilindiği gibi, varyansı dar ve geniş dağılımlar, ve ÇK = +0.5 gibi normal dağılıma yakın simetriklikte dağılımlar ve ÇK = +5 gibi değerlerde olan asimetrikliği çok fazla dağılımlar olabilir. Uzun sentetik serinin söz konusu rastgele değişkenin genel karakteristiklerini yansıtması gerekir. Bu da ancak, eldeki mevcut, ölçülmüş kaydedilmiş en uzun örnek serilerin karakteristiklerini inceleyerek yapılabilir. DMİ’nin ülkemizde işletmekte olduğu 253 adet plüviyograflı yağmur rasat istasyonunda kaydedilmiş yıllık yağmur pikleri serilerinden 20 ve daha fazla elemanlı olanların çarpıklık katsayılarının, +0.5 ile +5.0 arasında dağılımlı olduğu görülmüştür. Toplam 199 adet 20 ve daha uzun elemanlı 19914 = 2786 adet kaydedilmiş yıllık yağmur pikleri serilerinin varyasyon katsayıları ise, nispeten daha dar bir aralıkta değişmekte olup, çoğunluğu 0.5 civarında yoğunlaşmıştır. Dolayısıyla, uzun sentetik seri kombinezonlar adedini çok fazla arttırmamak amacıyla, ana dağılım varyasyon katsayısı, VK = 0.5 değerinde sabit alınmıştır. Bu kaydedilmiş 2786 adet serinin çarpıklık katsayılarının da yaklaşık %90’ı: +0.5 < ÇK < +3.0 aralığında değerler almaktadır. Kalanlardan %5 kadarı: –0.5 < ÇK < 0.5 aralığında, diğer %5 kadarı da:

+3.0 < ÇK < +5.0 aralığında değerler almaktadır. Genelde, örnek seri uzunluğu, n, arttıkça çarpıklık katsayısının da artacağı kanaati vardır (örneğin: Wallis ve ark., 1974). Ortalama değer izafi bir değer olduğundan ve olasılık yoğunluk fonksiyonunun absis ekseni üzerinde sağa veya sola hareketinde etkili olduğundan, bunun için herhangi bir sayısal boyut alınabilir. Varyasyon katsayının ve çarpıklık katsayısının beklenen aralıklar içinde birçok farklı değerleri ile farklı sentetik seriler türetilse çok fazla kombinezon oluşacağından çok fazla sayıda sentetik seri türetmek gerekebilir, ve bu da sentetik serilerden çıkarılmış binlerce 20 veya 30 gibi kısa süreli seriler üzerindeki analizleri ve yorumları içinden çıkılamayacak derecede karışık bir biçime sokabilir. Dolayısıyla, amaç, yeterli sayıda, fakat kitlenin beklenen değerleri civarında istatistiksel karakteristikleri olan uzun sentetik seriler türetmek ve bunlar ile analizleri gerçekleştirmek olmalıdır. Bu çalışmada, ortalama değeri: μ = 1, varyasyon katsayısı:

VK = 0.5, ve çarpıklık katsayıları da: ÇK = 0.5, 1, 2, 3, 5 olan beş farklı sentetik seri

türetme yoluna gidilmiştir. Böylece, 3 farklı ana dağılım ve 5 farklı istatistikleri olan toplam: 3×5 = 15 adet, birbirinden farklı, her biri 1Milyon elemanlı sentetik seriler türetilmiştir.

iii) Ortalama değer, varyasyon katsayısı (dolayısıyla varyans), ve çarpıklık katsayısı

verildikten sonra, olasılık dağılımına özgü parametreler ile momentler arasındaki analitik ilişkilerden yararlanarak sentetik seri türetiminde kullanılacak ana dağılımın parametreleri hesaplanır.

iv) Rastgele sayı türeticisinden 0 ile 1 aralığında üniform dağılımlı bir rastgele sayı elde

edilir (RS). Yukarıda bahsedildiği gibi, bu çalışmada, nümerik algoritmalar hakkında saygın bir klasik kaynak haline gelmiş olan Numerical Recipes kitabının RAN1 adlı alt-programı kullanılmıştır. 0 ile 1 aralığındaki bu rastgele sayının sentetik olarak türetilecek değişkenin ya küçük-kalma, ya da geçilme olasılığına eşit olduğu kabulü yapılır. Bu çalışmada ilk kabul tercih edilmiştir (Pnex = RS). Sonra, olasılık dağılımına özgü, (değişken değeri) ↔ (küçük-kalma olasılığı) ilişkisinden yararlanarak, sentetik seri türetiminde kullanılacak ana dağılım ile küçük-kalma olasılığı bilinen değişkenin değeri hesaplanır. Çalışmada kullanılan RAN1 adlı rastgele sayı türetici altprogramın sunulduğu Numerical Recipes kitabının 276.ncı sayfasında, bu programın algoritması hakkında: “On balance, we recommend RAN1 for general use. It is portable, based on

Park and Miller’s Minimal Standard generator with and additional shuffle, and has no known (to us) flaws other than period exhuastion.” denmektedir (Press ve ark., 1992) (Tercümesi: Bütün özellikler dengelendiğinde, genel kullanım için RAN1i tavsiye ederiz. O farklı bilgisayarlarda kullanılabilir, ilave olarak tekrar bir genel karışım yapan Park ve Miller’in minimal Standard türeticisine dayanır, ve bildiğimiz kadarıyla, peryot tükenimi dışında hiçbir hatası yoktur.). Yine Numerical Recipes kitabının 7.nci Bölümünde, RAN1 hakkında: “In fact, we do not know of any statistical test that RAN1 fails to pass, except when the number of calls starts to become on the order of the period

m, say > 108.” denmektedir (Press ve ark., 1992) (Tercümesi: Aslında, bildiğimiz kadarıyla, RAN1in rastgele sayı üretimi için çağrı adedi m peryodu mertebelerine kadar yükselmedikçe, ki bu yaklaşık 108 den büyüktür, RAN1in geçmekte başarısız olduğu hiçbir istatistiksel test yoktur.). Buna göre, RAN1 programı 100Milyona kadar ardarda rastgele sayı türetimi için çağrıldığında, sorunsuz rastgele sayılar türetip ana programa göndermektedir. Bizim çalışmamızda ise 1.3 Milyon rastgele sayı hesaplanmaktadır, ki bu 100 Milyondan çok daha küçüktür.

v) iv.üncü adım 1.3 Milyon kez tekrar edilmiştir. Program baştan, ‘seed value (kök

değer)’ denen herhangi bir negatif tam sayı istemekte, hesapları algoritmasının gerektirdiği biçimde bu kök değere dayandırarak rastgele sayı türetimine başlamaktadır. Bu çalışmada, kök değeri olarak, 15 adet koşturmanın hepsinde de –456 sayısı verilmiştir. Böylece, koşturmaların hepsinde de 0 ile 1 aralığında sayılardan oluşan aynı rastgele sayı serisi elde edilmiştir. 1.3 Milyon adet 0 ile 1 aralığındaki rastgele sayıdan oluşan bu serinin ilk 300Bin adedi kesilip atılmış, geriye kalan 1Milyon adedi, ayrı bir seriye depolanmıştır. 15 farklı koşturmanın hepsinin de 1Milyon adet 0 ile 1 aralığındaki rastgele sayıdan oluşan baz kısmı aynıdır. Böylece, bu, her biri küçük-kalma olasılığına eşit tutulan, 0 ile 1 aralığındaki rastgele sayıdan elde edilen, o ana dağılımın o özel parametreleriyle hesaplanan 1Milyon elemanlı sentetik seri ise, o parametre değerlerine sahip o ana olasılık dağılımına göre dağılan rastgele değişkenin 1Milyon adet değişken değerlerini içermekte, ve bu seri de, o özel parametre değerlerine sahip o ana dağılımın özelliğini yansıtmaktadır. Diğer bir deyişle, örneğin: μ=1,

VK=0.5, ÇK=2 değerleri ile ve LN3 ana dağılımı ile hesaplanan 1Milyon elemanlı

değişken değerlerinden oluşan sentetik seri ile, μ=1, VK=0.5, ÇK=2 değerleri ile ve GED ana dağılımı ile hesaplanan 1Milyon elemanlı değişken değerlerinden oluşan

sentetik seri arasındaki fark, sadece LN3 ve GED dağılımlarının analitik yapılarının farklılığını yansıtacaktır.

Baştan 1.3 Milyon adet 0 ile 1 aralığında rastgele sayı türetip, bunun ilk 300Binini atmanın sebebi, rastgele sayı türeticisinin ilk kök değere olan muhtemel bağımlılığını yok etmek, ve tam anlamıyla rastgele sayılardan oluşan bir seri elde etmek amacını gütmektedir.

vi) Daha önceden belirtildiği gibi, bu çalışmada geliştirilen paket program, Gumbel,

LN3, GED, P3, LP3 dağılımlarını almakta, bunlara 4 (LN3 için 5) farklı parametre tahmin yönteminin uygulanmasıyla ortaya çıkan 21 farklı dağılımdan, 3 klasik uygunluk testlerininin birlikte değerlendirilmesine göre en başarılı ilk beş dağılım ile beş farklı sonuç sunulmakta, normalde birinci en iyi olanın sonucunun kullanılması beklenmekte; fakat, tecrübe ve kişisel kanaat gibi faktörlerin etkisiyle, uygunluk testlerinde en başarılı ilk beş dağılımdan biri seçilebilmekte, veya hatta program kullanıcısının taktirine göre başka biri dahi seçilebilmektedir.

Analitik yapılarından dolayı, nümerik olarak, Gumbel, LN3, GED, ve P3 dağılımları, içerisinde negatif değerli elemanlar bulunduran serilerle de hesap yapabilir. LP3 dağılımı ise, analizlere serideki elemanların logaritmasını alarak başladığı için, pozitif işaretli elemanlardan oluşan serilerle hesap yapabilir. Serideki herhangi bir negatif değer, ‘negatif işaretli argümanın logaritmasını alma’ standart hata mesajı ile programın aniden durmasına sebep olur. Gerçek hayatta, bütün yağmur serileri pozitif sayılardan oluşur. Bu gerçeğe rağmen, alt sınırları negatif reel sayılar olabildiği için, yıllık taşkın pikleri serilerinin frekans analizinde dahi, Gumbel, LN3, GED, P3, ve LP3 dağılımları, tekerrür peryodu: T=1.01 yıl gibi küçük küçük-kalma olasılığına sahip değişken değerleri için negatif işaretli değerler hesaplayabilmektedir. Örneğin, Gumbel dağılımının alt sınırı daima –∞’dur. Genelde, oldukça büyük boyutlu pozitif sayılardan oluşan bir örnek serinin diğer dağılımlardan hesaplanan alt sınırlarının pozitif işaretli bir sayı olması beklenir; fakat bazı seriler için, özellikle simetriğe yakın ve negatif çarpıklıklı histogramlar arz eden bazı örnek seriler ile, analiz edilen rastgele değişken gerçek hayatta daima pozitif işaretli değerler alıyorken, o dağılımın alt sınırı negatif bir sayı olmakta ve o dağılım küçük küçük-kalma olasılıklarında negatif değerler verebilmektedir. Bu ise, çare arayışının bu çalışmanın kapsamı dışında olduğu,

uygulamacıların da bildiği, bu popüler dağılımlar hakkında çelişkili bir durumdur. Gumbel dağılımı alt sınırı –∞ olmasına rağmen, konum parametresi o kadar büyük bir değer alır ki, analitik olarak –∞’da x eksenine teğet olan Gumbel dağılımı olasılık yoğunluk fonksiyonunun büyük bir kısmı x ekseninin pozitif bölgesinde bulunur, ve asimptotik olarak –∞’da x eksenine teğet olan olasılık yoğunluk fonksiyonunun sol kuyruğunun büyük bir kısmı pratik anlamda x ekseninin pozitif bölgesi içinde kalıp, sadece analitik olarak, sol kuyruğun nicel değerini kaybetmiş olan kısmı x ekseninin negatif bölgesine uzar. Böylece, çoğu kez, T=1.01 yıl gibi küçük küçük-kalma olasılıklarında dahi pozitif değerli değişkenler hesaplanır. Benzeri argüman, sonlu fakat negatif işaretli bir alt sınıra sahip olabilen diğer dağılımlar için de söz konusudur. Yukarıdaki 5 adımda özetlenen yöntemle, μ=1 ve VK=0.5 sabit değerleriyle, LN3, GED, P3 olarak alınan her üç ana dağılım ile de, çarpıklık katsayısının ÇK=0.5 değeri ile hesaplanan 1Milyon elemanlı sentetik seriden, az sayıda da olsa, bazı elemanlar negatif değerli olmuştur. LN3 ve GED ana dağılımlarıyla, ÇK=1 değeriyle de, 1Milyon elemanlı sentetik seriden, az sayıda da olsa, bazı elemanlar negatif değerli olmuştur. Çarpıklık katsayısının 2, 3, ve 5 olduğu diğer kombinezonlarla, üç dağılımın üçüyle de hesaplanan 1Milyon elemanlı sentetik serilerin tamamı pozitif işaretli değerlerden oluşmuştur. Ortalama değerin 1 gibi küçük bir değerde olması, çarpıklığın 0.5 gibi simetriğe yakın olması, bu kombinezonlarda bazı negatif işaretli elemanların hesaplanmasına sebep olmuştur. Geliştirilen paket programda LP3 dağılımı bulunmasa, bu negatif işaretli elemanların varlığı Monte Carlo analizinde sorun yaratmayacaktı. LP3’ün mevcudiyeti, serideki bütün elemanların sıfırdan büyük olmasını zorunlu kılmaktadır. Dolayısıyla, türetilen toplam 15 adet 1Milyon elemanlı sentetik serinin her birinin en küçük boyutlu elemanı bulunmuş, eğer bu negatif işaretli ise, 1Milyon elemanın tamamına bunun mutlak değerinin 1.01 katı ilave edilmiş (1.01×│Xmin│), böylece 1Milyon elemanın tamamı 1.01×│Xmin│ değeri kadar sağa doğru kaydırılmıştır. Bu işlem, dağılımın varyansını ve çarpıklığını etkilememiş, sadece ortalama değerini 1.01×│Xmin│ kadar arttırarak olasılık yoğunluk fonksiyonunu, şeklini değiştirmeden, pozitif yönde sağa doğru kaydırmıştır.

Benzer Belgeler