• Sonuç bulunamadı

3. YÖNTEM

3.2 Değişkenlerin Seçimi

Kuruma noktası ve ortalama debi tahmini için çok değişkenli regresyon denklemleri kullanılmıştır. Regresyon denklemlerinde yer alan değişkenlerin t testi ile ayrı ayrı, F testi ile de bir bütün olarak anlamlı olup olmadıkları kontrol edilmelidir. Buna ek olarak çoklu regresyon modellemesinde birtakım varsayımlar yapılmaktadır. Bu varsayımlar değişkenler arasında çoklu bağlantının bulunmaması, hatalarda otokorelasyon olmaması ve hata terimlerinin varyansının sabit olmasıdır. Değişkenler buna uygun olarak seçildikten sonra ortalama debi tahmini için geliştirilen regresyon denkleminde kullanılabilir.

3.2.1 Değişkenlerin kontrolü

a) t testi: t testi sayesinde regresyon denkleminde yer alacak değişkenlerin anlamlılıkları ayrı ayrı kontrol edilir. Bu testte sıfır hipotezi H0: 𝜇𝑥= 𝜇𝑦 şeklindedir. X ve Y değişkenlerinin normal dağılmış olması halinde test istatistiğinin kesin örnekleme dağılımı bilinebilir. 𝑉𝑎𝑟(𝑥) = 𝑉𝑎𝑟(𝑦) = 𝑠2 kabul edilmesi durumunda

𝑡 = 𝑥̅ − 𝑦̅ √1 𝑟 + 1 𝑚 𝑠 (3.11)

istatistiğinin örnekleme dağılımı serbestlik derecesi 𝑠. 𝑑. = 𝑛 + 𝑚 + 2 olan t dağılımıdır. Burada

𝑠 = √(𝑟 − 1)𝑠𝑥2+ (𝑚 − 1)𝑠𝑦2

𝑟 + 𝑚 − 2 (3.12)

şeklinde hesaplanır. 𝑉𝑎𝑟(𝑥) ≠ 𝑉𝑎𝑟(𝑦) olması halinde ise

𝑡 = 𝑥̅ − 𝑦̅ √𝑠𝑥2 𝑛 + 𝑠𝑦2 𝑚 (3.13)

istatistiğinin örnekleme dağılımı serbestlik derecesi

𝑠. 𝑑. = (𝑠𝑥 2 𝑟 + 𝑠𝑦2 𝑚) 2 [(𝑠𝑥2⁄ )𝑟 2 𝑟 − 1 + (𝑠𝑦2⁄ )𝑚 2 𝑚 − 1 ](3.14) olan t dağılımıdır.

X ve Y değişkenlerinin normal dağılmış olması halinde yukarıda verilen örnekleme dağılımları kullanılarak ret bölgesi belirlenir ve t testi uygulanır. Ancak dağılımların normal olmaması halinde bu parametrik testin gücü az, yani gerçekte 𝜇𝑥= 𝜇𝑦 olmadığı halde H0 hipotezinin kabul edilmesi olasılığı yüksek olur. Bu gibi durumlarda aşağıda anlatılan, değişkenlerin dağılımından bağımsız testleri (parametrik olmayan test) uygulamak gerekir. Değişkenlerin normal dağılmaması halinde izlenebilecek diğer bir yol uygun bir dönüşüm uygulayarak değişkenleri normal değişkenlere çevirdikten sonra parametrik testin bu değişkenler için kullanılmasıdır.

b) F testi: İki örneğin varyanslarının toplum değerlerinin aynı olup olmadığını kontrol etmek için 𝑠𝑥> 𝑠𝑦 olmak üzere

𝐹 =𝑠𝑥

2

𝑠𝑦2 (3.15)

istatistiği hesaplanır. Bu istatistiğin dağılımı payının serbestlik derecesi 𝑠. 𝑑. = 𝑛 − 1, paydasının serbestlik derecesi 𝑚 − 1 olan F (Fisher) dağılımıdır. (3.15) denklemiyle hesaplanan 𝐹 değeri seçilen anlamlılık düzeyindeki kritik 𝐹𝑐 değerinden büyükse (𝐹 > 𝐹𝑐 ise) iki örneğin varyanslarının toplum değerlerinin aynı olduğu hipotezi ret edilir. Bu test, değişkenlerin normal dağılmış olması halinde geçerlidir (Bayazıt, 1996, s. 17).

3.2.2 Çoklu bağlantı için varyans artış faktörü

Çoklu bağlantı, en az bir değişkenin bir ya da daha fazla değişkenle yakından ilişkili olma durumudur. Değişkenler arasında çok iyi bir ilişki olması durumunda değişkenler arasındaki korelasyon katsayısı −1 veya 1 değerine yaklaşır. Dolayısıyla bu değişkenler belirlenerek regresyon modelinden çıkarılır. Aksi takdirde taraflı sonuçlar elde edilebileceği gibi, beklenmeyen veya anlamsız sonuçlarla karşılaşılabilir. Bu nedenle geliştirilen regresyon modelinin sadece istatistiksel değil aynı zamanda fiziksel olarak da anlamlı olması gerekir.

Çoklu bağlantı kontrolünde herhangi bir 𝑗 değişkeni için Varyans Artış Faktörü (𝑉𝐼𝐹)

𝑉𝐼𝐹𝑗 = 1 (1 − 𝑅⁄ 𝑗2) (3.16)

şeklinde hesaplanır (Helsel ve Hirsch, 2002). Burada 𝑅𝑗2, 𝑗’inci değişken ile diğer tüm değişkenler arasındaki regresyonun 𝑅2 değeridir. 𝑅𝑗2 ≅ 0’a karşı gelen 𝑉𝐼𝐹𝑗 değeri 1’dir. 𝑅𝑗2 > 0.9 olması durumunda 𝑉𝐼𝐹𝑗 > 10 olur. Bu durumda çoklu bağlantı, 𝑗’inci değişken için güven aralığı bandının genişliğini √𝑉𝐼𝐹𝑗 kadar arttırır. Bu da sonuçların güvenilirliğini azaltır. Hesaplanan 𝑉𝐼𝐹 değeri ile birlikte modelde kullanılacak değişkenlerin seçimi mümkündür.

3.2.3 Otokorelasyon için Durbin Watson istatistiği

Modeldeki hataları değerlendirmek için yaygın olarak kullanılan Durbin Watson (𝐷𝑊) istatistiğine bakılır. Hataların birbiriyle olan ilişkisinin (otokorelasyonun) değerlendirilmesi ele alınan değişkenlerin birbiriyle ilişkisinin araştırılmasında önemlidir. 𝐷𝑊 istatistiği ile değişkenlerin regresyon modeli tahmininden sonra kalan artık terimlerin korelasyonu incelenir. 𝐷𝑊 istatistiği

𝐷𝑊 =𝑛 (𝑒𝑖 − 𝑒𝑖−1)2 𝑖=2

𝑛𝑖=2𝑒𝑖2 (3.17)

şeklinde tanımlanır. 𝐷𝑊 değerinin küçük olması seri korelasyonunu ifade etmektedir. 𝐷𝑊 < 𝑑𝐿 olduğunda seri korelasyonu lehine 𝑒𝑖’lerin bağımsız olduğu kabul edilen H0

hipotezi reddedilir. Burada 𝑑𝐿 kritik değerin alt sınırı olup değeri veri setinin büyüklüğüne, değişken sayısına ve 𝛼 anlamlılık düzeyine bağlıdır. 𝐷𝑊’nin çok küçük olması da ilişkiyi yorumlama imkanı vermemektedir. 𝐷𝑊 değeri 0 ile 4 arasında

değişir. Otokorelasyon bulunmaması (𝜌 = 0) durumunda 𝐷𝑊 = 2 olur. Şekil 3.3’te hataların otokorelasyon katsayıları temsili olarak verilmektedir. Buna göre hataların bağımsız olması yani birbiriyle ilişkisinin olmaması durumunda hatalar rastgele dağılır ve otokorelasyon katsayısı 𝜌 = 0’dır. Hatalar arasında pozitif ilişki olması durumunda 𝜌 > 0, negatif ilişki olması durumunda ise 𝜌 < 0 hesaplanır.

Şekil 3.3 : Hatalar arasındaki otokorelasyonun temsili gösterimi. 3.2.4 Eşit varyans için grafik yöntem

Modele girdi olan değişkenlerin hata terimlerinin varyanslarının aynı olması eşit varyans (homosedastisite) olarak tanımlanır. Eğer değişkenlerin bulundukları aralıklar çok geniş ise hata terimlerinin varyansı değişir. Bu durum farklı varyans (heterosedastisite) olarak ifade edilir.

Farklı varyans durumuna model seçimi (denklem tipi) ile kullanılan verilerin özellikleri neden olur. Kullanılan verilerdeki ölçüm hatası, kullanılan verilerin seçilen modelin anlamlılığını etkileyecek şekilde modele dahil olmaması, verilerin içindeki uç değerler bu durumun oluşmasına örnektir. Grafik yöntem, farklı varyans durumunun belirlenmesinde pratik ve kolay bir yöntemdir. Ayrıca değişkenler ve hata terimleri arasındaki ilişkiyi görsel olarak karşılaştırma imkanı sunar (Şekil 3.4).

Şekil 3.4 : Farklı varyans (heterosedastisite) gösterimi (Güriş ve Çağlayan, 2000). Yöntem olarak öncelikle eşit varyans kabulüyle modelde seçilen parametrelerin tahmin hataları hesaplanır. Oluşturulan grafik üzerinde düşey eksene hata/hatanın karesi (standart sapması), yatay eksene ise modelden tahmin edilen değerlerin standartlaştırılmış hali eklenir (Şekil 3.5). Eksenlerde belirtilen ifadelerin fonksiyonel ilişkileri araştırılır. Şekil 3.5a’da herhangi ilişki gözlenmediği yani değişkenlerin eşit varyans durumunun kabul edileceği söylenebilir. Şekil 3.5b ve Şekil 3.5c’de ise sırasıyla, ikinci mertebeden bir ilişki ve doğrusal bir şekilde artan eğimli ilişkiye sahip olmaları değişkenlerin farklı varyans durumunu ortaya koymaktadır.

Benzer Belgeler