Lineer olmayan bulanık regresyonda tahmin

(1)

T.C.

SELÇUK ÜNİVERSİTESİ

FEN BİLİMLERİ ENSTİTÜSÜ

LİNEER OLMAYAN BULANIK

REGRESYONDA TAHMİN

ÜMRAN MÜNİRE TEKŞEN

YÜKSEK LİSANS TEZİ

İSTATİSTİK ANA BİLİM DALI

(2)

ÖZET

Yüksek Lisans Tezi

LİNEER OLMAYAN BULANIK REGRESYONDA TAHMİN

Ümran Münire TEKŞEN

Selçuk Üniversitesi Fen Bilimleri Enstitüsü İstatistik Ana Bilim Dalı

Danışman: Doç. Dr. Aşır GENÇ

2008, 121 sayfa

Gözlemlerin bulanık sayı olması durumunda lineer olmayan regresyon analizi için bazı yöntemler vardır. Yapay sinir ağları, en küçük kareler destek vektör mekanizmasına dayalı bulanık regresyon ve bulanık en küçük mutlak sapmalar regresyonu bunlardan bazılarıdır. Bu çalışmada, belirtilen yöntemler ele alınacak ve sayısal uygulamaların sonuçları karşılaştırılacaktır.

Anahtar Kelimeler: Lineer Regresyon, Lineer Olmayan Regresyon, Bulanık Küme Kuramı, Yapay Sinir Ağları, En Küçük Kareler Destek Vektör Mekanizması, Bulanık En Küçük Mutlak Sapmalar Regresyonu, Doğrusal Programlama.

(3)

ABSTRACT

Ms Thesis

ESTIMATION IN FUZZY NONLINEAR REGRESSION

Ümran Münire TEKŞEN

Selçuk University

Graduate School of Natural and Applied Sciences Department of Statistics

Supervisor: Assoc. Prof. Dr. Aşır GENÇ

2008, 121 page

There are some methods for fuzzy nonlinear regression analysis when the observations are fuzzy numbers. Some of them are artificial neural networks, least square-support vector machines and fuzzy least absolute deviations regression. In this study, explained methods will be handled and the results of numeric applications will be compared.

Key Words: Linear Regression, Nonlinear Regression, Fuzzy Sets, Artificial Neural Networks, Least Squares-Support Vector Machines, Fuzzy Least Absolute Deviations Regression, Linear Programming.

(4)

ÖNSÖZ

Lineer olmayan bulanık regresyonda tahmin adlı tezimin seçimi ve gerçekleşmesinde yardımını esirgemeyen, çalışmalarımda yol gösteren ve bilgileriyle katkıda bulunan değerli hocam Doç.Dr. Aşır GENÇ’e, yüksek lisans öğrenimim sırasında maddi olarak verdiği destekten dolayı TÜBİTAK’a ve olumlu yaklaşımlarıyla her zaman yanımda olan aileme teşekkür ederim.

(5)

İÇİNDEKİLER ÖZET………..…...i ABSTRACT ………...ii ÖNSÖZ ………...iii İÇİNDEKİLER………...iv ŞEKİLLER DİZİNİ...ix ÇİZELGELER DİZİNİ...x KISALTMALAR...xi 1. GİRİŞ VE ÖNCEKİ ÇALIŞMALAR...1 1.1. Giriş……….……..…….1 1.2. Önceki Çalışmalar………...…………....2

2. BULANIK KÜME KURAMI………...………...………...4

2.1. Bulanık Kümelerde Temel Kavramlar ..………...…………..5

2.2. Bulanık Kümelerde Temel İşlemler………..……..8

2.2.1. Kesişim ………...8 2.2.2. Birleşim ………...…8 2.2.3. Tümleme ………...9 2.2.4. Kapsama ………...9 2.2.5. Eşitlik ………...9 2.2.6. Cebirsel çarpım ………...10 2.2.7. Cebirsel toplam ………...…10 2.2.8. Fark ………...…10

2.3. Bazı İleri Bulanık Küme İşlemleri………...11

2.3.1. Bazı t-conorm operatörleri ………...…11

(6)

2.4. Üyelik Fonksiyonları………...…12

2.4.1. Üyelik fonksiyonları biçimleri ………...13

2.5. Bulanık Sayılar………...…16

2.6. Bulanık Sayılarda İşlemler………...…16

2.6.1. Toplama işlemi………...……16

2.6.2. Çıkarma işlemi………...…17

2.6.3. Çarpma işlemi………...…17

2.6.4. Bölme işlemi………...…18

2.7. Üçgensel ve Yamuksal Bulanık Sayılar………...……18

2.7.1. Üçgensel ve yamuksal bulanık sayılar üzerinde bulanık aritmetik…...…19

3. LİNEER REGRESYON ANALİZİ ...22

3.1. Parametre Tahmini...24

3.1.1. EKK (En küçük kareler kestiricisi)...25

3.1.2. En çok olabilirlik yöntemi...27

3.1.3. MLE tahmin edicilerinin bazı istatistiksel özelikleri...28

3.2. Artıklar...30

3.3. Çoklu Belirleyicilik Katsayısı ...30

3.4. Bireysel Parametreler İçin Güven Aralığı...31

3.5. Bireysel Parametreler İçin Hipotez testi …...31

3.6. j x Y m ’nin Tahmini...32

3.7. Sonradan Gözlemin Tahmini...32

4. LİNEER OLMAYAN REGRESYON ANALİZİ…...34

4.1. Modelin Tanıtımı ve Bazı Gösterimler...34

(7)

4.2.1 Başlangıç noktasının seçimi...40

4.2.2. Durdurma kuralı...41

4.2.3. Gauss- Newton Yöntemi…...41

5. YAPAY SİNİR AĞLARI...45

5.1. Giriş...45

5.1.1. Biyolojik nöron yapısı ...45

5.1.2. Aktivasyon fonksiyonları...47

5.1.3. İşlemci elemanları (Yapay nöron)...48

5.2. YSA ile Hesaplamanın Özellikleri...49

5.2.1. Doğrusal olmama ...50

5.2.2. Öğrenme... 50

5.2.3. Genelleme...50

5.2.4. Uyarlanabilirlik ...50

5.2.5. Dağıtılmış birleşik hafıza ...51

5.2.6. Hata toleransı...51

5.2.7. Paralel işlem yapma ...51

5.3. Yapay Sinir Ağlarının Sınıflandırılması...52

5.3.1. YSA’ların yapılarına göre sınıflandırılması ...52

5.3.1.1. İleri beslemeli ağlar... 52

5.3.1.2. Geri beslemeli ağlar ...53

5.3.2. YSA’ların öğrenme algoritmalarına göre sınıflandırılması ...53

5.3.2.1. Danışmanlı öğrenme (Supervised learning) ...54

5.3.2.2. Danışmansız öğrenme (Unsupervised learning) ...54

5.3.2.3. Takviyeli öğrenme (Reinforcement learning) ...55

5.4. Çok Katmanlı Perseptronlar ve Öğrenme Algoritmaları...56

5.4.1. Çok katmanlı perseptronlar ...56

(8)

5.5. Diğer Yapay Sinir Ağları ...61

5.5.1. LVQ (Learning vector quantization)…………...………61

6. YSA YARDIMIYLA LİNEER OLMAYAN BULANIK REGRESYON TAHMİNİ...63

6.1. Bulanık Regresyon...63

6.2. Lineer Olmayan Bulanık Regresyon...63

6.3. Modelin Test Edilmesi………...68

7. LS-SVM’YE DAYALI BULANIK LİNEER OLMAYAN REGRESYON...70

7.1. LS-SVM...70

7.1.1. Support vector machine (SVM) sınıflayıcısı...70

7.1.2. En küçük kareler (Least Square) SVM...72

7.2. Lagrange Yöntemi...74

7.3. Bulanık Lineer LS-SVM Regresyon...75

7.4. Bulanık Lineer Olmayan LS-SVM Regresyon…………...…79

8. DOĞRUSAL PROGRAMLAMA İLE BULANIK EN KÜÇÜK MUTLAK SAPMA REGRESYONU...82

8.1. Simpleks Yöntem...82

8.1.1. Doğrusal programlama probleminin standart biçimi...84

8.1.2. Temel çözümler...85

8.1.2.1. Temel uygun çözümü iyileştirme...87

8.1.3. Başlangıç temel uygun çözümün bulunması...95

8.1.3.1. Temel uygun çözümün bulunmasında bazı aykırı durumlar...96

8.2. Bulanık En Küçük Mutlak Sapma Regresyonu ...97

8.2.1. Genel bulanık lineer model...97

(9)

9. UYGULAMALAR...102 9.1. Uygulama 1...102 9.2. Uygulama 2...108 9.3. Uygulama 3...112 10. SONUÇ...115 KAYNAKLAR...118

(10)

ŞEKİLLER DİZİNİ

Sayfa

Şekil 2.1. Bulanık kümelerde zayıf a -seviye kesme kümesi 8

Şekil 2.2. Üçgensel bulanık sayı gösterimi 15

Şekil 4.1. Y vektörünün F ( )q sütun uzayına dik izdüşümü 39

Şekil 5.1. Biyolojik sinir sisteminin blok gösterimi 46

Şekil 5.2. YSA’larda en çok tercih edilen aktivasyon fonksiyonları a) sigmoid, b) doğrusal c) hiperbolik tanjant ve d) keskin sınırlayıcı 48

Şekil 5.3. Bir işlemci elemanı (yapay nöron) 49

Şekil 5.4. İleri beslemeli ağ için blok diyagram 52

Şekil 5.5. Geri beslemeli ağ için blok diyagram 53

Şekil 5.6. Danışmanlı öğrenme yapısı 54

Şekil 5.7. Danışmansız öğrenme yapısı 55

Şekil 5.8. Takviyeli öğrenme yapısı 55

Şekil 5.9. Geri yayılım MLP yapısı 57

Şekil 5.10. Çok katmanlı bir perseptron geri yayılım akış şeması 60

Şekil 5.11. LVQ ağı 61

Şekil 9.1. YSA eğitim verisi tahmin değerleri 105

Şekil 9.2. YSA test verisi tahmin değerleri 105

Şekil 9.3. YSA alt ve üst sınır değerleri 106

Şekil 9.4. LS-SVM tahmin değerleri 109

Şekil 9.5. LS-SVM alt ve üst sınır değerleri 111

(11)

ÇİZELGELER DİZİNİ

Sayfa

Çizelge 3.1. Artıkların hesaplanması 31

Çizelge 5.1. Sinir sistemi ile YSA’nın benzerlikleri 46

Çizelge 9.1. Uygulama verisi 103

Çizelge 9.2. YSA’da model yeterliliği değerleri 106

Çizelge 9.3. YSA uygulama sonuçları 107

Çizelge 9.4. LS-SVM uygulama verisi 108

Çizelge 9.5. LS-SVM uygulama sonuçları 110

Çizelge 9.6. FLAD uygulama verisi 112

Çizelge 10.1. Yöntemlerin hata kareler ortalaması ve R2 değerleri 115

(12)

KISALTMALAR

EKK: En küçük kareler EOTE: En çok olabilirlik YSA: Yapay sinir ağları İE: İşlemci eleman

MLP: Çok katmanlı perseptron BP: Geri yayılma

GA: Genetik algoritma

LVQ: Öğrenen vektör ölçümü

FNR: Lineer olmayan bulanık regresyon AAE: Ortalama mutlak hata

LS-SVM: En küçük kareler destek vektör mekanizması FLAD: Bulanık en küçük mutlak sapmalar regresyonu Dpp: Doğrusal programlama problemi

TFN: Üçgensel bulanık sayı QFN: Dörtgensel bulanık sayı HKO: Hata kareler ortalaması

(13)

1. GİRİŞ VE ÖNCEKİ ÇALIŞMALAR

1.1. Giriş

Lineer regresyon analizinde, açıklanan değişken, açıklayıcı değişken veya değişkenlerin lineer formda bir fonksiyonuyla ifade edilir. Lineer olmayan regresyonda bu fonksiyon parametreye göre lineer olmayan yapıdadır ve fonksiyonun biçimsel olarak bilindiği varsayılır. Regresyon parametrelerinin tahmini sıradan en küçük kareler (EKK) yöntemiyle elde edilebilir. Fonksiyonel ilişkinin bilinmemesi durumunda ise bu yöntem kullanılamaz (Genç 1997).

Verilerin her zaman kesin sayılarla ifade edilemediği durumlarda, özellikle veri için niteliksel tanımlamalar getirildiğinde bulanık sayı ifadesi ortaya çıkmakta ve bulanık küme teorisine ihtiyaç duyulmaktadır.

Bu çalışmada verilerin kesin sayı olmaması durumunda bir bağımlı ve bir bağımsız değişken arasındaki ilişkinin ortaya konulması ve tahmin yapılması problemi ele alınmıştır. Bu bağlamda yapay sinir ağları ile bulanık regresyon, LS-SVM’ye dayalı bulanık regresyon ve bulanık en küçük mutlak sapma regresyonu konularında bilgi verilecektir.

Yapay sinir ağları (YSA), beynin fizyolojisinden faydalanılarak oluşturulan bilgi işleme modelleridir. YSA’lar sahip oldukları öğrenme özelliği yardımıyla, girdi ve çıktı arasındaki ilişkiyi, doğrusal olsun veya olmasın, daha önce hiç görülmemiş olaylara uygulayabilmektedir (Yazıcı ve ark. 2006). Böylece, girdi ve çıktı değişkenleri arasındaki ilişkinin biçimi bilinmese de tahmin yapılabilmektedir.

Girdi ve çıktısı bulanık veri setleri için LS-SVM’ye dayalı bulanık lineer regresyon yönteminde hataların en küçük hale getirilmesi amaçlandığından bir optimizasyon problemi olarak düşünülmüştür (Hong ve Hwang 2006).

Bulanık en küçük mutlak sapma regresyonu (FLAD), en küçük kareler yöntemine alternatif olarak sunulan L normuna dayalı bir yöntemdir. Bu yöntem de sonuçta bir ₁

(14)

Çalışmanın ikinci bölümünde bulanık küme teorisine ilişkin bazı temel kavramlarla, bulanık kümelerde ve bulanık sayılarda işlemler ele alınacaktır.

Üçüncü bölümde doğrusal regresyon analizine giriş yapılacak, modele ilişkin gösterimler, parametre tahmin yöntemleri, çoklu belirleyicilik katsayısı, parametre tahminlerinin güven aralıkları ve bu parametreler için hipotez testleri verilecektir. Dördüncü bölümde de lineer olmayan regresyon analizinde gösterimler ve parametre tahmini için bir algoritma açıklanacaktır.

Beşinci bölümde yapay sinir ağları tanıtılacak ve altıncı bölümde yapay sinir ağları yardımıyla bulanık regresyon tahmini yapmak için bir algoritma verilecektir.

Yedinci bölümde LS-SVM’ye dayalı bulanık regresyon analizi için gerekli tanımlamalarla optimizasyon algoritması açıklanacak ve bulanık lineer ve lineer olmayan regresyon modeli için tahmin elde etme adımları verilecektir.

Sekizinci bölüm doğrusal programlama ve bulanık en küçük mutlak sapma regresyonunu içermektedir.

Dokuzuncu bölümde verilen yöntemler için uygulamalar yapılacak ve elde edilen tahminler grafikler yardımıyla açıklanmaya çalışılacaktır. Sonuç bölümünde ise uygulamalar yardımıyla yukarıda değinilen yöntemler kıyaslanacak, avantaj ve dezavantajları açıklanmaya çalışılacaktır.

1.2. Önceki Çalışmalar

Bulanık lineer regresyon analizi alanında ilk çalışma Tanaka ve ark. (1982) tarafından yapılmıştır. Girdinin kesin sayı çıktının ise bulanık sayı olduğu modelde bulanık katsayıların tahmini için model geliştirilmiştir.

Ishibuchi ve Tanaka (1992), bulanık regresyon için sinir ağlarını kullanarak basit fakat güçlü bir yöntem önermiştir. Bulanık regresyon analizini aralık regresyon analizine indirgeyip, çıktı aralığının alt ve üst sınırlarını iki bağımsız sinir ağının eğitilmesi ile tanımlamışlardır.

Xu ve ark. (2000), bulanık lineer olmayan regresyon analizi için aralık tahmini yapmayı hedeflemişlerdir.

(15)

Hong ve Hwang (2006), LS-SVM’ye dayalı bulanık lineer regresyon analizi için bir algoritma önermişler ve lineer olmayan regresyon için de uygulamışlardır.

Sun ve Sun (2003), bir sınıflayıcı ve regresyon tahmin edicisi olarak SVM’yi ele almıştır. Çalışmada bulanık mantıktan yararlanarak genel SVM modelinden çok katmanlı SVM yapısına geçiş açıklanmıştır.

Chang ve Lee (1994), bulanık regresyon analizi için genel bulanık lineer regresyon modeline dayalı bulanık fark sıralama yöntemi geliştirmiştir. Böylece bulanık en küçük mutlak sapma regresyonu oluşturmuşlardır.

Kim ve Kim (2005), bulanık girdi ve çıktıya sahip veride bulanık lineer regresyon modeli yerine bulanık en küçük mutlak sapma regresyonu yöntemini uygulamışlardır.

Dasgupta ve Mishra (2004), ekonometrik modellerde en küçük mutlak sapma regresyonu üzerine inceleme yapmışlardır.

(16)

2. BULANIK KÜME KURAMI

Bulanık küme kuramı ilk olarak 1965’te L.A. Zadeh tarafından ele alınmıştır. Sözel ifadelerdeki belirsizliği göstermek için matematiksel bir yöntem olarak tanıtılan bulanık kümeler, klasik küme teorisinin genişletilmesi olarak düşünülebilir (Pedrycz ve Gomido 1998).

Kesin veya klasik küme, elemanları belirli sınırlar içinde yer alan kümedir. Elemanlar kümenin tam olarak üyesidir.

Bulanık küme ve kesin küme arasındaki bağlantıyı görmek için öncelikle kesin kümelerdeki üyelik durumuna bakalım. X , ilgilendiğimiz elemanları içeren evrensel küme olsun. A da, X ’in bir alt kümesini göstersin. A’nın, X üzerindeki üyelik fonksiyonu (veya karakteristik fonksiyonu) 0 veya 1 değerini alır. Yani, X ’te bir x elemanı A’nın elemanı ise üyelik fonksiyonu değeri 1, diğer durumlarda 0’dır (Xu ve Khosgoftaar 2000).

Bir A Í X kümesinin üyelik derecesi [0,1] aralığı kabul edilirse A kümesi bulanık küme olarak adlandırılır ve A~ ile gösterilir. A~ bulanık kümesi

} | )) ( , {( ~ ~ x x X x A A Î = m (2.1)

şeklinde tanımlanmıştır ve üyelik derecesi

] 1 , 0 [ : ) ( ~ x X ® A m (2.2)

fonksiyonu ile tanımlanır. A~ bulanık kümesi, X ={x₁,x₂,...,x_n} olmak üzere,

n n A A A x x x x x x A~=m~( ₁)/ ₁+m~( ₂)/ ₂ +...+m~( )/ (2.3)

(17)

olarak tanımlanır. Burada “/” işareti x elemanının A~ bulanık kümesine ait olma (üyelik) derecesini gösteren ayrım işaretidir. “+” işareti Boole cebri anlamında birleşme işaretidir.

2.1. Bulanık Kümelerde Temel Kavramlar

Bulanık kümelerde işlem yapabilmek için bazı temel kavramların açıklanmasına ihtiyaç duyulmaktadır. Burada X ÌÂ’dir.

- Destek

A~ bulanık kümesinin desteği,

} 0 ) ( | { ) ~ (A = xÎX ~ x > Supp m_A (2.4)

olarak tanımlanır. Üyelik derecesi sıfırdan büyük olan elemanların oluşturduğu kümedir.

- a - kesme (a -seviye) kümesi

A~ bulanık kümesinin zayıf a -kesme kümesi,

} ) ( | { ~ ~ a m a = xÎX x ³ A A (2.5)

ve A~ bulanık kümesinin güçlü a -kesme kümesi,

} ) ( | { ~ ~ a m a¢ = xÎX x > A _A (2.6)

(18)

- Dışbükeylik

A~ bulanık kümesi için,

) ( ) 1 ( ) ( ) ) 1 ( ( ₁ ₂ ~ ₁ ~ ₂ ~ x x x x A A A l l lm l m m + - ³ + - "x₁,x₂ ÎX ve lÎ[0,1] (2.7)

ifadesi sağlanırsa A~ bulanık kümesi dışbükeydir.

- Normallik

A~ bulanık kümesi ancak ve ancak

1 ) ( sup ~ x = A x m (2.8)

eşitliği sağlandığında normaldir. Yani üyelik fonksiyonunun en büyük değeri 1 olduğunda bulanık küme normaldir.

- Yükseklik

A~ bulanık kümesinin yüksekliği,

) ( sup ) ~ (A ~ x h _A X x m Î = (2.9)

(19)

Örnek 2.1. A~={0.1/1+0.4/3+0.6/4+1.0/5+1.0/6+0.6/7+0.5/8+0.2/10} bulanık kümesi X ={1,2,3,4,5,6,7,8,9,10} evrensel kümesi üzerinde tanımlıdır. Bulanık kümelerde temel kavramları A~ kümesi üzerinde aşağıdaki biçimde gösterilebilir

} 10 , 8 , 7 , 6 , 5 , 4 , 3 , 1 { ) ~ (A = Supp 4 . 0 = a için;

Zayıf a -seviye kesme kümesi A~_a ={3,4,5,6,7,8}

Güçlü a -seviye kesme kümesi A~_a ={4,5,6,7,8} olarak bulunur.

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 0 1 2 3 4 5 6 7 8 9 10 x Üyelik Fonksiyonu Şekil 2.1. 5 . 0 = l 2 . 0 5 . 0 6 . 0 5 . 0 ) 10 5 . 0 4 5 . 0 ( ~ ´ + ´ ³ ´ + ´ A m 4 . 0 ) 7 ( ~ ³ A m 4 . 0 6 .

(20)

1 ) ( sup ~ x = A x

m olduğundan A~ kümesi normaldir.

4 . 4 2 . 0 5 . 0 6 . 0 1 1 6 . 0 4 . 0 1 . 0 ) ( | ~ | ~ = + + + + + + + = =

å

ÎX x A x A m ) ( sup ) ~ (A ~ x h _A X x m Î = =1 dır.

2.2. Bulanık Kümelerde Temel İşlemler

Bulanık kümelerde işlemler üyelik fonksiyonları yardımı ile tanımlanır. A~ ve B~ iki bulanık küme olmak üzere Zadeh (1965) tarafından tanımlanan cebirsel işlemler aşağıda verilmiştir.

2.2.1. Kesişim

A~ ve B~ bulanık kümelerinin kesişimi A~ÇB~ nin üyelik fonksiyonu,

} , ) ( ), ( min{ ) ( ) ( ) ( ~ ~ ~ ~ ~ ~ x x x x x x X B A B A B AÇ =m Ùm = m m Î m (2.10)

ile tanımlanır. Burada “Ù” işareti bulanık kümelerde kesişim işlemini göstermektedir.

2.2.2. Birleşim

(21)

} , ) ( ), ( max{ ) ( ) ( ) ( ~ ~ ~ ~ ~ ~ x x x x x x X B A B A B AÈ =m Úm = m m Î m (2.11)

ile tanımlanır. Burada “Ú” işareti bulanık kümelerde birleşme işlemini göstermektedir.

2.2.3. Tümleme

A~ bulanık kümesinin tümleyeni A~c ile gösterilsin. A~c nin üyelik fonksiyonu

) ( 1 ) ( ~ ~ x x A Ac m m = - (2.12)

şeklinde ifade edilir.

2.2.4. Kapsama

A~ ve B~ bulanık kümelerinde A~ÌB~ ise bunun üyelik fonksiyonu,

X x x x _B A( )£ ~( ), Î ~ m m (2.13)

eşitsizliği ile ifade edilir.

2.2.5. Eşitlik

A~ ve B~ bulanık kümeleri eşit ise A~=B~ biçiminde gösterilir ve üyelik fonksiyonu

X x x x _B A( )= ~( ), Î ~ m m (2.14)

(22)

biçiminde ifade edilir.

2.2.6. Cebirsel çarpım

A~ ve B~ bulanık kümelerinin cebirsel çarpımı A~×B~ nin üyelik fonksiyonu,

X x x x x _A _B B A×~( )= ~( )× ~( ) , Î ~ m m m (2.15)

eşitliği ile ifade edilir.

2.2.7. Cebirsel toplam

A~ ve B~ bulanık kümelerinin cebirsel toplamı A~ÅB~ nin üyelik fonksiyonu,

X x x x x x x _A _B _A _B B AÅ~( )= ~( )+ ~( )- ~( )× ~( ) , Î ~ m m m m m (2.16)

2.2.8. Fark

A~ v e B~ bulanık kümelerinin farkı c

B A B

A~- ~= ~Ç ~ , ( c

B~ , B~ nin tümleyenini göstermek üzere) biçimindedir ve üyelik fonksiyonu,

)} ( 1 ), ( min{ )} ( ), ( min{ ) ( ~ ~ ~ ~ ~ ~ x x x x x B A B A B A c m m c m m m _Ç = = - (2.17)

(23)

2.3. Bazı İleri Bulanık Küme İşlemleri

Bulanık birleşme operatörlerine t-conorm ( Å )(s-norm) operatörü, bulanık kesişme operatörlerine t- norm (*) operatörü denir.

2.3.1. Bazı t-conorm operatörleri

- Sınırlı toplam

A~ ve B~ bulanık kümelerinin cebirsel toplamı A~ÅB~ nin üyelik fonksiyonu,

X x x x x _A _B B AÅ~( )=min{1, ~( )+ ~( )} , Î ~ m m m (2.18)

- Güçlü toplam

A~ v e B~ bulanık kümelerinin üyelik fonksiyonu ile bulanık birleşimi, üyelik fonksiyonu aşağıda gösterilen bulanık kümedir.

ï î ï í ì > = = = Å 0 ) ( ), ( , 1 0 ) ( , ) ( 0 ) ( , ) ( ) ( ~ ~ ~ ~ ~ ~ ~ ~ x x x x x x x B A A B B A B A m m m m m m m (2.19)

(24)

2.3.2. Bazı t-norm operatörleri

- Sınırlı çarpım

A~ ve B~ bulanık kümelerinin cebirsel çarpımı A~×B~ nin üyelik fonksiyonu,

X x x x x _A _B B A×~( )=max{0, ~( )+ ~( )-1} , Î ~ m m m (2.20)

- Güçlü çarpım

A~ v e B~ bulanık kümelerinin üyelik fonksiyonu ile bulanık kesişimi, üyelik fonksiyonu aşağıda gösterilen bulanık kümedir.

ï î ï í ì < = = = × 1 ) ( ), ( , 0 1 ) ( , ) ( 1 ) ( , ) ( ) ( ~ ~ ~ ~ ~ ~ ~ ~ x x x x x x x B A A B B A B A m m m m m m m (2.21) 2.4. Üyelik Fonksiyonları

Üyelik fonksiyonu, X evrensel kümesine ait bir x elemanının A~ bulanık kümesine ait olma derecesini gösteren fonksiyondur. Üyelik fonksiyonu, karakteristik fonksiyon olarak da adlandırılır. ] 1 , 0 [ : ) ( ~ x X ® A m

(25)

2.4.1. Üyelik fonksiyonları biçimleri

Üyelik fonksiyonu biçimleri dört ana grupta toplanmaktadır.

1. Deneysel karar vermeye dayalı üyelik fonksiyonları

Bu tip üyelik fonksiyonlarına örnek olarak Zadeh’in unimodal fonksiyonları verilebilir. î í ì £ > -+ = 25 , 1 25 }, ] 25 / ) 25 [( 1 /{ 1 ) ( 2 x x x x m (2.22) ve î í ì £ > -+ = -50 , 1 50 }, ] 50 / ) 50 [( 1 /{ 1 ) ( 2 x x x x m (2.23)

2. Güvenilirlik kavramına dayalı üyelik fonksiyonları

Üçgensel üyelik fonksiyonu bu tiptedir.

ï ï ï î ï ï ï í ì > £ £ -£ £ -< = b x b x m m b x b m x a a m a x a x x , 0 , , , 0 ) ( m (2.24)

(26)

Burada üçgensel bulanık sayının gösterimi A =~ (a,m,b) şeklindedir.

Şekil 2.1.

Bu grupta örnek olarak Dubois ve Prade’in (1980) LR-tip bulanık sayısı da verilir.

ï î ï í ì £ £ > -< -= b x a b x b x R a x x a L x , 1 , ) / ) (( , ) / ) (( ) ( b a m (2.25)

Burada L(×) ve R(×) referans fonksiyonlarıdır. Üçgensel bulanık sayı

î í ì - £ < = = . . , 0 1 0 , 1 ) ( ) ( y d x x x R x L (2.26)

olan özel bir LR-tip bulanık sayıdır.

3. Teorik isteklere dayalı üyelik fonksiyonları

Civanlar ve Trussel’in (Yapıcı 2000) fonksiyonu örnek verilebilir.

) ( ~ x A m 1 x b m a

(27)

î í ì £ = . . , 0 1 ) ( , ) ( ) ( y d x ap x ap x m (2.27)

ile ifade edilmek üzere aÎ[0,1] bir parametre ve p(x) olasılık yoğunluk fonksiyonudur.

4. Kişi kavramlarının bir modeli olarak üyelik fonksiyonları

Bu kategoride Dombi’nin (1990) fonksiyonu

] ) 1 ( ) 1 /[( ) 1 ( ) (_x ₌ _-_s _x2 _-_s _x2 ₊_s _-_x 2 m (2.28)

şeklinde verilir. Burada s , durumun karakteristik değerini belirtir ve y=m(x) ve y = x

değerlerinin kesişimidir.

Örnek 2.2. Simetrik 5~ üçgensel bulanık sayısının üyelik fonksiyonu,

ï î ï í ì £ £ -£ £ -> < = için x x için x x için x ve x x X 7 5 2 / ) 7 ( 5 3 2 / ) 3 ( 7 3 0 ) ( ~ m

olarak yazılabilir. Aynı sayı için LR-tip üyelik fonksiyonu aşağıdaki gibi verilir.

ï î ï í ì = > -< -= 5 , 1 5 , ) 2 / ) 5 (( 5 , ) 2 / ) 5 (( ) ( x x x R x x L x m

(28)

2.5. Bulanık Sayılar

Normal ve dışbükey bir bulanık küme için eğer zayıf a -kesme kümesi kapalı bir

aralık ise “bulanık sayı” olarak adlandırılır. Bulanık sayılar, üyelik fonksiyonuna sahiptir. Eğer bulanık bir sayının üyelik fonksiyonu sürekli ise zayıf a -kesme kümesi kapalı bir

aralık olacaktır.

Başka bir tanıma göre A~ bulanık sayısı , dışbükey, normal bir gerçek düzlem Â ’de tanımlı A~ bulanık kümesidir. Aşağıdaki özellikleri sağlar.

i) m~A(x0)=1 ise (x0 , A ~

bulanık sayısının ortalama değeridir) kesinlikle x₀ ÎÂ

mevcuttur. ii) ~(x₀)

A

m parçalı süreklidir.

A~ bulanık sayısının pozitif (negatif) olarak adlandırılabilmesi için ~(x)=0,"x<0

A

m

("x>0) olmalıdır (Yapıcı 2000).

2.6. Bulanık Sayılarda İşlemler 2.6.1. Toplama işlemi

X~ ve Y~ bulanık sayılar olmak üzere toplamları aşağıda verilen yöntemle elde edilir.

X~ ve Y~ nin a -seviye kesme kümeleri X~_a =[x_aL,x_aU] ve Y~_a =[y_aL,y_aU] dır. Burada U L x xa, a , U L y ya, a ÎÂ dir.

(29)

] , [ ~ ) ( ~ ~ L L U U y x y x Y X Za = a + a = a + a a + a , aÎ[0,1] (2.29)

şeklinde elde edilir.

2.6.2. Çıkarma işlemi

Bulanık sayılarda çıkarma işlemi toplama işlemine benzer.

X~ ve Y~ nin a -seviye kesme kümeleri X~_a =[x_aL,x_aU] ve Y~_a =[y_aL,y_aU] dır. Burada U

L

x

x_a, _a ,y_aL,y_aU ÎÂ dir.

X~ ve Y~ bulanık sayılarının farkı Z~,

] , [ ~ ) ( ~ ~ L U U L y x y x Y X Z_a = _a - _a = _a - _a _a - _a , aÎ[0,1] (2.30)

şeklinde elde edilir.

2.6.3. Çarpma işlemi X~ v e Y~ bulanık sayıları X =~ [xL,xU] v e Y =~ [yL,yU] dır . B u r a d a U L x x , ,y ,L yUÎÂ dir.

X~ ve Y~ bulanık sayılarının çarpımı Z~,

)] , , , max( ), , , , [min( ~ ) ( ~ ~ L L L U U L U U L L L U U L U U y x y x y x y x y x y x y x y x Y X Z = × = (2.31)

(30)

2.6.4. Bölme işlemi

X~ v e Y~ bulanık sayıları X =~ [xL,xU] v e Y =~ [yL,yU] dır. Burada U L x x , , L U y y , ÎÂ dir.

X~ ve Y~ bulanık sayılarının oranı Z~,

)] / , / , / , / max( ), / , / , / , / [min( ~ (/) ~ ~ L L L U U L U U L L L U U L U U y x y x y x y x y x y x y x y x Y X Z = = (2.32)

2.7. Üçgensel ve Yamuksal Bulanık Sayılar

Bulanık sayılar içinde üçgensel ve yamuksal sayılar sıklıkla kullanılmaktadır. Üçgensel bulanık sayılar

) , , ( ~ b a x X = ve Y =~ (y,r,d)

biçiminde gösterilir. Burada x ve y üyelik fonksiyonu değerleri 1 olan merkezi değerleri,

a ve r sol yayılma miktarını, b ve d ise sağ yayılma miktarını göstermektedir. Sayının

simetrik olması durumunda sağ ve sol yayılmalar birbirine eşittir.

Yamuksal bulanık sayılar

) , , , ( ~ 2 1 x a b x X = ve Y =~ (y₁,y₂,r,d)

(31)

şeklinde gösterilir. Burada da x ve ₁ x , ₂ X~ bulanık sayısının, y ve ₁ y , ₂ Y~ bulanık sayısının üyelik fonksiyonu değerleri 1 olan merkez değerlerinin göstermektedir.

Üçgensel bulanık sayılar bir başka şekilde,

) , , ( ~ c l r x x x

X = ve Y =~ (yc,yl,yr) biçiminde de gösterilebilir. Burada xc ve _yc merkez değerlerini, l

x ve l

y ile r

x ve r

y değerleri de sırasıyla bulanık sayının sol ve sağ ayaklarını göstermektedir.

Aynı şekilde yamuksal bulanık sayılar da ~ ( 1, 2, , )

r l c c x x x x X = ve ~ ( 1, 2, , ) r l c c y y y y Y = şeklinde yazılabilir.

A~ bulanık sayısının üyelik fonksiyonu simetrik üçgensel ise, aşağıdaki eşitlik A~

bulanık sayısının a -seviye kümesi

[ ]

A~_a aralığını hesaplamada kullanılır.

[ ]

[

C W C W

]

a a a a A_a = -(1-a) , +(1-a) (2.33)

Burada aC, sayının merkezini, aW ise yayılma miktarını göstermektedir.

2.7.1. Üçgensel ve yamuksal bulanık sayılar üzerinde bulanık aritmetik

) , , ( ~ c l r x x x

X = ve Y =~ (yc,yl,yr) olan üçgensel bulanık sayılar üzerinde bulanık aritmetik işlemleri şöyle uygulanır.

1. Y~ nin toplamaya göre tersi -Y~=(-yc,-yr,-yl) (2.34)

(32)

3. Toplama X~+Y~=(xc + yc,xl + yl,xr + yr) (2.36) 4. Çıkarma X~-Y~=(xc -yc,xl -yr,xr - yl) (2.37) 5. Çarpma X~>0 ve Y~>0 ise X~ (× Y) ~=(xcyc,xlyl,xryr) X~<0 ve Y~>0 ise X~ (× Y) ~=(xcyc,xlyr,xryl) (2.38) X~<0 ve Y~<0 ise X~ (× Y) ~=(xcyc,xryr,xlyl) 6. Bölme X~>0 ve Y~>0 ise X~ (:) Y~=(xc/yc,xl /yr,xr /yl) X~<0 ve Y~>0 ise X~ (:) Y~=(xc/yc,xl /yl,xr /yr) (2.39) X~<0 ve Y~<0 ise X~ (:) Y~=(xc/yc,xr /yl,xl/yr) 7. Skaler Çarpım a>0, aÎÂ a(×)X~ =(axc,axl,axr) a<0, aÎÂ a(×)X~ =(axc,axr,axl) ) , , , ( ~ 2 1 r l c c x x x x

X = ve Y =~ (y₁c,y₂c,yl,yr) şeklinde verilen yamuksal bulanık sayılar üzerine bulanık aritmetik işlemler şu şekilde uygulanır.

1. Y~ nin toplamaya göre tersi -Y~=(-y₂c,-y₁c,-yr,-yl) (2.40)

2. Y~ nin çarpmaya göre tersi Y~-1 =(1/y₂c,1/y₁c,1/yr,1/yl) (2.41)

3. Toplama X~+Y~=(x₁c + y₁c,x₂c +y₂c,xl + yl,xr + yr) (2.42)

(33)

5. Çarpma X~>0 ve Y~>0 ise X~ (× Y) ~=(x₁cy₁c,x₂cy₂c,xlyl,xryr) X~<0 ve Y~>0 ise X~ (× Y) ~=(x₂cy₁c,x₁cy₂c,xlyr,xryl) (2.44) X~<0 ve Y~<0 ise X~ (× Y) ~=(x₂cy₂c,x₁cy₁c,xryr,xlyl) 6. Bölme X~>0 ve Y~>0 ise X~ (:) Y~=(x₁c/y₂c,x₂c/y₁c,xl /yr,xr /yl) X~<0 ve Y~>0 ise X~ (:) Y~=(x₂c/y₂c,x₁c/y₁c,xl /yl,xr /yr) (2.45) X~<0 ve Y~<0 ise X~ (:) Y~=(_x₂c/_y₁c,_x₁c/_y₂c,_xr /_yl,_xl/_yr) 7. Skaler Çarpım a>0, aÎÂ ()~ ( ₁c, ₂c, l, r) ax ax ax ax X a × = a<0, aÎÂ ()~ ( 2, 1, , ) l r c c ax ax ax ax X a × = (2.46)

(34)

3. LİNEER REGRESYON ANALİZİ

Y ile x arasında m_Y_/_x =b₀+b₁x gibi bir bağıntının olduğunda gözlemler ile,

Y_i =b₀ +b₁x_i +e_i ,i=1,2,...,n (3.1)

şeklinde ifade edilir.e_i’lerin sıfır ortalamalı, aynı varyanslı (s2), bağımsız gözlenemeyen

rasgele değişkenler olduğu varsayıldığında x ile gösterilen değişkene açıklayıcı (bağımsız) değişken, Y ile gösterilen değişkene de bağımlı (açıklanan, tepki) değişkeni denir. Açıklayıcı değişkenin verilmiş x değeri için Y’nin dağılımının beklenen değeri m_{Y /}_x ile x arasındaki x x g x Y/ ( ;b0,b1) b0 b1 m = = +

bağıntısına regresyon fonksiyonu denir (Genç 1997). Gözlemler ile ilgili yazılan

n i x x g Y_i = ( ;b₀,b₁)+e_i =b₀ +b₁ _i +e_i, =1,2,...,

denklemine regresyon denklemi ve bu e_i’ler üzerinde yapılan varsayımlarla birlikte bu

regresyon denklemine regresyon modeli denir. b0,b1,s2 parametrelerine regresyon

parametresi denir.

Birden çok açıklayıcı değişken x1,x2,...,xp ve açıklanan değişken Y olmak üzere çoklu lineer regresyon modeli;

n i x x x Yi =b1 1 +b2 2 +K+bp p +ei, =1,2,K, (3.2) veya

(35)

Yi =b0 +b1x1 +b2x2 +K+bpxp +ei, i =1,2,K,n (3.3)

şeklinde gösterilsin. Matris gösterimiyle;

ú ú ú ú û ù ê ê ê ê ë é + ú ú ú ú ú û ù ê ê ê ê ê ë é ú ú ú ú ú û ù ê ê ê ê ê ë é = ú ú ú ú û ù ê ê ê ê ë é n p np n n p p n x x x x x x x x x Y Y Y e e e b b b M M L M O M M L L M 2 1 2 1 2 1 2 22 21 1 12 11 2 1 olup e b + = X Y (3.4)

biçiminde yazılabilir. X tasarım matrisi

[

]

ú ú ú ú ú û ù ê ê ê ê ê ë é = = n p x x x x x x X M L 2 1 2 1, , ,

olup burada xi =

(

x_i₁ ,x_i₂ ,L ,x_i_p

)

ÎÂp bir satır vektörünü göstermektedir (Genç 1997).

Hata Terimi Üzerindeki Varsayımlar :

Regresyon modelinin rasgele terimini oluşturan hata terimi üzerinde bazı varsayımlar vardır. Bunlar:

(36)

2. Var(ei )= s2, i=1,2,L,n (hata terimleri sabit varyanslıdır)

3. Cov(ei,ej)=0, i ¹ j için (hata terimleri birbiriyle ilişkili değildir)

4. e vektörü X matrisinin her bir sütun vektörüne diktir.

5. İleride verilecek hipotez testleri için e ~_N(0,_s2_I)_{’dır. Hata terimleri normal}

olasılık dağılımına sahip rasgele değişkenlerdir.

Hata terimi üzerindeki varsayımlardan başka regresyon modeli ile ilgili olarak şu varsayımlar vardır.

1. rank(X)= p’dir.

2. X’X matrisi tekil olmayan bir matristir.

3. Model doğru olarak belirlenmiştir (model spesifikasyonu).

3.1. Parametre Tahmini

Çoklu lineer regresyon modeli,

n i x x x Y_i =b₀ +b₁ ₁ +b₂ ₂ +K+b_k _k +e_i , =1 ,2 ,K , ya da

(37)

ú ú ú ú û ù ê ê ê ê ë é + ú ú ú ú û ù ê ê ê ê ë é ú ú ú ú û ù ê ê ê ê ë é = ú ú ú ú û ù ê ê ê ê ë é n k nk n n k k n x x x x x x x x x Y Y Y e e e b b b M M L M O M M L L M 2 1 1 0 2 1 2 22 21 1 12 11 2 1 1 1 1 1

dır. X matrisinde birinci sütunda 1'ler gelmiştir. p=k+1 dir. Burada parametre tahmin yöntemlerinden en küçük kareler yöntemi ve en çok olabilirlik yöntemi ele alınacaktır.

3.1.1. EKK (En küçük kareler tahmin edicisi):

Lineer regresyon modelinin matris gösterimiyle,

e b + = ´ ´ ´1 n p _n₁ n X Y

modelinde bÎÂp parametresinin tahmin edilmesi problemi göz önüne alınsın. En küçük kareler yöntemi ele alındığında,

min( b)( b) min( 2b b b) b b Y X Y X Y Y X Y XX ¢ ¢ + ¢ ¢ -¢ = -¢ - (3.5)

optimizasyon problemini çözmek için (3.5) eşitliğinin b’ya göre türev alınıp sıfıra eşitlenir ve

Y X X

X¢ bˆ = ¢ (3.6)

(38)

p X X rank X rank( )= ( ¢ )= olduğundan Y X X X¢ ¢ =( )-1 ˆ b (3.7)

elde edilir (Genç 1997). Y örneklem olmak üzere Y nin bir fonksiyonu olan bˆ, b için bir tahmin edici olmak üzere bu tahmin ediciye “en küçük kareler tahmin edicisi” denir.

2

s ' nin tahmin edicisi; bˆ’nın EKK tahmin edicisine göre

) ˆ ( ) ˆ ( 1 ˆ2 b b s Y X Y X n - ¢ -= (3.8) ya da p n Y X X X X Y S -¢ ¢ -I = -) ) ( ( ' 1 2 p n Y X X X X Y Y Y -¢ ¢ -= -1 ) ( ' ' (3.9) p n Y Y -= ' X'Y ˆ ' b dır. bˆ ve 2 S bağımsızdır. Hipotez modellerinde ) , 0 ( 2I ~ s e N , bˆ ~N(b,s2(X'X)-1)

(39)

c

s 2 ) ( 2 2 ) ( p n S p n -~ -dir (Genç 1997).

3.1.2. En çok olabilirlik yöntemi

Hataların normallik varsayımı altında regresyon modelinin matris gösterimi,

) , 0 ( , 2 1 1 X n1 N I Y n p n n´ = ´ b ´ +e ´ e ~ s

olmak üzere bÎÂp ve s2 parametrelerini tahmin etmek için en çok olabilirlik yöntemi şu şekilde verilebilir. Olabilirlik fonksiyonu,

) ( ) ( 2 1 2 2 2 2 2 ) ( ) 2 ( 1 ) ; , ( s b b s p s b Y X Y X n n e Y - ¢ -= l

dır. Olabilirlik fonksiyonunun logaritması,

) ( ) ( 2 1 ) ln( 2 ) 2 ln( 2 ) ; , ( ln 2 2 ₂ b b s s p s b Y =-n -n - Y -X ¢Y -X l ( 2 ' ' ) 2 1 ) ln( 2 ) 2 ln( 2 2 2 b b b s s p n Y Y X Y XX n ¢ + ¢ -¢ -= (3.10) ve ) 2 2 ( 2 1 ln 2 b s b ¶ ¶ X X Y X¢ + ¢ -= l

(40)

)) ( ) (( 2 1 2 ln 4 2 2 b b s s ¶s ¶ X Y X Y n -¢ -+ -= l

olmak üzere türevlerin sıfıra eşitlenmesiyle bÎÂp v e s2 parametrelerinin En Çok Olabilirlik Tahmin Edicileri (EOTE-MLE),

Y X X X¢ ¢ =( )-1 ˆ b (3.11) ve ) ˆ ( ) ˆ ( 1 ˆ2 b b s Y X Y X n - ¢ -=

elde edilir (Genç 1997).

3.1.3. EOTE’nin bazı istatistiksel özelikleri

) , 0

( 2I

N s

e ~ ve Y ~N(Xb,s2I) olduğundan Y nin bir lineer dönüşümü olan bˆ

da normal dağılımlıdır. Böylece,

) ) (( ) ˆ ( E XX 1X Y E b = ¢ - ¢ =(X¢X)-1X¢E(Y) X¢X -1X¢Xb ) ( = =b (3.12) ve ) ) cov(( ) ˆ cov(b = X¢X -1X¢Y =(_X_¢_X)-1_X_¢cov(_Y)((_X_¢_X)-1_X_¢)_¢ X¢X -1X¢ 2I X¢X -1X¢ ) ( ) ( = s

(41)

=s2(X¢X)-1 (3.13)

olmak üzere bˆ ~N(b,s2(X¢X)-1) dır. bˆ , b nın yansız bir tahmin edicisidir (Genç 1997).

2

ˆ

s tahmin edicisine gelince, )) ˆ ( ) ˆ ( 1 ( ) ˆ (s2 Y Xb Y Xb n E E = - ¢ -) ) ) ( ( ) ) ( ( 1 ( E = Y -X X¢X -1X¢Y ¢Y -X X¢X -1X¢Y ¢ n ) ) ) ( ( ( n 1 = E Y¢ I -X X¢X -1X¢ Y (3.14)

[

]

{

( ( ) ) ( )( ( ) )( )

}

n 1 = tr I -X X¢X -1X¢s2I + Xb ¢ I -X X¢X -1X¢ Xb 2 ) ( n 1 = n - ps (3.15)

olmak üzere sˆ2 yansız değildir. s2 nin yansız bir tahmin edicisi

p n Y X X X X I Y p n X Y X Y S -¢ ¢ -¢ -¢ -= -) ) ( ( = ) ˆ ( ) ˆ ( 1 2 b b (3.16) dır ve dağılımı

c

s s 2 ) ( 2 2 2 1 ) ( ) ) ( ( ' p n S p n Y X X X X I Y -~ -= ¢ ¢ (3.17) dir (Genç 1997).

(42)

) , 0

( 2I

N s

e ~ olan basit lineer hipotez modeli için b parametresinin en çok olabilirlik tahmin edicisi yukarıdaki en küçük kareler tahmin olmak üzere

) ) ( , ( ˆ 2 _¢ -1 ~N b s XX b (3.18) ve 2 ) 2 ( 2 2 ) 2 ( -~ -n S n c s (3.19) dir (Genç 1997). 3.2. Artıklar Artık terimi e_i = Y_i - ˆ i

Y şeklindedir. Buna göre artıkları tablo halinde aşağıdaki biçimde yazabiliriz. Çizelge 3.1. i Y Yˆi ei 1 Y Yˆ₁ Y -₁ Yˆ₁ 2 Y Yˆ₂ Y -₂ Yˆ₂ M M M n Y Yˆn Y -n Yˆn ˆ ˆ ˆ ˆ ˆ ˆ 2 2 1 1b b b b m _Y _x _j _j _jp _p j j x x x x Y = j= + +K+ = şeklindedir.

(43)

3.3. Çoklu Belirleyicilik Katsayısı

Belirleyicilik katsayıları modelin gözlemlere uyumunun iyiliği veya bağımlı değişkendeki toplam değişimin regresyon modeli tarafından açıklanan kısmı için bir ölçüt olmak üzere, düzeltilmiş belirleyicilik katsayısı regresyondaki açıklayıcı değişken sayısını dikkate almaktadır.

Çoklu belirleyicilik katsayısı

SST SSR R =2 ₂ 2 ' ' ˆ Y n Y Y Y n Y X -= b

å

= = -= n i i n i i Y Y Y Y 1 2 1 2 ) ( ) ˆ ( (3.20)

şeklinde hesaplanmaktadır. R2 değeri 0 ile 1 arasında değer alır. 1’e yakın olması bağımsız değişkenlerin bağımlı değişkeni açıkladığını gösterir. 0’a yakın olması bağımsız değişkenlerin bağımlı değişkeni açıklamadığını ifade eder. _R2 _{değeri, bağımsız}

değişkenlerin bağımlı değişkeni açıklama oranıdır.

3.4. Bireysel Parametreler için Güven Aralığı

i. bireysel parametreb_i için 1-a ' lık güven aralığı

÷ ø ö ç è æ _- ₊ -- ii i ii i t s c t s c 2 1 2 1 ˆ , ˆ a a b b (3.21)

(44)

3.5. Bireysel Parametreler İçin Hipotez Testi

:

0 a

H b_i = hipotezini

a

H₁:b_i ¹ hipotezine karşı a anlam düzeyinde test etmek için test istatistiği

p n ii h t c s a t = - ~ -ˆ j b

olup t_h , n - p serbestlik dereceli t dağılımına sahiptir.

; 2 1 n p T t t -= _a

şeklinde hesaplanıp t_h >t_T ise H₀ hipotezi reddedilir (Genç 1997).

3.6. j

x Y

m

' nin Tahmini

Açıklayıcı değişkenler üzerinde j. gözlem X matrisinin j. satırı olsun. Açıklayıcı değişkenlerin aldığı bu değerler Y ' nin koşullu dağılımının beklenen değeri olan j

x Y

m

için bir tahmin edici ˆ b m j x Y j= x (3.22) olmak üzere ) ˆ (m_y _x xjb E j =

(45)

) )( ˆ ( ) ( ) ˆ ( = j j ¢ x y x Cov x Var m j b = 2( j)( ¢ )-1( j)¢ x X X x s

dir. Hipotez modellerinde

j x y mˆ ~N( xjb , 2( j)( ¢ )-1( j)¢ x X X x s ) dır (Genç 1997).

3.7. Sonradan Gözlemin Tahmini

1 , *

´

p

x boyutlu bir satır vektörü olmak üzere, açıklayıcı değişkenlerin aldığı değer

*

x olduğunda Y ' nin koşullu beklenen değeri *

x Y

m için bir tahmin edici yerine ˆ * * b m x x Y = olacaktır.

Açıklayıcı değişkenlerinx*değerinde alınacak sonradan bir *

x

Y gözlemi için tahmin olarak *

x Y

m değeri alınır, ancak bu durumda

) ) ( ) ( 1 ( ) ( * = 2 + * ¢ 1 * ¢ -x X X x Y Var x s dır (Genç 1997).

(46)

4. LİNEER OLMAYAN REGRESYON ANALİZİ

Lineer olmayan modelde değişkenler arasındaki bağıntı, parametrelerin en az birinin lineer olmayan fonksiyonu biçimindedir. Lineer olmayan modellerin teorisi ve metotları, lineer modeller teorisi ve metotları ile yakından ilişkilidir. Bu bölümde bir bağımsız değişkenli lineer olmayan modelin tanıtımı ve bu modellerde parametre tahmini verilecektir.

4.1. Modelin Tanıtımı ve Bazı Gösterimler

Y bağımlı değişken, X X₁, ₂,...,X_k açıklayıcı değişkenler ve

X =(X₁,X₂,...,X_k)¢ açıklayıcı değişkenlerin vektörü olmak üzere,

n 1,2,..., = t , ) ,..., , ( , _t = ₁_t ₂_t _kt ¢ t X X X X Y

gözlemleri için Xt = xt , (xtÎ

x

ÌÂk) olarak gözlendiğinde,

Y_t = f x( , )_t q +e_t, t=1 2, ,...,n (4.1)

biçiminde yazılabilsin. f fonksiyonu bilinmeyen q =(q q₁, ₂,...,q_p)¢₍qÎ Ì Âp)

Q ,

parametre vektörünün bileşenlerine göre lineer olmayan bir ifade olduğunda bu modele lineer olmayan model denir (Genç 1997). f fonksiyonuna bazen tepki fonksiyonu da denir.

e_t gözlenemeyen hata terimi olmak üzere modelleme düşüncesi çerçevesinde belirtilen özelliklere sahip olduğu varsayılmaktadır. Açıklayıcı değişkenlerin vektörü ile ilgili

x x₁, ₂,...,x_n gözlemleri rasgele bir vektörün gözlem değerleri gibi yorumlanmamaktadır. Örneğin, bunlar önceden belirlenen deney noktaları olarak tasarlanan değerler olabilir. Parametre kümesi Q Q ( Ì Âp) olmak üzere bilinmeyen gerçek parametre değeri

(47)

Y_t = f x( _t,q0)+e_t, t = 1,2,..., n

biçiminde olmak üzere, istatistik teorisi açısından matematiksel işlemleri yürütmek için q0

yerine q yazılmaktadır. (4.1) modeline atıf yapıldığında q yerine q0 gelebilir. Kısaca

f x( _t, )q ’yı f_t( )q olarak gösterip,

Y Y Y Y_n = é ë ê ê ê ê ù û ú ú ú ú 1 2 M , f f x f x f x f f f n n ( ) ( , ) ( , ) ( , ) ( ) ( ) ( ) q q q q q q q = é ë ê ê ê ê ù û ú ú ú ú = é ë ê ê ê ê ù û ú ú ú ú 1 2 1 2 M M , e = e e e , 1 2 n M M é ë ê ê ê ê ù û ú ú ú ú = é ë ê ê ê ê ù û ú ú ú ú q q q q 1 2 p

olmak üzere (4.1) modeli

Y = f( )q +e (4.2)

şeklinde yazılabilir (Genç 1997).

4.2. Parametre Tahmini

Bu kısımda (4.1) ile verilen,

Y_t = f x( , )_t q +e_t, t=1 2, ,...,n (4.3)

lineer olmayan tek değişkenli modelin bilinmeyen q0 parametresinin tahmini için bazı algoritmalar sunulacaktır. Parametre tahmininde en küçük kareler yöntemi ve en çok olabilirlik yöntemi dikkate alınacaktır. Hatalar için

(48)

E e( )_t = 0 t = 1,2,..., n, (4.4) Cov(e i, ) , , e i j i j j = ¹ = ì í î 0 2 s , i , j = 1,2,...,n

veya vektör gösterimi ile

E e( ) = 0

(4.5)

Cov e( ) = s2I

olduğu varsayılacaktır. Normallik varsayımı altında

e ~ N(0,s2I) (4.6)

dağılımlı olacaktır.

İlk önce en küçük kareler yöntemini ele alalım. f biçimsel olarak bilindiğinden

[

]

å

= -= n t t t f x Y Q 1 2 ) , ( ) (q q (4.7)

hata kareler toplamı minimum olacak şekilde q parametre değerini belirlemek en küçük kareler yöntemine göre en iyi tepki fonksiyonunu bulmak demektir (Genç 1997). Vektör gösterimi ile (4.7) eşitliği

[

] [

]

Q( )q = Y- f( )q ' Y- f( )q (4.8)

(49)

t (t=1,2,...,n) satır ve j (j=1,2,...,p) sütun indisi olmak üzere, ú ú ú ú ú ú ú ú û ù ê ê ê ê ê ê ê ê ë é ÷ ÷ ø ö ç ç è æ = = ) , ( ) , 1 ( 1 ) , ( 1 ) , 2 ( ) , 2 ( 2 ) , 2 ( 1 ) , 1 ( ) , 1 ( 2 ) , 1 ( 1 ) , ( ) ( q ¶q ¶ q ¶q ¶ q ¶q ¶ q ¶q ¶ q ¶q ¶ q ¶q ¶ q ¶q ¶ q ¶q ¶ q ¶q ¶ q ¶q ¶ q n x f p x f n x f x f p x f x f x f p x f x f t x f j F L M O M M L L (4.9)

matrisi f ( )q fonksiyonunun türev (jakobiyen) matrisi olmak üzere (4.8) ile verilen hata kareler toplamının bilinmeyen q parametre vektörüne göre türevi

[

]

¶ ¶q' ( )q ( )q ( )q ' Q = -2Y- f F

[

]

= -2F' ( )q Y- f( )q (4.10)

şeklindedir. q ’nın en küçük kareler tahmin edicisi, Q parametre uzayı üzerinde Q( )q nın,

min ( ) ( $)

qÎQ Qq =Q q (4.11)

minimizasyonundan elde edilen $qdeğeridir. Yani,

¶

¶q q q q

'Q( ) =$ = 0

(50)

F' ( $ )q

[

Y- f( $ )q

]

= 0 (4.12) olacağından

$ ( $ ) e=Y- f q

artık vektörü, q= $q noktasında f ( )q ’nın jakobiyen matrisi F ( )q ’nın sütun uzayına diktir (Şekil 4.1) (Genç 1997):

Şekil 4.1. Y vektörünün F ( )q sütun uzayına dik izdüşümü

Parametre tahmini yapmak için en çok olabilirlik yöntemi şöyle verilir. (4.1)’deki modelde e_t, t =1,2,...,n hata terimlerinin bağımsız ve her birinin sıfır ortalamalı bilinmeyen s2 varyanslı normal dağılıma sahip olduğu varsayılsın. Bu taktirde,

(

)

(

)

Y_t ~ N f x_t,q s, 2 , t=1,2,...,n

dağılımına sahip olup, olasılık yoğunluk fonksiyonu

(

y_t

)

= e- [Y-f(x )] -¥< y_t <¥ f t t , 2 1 , ; 2 2 , 2 1 2 s q s p s q

(51)

olacaktır.Y Y₁, ₂,...,Y_n rasgele değişkenlerinin olabilirlik fonksiyonu, Y =

(

Y Y1, 2,...,Y_n

)

¢ olmak üzere,

(

)

_Õ

(

)

= = n t t Y n Y L 1 2 2 , ; ; ,s q s q

( )

( ) [ ] å = = -n t t t f x Y n n e 1 2 2 , 2 1 2 2 q s s p

şeklindedir. L

(

q,s2;Y

)

fonksiyonunu maksimum yapan bilinmeyen q v e s2 parametrelerinin tahmin edilmesi istenmektedir. L

(

q,s2;Y

)

nin maksimize edilmesi yerine bunun logaritması alınarak elde edilen logL

(

q,s2;Y

)

nin maksimize edilmesiyle

[

Y_t f x_t

]

f x t n t -¢ = =

å

( , )q ¶ ( , )q ¶q 1 0

[

]

- + - = =

å

n Y_t f x_t t n s2 q 1 2 0 ( , )

denklem sistemine ulaşılır. Bu denklem sistemindeki birinci denklemin sol tarafı (4.10) daki ifadenin aynısıdır. Dolayısıyla q nın en küçük kareler yöntemi ile elde edilen tahmini en çok olabilirlik yöntemi ile elde edilen tahminine eşittir. q nın en çok olabilirlik yöntemi ile elde edilen tahmini q$ olmak üzere ikinci denklemden s2 nin tahmini,

[

]

$ ( , $) s q 2 1 2 = -=

å

Y f x n t t t n (4.13) dir.

(52)

(4.11) deki minimizasyon probleminde Q, q ’nın lineer olmayan bir fonksiyonudur. Lineer olmayan bu fonksiyonun minimizasyonu ile ilgili kullanılan optimizasyon algoritmasının ismine bağlı olarak tahmin yöntemi de bu ismi almaktadır. Burada parametre tahmin yöntemi olarak Gauss-Newton algoritmasına değinilecektir.

Algoritmalar f x( _t, )q tepki fonksiyonunun Taylor serisine açılımının yapılması ve

gradientinin hesaplanması civarında toplanmıştır. Nümerik hesaplamalar açısından amaç, işlemlerin yakınsama hızını artırmak ve ardışık işlem sayısını azaltmaktır. Bunun için ardışık işlem adımlarına iyi bir noktadan başlamak gerekir.

4.2.1 Başlangıç noktasının seçimi

Parametre tahmini yapmak için bir ardışık işlem adımına başlamadan önce iyi bir başlangıç noktasının saptanması gerekir. Saptanan nokta optimal noktadan çok uzakta ise ardışık işlem sayısı büyüyecektir ve belki gidilmek istenen noktaya yakınsama gerçekleşmeyecektir.

Başlangıç noktasının seçimi için aşağıdaki yöntemlerden birisi uygulanabilir:

i- Önce f fonksiyonunun varsa, lineer kısmı alınıp lineer olmayan kısmında lineerliği bozan parametrelere başlangıç değerleri verilip elde edilen lineer modelde parametreler tahmin edilip bu değerler q₀ başlangıç noktası olarak alınır.

ii- Gözlem sonucu bilinen Y_t ve xt değerlerini modelde yerine yazarak elde edilen denklem sisteminden parametre sayısı kadar bir alt sistem alınır. Alınan bu denklem sistemi çözülerek q₀ başlangıç noktası bulunur.

t = 1,2,...,n için n tane Y_t , x_tgözlemi p gruba ayrılır, herbir grup için bulunan

Y ’lerin Y_j (j = 1,2,..., p) ortalaması ile f değerlerinin fj( ) (j = 1,2,..., p)q ortalaması yardımıyla,

Y_j = f_j( ) , j = 1,2,..., pq

(53)

iii- Konuya hakim olan uygulayıcının önerdiği bir nokta q₀ başlangıç noktası olarak kabul edilir.

Bir tahmin yöntemi yardımıyla lineer olmayan bir model için parametre tahmini yapılmak istendiğinde ardışık işlem adımına q₀ başlangıç noktası ile başlanır. Yakınsama sağlandığında ardışık işlem adımlarının durdurulması gerekir (Genç 1997).

4.2.2. Durdurma kuralı

e > 0 ve t > 0 keyfi sabitler olsun. Genellikle t =10-3 v e e =10-5 önerilir. Aşağıdaki kuralın her ikisi de aynı anda sağlandığında ardışık işlem adımlarına son verilir,

(

)

q_i -q_i_-₁ <e q_i_-₁ +t (4.14)

ve

( )

(

( )

)

Q q_i -Q q_i_-₁ <e Q q_i_-₁ +t (4.15)

eşitsizlikleri sağlandığında q₀ ®q₁ ®q₂ ® ... ®q_i ® ... ardışık işlemi durdurulur (Genç 1997).

4.2.3. Gauss- Newton Yöntemi

(4.1) de verilen lineer olmayan tek değişkenli modelde açıklayıcı değişkenlerin gözlenen değerlerinde q ’nın bir fonksiyonu olan tepki fonksiyonunun q0 başlangıç noktası civarında Taylor serisine açılımı

(54)