Yapay Sinir Ağları Ve Türkiye Elektrik Tüketimi Tahmin Modeli

(1)

ĠSTANBUL TEKNĠK ÜNĠVERSĠTESĠ  FEN BĠLĠMLERĠ ENSTĠTÜSÜ

YAPAY SĠNĠR AĞLARI VE TÜRKĠYE ELEKTRĠK TÜKETĠMĠ TAHMĠN MODELĠ

YÜKSEK LĠSANS TEZĠ Abdullah AKKURT

507021112

Tezin Enstitüye Verildiği Tarih : 9 Mayıs 2005 Tezin Savunulduğu Tarih : 30 Mayıs 2005

Tez DanıĢmanı : Prof. Dr. Ataç SOYSAL

Diğer Jüri Üyeleri Doç. Dr. Demet BAYRAKTAR Yrd. Doç. Dr. ġule ÖNSEL ġAHĠN

(2)

ÖNSÖZ

Aylar süren yoğun ve yorucu bir çalışmanın ürünü olan tezimin son satırlarını yazarken hem yoğun emek sarfettiğim çalışmanın başarılı bir şekilde sonuçlanmasının verdiği mutluluğu hem de hayatım boyunca devam ettirmek istediğim akademik hayatımın önemli bir basamağını geride bırakmış olmanın verdiği gururu ve sevinci birlikte yaşıyorum.

Yüksek lisans öğrenimimin son adımı olan bu tezde yapay sinir ağlarını mümkün olduğunca anlaşılır bir şekilde ele almaya ve aktarılan bilgileri mümkün olduğunca örnekler üzerinde pratik beceriye dönüştürmeye çalıştım. Uygulama kapsamında ise Türkiye için hayati önem taşıyan konulardan bir tanesi olan elektrik enerjisinin planlaması çalışmalarına güvenilir bilgi sağlayacak tahmin modelinin performansını mevcut koşullar çerçevesinde en çoklamaya gayret gösterdim. Bu amaç doğrultusunda günler ve geceler boyu içinde kaybolduğum verilerin ve iterasyonların sonrasında beklenenden çok daha düşük hata miktarları ile tahmin yapabilen bir model elde ettiğim zamanki mutluluğumu sanırım hayatım boyunca unutamayacağım.

Elbette, bu çalışmanın gerçekleştirilmesinde bana destek olan çok sayıda kişiye teşekkür borçluyum. Ama herşeyden önce koşullar ne olursa olsun hiçbir fedakarlıktan kaçınmadan her zaman yanımda olan, bana kendime inandığımdan daha fazla inanan, varlıklarını ve sevgilerini her daim yürekten hissettiğim aileme olan minnettarlığımı ifade etmeliyim. İyi ki varsınız...

Lisans ve yüksek lisans öğrenimim boyunca ihtiyacım olan her konuda bana yardımcı olmaya çalışan, anlayışlı ve hoşgörülü yaklaşımıyla beni motive etmesinin yanı sıra engin bilgisi ve deneyimiyle yol gösterici olan değerli hocam Prof. Dr. Ataç Soysal‟a, seminer dersimi izlemeye gelen, daha sonra bütün işlerine ve kendi yürüttüğü tez çalışmalarına rağmen yardımlarını benden esirgemeyen ve uygulama ile ilgili sıkıştığım noktalarda verdiği fikirlerle çalışmayı başarılı bir şekilde neticelendirmemde katkılarını yadsıyamayacağım Yrd. Doç. Dr. Şule Önsel Şahin‟e, stres dolu günlerimde konuşmalarıyla beni rahatlatan ve çalışmaya olan motivasyonumu arttıran değerli arkadaşlarım Eda Çetinkaya ve Çağlar Evren

(3)

Özdemir‟e, lisans öğrenimimde olduğu gibi yüksek lisans öğrenimim ve tez çalışmam boyunca ihtiyacım olan her zaman yardımını esirgemeyen arkadaşım Ar. Gör. Emel Aktaş‟a, uygulama programı konusunda çok sayıda soruma sıkılmadan cevap veren arkadaşım Ar. Gör. Murat Engin Ünal‟a, tez çalışmalarının getirdiği yoğun mesaiyi anlayışla karşılayan Türkiye Sanayi Sevk ve İdare Enstitü‟sü yönetimine ve ihtiyaç duyduğum verilerle ilgili tüm sorularımı içtenlikle cevaplandıran Enerji ve Tabii Kaynaklar Bakanlığı, Türkiye Elektrik Dağıtım A.Ş., Türkiye Elektrik İletim A.Ş., Devlet İstatistik Enstitüsü ve Enerji Piyasası Düzenleme Kurumu çalışanlara sonsuz teşekkürler.

Umarım bu çalışma konuyu öğrenmeye çalışanlara faydalı bir kaynak olma niteliği taşımakla birlikte konu ile ilgili olarak ileride gerçekleştirilecek çalışmalar için bir başlangıç noktası olabilir.

(4)

ĠÇĠNDEKĠLER

TABLO LĠSTESĠ vi

ġEKĠL LĠSTESĠ vii

SEMBOL LĠSTESĠ viii

ÖZET ix

SUMMARY xi

1. YAPAY SĠNĠR AĞLARI 1

1.1. Tanım 1

1.2. Tarihsel Gelişim 4

1.3. Yapay Sinir Ağlarının Genel Özellikleri 6

1.3.1. Paralellik Özelliği 8

1.3.2. Öğrenme, Genelleme ve Uyum Sağlama Özellikleri 9

1.3.3. Yüksek Hata Toleransı 9

1.3.4. Gerçeklenme Kolaylığı 10

1.3.5. Yapay Sinir Ağlarının Dezavantajları 10

1.4. Yapay Sinir Ağlarının Kullanım Alanları 10

1.5. Yapay Sinir Ağlarının Temel Yapısı 13

1.5.1. Yapay Sinir Ağı Katmanları 14

1.5.2. Yapay Sinir Hücreleri 15

1.5.3. Bağlantılar ve Ağ Topolojisi 18

2. YAPAY SĠNĠR AĞLARINDA ÖĞRENME 20

2.1. Gözetimli Öğrenme 21

2.2. Gözetimsiz Öğrenme 25

2.3. Karma Öğrenme 26

3. YAPAY SĠNĠR AĞI ÇEġĠTLERĠ 27

3.1. Tek Katmanlı İleri Beslemeli Ağlar 28

3.2. Çok Katmanlı İleri Beslemeli Ağlar 31

3.2.1. Kavramsal Boyut 31

3.2.2. Çok Katmanlı İleri Beslemeli Yapay Sinir Ağları İçin

Süreç Örneği 32

3.2.2.1. Problemin Tanımlanması 32

3.2.2.2. Ağ Yapısının Oluşturulması 32

(5)

3.2.2.4. Eğitim ve Test Veri Gruplarının Oluşturulması 34 3.2.2.5. Eğitim Bitiş Göstergelerinin Belirlenmesi 34 3.2.2.6. Tasarlanan Ağın Eğitim Verileri İle Çalıştırılması 34

3.2.2.7. Hatanın Hesaplanması 35

3.2.2.8. Geri Yayılma 35

3.2.2.9. Yeni Girdilerle Eğitim Sürecinin Tekrarlanması 36

3.2.2.10. Momentum Sabitinin Kullanımı 37

3.2.2.11. Problemin Çözümü 39

3.3. Kohonen Ağları ve Özdüzenlemeli Haritalar 40

3.4. Hopfield Ağları ve Yinelenen Ağlar 42

4. UYGULAMADA KULLANILAN BĠLGĠSAYAR PROGRAMI -

MATLAB 45

4.1. MATLAB Hakkında Genel Bilgi 45

4.2. XOR Probleminin MATLAB Yardımı İle Çözülmesi 47 5. ELEKTRĠK TÜKETĠMĠ TAHMĠNĠ VE YAPAY SĠNĠR AĞLARI 62

5.1. Yapay Sinir Ağları ve Tahmin Modelleri 62

5.2. Dünya‟da Elektrik Tüketimi Tahmin Çalışmaları 64 5.3. Türkiye‟de Elektrik Tüketimi Tahmin Çalışmaları 65

6. ELEKTRĠK TÜKETĠMĠ TAHMĠN MODELĠ 68

6.1.Uygulama Konusunun Seçimi 69

6.2.Değişken Seçimi 69

6.3.Veri Toplama 70

6.4.Veri Önişleme 81

6.5.Eğitim ve Test Veri Kümelerinin Belirlenmesi 83

6.6.Sinir Ağı Yapısının Belirlenmesi 83

6.7.Değerlendirme Kriterleri 84

6.8.Yapay Sinir Ağının Eğitilmesi 84

6.9.Uygulama 85

7. SONUÇLAR VE DEĞERLENDĠRMELER 88

KAYNAKLAR 91

(6)

TABLO LĠSTESĠ

Sayfa No Tablo 1.1. Yapay Sinir Ağlarının Tarihsel Gelişimi 6 Tablo 1.2. Yapay Sinir Ağlarının Başlıca Uygulama Alanları 11

Tablo 1.3. Toplama Fonksiyonları 16

Tablo 1.4. Aktivasyon Fonksiyonları 17

Tablo 1.5. Aktivasyon Fonksiyonlarının Türevleri 18

Tablo 3.1. XOR Çıktı Tablosu 32

Tablo 3.2. Bağlantı Kuvvetleri İçin Rassal Başlangıç Değerleri 33

Tablo 3.3. XOR Probleminin Çözümü 39

Tablo 3.4. Mevcut Ağın Test Edilmesi 40

Tablo 6.1. Sinir Ağı Tahmin Modellerinin Tasarımının Sekiz Adımı 68 Tablo 6.2. Uygulama Çalışmasında Kullanmak Üzere Belirlenen Ana

Konular ve İlgili Alt Başlıklar 69

Tablo 6.3. Gayri Safi Yurtiçi Hasıla Verileri 71

Tablo 6.4. GSYİH‟nin Sektörel Dağılımı 73

Tablo 6.5. Esneklik Katsayısı 74

Tablo 6.6. Nüfus 74

Tablo 6.7. Nüfus Artış Hızı 75

Tablo 6.8. Sektörel Büyüme Hızları 75

Tablo 6.9. Hanehalkı Büyüklüğü 77

Tablo 6.10. İşgücü Potansiyeli 77

Tablo 6.11. Elektrik Tüketimi Artış Hızı 78

Tablo 6.12. Elektrik Kaçak ve Verimsizlik Oranı 78

Tablo 6.13. Kırsal Nüfusun Gelişimi 79

Tablo 6.14. Enerji Yoğunluğu 79

Tablo 6.15. Konut ve Sanayi Elektrik Tüketimi 80

Tablo 6.16. Elektrik Tüketimi 81

Tablo 6.17. Veriler Normalize Edilirken Kullanılan Değerler 82 Tablo 6.18. Değişik Sayıda Gizli Sinir Hücresine Sahip Yapay Sinir Ağları

İçin Test ve Eğitim Performansları 85

Tablo 7.1. Test Kümesi İçin Modelin Ürettiği Normalize Edilmiş Çıktılar

İle Normalize Edilmiş Gerçek Değerlerin Karşılaştırılması 89 Tablo 7.2. Test Kümesi İçin Modelin Ürettiği Çıktılar İle Gerçek Değerlerin

(7)

ġEKĠL LĠSTESĠ Sayfa No ġekil 1.1 ġekil 1.2 ġekil 1.3 ġekil 1.4 ġekil 3.1 ġekil 3.2 ġekil 3.3 ġekil 3.4 ġekil 3.5 ġekil 3.6 ġekil 4.1 ġekil 4.2 ġekil 4.3 ġekil 4.4 ġekil 4.5 ġekil 4.6 ġekil 4.7 ġekil 4.8 ġekil 4.9 ġekil 4.10 ġekil 4.11 ġekil 4.12 ġekil 4.13 ġekil 4.14 ġekil 4.15 ġekil 4.16 ġekil 4.17 ġekil 4.18 ġekil 5.1

: Bir Sinir Hücresi... : Bir Sinir Hücresinin Yapay Modeli... : Yapay Sinir Ağlarının Temel Bileşenleri... : Örnek Bir Yapay Sinir Ağı Yapısı... : Yapay Sinir Ağlarının Sınıflandırılması... : Basit Algılayıcı Sinir Ağı Modeli... : Çıktıların Doğrusal Olarak Ayrılabilirliği... : Çok Katmanlı Yapay Sinir Ağlarının Genel Görünümü... : XOR Probleminin Çözümünde Kullanılacak Yapay

Sinir Ağı Modeli... : Hopfield Ağı... : Yapay Sinir Ağları Araç Kutusuna (NNTool) Erişim... : NNTool Arayüzü... : Girdi ve Çıktı Vektörlerinin Tanımlanması... : Girdi ve Çıktı Vektörlerinin Modele Tanıtılması... : Yapay Sinir Ağı Oluşturma Arayüzü... : Oluşturulan Ağın Görünümü... : Başlangıç Ağırlıklarının Atanması... : Modelin Kullandığı Ağırlık Değerleri... : Eğitim Bilgilerinin Tanımlanması... : Eğitim Parametrelerinin Tanımlanması... : Eğitim Sırasında Kullanıcı Tercihine Bağlı Olarak

Gerçekleştirilebilecek İşlemler... : Eğitim Süresince Hatada Meydana Gelen Değişim... : Eğitilen Ağın Test Edilmesi... : Eğitim Sonrası YSA Arayüzünün Görünümü... : Test Sonuçlarına Erişim... : Test Sonuç Grafiğine Erişim... : Test Sonuç Grafiği... : Test Sonuçları... : Geleceği Tahmin Modelleri ...

2 3 13 15 28 29 30 31 33 43 47 48 50 50 51 52 53 53 54 55 56 57 58 58 59 60 60 61 63

(8)

SEMBOL LĠSTESĠ

i : Çıktı Sinir Hücresi Numarası j : Gizli Sinir Hücresi Numarası k : Girdi Sinir Hücresi Numarası

wij : j Gizli Sinir Hücresi İle i Çıktı Sinir Hücresi Arasındaki Bağlantının Kuvveti

wjk : j Gizli Sinir Hücresi İle k Girdi Sinir Hücresi Arasındaki Bağlantının Kuvveti

Δwjk : wjk Bağlantısında Yapılacak Olan İyileştirme Miktarı

Sj : j Sinir Hücresine Ait Toplama Fonksiyonu Değeri

f (Sj) : j Sinir Hücresine Ait Çıktı Değeri

yi : i Çıktı Sinir Hücresi Değeri

vj : j Gizli Sinir Hücresi Değeri

xk : k Girdi Sinir Hücresi Değeri

θj : j Sinir Hücresini Etkileyen Birim Sinir Hücresi

η : Öğrenme Oranı

α : Momentum Sabiti

di : i Çıktı Sinir Hücresinin Üretmesi Gereken Gerçek Çıktı Değeri

yi :i Çıktı Sinir Hücresinin Ürettiği Çıktı Değeri

dk : Algılayıcılar İçin Modelin Üretmesi Gereken Gerçek Çıktı Değeri

yk : Algılayıcılar İçin Modelin Ürettiği Çıktı Değeri

E : Hata Fonksiyonu

x1, x2 : XOR Problemi Girdi Sinir Hücreleri

G1, G2 : XOR Problemi Gizli Sinir Hücreleri Ç : XOR Problemi Çıktı Sinir Hücresi B1, B2 : XOR Problemi Birim Sinir Hücreleri

(9)

YAPAY SĠNĠR AĞLARI VE TÜRKĠYE ELEKTRĠK TÜKETĠMĠ TAHMĠN MODELĠ

ÖZET

Ekonomik ve sosyal hayatın vazgeçilmez unsurlarından biri olan elektrik enerjisi, yaşayışın ve gelişmenin sürekliliğinin sağlanabilmesi için kesintiye uğramadan sağlanması gereken kaynaklardan biridir. Yanı sıra, gerek elektrik enerjisi yatırım maliyetlerinin yüksek oluşu gerekse yatırımların elektrik üretimine dönüş süresinin uzunluğu yapılacak planlamanın önemini arttırmaktadır.

Planlama çalışmalarının başarısını etkileyen en önemli kriterlerden birisi gelecekte gerçekleşecek elektrik tüketimi ile ilgili yapılan öngörü çalışmalarıdır. Planlama faaliyetleri doğrudan yapılan öngörü çalışmalarının sonuçlarına dayandığından öngörü çalışmalarının tutarlılığı planlamanın daha gerçekçi bir şekilde yapılması sonucunu doğuracaktır.

Bu çalışma, elektrik enerjisinin planlamasına kaynak teşkil etmek üzere yapılan öngörü çalışmalarına, yapay sinir ağları yöntemi ile farklı bir yaklaşım geliştirme ile ilgilidir. Dünyada elektrik enerjisi öngörüsü ile ilgili çalışmalar çok değişik modellerle gerçekleştirilmektedir. Son yıllarda yapay sinir ağı yaklaşımı, kullanılan modeller içerisinde yer almaya başlamıştır. Japonya ve Suudi Arabistan‟da gerçekleştirilen çalışmalar buna örnek teşkil etmektedir.

Türkiye‟de elektrik tüketimi ile ilgili öngörü ve planlama çalışmaları Enerji ve Tabii Kaynaklar Bakanlığı tarafından Devlet Planlama Teşkilatı Müsteşarlığı ile koordineli bir şekilde yürütülmektedir. Son dönemde Enerji ve Tabii Kaynaklar Bakanlığı, Devlet Planlama Teşkilatı Müsteşarlığı, Hazine Müsteşarlığı ve Enerji Piyasası Düzenleme Kurumu ortak bir çalışma sonucu “Türkiye Uzun Dönem Elektrik Enerjisi Talep Çalışması” adıyla bir çalışma gerçekleştirmiş olup bu çalışmada

(10)

Bu çalışmada, öncelikle yapay sinir ağları kavramı, tarihsel gelişimi, bileşenleri ve türleri incelenmiştir. Uygulamada kullanılan çok katmanlı ileri beslemeli yapay sinir ağları daha kapsamlı şekilde ele alınmış, işleyiş mantığı teorik olarak ve örnek bir uygulama ile anlatılmaya çalışılmıştır.

Ayrıca, uygulama sırasında kullanılan yazılım programı MATLAB hakkında genel bilgiler verilmiş ve yapay sinir ağı uygulamalarında kullanımı örnek üzerinde açıklanmıştır.

Son olarak, tahmin modelleri ve yapay sinir ağlarının bu modeller arasındaki yeri irdelenmiş ve Türkiye elektrik tüketimi tahmin modelinin kuruluş aşamaları, elde edilen sonuçlar ve değerlendirmelere yer verilmiştir.

(11)

ARTIFICIAL NEURAL NETWORKS AND TURKEY ELECTRICAL CONSUMPTION FORECAST MODEL

SUMMARY

Electrical energy is one of the major components of human life. This energy must be uninterrupted and supplied any way and any time for the purpose of continuity of the existence and development. Furthermore, both the expensiveness of the investment costs of the electrical energy and the long duration that is needed for the return of the investments to production of electricity, increase the importance of the well defined planning.

One of the most considerable criteria that affect the success of the planning is the forecast studies on the electric consumption. Planning directly depends on the results of forecast studies thus the consistency of these studies will directly make the planning more realistic.

This thesis is about developing a different approach to the forecast studies those are done to form source to electrical energy planning with artificial neural networks methodology. The electrical energy forecast studies done in the world are realized with a lot of different models. Recently, artificial neural networks have become to take place within these models. The studies done in Japan and Saudi Arabia form examples to that.

In Turkey, the forecast and planning studies are executed by Energy and Natural Resources Ministry in coordination with State Planning Organization. Recently, Energy and Natural Resources Ministry, State Planning Organization, Turkish Treasury and Energy Market Regulatory Authority realized an associated study named “Turkey Long Term Electrical Energy Demand Study” in which MAED model that is developed by International Atomic Energy Association was used.

(12)

neural networks are explained more detailed and the logic of these networks is theoretically and exemplary examined.

In addition, some general information is given about the software called MATLAB that is used in the applications and its usage for the artificial neural network application is explained by an example.

Finally, the estimation models and the position of the artificial neural networks amongst these models are examined and beginning phases, results and evaluations of the electrical consumption estimation model are stated.

(13)

1. YAPAY SĠNĠR AĞLARI

1.1. Tanım

Yapay sinir ağları için en uygun tanımlama, paralel işleme temeli üzerine inşa edilmiş, uyum sağlama ve öğrenme, genelleme yapma veya veri sınıflandırma ya da organize etme yetileri olan hesaplama modeli şeklinde yapılabilir (Kröse ve Smagt, 1996). Yapay sinir ağları, geleneksel hesaplama modellerinin aksine, beynin yapısını ve işleyişini andıran matematiksel modeller üzerine oturtulmuş hesaplama paradigmalarıdır.

Yapay sinir ağları dünya üzerinde varolan en yetkin bilgi işlemci olan beynin, yapısından ve çalışma prensiplerinden ileri gelen üstünlüklerinin insan yapımı makinelere kazandırılması hayali doğrultusunda gerçekleştirilen çalışmalar ile insanlığın bilim dağarcığına kazandırılmış bir konudur. Bu nedenle yapay sinir ağlarına olan ilginin iki ana kaynağı olduğu söylenebilir:

 İnsan beyninin çalışma prensiplerini anlama arzusu,

 Karmaşık işlemleri başarıyla sonuçlandırma yetisine sahip makineler inşa etme isteği (Müller ve Reinhardt, 1990).

Her ne kadar günümüzde yapay sinir ağları ile ilgili olarak yapılan çalışmalar daha çok ikinci istek üzerinde yoğunlaşmış olsa da konunun asıl çıkış noktası insan beyninin işleyişinin anlaşılması ile ilgili olarak yapılan araştırmalardır. Yapay sinir ağları beynin doğası ile ilgili yapılan araştırmalardan elde edilen kavramlar üzerine geliştirilmiş algoritmalardır (Müller ve Reinhardt, 1990). Beynin çalışma prensipleri ile ilgili bilgi elde edildikçe, insan zekasına özgü bazı faaliyetlerin sayısal olarak ifade edilebileceği düşüncesi ortaya çıkmış ve bu, işlem birimlerinin ve oluşturdukları yapının modellenmesi fikrini de beraberinde getirmiştir (Haykin, 1994).

(14)

Kabaca ifade etmek gerekirse beyin, yaklaşık olarak 2,5 milyar sinir hücresinin oluşturduğu karmaşık bir ağ yapıdır. Biyolojik bir sinir hücresi, kaba bir hesaplama becerisine sahip tek bir hücreden oluşur (ġahin, 2002). Her sinir hücresinde, hücrelerin diğer sinir hücreleriyle bağlantı kurmalarını sağlayan akson adında ve diğer hücrelerin kendileriyle bağlantı kurmalarını sağlayan dentrit adında uzantılar bulunmaktadır. İki hücre arasında bağlantı bir hücrenin aksonu ile diğer hücrenin dentritinin oluşturduğu sinaps adı verilen bağlantı noktalarında kurulur. Beyin, sinir hücrelerinin dentritleri vasıtasıyla diğer sinir hücrelerinden aldıkları uyarılara hücre çekirdeğinde sakladıkları bilgi uyarınca bir çıktı oluşturması ve bu çıktıyı aksonlar vasıtasıyla ilgili yerlere ulaştırması yoluyla çalışan bir yapıdır. Oluşan çıktı, her bir girdinin kuvvetine ve girdilerin söz konusu hücre ile olan bağlantılarının yapısına bağlıdır (ġahin,2002). Şekil 1.1‟de bir sinir hücresi gösterilmektedir.

ġekil 1.1: Bir Sinir Hücresi (Freeman ve Skapura, 1991)

Yapay sinir ağları, beyindeki sinir hücrelerini ve bu hücrelerin birbirleriyle oluşturdukları bağlar sonucunda çıktı üretme yapısını modelleyen bir sistemdir. Yapay sistem, elektrik devrelerle ya da bilgisayarlarda yazılım olarak gerçeklenebilir (Dobnikar ve diğ.,1999). Şekil 1.2‟de bir sinir hücresi ile sinir hücresinin yapay modeli görülmektedir. Sinaps Dentritler Akson Ranvier Boğumu Miyelin kılıf Akson tepeciği Çekirdek Hücre Gövdesi Sinaps Dentritler Dentritler

(15)

++++-+ ġekil 1.2: Bir Sinir Hücresinin Yapay Modeli (Veelenturf, 1995)

Bu bilgiler ışığında yapay sinir ağlarının, şu bileşenlerden oluşan çok işlemcili bir bilgisayar sistemi modeli olduğu söylenebilir:

 Basit işlem elemanları

 Yüksek derecede iç bağlantılar

 Basit skaler mesajlar ve

 Elemanlar arasında uyum geliştiren etkileşim

Günümüzde, sinir hücrelerinden daha hızlı işlem yapmak başarılabildiyse de geliştirilen sistemler beynin kusursuz ağ yapısının sağladığı yüksek hızın oldukça gerisinde kalmaktadır. Ancak, karmaşık eşleştirilmelerin gerçekleştirilmesindeki başarısı ve yapısal bağışıklığı sebebiyle gün geçtikçe daha çok uygulama alanı bulmaktadır. Bilgisayar bilimi ve mühendislik başta olmak üzere ekonomi ve psikoloji gibi alanlarda kullanılmaktadır (Lippmann,1987).

Akson Sinaps Dentritler

(16)

1.2. Tarihsel GeliĢim

Beyin teorisi ve yapay sinir ağlarının en basit tarihsel gelişim öyküsü üç maddede ifade edilebilir: McCulloch ve Pitts‟in 1943 yılında yayınladıkları çalışma, Hebb‟in 1949 yılında yayınladığı çalışma ve Rosenbaltt‟ın 1958 yılındaki çalışması (Arbib, 2003).

Yapay sinir ağlarına („bağlantısal modeller‟ veya „paralel dağıtılmış işleme‟ olarak da bilinir) olan ilginin ilk dalgası McCulloch ve Pitts‟ in 1943 yılında bilim dünyasını basitleştirilmiş sinir hücreleri ile tanıştırmaları ile ortaya çıkmıştır. (Kröse ve Smagt, 1996). Warren McCulloch ve Walter Pitts yayınladıkları çalışmada ikili devre anahtarları veya karar verme elemanlarından oluşan ağsal bir yapıya dayalı bilgi işleme için genel bir teori önermişlerdir (Hu ve Hwang, 2002). Bu çalışmada sinir hücreleri, biyolojik sinir hücrelerinin modelleri ve karmaşık işlemleri gerçekleştirebilen döngüler için kavramsal bileşenler olarak tanıtılmışlardır (Kröse ve Smagt, 1996). McCulloch ve Pitts yayınlarında, ortaya koydukları teorinin ve ağsal yapıların, programlanabilir dijital bir bilgisayarın yapabileceği bütün hesaplamaları gerçekleştirebileceğini göstermiştir (Müller ve Reinhardt, 1991). 1949 yılında Hebb, hücreler arası bağlantıları ayarlama amacıyla kullanılacak ilk öğrenme kanununu geliştirmiştir (Dobnikar ve diğ.,1999). Bu tarihten sonra geliştirilen bu model, yapay sinir ağlarında öğrenme işleminin nasıl gerçekleştirileceği konusundaki çalışmalara ışık tutmuştur.

Takip eden yıllarda yapay sinir ağları üzerinde bir çok çalışma gerçekleştirilmiş ve bir çok yapay sinir ağı geliştirilmiştir. Geliştirilen ağlar ilk başta elektrik devreleri olarak üretilmiştir. İlerleyen zamanlarda elektrik devrelerinin yerini bilgisayar uygulamaları almış ve bilgisayar temelli yapay sinir ağları geliştirilmiştir. Bu dönemin başlıca araştırmacıları Marvin Minsky, Rosenblatt ve Bernard Widrow‟dur. 1960‟lı yıllara doğru Frank Rosenblatt ve çalışma arkadaşları “algılayıcı” adı verdikleri özel bir yapay sinir ağı geliştirmiştir (Hu ve Hwang, 2002). Bu yapay sinir ağına “algılayıcılar” ismini vermeleri, geliştirdikleri ağın duyumsal bilgilerin işlendiği biyolojik mekanizmaların basitleştirilmiş bir modeli olduğuna dair olan inançlarıdır. Algılayıcı, girdi ve çıktı katmanlarını oluşturan iki farklı sinir ağı

(17)

katmanından oluşan bir yapıdır (Müller ve Reinhardt, 1991). Bu ağlar, elektro diyagram analizleri ve hava tahmini gibi çeşitli alanlarda kullanılmışlardır.

Yapay sinir ağlarına olan ilgi 1960‟lı yılların sonuna kadar artarak devam etmiştir. 1969 yılında Marvin Minsky ve Seymore Papert‟in çalışmalarını yayınladıkları “Perceptrons” (algılayıcılar) adlı kitap yapay sinir ağları için karanlık bir dönemin başlangıcı olmuştur. Minsky ve Papert yaptıkları çalışmalar sonucunda tek katmanlı yapay sinir ağlarının, teorik olarak algılayıcılar ile çözülmeye uygun olan problemler dışında, çözemediği bir çok basit problemin varlığını ispatlamışlardır (Müller ve Reinhardt, 1991). Bu yayının ardından yapay sinir ağlarına yapılan yatırımların büyük kısmı kesilmiş ve bu alanda çalışan araştırmacıların hemen hemen hepsi başka alanlar kaymıştır. Sadece bir kaç araştırmacı bu alanda çalışmaya devam etmiştir. Bu araştırmacıların en önemlileri Teuvo Kohonen, Stephen Grossberg, James Anderson ve Kunihiko Fukushima‟dır (Kröse ve Smagt, 1996).

Bu dönemde yapay sinir ağlarına olan ilginin azalmasında etkili olan bir başka faktör de bilgisayar alanında kaydedilen gelişmelerdir. Kaydedilen teknolojik ilerlemeler – başta yarı iletken teknoloji olmak üzere – günümüzün eskiye göre ucuz ve güvenilir, hızlı işlem yapabilen ve geniş kapasiteli bilgisayarlarının geliştirilmesini sağlamıştır. Yapay sinir ağlarının bilgi işleme konusunda alternatifi olan bilgisayarlardaki bu çarpıcı gelişim ağlara olan ilgiyi daha da azaltmıştır (Dobnikar ve diğ.,1999).

Dönemin yapay sinir ağları ile ilgilenen araştırmacılarının çalışmaları fazla ilgi ve destek görmemiştir. Bu nedenle eserlerini yayınlama imkanı bulamayan araştırmacılar çalışmalarını gazete ve dergilerde parçalar halinde bilim dünyasına sunmuşlardır. Bu çalışmalar günümüzde kullanılan çok katmanlı yapay sinir ağları için temel teşkil etmektedir.

1980‟li yılların başlarında, bir takım önemli teorik gelişmenin – en önemlisi geri yayılımlı algoritmanın keşfedilmesi – kaydedilmesiyle yapay sinir ağlarına olan ilgi canlanmaya başlamıştır (Kröse ve Smagt, 1996).

Hopfield, 1982 yılında teknik problemlerin çözülmesi için doğrusal olmayan Hopfield ağlarını; 1982-1984 yıllarında da Kohonen öz düzenlemeli harita tanımını

(18)

Günümüzde, Minsky ve Papert‟in “Perceptrons” kitabında dönemin yapay sinir ağları ile çözülemeyeceği ispatlanan bir çok soruna çözüm üreten ağlar geliştirilmiştir. Yapay sinir ağları alanına olan ilgi son yılarda oldukça artmış, hatta teorik çalışmalar ticari anlamda uygulamaya geçirilmiştir. Yarının daha da gelişmiş ve yetkin ağlarının üretilmesi için varolan tekniklerin geliştirilip bu havuza yenilerinin eklenmesi ve teorik tabanın sağlamlaştırılması gereklidir. (Lahkmi ve Vemuri, 1999)

Tablo 1.1: Yapay Sinir Ağlarının Tarihsel Gelişimi (Netfirms, 2005)

Yıl Ağ Mimarisi Bulucu Bilim Adamı

1942 McCulloch-Pitts Hücresi McCulloch-Pitts 1957 Algılayıcı (Perceptron) Rosenblatt

1960 Madaline Widrow

1969 Cerebellatron Albus

1974 Geriye Yayılım (Back

Propagation) Werbos, Parker, Rumelhart

1977 Bir Kutu İçinde Zeka Anderson

1978 Neocognition Fukushima

1978 Adaptif Rezonans Teorisi Carpenter, Grossberg

1980 Öz Düzenlemeli Harita Kohonen

1982 Hopfield Hopfield

1985 İki Yönlü Bileşik Hafıza Kosko

1985 Boltzman Makinesi Hinton, Sejnowsky, Szu

1986 Sayıcı Yayılım Hecht-Nielsen

1988 Hücresel Sinir Ağı Chua, Yang

1.3. Yapay Sinir Ağlarının Genel Özellikleri

Yapay sinir ağları, klasik algoritmik programlama anlayışına karşı biyolojik sistemlerdeki hesaplama dinamikleri örnek alınarak yaratılmış yeni bir meta sezgisel yöntemdir (Schalkoff, 1997). Bu bağlamda yapay sinir ağlarının özelliklerine, ve üstünlüklerine değinmeden önce klasik programlama anlayışının özelliklerine değinmek gerekmektedir.

(19)

Bilgisayar temelli klasik programlama kuralların, ilişkilerin ve denklemlerin önceden tanımlanmış olduğu problemlere etkin çözümler üreten ve sıkça kullanılan bir yaklaşımdır. Çeşitli program dilleri ile verilerin işleneceği sürecin, bu sürece ait ilişkilerin, eşitliklerin ve elemanların programa özgü kalıplarla tanımlanması suretiyle programcının ve/veya kullanıcının istediği işlemleri gerçekleştiren ve beklediği çıktıyı sunan bir metodolojidir. Bugün gelinen noktada, hem donanımsal hem de yazılımsal ilerlemelerin bir sonucu olarak işlemleri oldukça hızlı gerçekleştirebilmekte ve çalışma temellerine uygun problemler için programcıya ve/veya kullanıcıya tam olarak doğru çıktıları üretebilmektedir.

Klasik bilgisayar programlarının bu denli hızlı ve doğruluk oranı oldukça yüksek işlem kapasitelerine rağmen yapay sinir ağları gibi alternatif bir veri işleme yaklaşımına ihtiyaç duyulmasının nedenleri şu şekilde özetlenebilir:

 Klasik programlamanın beklenen çıktıyı üretmesi için ele alınan problemlerin, problem elemanlarının, çözüm sürecinin ve çözüm elemanlarının programcı ya da kullanıcı tarafından tam olarak tanımlanmış olması gerekmektedir. Sürecin ve ilişkilerin tam olarak tanımlanmaktan kısmen de olsa uzaklaştığı durumlarda sistem modellenememektedir. Pratikte tanımlamanın bu kadar net bir şekilde yapılmasının mümkün olmadığı bir çok olay bulunmaktadır (Rafiq, 2001).

 Tüm donanımsal ve yazılımsal gelişimlerin sağladığı avantajlara rağmen büyük miktarda girdinin işlenmesiyle küçük miktarlarda çıktı üretilmesinin gerektiği konuşma ve resim işleme gibi karmaşık olaylarda etkin işleyiş sağlanamamaktadır (Simpson, 1992).

 Günümüzün en yetkin bilgisayarları bile en ilkel memeli beyninin büyük hızlarda gerçekleştirdiği karmaşık optik ve/veya akustik modellerin çözümünü gerçekleştirmekten çok uzaktır. Bu ihtiyacı gidermek amacıyla klasik programlama modelleri üzerinde bir çok çalışma gerçekleştirilmiş ancak ortaya konan çözümlerin tamamı mantıksal muhakemeye dayandığından sadece ele alınan problemin mantıksal yapısının tanımlanabildiği durumlara çözüm üretilebilmiştir (Müller ve Reinhardt,

(20)

 Elektronik bilgisayarların sahip oldukları yüksek hızın en önemli kaynağı olan donanımsal gelişimde oldukça mesafe kaydedilmiştir. Yakın gelecekte gerçekleştirilebilecek donanım iyileştirmelerinin işlem hızları üzerinde tatmin edici gelişmeler sağlaması beklenmemektedir. Bu nedenle, işlem hızlarının geliştirilmesi hedefi doğrultusundaki çalışmalar farklı kavramlar ve düşünceler üzerinde yoğunlaşmıştır (Müller ve Reinhardt, 1991).

 Klasik programlama, gerek yazılım gerekse donanım bakımından çok dayanıklı (robust) bir sistem değildir. Donanımı oluşturan parçalar veya yazılımı oluşturan söz dizinlerinde meydana gelecek herhangi bir deformasyon en iyi programın en iyi ihtimalle sapması oldukça yüksek çıktılar üretmesine sebep olacağı gibi bu durumun beklenen sonucu sistemin çalışmaması durumudur.

Bu bilgiler ışığında yapay sinir ağlarının;

 Algoritmik bir çözümün formüle edilemediği,

 İstenilen davranışın bir çok örneğine erişilebildiği,

 Mevcut verilerden bu verilerin ait olduğu yapının tanımlanmasının gerektiği problemlerde faydalanılabilecek donanımda ve/veya yazılımda meydana gelebilecek sorunlara karşı dayanıklı (robust) modeller olduğu söylenebilir (Smith, 2003).

Yapay sinir ağlarının temel özellikleri, başka bir ifadeyle klasik doğrusal programlama yaklaşımının çözümsüz kaldığı noktalarda tercih ediliyor olmasının temel sebepleri, ise yapay sinir ağlarının sahip oldukları paralellik özelliği, öğrenme, genelleme ve uyum sağlama özellikleri, yüksek hata toleransı ve gerçeklenme kolaylığıdır.

1.5.1. Paralellik Özelliği

Bilindiği üzere yapay sinir ağları birbirleriyle bağlantılı sinir hücrelerinden oluşmaktadır. Basit işlem elemanları olan sinir hücrelerinin gücü ağ içerisinde, birbirleri arasında oluşturdukları bağlantılar sayesinde sergiledikleri kollektif davranıştan gelmektedir (Galkin, 2004). Yapay sinir ağını oluşturan elemanlar basit işlemleri birbirlerinden bağımsız olarak eşzamanlı gerçekleştirmektedir. Yani tüm

(21)

sinir hücrelerinin problemin bütünü ile üzerinde işlem yapması yerine sadece kendileri ile ilgili olan bölümü işledikleri paralel bir yapı oluşturmuşlardır. Bu yapıda ağın gerçekleştirmesi beklenen işlev yapısal olarak dağıtılmıştır (Haykin, 1994). Bu sayede yapay sinir ağları oldukça hızlı işlem gerçekleştirmektedir. Yine aynı nedenden dolayı, biyolojik sinir hücrelerinden hızlı işlem yapabilen işlem elemanları yapılabildiyse de bütünsel olarak beynin işlem hızına erişebilen bir bilgisayar üretilememiştir (Dobnikar ve diğ.,1999).

Paralellik özelliğinin sağladığı bir başka avantaj da dayanıklılıktır (robustluk). Ağın paralel işleyişi, ağ elemanlarından birinde meydana gelecek herhangi bir sorunun bütün üzerinde sadece kendi fonksiyonel katkısı oranında değişikliğe sebep olması üstünlüğünü de beraberinde getirmektedir. Bu nedenle, klasik programlama sistemlerini çalışmaz duruma getirebilecek etkiler yapay sinir ağları üzerinde sadece ufak sapmalara sebep olabilecektir (Ergezer ve diğ.,2003).

1.5.2. Öğrenme, Genelleme ve Uyum Sağlama Özellikleri

Klasik programlar ne yapacaklarının ve bunu nasıl yapacaklarının programcı tarafından tam olarak tanımlandıkları programlardır. Bu bakış açısıyla yapay sinir ağları klasik anlamda programlanmamaktadır. Yapay sinir ağları çözülmesi beklenen problemle ilgili örnekler üzerinde çalışarak veriler arasındaki ilişkiyi keşfetmektedir (ġahin, 2002). Klasik yaklaşımda programcının yaptığı programlama işlemi yerine yapay sinir ağlarında ağ eğitime tabi tutulur ve böylece problemle ilgili geniş tanım yapılmadan problemle ilgili bir algoritma geliştirilmektedir.

Yapay sinir ağları, eğitimleri sırasında işledikleri örneklerden elde ettikleri bilgiler vasıtasıyla genellemeler yapar ve eğitim sırasında hiç karşılaşmadıkları problemlere istenen çıktıları üretebilir (Grossberg, 1992). Ayrıca, ilgili problemde meydana gelecek değişimler uyarınca ağ yeniden eğitilebilir ve ağın kendini yeni duruma uyarlaması ile beklenen çıktılara ulaşmak mümkün olmaktadır.

1.5.3. Yüksek Hata Toleransı

(22)

ilgili verilerin tam olmadığı ve/veya hatalar içerdiği yani bulanık olduğu durumlarda bile bu veriler arasındaki ilişkilerle ilgili yaklaşım üretebilir ve anlamlı çıktılar üretebilir (Smith, 2003).

1.5.4. Gerçeklenme Kolaylığı

Yapay sinir ağları yapı olarak basit işlemler yapan işlem elemanlarından ve bu elemanlar arasında kurulan bağlantılardan ibarettir. Bu nedenle yapay sinir ağlarının tasarlanması ve gerçeklenmesi düşük maliyetlerle gerçekleştirilebilmektedir (Dobnikar ve diğ.,1999).

1.5.5. Yapay Sinir Ağlarının Dezavantajları

Yukarıdaki maddelerde ifade edilen üstünlüklerinin yanı sıra yapay sinir ağlarının bir takım dezavantajları da bulunmaktadır.

 Eğitim süreci, yapay sinir ağları için en kritik konulardan biridir. Ağın bütün başarısı bu süreçte edineceği tecrübeye ve çıkaracağı genellemelere bağlıdır. Ancak eğitim yoğun bir hesaplama ve kayda değer bir süre gerektirdiği gibi bazı durumlarda oldukça zor ve hatta imkansız bile olabilir.

 Yapay sinir ağları önceden detaylı olarak tanımlanan ve programlanan yapılar olmadıkları için ürettikleri çözümleri neden ve nasıl ürettikleri konusunda açıklama sağlayamamaktadırlar. Bu bağlamda kapalı bir kutu oldukları söylenebilir (Dereli, 2000).

1.4. Yapay Sinir Ağlarının Kullanım Alanları

Bölüm 1.3.‟de ifade edilen özelliklerinden ötürü yapay sinir ağları elde çok sayıda verinin olduğu ancak bu verilerin bulanık olduğu, problemin ve ilişkilerin net olarak tanımlanamadığı ve kuralların kolaylıkla uygulanamadığı problemlerde klasik yöntemlere göre daha başarılı sonuçlar üretmektedir.

1980‟li yıllarda kaydedilen gelişmeler ve yapay sinir ağlarının o zamana kadar çözüm üretilemeyen sorunlarının aşılması ve doğrusal olmayan veri kümelerine uygulanabilirliğinin gösterilmesinin ardından yapay sinir ağlarına olan ilginin

(23)

canlanmasıyla birlikte ağlar, ekonomi, mühendislik ve tıp alanları başta olmak üzere birçok alanda uygulama olanağı bulmuş ve oldukça etkileyici sonuçlar üretmiştir (Müller ve Reinhardt, 1991). Yapay sinir ağlarının çeşitli alanlardaki uygulamaları ağın yerine getirdiği işlev bakımından kabaca şu şekilde gruplandırılabilir (Fuente, 2004) :

 Bir araya getirme

 Gruplama

 Sınıflandırma

 Şablon tanıma

 Regresyon ve genelleme

 Optimizasyon

Yapay sinir ağları kullanımı ile ilgili genel düşünce yapay sinir ağlarının bugün herhangi bir yöntemle çalıştırılan herhangi bir fonksiyonu çalıştırabileceği ve geleneksel modelleme yöntemlerine göre daha etkin çözümler üretebileceği yönündedir (ġahin, 2002). Bu konuda yapılan bir araştırmada ele alınan 42 çalışmanın 30‟unda (%71) yapay sinir ağlarının geleneksel istatistik tekniklerine oranla daha iyi çıktılar ürettiği görülmüştür (ġahin, 2002; Sharda, 1992).

Tablo 1.2‟ de yapay sinir ağlarının başlıca uygulama alanları ve bu alanlardaki önemli başlıklar verilmiştir (Netfirms, 2005).

Tablo 1.2: Yapay Sinir Ağlarının Başlıca Uygulama Alanları

Uygulama Alanı Uygulama BaĢlığı

ASKERİ

Hedef tanıma ve izleme Keşif yapma

Kıt kaynakların kullanımını optimize etme Radar sinyallerini anlama

Yeni ve gelişmiş silahlar yaratma

BİYOLOJİ Beyni ve diğer sistemleri daha iyi anlama Retina ve korneayı modelleme

(24)

Tablo 1.2: Yapay Sinir Ağlarının Başlıca Uygulama Alanları (Devam)

Uygulama Alanı Uygulama BaĢlığı

ÇEVRESEL

Hava tahmini

Numuneleri analiz etme

FİNANS

El yazısı formlarının değerlendirilmesi Kredi riski değerlendirmesi

Sahte para ve evrak tanımı

Yatırım eğilimleri ve portföy analizi

İŞ DÜNYASI

El yazısı karakterini tanıma Hava yolları ücret düzenlemesi

Özel durumlar için toplum eğilimlerinin tanımı Petrol ve jeolojik yapı değişimlerinin tahmini Veri tabanı oluşturulması

TIP

Ameliyat görüntüleme

Epileptik felcin nedenlerini anlama İlaçların yan etkilerinin analizi Sağırlar için ses analizi

Semptom hastalıkların teşhis ve tedavisi X-ışınlarını okuma

ÜRETİM

Kalite kontrolü

Montaj hattında parça seçimi

Robot ve kontrol sistemlerini otomatikleştirme Üretim işlem kontrolü

(25)

1.5. Yapay Sinir Ağlarının Temel Yapısı

Bir yapay sinir ağı genel olarak sinir hücresi adı verilen birbirleriyle ileri derecede ilişkilendirilmiş işlem elemanlarından oluşan bir hesaplama sistemi olarak tanımlanabilir (Tebo, 1994). Bu tanımdan da anlaşıldığı üzere yapay sinir ağı yapısının en temel üç bileşeni sinir hücreleri, bu hücreler arasında kurulan bağlantılar ve hesaplama fonksiyonlarıdır.

Şekil 1.3‟e gösterilen klasik bir yapay sinir ağı modelinin genel görüntüsünü oluşturan elemanlar şu şekilde ifade edilebilir (Kröse ve Smagt, 1996):

 İşlem elemanları kümesi yani yapay sinir hücreleri,

 Her eleman için o elemanın çıktısını ifade eden bir faaliyet ifadesi (yj),

 Bir elemanın diğer eleman üzerindeki etkisini belirleyen ve genellikle wjk (k elemanının j elemanı üzerindeki etkisinin kuvveti) şeklinde bir ağırlıkla ifade edilen yapay sinir hücreleri arası bağlantılar,

 Her elemanın girdilerini işleyerek o elemanda kullanılacak etkin girdiyi (sj) belirleyen bir yayılım kuralı,

 Her eleman için θj şeklinde ifade edilen dış girdi (birim – bias nöron),

 Bilgi oluşturmada kullanılacak bir metot, yani öğrenme kuralı,

 Sistemin işleyişini gerçekleştirdiği, girdi uyarılarını ve gerektiğinde hata uyarılarını sağlayan çevre.

k j yk yj θj Fj sj = ∑k wjk yk+θj

(26)

1.5.1. Yapay Sinir Ağı Katmanları

Yapay sinir ağları çeşitli katmanlarda toplanmış yapay sinir hücreleri ve bu hücreler arasındaki bağlantılardan oluşur (Arbib, 2003). Bir yapay sinir ağını oluşturan sinir hücreleri tam olarak bağlantılarla birbirine bağlanmış olabileceği gibi, bağlantılar seyrek ya da yerel olarak da kurulmuş olabilir. Katmanlar, bünyelerinde bulunan sinir hücrelerinin birbirleriyle bağlantılar vasıtasıyla ilişkilendirilmediği ancak diğer katmanlarla bağlantılı olan sinir hücresi kümeleridir (Tebo, 1994). Yapay sinir hücrelerinin bulundukları katmanlar üç ana başlık altında toplanmaktadır:

 Girdi katmanı, yapay sinir ağının üzerinde çalışacağı probleme ait başlangıç verilerinin (girdilerin) ağa girildiği katmandır. Bu katmandaki sinir hücreleri sayısı problemin girdi parametrelerinin sayısına eşittir ve her sinir hücresi ilgili girdi ile ilgili bir veri içerir (Veelenturf, 1995). Girdi hücreleri yapay sinir ağının çalışması için gerekli verileri taşıdığından kuramsal hücrelerdir, taşıdıkları veriler üzerinde işlem yapmadan bu verileri diğer hücrelere iletirler (ġahin, 2002).

 Gizli katman, yapay sinir ağının asıl işleme katmanıdır. Bu katmanın gizli olarak ifade edilmesi kullanıcı tarafından görülmüyor olmasından gelmektedir. Girdi katmanından ağa alınan verilerin ilgili probleme uygun bir fonksiyonla işlendiği ve sonucun elde edilmesi amacıyla çıktı katmanına iletildiği katmandır. Ağ içerisinde gizli katman bulunup bulunmayacağı ya da ağın kaç katmandan oluşacağı konuları ağ tasarımcısının kontrolündedir ve uğraşılan probleme göre belirlenmektedir. Gizli katmanı oluşturan sinir hücresi sayısı da benzer şekilde belirlenmektedir. Gizli katmanda yer alan yapay sinir hücrelerinin sayısının gereğinden az olması çıktıların verilere olan bağımlılığını yani hassasiyetini azaltırken, gizli katman yer alacak gereğinden fazla yapay sinir hücresi ağın eğitilmesi ile değişen durumlara ve veri gruplarına uyum sağlama süreçlerini zorlaştırıcı etki yapmaktadır.

 Çıkış katmanı, girdi katmanından ağa girilen ve gizli katmanda işlenen verilerin ağın yapısına uygun bir fonksiyonla işlendiği ve sonucun sistemin çıktısı olarak sunulduğu katmandır. Girdi katmanındaki ilişkiye benzer şekilde, çıkış katmanındaki sinir hücresi sayısı ağdan beklenen çıktı sayısına eşittir.

(27)

ġekil 1.4: Örnek Bir Yapay Sinir Ağı Yapısı (Freeman ve Skapura, 1991) Bir yapay sinir ağının büyüklüğü iki temel kriter ile ifade edilir:

 Ağı oluşturan katman sayısı ve

 Gizli birimlerin sayısı (Fuente, 2004). 1.5.2. Yapay Sinir Hücreleri

Yapay sinir hücreleri, her biri ağın işlemesi gereken toplam problemin belirli bir parçası ile ilgilenen işlem birimleridir. Gerçek bir sinir hücresine benzer şekilde, bir çok farklı sinir hücresinden girdi verilerini alır, bunu taşıdığı bilgi ve fonksiyonel özelliği uyarınca işleyerek bir tane çıktı üretir, bunu ilgili sinir hücreleriyle paylaşır ve/veya ağ işleyişinin çıktısı olarak kullanıcıya sunar (Freeman ve Skapura, 1991). Bu ifadeden de anlaşılacağı üzere yapay bir sinir hücresinde iki temel fonksiyon gerçekleşmektedir:

 Diğer yapay sinir hücreleri tarafından, aralarındaki ilişkinin yapısı uyarınca kendilerine iletilen girdileri toplama ve işleyiş süreçlerinde kullanabilecekleri etkin ve de uygun girdiye dönüştürme (toplama),

 Toplanan girdilerden üretilen etkin girdiyi fonksiyonel özelliği ve sahip olduğu bilgi uyarınca işleme ve işleyiş sürecinin sonucu olan çıktıyı üretme (aktivasyon).

Gizliler

Çıktılar Girdiler

(28)

Yapay sinir hücrelerinin, çok sayıda diğer yapay sinir hücrelerinden aldığı verileri kullanılabilir girdi haline çevirmede kullandığı fonksiyonlara toplama fonksiyonu veya net fonksiyon adı verilmektedir. Toplama fonksiyonu yapay sinir hücrelerinden gelen verilerle bu verilerin ait oldukları bağların kuvvet bilgisini kullanarak çeşitli formüller vasıtasıyla girdilerin bütünsel anlamını (değerini) hesaplayan fonksiyonlardır. Yapay sinir ağları uygulamalarında kullanılacak net fonksiyon formülü ile ilgili olarak çeşitli yaklaşımlar bulunmasına rağmen en çok uyulama alanı bulan formül ağırlıklandırılmış lineer kombinasyon formülüdür (Hu ve Hwang, 2002). Toplama fonksiyonunu işleten sinir hücresi j, girdileri sağlayan sinir hücreleri

j ve hücreler arası bağlantıların kuvvetleri wjk ile gösterilmek üzere ağırlıklandırılmış lineer kombinasyon formülü şu şekildedir:

Sj = ∑k wjk * yk + θj (1.1)

θk, sapma veya hata terimi olarak ifade edilen ve ilgili adımı modellemede kullanılan bir parametredir (Hu ve Hwang, 2002).

Literatürde karşılaşılabilecek toplama fonksiyonları Tablo 1.3‟te özetlenmiştir.

Tablo 1.3: Toplama Fonksiyonları (Hu ve Hwang, 2002)

Toplama Fonksiyonu Formül Yorumlar

Lineer Sj = ∑k wjkyk + θj En çok kullanılan fonksiyon Yüksek Dereceli

Sıralama (ikinci dereceden sıralama formülü gösterilmiştir.)

Sj = ∑k ∑j wjkyjyk+ θj

Sk , girdi verilerinin yüksek dereceli polinomiyal

ağırlıklandırılmış ifadelerinin lineer kombinasyonudur. Delta (∑ - ∏) Sj = ∏k wkyk Seyrek kullanılmaktadır.

Yapay bir sinir hücresi için toplama fonksiyonu ile girdilerin anlamlı ve kullanılabilir hale getirilmesini takiben yapılması gereken işlem bu girdiyi kullanarak, sahip olduğu bilgi uyarınca, ağın ilerleyen adımlarında kullanılacak çıktıyı üretmektir. Bu işlevi gerçekleyen fonksiyona aktivasyon fonksiyonu ya da hareket fonksiyonu adı verilmektedir. Aktivasyon fonksiyonu doğrusal ya da doğrusal olmayan bir fonksiyon olabilir. Yapay sinir hücresi için çıktı değerini üreten aktivasyon

(29)

fonksiyonu çok önemli olmakla birlikte aktivasyon fonksiyonun tipinin genel ağ performansı üzerindeki etkisi oldukça düşüktür (ġahin, 2002; Masters, 1993). Yapay sinir ağları uygulamalarında bir çok farklı aktivasyon fonksiyonu kullanımı görülmektedir. Yine de, bu uygulamalar arasında sigmoid tipi aktivasyon fonksiyonu daha fazla uygulama alanı bulmuştur. Bu farkın en önemli sebebi olarak fonksiyonun türevinin kolay alınabilir olması söylenebilir (Hu ve Hwang, 2002). Sigmoid fonksiyonlar içerisinde en çok rağbet göreni 0.0 – 1.0 aralığında değer üreten lojistik fonksiyonudur (ġahin, 2002; Hart, 1992).

f (sj) =

1

(1.2) 1 + e -Sj

Literatürde karşılaşılabilecek aktivasyon (hareket) fonksiyonları, fonksiyonların kullanım alanları ve kullanım sıklığı ile ilgili yorumlar Tablo 1.4‟te, bu fonksiyonlara ait türev alma formülleri Tablo 1.5‟te özetlenmiştir.

Tablo 1.4: Aktivasyon Fonksiyonları (Hu ve Hwang, 2002)

Aktivasyon Fonksiyonu Formül Yorumlar

Sigmoid f (sj) = 1 / (1 + e

–Sj/T

)

Yaygın olarak kullanılır. Türev, doğrudan f (sj) fonksiyonundan üretilebilir.

Hiperbolik Tanjant f (sj) = tanh (sj / T) T = sıcaklık parametresi Ters Tanjant f (sj) = 2 /π tan-1 (sj / T)

Eşik

1 sj > 0;

f (sj) =

-1 sj <0.

Gauss Radyal Temel

f (sj) =

exp [-(II sj - m II2)/σ2]

Radyal temelli yapay sinir ağları için kullanılır; m ve σ2

belirlenmesi gereken parametrelerdir. Doğrusal f (sj) = asj + b

(30)

Tablo 1.5: Aktivasyon Fonksiyonlarının Türevleri (Hu ve Hwang, 2002)

Aktivasyon Fonksiyonu Formül Türevler

Sigmoid f (sj) = 1 / (1 + e -sj /T) f (sj).[1- f (sj)] / T Hiperbolik Tanjant f (sj) = tanh (sj / T) ( 1-[ f (sj)]2) / T Ters Tanjant f (sj) = 2 /π tan-1 (sj / T) (2 /πT) / (1+[ sj / T]2)

Eşik 1 sk >0; f (sj) = -1 sk < 0. sj = 0 noktasında fonksiyonun türevi alınamamaktadır.

Gauss Radyal Temel

f (sk) =

exp [-(II sj - m II2)/σ2]

-2 (sj – m).f (sj) / σ2

Doğrusal f (sj) = asj + b a

1.5.3. Bağlantılar ve Ağ Topolojisi

Bağlantılar, yapay sinir ağı katmalarında yer alan yapay sinir hücrelerinin birbirleriyle ilişki kurmasını sağlamaktadır. Çıktı üreten bir yapay sinir hücresinin, bu çıktıyı işlemek üzere girdi olarak kabul eden bir diğer hücreyi etkileme düzeyi iki hücre arasında belirlenen bağlantı kuvveti (ağırlık) ifade edilmektedir. Bağlantılar, yapay sinir ağı modelinin en kritik elemanlarından biridir çünkü mevcut problemle ilgili ağın eğitilmesi sırasında ağın problemin çözümü ile ilgili geliştirdiği yaklaşım temelde bu bağlantıların kuvvetleri üzerinde yaptığı ayarlamalarla olmaktadır (Bargash ve Santarisi, 2004).

Bir yapay sinir hücresine girdi sağlayan diğer bir yapay sinir hücresinin bu hücreye katkısının pozitif yönde olması durumu – yani iki hücre arasındaki bağlantının kuvveti (ağırlık) pozitif ise – harekete geçirme, bu katkının negatif olması durumu ise engelleme ya da çekingenlik olarak kabul edilmektedir (Freeman ve Skapura, 1991). Harekete geçiriciler ve engelleyiciler genellikle birlikte ele alınmakla beraber bazı durumlarda, yapay sinir hücresine gelen girdileri birleştirmek için, bu iki tip girdi arasında ayrım yapıldığı daha karmaşık kuralların uygulandığı da görülmektedir (Kröse ve Smagt, 1996).

(31)

Yapay sinir ağı modelleri bağlantıların şablonu ve verilerin yayılım şekline göre farklılık gösterebilmektedir. Temelde bu farklılık iki başlık altında ifade edilebilir:

 Verilerin sadece girdi hücrelerinden çıktı hücrelerine doğru olduğu yapay sinir ağları modellerine “ileri beslemeli (döngüsel olmayan) ağ” denilmektedir. Bu tip ağlarda yapay sinir hücrelerinin çıktıları ile girdileri arasında ilişkiyi sağlayan bağlantı bulunmamaktadır (Kröse ve Smagt, 1996; Pearlmutter, 1990). Bu tip ağlar genellikle girdiler ve çıktılar arasında doğrusal olmayan eşlemeler için tahminde bulunmada kullanılır (Hu ve Hwang, 2002). Algılayıcılar ve Adaptif Doğrusal Elemanlar (Adaline) bu tip ağlara örnek verilebilir.

 Yapay sinir hücrelerinin çıktıları ile girdileri arasında bağlantıların bulunduğu ağ modelleri “yinelenen (döngüsel) ağlar” olarak ifade edilmektedir (Kröse ve Smagt, 1996; Pearlmutter, 1990). Yinelenen ağlardaki geri besleme döngüsü bu ağların iç hafızaya sahip doğrusal olmayan bir dinamik sistem modeli olma özelliği olmasında başrol oynamaktadır (Hu ve Hwang, 2002). Anderson, Kohonen ve Hopfield ağları yinelenen ağ modellerine örnek olarak verilebilir.

(32)

2. YAPAY SĠNĠR AĞLARINDA ÖĞRENME

Klasik algoritmaların aksine, yapay sinir ağları için ilgilendikleri problemin çözümünün tanımlandığı temel ya da genel bir yapı bulunmamaktadır. Yapay sinir ağları örnekler üzerinde çalışarak çözümü öğrenmektedirler (Murray, 2003).

Bir yapay sinir ağı modelinde öğrenme, tasarlanan modelin çözüm aranan probleme uyum sağlaması süreci olarak ifade edilebilir. Memeli beyninin deneyimlerden öğrenmesine benzer bir şekilde, yapay sinir ağları ilgilenilen problemle ilgili geçmiş verilerle beslenerek problemin çözümünü öğrenir ve daha önce karşılaşmadığı benzer problemlere doğru cevaplar üretebilir.

Temelde öğrenme sürecini iki aşamada ele almak mümkündür (Tebo, 1994):

 Yapay sinir ağı modelinin probleme ilişkin geçmiş verilerle çalıştırılması ve çözümle ilgili yaklaşım geliştirmesinin sağlanması (öğrenme aşaması),

 Eğitilen yapay sinir ağının ürettiği sonuçların doğruluğunun ve de tutarlılığının test edilmesi (test etme aşaması).

Bir yapay sinir ağında öğrenme, ağın sinir hücreleri arasındaki bağlantı kuvvetlerini, probleme uygun çözümleri üretecek kombinasyona ulaştırması sürecidir (Barghash ve Santarisi, 2004). Yapay sinir ağı modeli tasarlandıktan sonra, problemle ilgili olarak ağı eğitmek ve de test etmek amacıyla problemin geçmiş verilerine ait birbirinden farklı iki grup oluşturulur. Eğitim ve test veri grubunun birbirinden tamamen farklı elemanlardan oluşturulmasının sebebi, eğitim sırasında kendini probleme adapte etmeye çalışan yapay sinir ağı modelini, o zamana kadar karşısına hiç çıkmamış koşullarla sınamak ve genelleme yapabilme yetkinliği konusunda daha sağlıklı bir kanaate varmaktır.

Yapay sinir ağı modeli ilk tasarlandığında yapay sinir hücrelerini birbirine bağlayan bağlantılara rassal kuvvetler atanmaktadır. Model, eğitim test grubu ile çalıştırılmaya başladığında veri kümelerine ilişkin sonuçlarla ilgili tahminlerde bulunur. Süreç

(33)

ilerledikçe ağ bağlantı kuvvetlerini her adımda iyileştirir ve eğitim, modelin çıktıların tutarlı olduğu düşünülen kararlı bir durum aldığı ana kadar devam ettirilir.

Kararlı bir hal aldığı düşünülen sistem için eğitim aşamasının tamamlandığı kabul edilir ve test aşamasına geçilir. Eğitime tabi tutulan ağ, daha önce karşılaşmadığı yeni verilerle çalıştırılır ve ürettiği sonuçların performansı değerlendirilir. Literatürde bir ağın performansını ölçmede kullanılan bir çok ölçüt vardır. Bunlara örnek olarak ortalama akış süresi, ortalama hedef model akış süresi, hedef oranı ve hata karelerinin toplamı verilebilir (Barghash ve Santarisi, 2004).

Bağlantı kuvvetlerinin adaptasyonu şeklinde ilerleyen eğitim süreci için şimdiye kadar geliştirilmiş bir çok algoritma bulunmaktadır. Ancak mevcut algoritmalar ağın eğitimi sırasında kullanılan veri kümesinin yapısına göre üç ana başlık altında bir araya getirilebilir:

 Gözetimli öğrenme

 Gözetimsiz öğrenme

 Karma öğrenme

2.1. Gözetimli Öğrenme

Gözetimli öğrenme, öğrenme yaklaşımları içerisinde en çok tercih edilen ve uygulanan öğrenme sürecidir. Yapay sinir ağının eğitilmesi amacıyla hazırlanan eğitim veri kümesinin, problemle ilgili geçmiş verilerle birlikte bu verilere ait çözümleri de içerdiği durum “Gözetimli Öğrenme” olarak adlandırılmaktadır. Bu öğrenme yaklaşımı, yapay sinir ağı modeline tahmini çözümlerini karşılaştırması amacıyla gerçek çözümlerin verilmesi yani, ağa her adımda beklenen çıktının etkin bir şekilde bildirilmesi temeline dayandığından gözetimli olarak tanımlanmaktadır (Murray, 2003).

Gözetimli öğrenmede eğitim süreci, yapay sinir ağı tarafından üretilen tahmini çözümlerin gerçek çözümler ile karşılaştırılması, sonuçlara ilişkin hata miktarının belirlenmesi ve modelin yapay sinir hücreleri arasındaki bağlantıların kuvvetlerini bu hatayı en küçükleyecek şekilde güncellemesi şeklinde gerçekleşmektedir. Geriye yayılım algoritması gözetimli öğrenme algoritmaları içinde en popüler olan

(34)

Gözetimli öğrenme algoritması kullanan bir yapay sinir ağı modelinde öğrenme süreci şu adımlarla ifade edilebilir (Freeman ve Skapura, 1991):

 Eğitim kümesinden bir girdi vektörünün ağa uygulanması ve bu girdilere ait çıktı değerlerinin üretilmesi.

 Ağın ürettiği çıktıların doğru çıktı değerleriyle karşılaştırılması ve hata büyüklüğünün belirlenmesi.

 Hatanın azaltılması için bağlantı kuvvetlerinde yapılacak iyileştirmelerin hangi yönde (+ veya -) olacağının belirlenmesi.

 Her bağlantı kuvvetinde gerçekleştirilecek değişiklik miktarının belirlenmesi.

 Ağırlıkların belirlenen değerler ve koşullar doğrultusunda güncellenmesi.

 Hata miktarının kabul edilebilir bir düzeye erişmesine kadar bu adımların tekrarlanması.

Geri yayılım algoritması, ağın ürettiği çıktının hata miktarını belirlemek için ağa ait bir performans fonksiyonu tanımlamaktadır. En yaygın kullanılan performans ölçütü üretilen çıktılar ile olması beklenen çıktılar arasındaki farkın kareleri toplamıdır. Fonksiyon, yi ağın ürettiği çıktı, di olması gereken çıktı olmak üzere şu şekilde gösterilebilir (Hamzaçebi ve Kutay, 2004):

m

(2.1) E = ∑(di – yi)2

k=1

En küçüklenmesi gereken hata miktarını belirleyen fonksiyondan yola çıkılarak yapay sinir hücreleri arasındaki bağlantıların kuvvetlerini çözüm yolunda iyileştiren Gradyan İniş ve Newton Metodu gibi çeşitli güncelleme – optimizasyon kuralı geliştirilmiştir (Hamzaçebi ve Kutay, 2004). Bu sayede fonksiyon, hatanın çıktı elemanlarından girdi elemanlarına doğru yayılımının sağlanması yoluyla küçüklenmeye çalışılan global bir maliyet fonksiyonu halini alır. Ağın toplam hatası, önceden belirlenen eşik değerinin altına indiğinde veya bu değeri yakaladığında ağın eğitilmiş olduğu kabul edilir (Tebo, 1994).

(35)

Gizli katmanındaki yapay sinir hücreleri ile çıktı katmandaki yapay sinir hücreleri arasındaki bağlantıların kuvvetlerinde her adımda meydana gelecek değişim miktarını belirlemek üzere delta kuralı uyarınca 2.2‟de verilen formül kullanılmaktadır (Kröse ve Smagt, 1996):

Δwij = - η ∂E (2.2)

∂wij

Formülde, η öğrenme oranını ifade etmektedir. Öğrenme oranı, eğitimin her adımında bağlantı kuvvetlerinde gerçekleşecek iyileştirmelerin büyüklüğünü gösteren 0 ile 1 arasında bir sayıdır ve kullanıcı tarafından belirlenir (ġahin, 2002).

Performans fonksiyonunun, E, yerine formülün yazılması ve matematiksel işlemlerin yapılması sonrasında ağırlıklarda yapılacak değişiklik miktarını hesaplayan formül 2.3‟te verilen hali alacaktır (ġahin, 2002; Hertz ve diğ., 1991).

(2.3) Δwij = η ∑(di - yi) . f’ (∑wij vj) . vj

2.3‟te verilen formülde 2.4‟te verilen değişiklik yapılacak olursa formül 2.5‟te verilen son halini almış olur (Arbib, 2003).

(2.4) δi = (di – yi) . f′ (∑wij vj) (2.5) Δwij = η ∑ δi vj

Benzer işlemler sonucunda, girdi hücreleri ile gizli hücreler arasındaki bağlantılar için formül 2.6‟daki gibi elde edilir.

(2.6) Δwjk = η ∑ δj xk (2.7) δj = f′(∑wjk xk) . ∑ wij δi

(36)

kontrol etmek üzere momentum sabiti (α) kullanılmaktadır (Veelenturf, 1995). Bu sayede, ağırlıklarda daha önce yapılan değişmelerin etkileri ileriki iyileştirmelere aktarılmış olur. Momentum sabitinin eklenmesi ile birlikte ağırlıklarda yapılacak iyileştirme miktarı için kullanılan formül 2.8‟deki hali alır (ġahin, 2002).

Δw(n+1) = - η ∂E + α Δw(n) (2.8)

∂w

Gözetimli öğrenme algoritmasının uygulamasında karar verilmesi gereken en önemli konulardan biri algoritmanın kullanılacağı parametreler olan öğrenme oranı (η) ve momentum sabitinin (α) büyüklükleridir. 0 ile 1 arasında değerler alan iki sabitin de gereğinden büyük ya da küçük seçilmesi çeşitli sakıncalar doğurmaktadır (Hu ve Hwang, 2002).

Öğrenme sabitinin çok küçük seçilmesi öğrenme sürecinin daha etkin şekilde gerçekleşmesini sağlayacaktır (ġahin, 2002; Leu ve diğ., 2001). Bununla birlikte gerçekleştirilmesi gereken iterasyon sayısını arttıracağından sürecin çok yavaşlamasına ve başarıya ulaşımın gecikmesine sebep olacaktır. Öğrenme oranının genel olarak 0,05 ile 0,25 aralığından seçilmesi tavsiye edilmektedir (Freeman ve Skapura, 1991). Bazı kaynaklarda bu değerin 0,01‟den küçük seçilmesi de önerilmektedir (Arbib, 2003). Bir diğer yaklaşım, öğrenme oranının süreç boyunca giderek azalan değerlerle kullanılması yönündedir (Veelenturf, 1995).

Momentum sabiti ağırlıklar üzerinde yapılacak olan iyileştirme düzeyini daha etkin bir hale getirmek için kullanılmaktadır. Momentum sabiti kullanımı kullanıcının tercihine bağlı olmakla birlikte kullanılması halinde ardışık iyileştirme vektörlerinin aynı doğrultuda sistemi güncellediği durumda etkin adım büyüklüğünü arttırıcı, ardışık vektörlerin zigzaglar çizdiği durumda da toplam hata miktarını azaltıcı yönde etki yapacaktır. Bu sebeple çözüme ulaşılması sürecini hızlandırıcı bir katkı sağlayacaktır. Genel olarak momentum sabitinin 0,6 ile 0,9 arasında bir değer olarak belirlenmesi önerilmektedir (Hu ve Hwang, 2002).

Algılayıcılar, Adaptif Doğrusal Elemanlar (ADALINE), Çoklu Adaptif Doğrusal Elemanlar (MADALINE), Hopfield ağları ve Çağrışımlı Bellek Makineleri gözetimli öğrenme algoritmaları ile eğitilen ağlara örnek olarak verilebilir (Murray, 2003).

(37)

2.2. Gözetimsiz Öğrenme

Gözetimli öğrenme algoritmalarına benzer şekilde geçmiş verilerle ağın çalıştırılması şeklinde gerçekleştirilen gözetimsiz öğrenmenin en önemli farkı, eğitim sırasında ağ tarafından üretilen tahmini çözümlerin karşılaştırılabileceği gerçek çözümlerin mevcut olmamasıdır. Bu tip algoritmalarda, yapay sinir ağı modeli istatistiksel olarak girdilerin belirgin özelliklerini keşfetmeye ve bunlarda meydana gelen değişikliklere göre kendi cevap mekanizmasını iyileştirmeye çalışmaktadır (Kröse ve Smagt, 1996).

Gözetimsiz öğrenme için geliştirilmiş çeşitli hata tanımları bulunmaktadır. Bu tanımlar içerisinde en çok rağbet göreni eğitim sırasında kullanılan veri grubu ile bu grubu temsil eden ağırlık vektörünün arasındaki fark hata göstergesi olarak kabul edilebilmektedir (ġahin, 2002).

Gözetimsiz yapay sinir ağlarında, bağlantı ağırlıklarının amaca yönelik iyileştirilmesi için toplamlı ve çıkarımlı olmak üzere iki farklı yöntem kullanılabilir. Toplamlı yöntem, girdi vektörünün belirli bir oranının ağırlık vektörüne eklenmesi ve elde edilen bütünün toplam birim uzunluğa oranlanmasıyla normalize edilmesi yöntemidir. Çıkarımlı yöntemde ise, ağırlık vektörü ile veri vektörü arasındaki farkın belirli bir oranı ağırlık vektörüne eklenerek iyileştirme yapılır (ġahin, 2002). Toplamlı yönteme ilişkin formül 2.9‟da, çıkarımlı yönteme ilişkin formül 2.10‟da verilmiştir. wt+1 = w t + ηx (2.9) IIwt + ηxII wt+1 = wt + η(x – wt) (2.10)

Kohonen ağları ve Özdüzenlemeli ağlar gözetimsiz öğrenme algoritmaları ile eğitilen ağlara örnek olarak verilebilir (Veelenturf, 1995). Bu tip öğrenme algoritmaları genellikle veri ve kümeleme analizleri gibi istatistiksel analizlerin yapılmasını gerektiren durumlarda tercih edilir.

(38)

2.3. Karma Öğrenme

Bu tip öğrenme, eğitim veri kümesi ile ilgili gerçek çözümler ağa sağlanamadığı için gözetimsiz öğrenme özelliği taşımakta iken; yapay sinir ağı modelinin ürettiği çözümler ile ilgili olarak “iyi” ya da “kötü” şeklinde genel bir yaklaşıma sahip olunması bakımından gözetimli öğrenme olarak sınıflandırılabilir (ġahin, 2002). Her iki öğrenme yapısının özelliklerini taşıdığından bu tür öğrenme karma öğrenme olarak adlandırılmaktadır.

(39)

3. YAPAY SĠNĠR AĞI ÇEġĠTLERĠ

Literatürde karşılaşılabilecek bir çok farklı yapay sinir ağı modeli bulunmaktadır. Bu modellerin her biri ele aldıkları değişik türde problemlere tatmin edici çözümler üretmek üzere tasarlanmışlardır. Her ne kadar ele alınan problemlerin yapıları oldukça farklılık gösterse de bu problemlere çözüm üretecek ağ modelleri için genel bir sınıflandırma yapmak mümkün olabilmektedir.

Mevcut yapay sinir ağlarının birbirinden farklılıklarının ortaya konulabileceği çok temel iki etmen bulunmaktadır (Arbib, 2003) :

 Yapay sinir ağları problemde kullanılan verilerin yapısına göre kesikli (kategorik) girdilerle çalışan yapay sinir ağları ve sürekli (nicel) girdilerle çalışan yapay sinir ağları olarak iki başlık altında ele alınmaktadırlar. Kesikli ya da kategorik olarak adlandırılan değişkenler sonlu sayıda nitel veya sembolik değer alabilen değişkenlerdir ve belirli yöntemle sayısallaştırılarak ağa girişleri sağlanır. Sürekli veya nicel değişkenler ise kendiliğinden sayısal olarak ifade edilen ağırlık, uzunluk, büyüklük gibi ölçüm ifadeleridir.

 Modelde kullanılan öğrenme yaklaşımına göre gözetimli öğrenme algoritması kullanan yapay sinir ağları ve gözetimsiz öğrenme algoritması kullanan yapay sinir ağları olarak ele alınmaktadırlar.

Bu bağlamda yapay sinir ağları için Şekil 3.1‟de gösterildiği gibi bir sınıflandırma yapmak mümkündür.