• Sonuç bulunamadı

5. YAPAY SİNİR AĞLARI VE TAHMİN

5.5. Yapay Sinir Ağları

5.5.3. Biyolojik ve Yapay Sinir Ağı Sistemleri

İnsan sinir sistemi, Şekil 5.3'de gösterildiği gibi alıcılar (receptors), beyin ve tepki sinirleri (effectors) olmak üzere üç parçada incelenebilir. Alıcı (örneğin, retina üzerindeki fotonlar) çevreden bilgileri toplama görevi görmekte tepki sinirleri ise çevre ile etkileşimi meydana getirmektedir. Şekil 5.3'deki oklar bilgi veya aktivasyon akışını göstermektedir.

Şekil 5.3. Sinir sistemi

İnsan beyninin ve YSA'nın temel yapı taşı sinir hücreleridir. İnsan sinir hücresi Şekil 5.4.'de görülmektedir. Sağlıklı bir insan beyni yaklaşık olarak birbirine bağlı 1011

sinir hücresinden oluşarak beynin muazzam paralel işlem yeteneğini sağlamaktadır. Birbiriyle bağlantılı iki nöronun; akson, dendrit, sinaps ve hücre gövdesi (soma) olmak üzere dört önemli bölümü bulunmaktadır.

Dendrit: Nöronun ağaç köküne benzeyen, görevi hücreye girdilerin sağlanması olan

uzantılardır.

Şekil 5.4. İnsan sinir hücresi [271].

80

Hücre Gövdesi (Soma) : Bir nöronun gövdesine soma adı verilmektedir. Soma nucleus

adı verilen hücre çekirdeğini içermektedir. Soma, hücrenin yaşamasını sağlayan işlevleri görmektedir. Sinapslar aracılığıyla dendritlere geçirilen iletiler birleşerek akson üzerinde elektriksel bir çıktı oluştururlar. Bu çıktının olup olmayacağı veya çıktının elektriksel olarak yoğunluğu, sinapsların etkileri sonucu hücreye gelen tüm girdilerin, toplam değeri tarafından belirlenmektedir. Somaya gelen girdilerin ağırlıklı toplamı akson üzerinde çıktı oluşturacak değere ulaştığında, bu değere "eşik değer" adı verilmektedir. Bu şekilde girdiler nöron tarafından değerlendirilerek çıktıya dönüştürülmüş olmaktadır.

Akson: Hücrenin hücre çıktısını göndermeye yarayan uzantısı akson olarak

tanımlanmaktadır. Bir hücrenin tek bir akson uzantısı bulunur. Ancak bu akson uzantıdan çıkan çok sayıda uzantı ve bunların ucunda sinaptik bağlantılar bulunmaktadır.

Sinaps: Sinapslar, sinir hücrelerindeki aksonların, diğer sinir hücreleri ve/veya onların

dendritleri üzerinde sonlanan özelleşmiş bağlantı noktalarıdır. Bu bağlantı noktalarının görevi aksondaki elektriksel iletisinin, diğer hücrelere aktarılmasıdır. Bu bağlantı noktalarında iletiler elektro-kimyasal süreçlerle diğer hücrelere geçirilmektedir. Sinapslar bağlandıkları dendritde veya nöronda bölgesel olarak elektrik kuvvetini pozitif veya negatif yönde etkileyebilme yeteneğine sahiptirler. Böylelikle bir nöronun diğerini etkileyebilmesi söz konusu olmaktadır. Bir biyolojik sinir hücresinin çalışması, diğer sinir hücrelerinden gelen uyarıları (elektriksel sinyaller) sinapsları üzerinden dendritlerine alması ile başlamaktadır. Bu sırada gelen sinyaller sinapslar tarafından güçlendirilir ya da zayıflatılırlar. Dendritler sinyalleri hücre gövdesine iletirler. Hücre gövdesi gelen sinyalleri birbirlerini kuvvetlendirme ve zayıflatma etkilerine göre işlemektedir. Eğer sonuçta sinyaller birbirlerini yeteri kadar kuvvetlendirerek bir eşik değerini aşabilirlerse, aksona sinyal gönderilir ve sinir aktif hale getirilmektedir. Aksi halde, aksona sinyal gönderilmez ve sinir pasif durumda kalmaktadır [272].

Yapay Sinir Hücresi (YSH), insan sinir hücresini taklit etmeye yönelik bir girişimin sonucudur. Yapay sinir ağları, biyolojik sinir ağları gibi yapay sinir hücrelerinin veya işlem elemanlarının bir araya gelmesinden oluşmaktadır. Biyolojik sinir sistemi ile yapay sinir ağlarının benzerlikleri Tablo 5.1’de görülmektedir.

Tıpkı biyolojik sinir hücresi gibi, yapay sinir ağlarında, işlem elemanına birden fazla giriş gelmekte ve sadece bir çıkış üretilmektedir. Girişler, dendritlere benzer şekilde diğer yapay hücrelerden bağlantılar vasıtasıyla işlem elemanına bilgilerin gelmesini sağlamaktadır.

81

Tablo 5.1. Bir sinir sistemi ile YSA’nın benzerlikleri [272].

Biyolojik Sinir Sitemi Yapay Sinir Ağı sistemi

Sinir Yapay sinir (İşlem elemanı)

Sinaps Ağırlık

Dendrit Toplama fonksiyonu

Hücre Gövdesi Transfer fonksiyonu

Aksonlar Eleman çıkışı

Bazı durumlarda bir işlem elemanı kendisine de bilgi geri gönderebilmektedir. Bahsedilen bu bilgiler elemanlar arasında bulunan bağlantı hatları üzerinde depolanmaktadır. Her bağlantının bir ağırlığı vardır. Bu ağırlık bir işlem elemanının diğeri üzerindeki etkisini göstermektedir. Ağırlık büyüdükçe etki de büyümektedir

Yapay sinir sisteminde her işlem elemanı Şekil 5.5’de görüldüğü gibi beş parçadan oluşmaktadır. Bunlar; girişler, ağırlıklar, toplama fonksiyonu, aktivasyon fonksiyonu ve çıkıştır. Ağırlığın sıfır olması hiçbir etkisinin olmadığı, negatif olması ise etkinin ters yönde olduğu anlamındadır. Bu ağırlıklar sabit olabildikleri gibi değişkende olabilmektedirler. Toplama fonksiyonu, bir işlem elemanına gelen net girişi hesaplayan bir fonksiyondur. Net giriş genellikle gelen bilgilerin ilgili bağlantıların ağırlıkları ile çarpılıp toplanması ile belirlenir. Bu nedenle adı toplama fonksiyonu olarak verilmiştir. Aktivasyon fonksiyonu da toplama fonksiyonu tarafından belirlenen net girişi alarak, işlem elemanının çıkışını belirleyen fonksiyondur. Genel olarak türevi alınabilen bir fonksiyon olması tercih edilmektedir [273].

Şekil 5.5. Yapay sinir hücresinin modeli [273].

v Wm W3 W2 W1 Σ b Xo X1 X2 X3 Xm F(.) Xİ = Girişler Wi = Ağırlıklar Σ = Toplama Fonksiyonu F = Aktivasyon Fonksiyonu V = Çıkış

82

Şekil 5.5’de görüldüğü üzere her bir xi girdisi kendisine karşılık gelen wi ağırlık katsayısı ile çarpılır, tüm bu çarpımlar toplanır ve bir transfer (aktivasyon) fonksiyonundan geçirilerek bir çıktı üretilmektedir. McCullogh ve Pitts (1943) tarafından tasarlanan ilk yapay sinir hücresinin matematik ifadesi,

 

        

j i n j ij i f g x f w x Q y 0 ; xi

x1,x2,...,xn

R (5.3) şeklinde verilmektedir. Burada yi çıktı değerini, f (.) transfer fonksiyonunu, g (.) toplama fonksiyonunu, w

ij bağlantı ağırlıklarını ve Qi ise i nolu sinir hücresi için eşik değerini ifade etmektedir. Transfer fonksiyonu olarak aşağıdaki birim adım fonksiyonu kullanılmıştır.

         0 (.) ; 0 0 (.) ; 1 (.) g g f (5.4)

Literatürde en çok kullanılan transfer fonksiyonları adım, eşik, sigmoid ve hiperbolik tanjant fonksiyonlarıdır. Bu fonksiyonlar Şekil 5.6’da gösterilmiştir.

Şekil 5. 6. En çok kullanılan transfer fonksiyonları, a: lineer fonksiyon, b: rampa fonksiyonu, c: basamak fonksiyonu, d: sigmoid fonksiyonu, e: tanjant hiperbolik [274].

83

YSA, yapay sinir hücrelerinin gruplanması ile oluşmuş sistemin adıdır. Bu gruplandırma katmanları oluşturmaktadır. Dolayısıyla YSA’da birbirine bağlı katmanlardan meydana gelmektedir. Şekil 5.7, bir YSA yapısını göstermektedir. Bu yapıda da görüleceği üzere YSA'lar, gerçek dünyadan verileri alan nöronların bulunduğu girdi katmanından, ağın sonuçlarını dışarıya veren nöronların oluşturduğu çıktı katmanından ve bu iki katman arasındaki bir veya daha fazla gizli katmandan oluşmaktadır. Şekil 5.7’de tek yönlü ağların olduğu, bir katmandaki bilgilerin sadece bir sonraki katmana geçtiği ve yine bir katmandaki işlem elemanlarının bir sonraki katmana tamamen bağlandığı bir ağ yapısı gösterilmiştir. Çok bilinen geriye yayılım ağı (ileri beslemeli, katmanlı ağ) modeli bu tür yapıya örnek olarak verilebilir [265].

Şekil 5.7. YSA’ların genel yapısı [275].

Eğiticili öğrenme kullanılarak eğitilen ileri beslemeli ağda, girişe bir giriş vektörü uygulanmakta ve çıkıştan bir çıkış vektörü elde edilmektedir. Amaç her giriş vektörü için, ağın üreteceği cevabın istenilen çıkış vektörünün aynısı veya yeterince yakın değerlerde olmasını sağlayacak şekilde, ağırlık vektörleri oluşturmaktır. Yakın zamana kadar ileri beslemeli ağlar, eğitim algoritmalarının biyolojik sistemlere uygun olmamasına rağmen, son zamanlarda geliştirilen öğrenme algoritmalarıyla yaygın bir şekilde kullanımı sağlanmıştır.

İleri beslemeli ağın çıkışını elde etmek için, ileri yönde (girişten çıkışa) hesaplamalar yapılır. j. düğümün net girişi uj, girişlerin bir lineer fonksiyonudur ve wji ağırlıklarıyla birlikte,

84 j i i ji j b w x u   (5.5)

şeklinde ifade edilir. Net girişin lineer olmayan fonksiyonu olan vj,

j u j u j e 1 e - 1 v    (5.6)

ile ifade edilir. Ara katman çıkışı vj ile çıkış düğümü arasındaki ilişki doğrusaldır. Ağ çıkışı, y vw q j 2 j j    (5.7)

şeklinde elde edilir. Giriş değerlerinin polarlama ağırlığı ile birleştirilmesi, öğrenmeyi kolaylaştırmaktadır. Başlangıçta tüm ağırlıklara küçük rasgele değerler atanmaktadır. Bu ağın simetrisini bozmakta ve ağırlıkların büyük değerlerle dolmuş hale gelmesini engellemektedir. Giriş tabakasına x1, x2 ... xn giriş vektörü uygulanmakta ve (5.5) - (5.7) eşitlikleri ile ağ çıkışları y1, y2 ... ym hesaplanmaktadır (aktivasyon fonksiyonu olarak sigmoid fonksiyonu kullanıldığı kabul edilmiştir).

Katmanların boyutu hakkında genelleme yaparak bir değer vermek mümkün değildir. Giriş ve çıkış katmanlarının boyutu uygulamaya göre tespit edilmektedir. Ancak ara katmanın boyutu belirsiz olmakla birlikte genellikle giriş katmanından daha büyük olmalıdır. Eğer ara katmandaki hücre sayısı az seçilirse, giriş değerleri arasından gerekli özellikleri tanımlamayabilir. Gereğinden fazla olması halinde ise, genelleme ve soyutlama hatasına düşebilir. Ortaya çıkan bu sorunun en iyi çözümü ortalama bir değer alınmasıdır [265].