• Sonuç bulunamadı

3.8. Veri Madenciliği Modelleri

3.8.1. Tahmin edici modeller

3.8.1.2. Yapay sinir ağları

Yapay sinir ağları biyolojik sinir ağlarından esinlenerek geliştirilmiş bir bilgi işleme sistemidir. Yapay sinir ağlarının geçmişi 1942 yılına kadar gitmektedir. 1942 yılında McCulloch ve Pitts ilk hücre modelini geliştirmiştir o nedenle yapay sinir ağlarının başlangıcı kabul edilmektedir. 1949 yılında Hebb tarafından hücre bağlantılarını ayarlamak için ilk öğrenme kuralı önerilmiştir. 1958 yılında ise Rosenblatt, algılayıcı modeli ve öğrenme kuralını geliştirerek, bugün kullanılan kuralların temelini ortaya koymuştur. 1969 yılında Minsky ve Papert algılayıcının kesin analizini yaptı ve algılayıcının karmaşık lojik fonksiyonlar için kullanılamayacağını ispatladılar. 1982-1984 yılında kohonen kendi kendini düzenleyen haritayı (SOM) tanımladı. Kendi adıyla anılan denetimsiz öğrenen bir ağ geliştirdi. 1986 yılında

Rumelhart geriye yayılımı tekrar ortaya çıkarttı. 1988 yılında Chua ve Yang hücresel sinir ağlarını geliştirdiler.

Sinir ağları iki ya da üç katmandan oluşmaktadırlar. Bu katmanlar girdi, gizli ve çıktı katmanları olarak adlandırılmaktadır. İki katmanlı sinir ağlarından gizli katman yer almamaktadır. Şekil 3.5.’te üç katmanlı sinir ağı örneği gösterilmektedir (Şekeroğlu, 2010).

Şekil 3.5. 3 Katlı sinir ağı örneği

Şekil 3.5.’te görüldüğü üzere ilk katman girdi katmanıdır. Giren her bir verinin 0 ile 1 arasında olması zorunludur. Gizli katman daha önce de belirtildiği üzere tüm sinir ağlarında bulunmak zorunda değildir. Gizli katman, daha fazla örüntünün tanınmasını mümkün kılmasından dolayı ağı daha güçlü kılmaktadır. Genellikle tek bir gizli katman yeterli olmaktadır. Son katman çıktı katmanıdır. Birden fazla çıktı katmanı olabilir fakat çoğunlukla sinir ağları tek bir değer hesaplamaktadır. Bu değer 0 ile 1 arasında yer almaktadır. Eğer gizli katmanı var ise tüm girdiler gizli katmanlara bağlanmaktadır, yok ise çıktı katmanına bağlanmaktadır. Gizli katmanından ise girdilerin tamamı çıktı katmanına bağlanmaktadır. Gizli katmanın aktif hale gelebilmesi için fonksiyonun değerinin belirli bir eşiğin üzerinde olması gerekmektedir. Yapay sinir ağları, sınıflandırma, öngörü ve kümeleme modellerinde doğrudan uygulanabilen çok güçlü bir yöntemdir. Mali serilerin tahmininden sağlık durumlarının teşhisine, değerli müşterilerin belirlenmesinden kredi kartı sahtekârlıklarının tespitine, el yazısı formlarının değerlendirilmesinden makine arızalanma oranının öngörülmesine kadar birçok alanda uygulanmaktadır. Yapay sinir ağları tıpkı insanların yaptığı deneyimlerden bilgi çıkarma işlemini yapmaktadır. Yapay sinir ağları da kendilerine

verilen örneklerden bir takım bilgiler çıkarmaktadır. Öncelikle bir veri kümesi üzerinde öğrenme algoritmaları çalıştırılarak eğitilir. Bu eğitim sonucunda yapay sinir ağının içerisinde bir takım ağırlıklar belirlenir. Bu ağırlıklar kullanılarak yeni gelen veriler üzerine işlenir ve aşamalar sonucunda bir sonuç elde edilir. Yapay sinir ağlarının en olumsuz tarafı ise bu ağırlıkların neden ilgili değerleri aldıklarının bilinmemesidir. Çıkan sonucun nedenleri açıklanamamaktadır. Açıklanamaması kullanım alanını daraltmaktadır.

Yapay sinir ağlarını kullanmak için en iyi yaklaşım, onları içi bilinmeyen bir şekilde çalışan kara kutular olarak düşünmek olacaktır (Göral, 2007). Örneğin müşterinin riskli müşteri grubunda olduğu sonucu elde edilmiş olsun. Müşterinin neden riskli olduğunu açıklamaz ve bu durumda bankacıları zor durumda bırakabilir. Elde edilen sonuçların en iyisi olduğuna dair bir garanti yoktur. Yapay sinir ağlarının veri madenciliğinde kullanılması çok fazla miktarda avantaj sağlamaktadır. Yapay sinir ağları kullanımı sayesinde çok geniş yelpazedeki problemlerin çözümü sağlanabilmektedir. Öğrenme işlevi sayesinde çok karmaşık durumlarda dahi çok iyi sonuçlar üretmektedir. Hem sayısal hem de kategorik veriler üzerinde de işlem yapabilmektedir. Bütün bu avantajlarına rağmen dezavantajları da mevcuttur. Girdi verilerinin 1 ile 0 arasında olması gereklidir ve bunu sağlamak için verilerde dönüşüm işlemi yapılması gerekmektedir. Bu durum zaman kaybına yol açmaktadır (Şekeroğlu, 2010).

3.8.1.2.1 Self organizing map sinir ağları

Kümeleme çalışmalarında, klasik istatistiksel yöntemler yerine yapay sinir ağları kullanılabilir. Yapay sinir ağları, veriler için dağılım varsayımlarına gerek duymaz. Bir veri setindeki eleman ve değişken sayısının çok fazla olması sinir ağları için bir zorluk oluşturmaz. Kümeleme çalışmalarında en çok kullanılan yapay sinir ağları SOM sinir ağlarıdır (Kohonen, 2001). Bu ağlar, 1982 yılında Teuvo Kohonen tarafından geliştirilmiştir. Bu sebeple, bu ağlar kohonen SOM ağları olarak da bilinir. SOM ağları, klasik istatistikteki k-ortalamalar ile çok boyutlu ölçekleme yöntemlerinin her ikisinin de işlevlerini yerine getirebilir. Yani, veri setindeki elemanları hem kümelendirir hem de haritalandırır. Bu sebeple, bu ağlar son yıllarda oldukça popüler olmuştur. SOM ağları, tek katmanlı bir ağ olup giriş ve çıkış nöronlarından oluşur. Giriş nöronlarının

sayısını veri setindeki değişken sayısı belirler. Çıkış nöronlarının her biri bir kümeyi temsil eder. Şekil 3.6.’da bir SOM ağı görülmektedir. Diğer yapay sinir ağlarından farklı olarak, çıkış katmanındaki nöronların dizilimi çok önemlidir. Bu dizilim doğrusal, dikdörtgensel, altıgen veya küp şeklinde olabilir. En çok dikdörtgensel ve altıgen şeklindeki dizilimler tercih edilmektedir. Pratikte, çoğu kez dikdörtgensel dizilim karesel dizilim olarak uygulanır. Buradaki dizilim topolojik komşuluk açısından önemlidir. Aslında, çıkış nöronları arasında doğrudan bir bağlantı yoktur. Giriş nöronları ile her bir çıkış nöronu arasındaki bağlantıyı referans vektörleri gösterir. Bu vektörler bir katsayılar matrisinin sütunları olarak da düşünülebilir. SOM sinir ağları eğitilirken bu topolojik komşuluk referans vektörlerinin yenilenmesinde kullanılır Zontul ve ark. (2004).

Şekil 3.6. Kohonen SOM sinir ağı

Benzer Belgeler