• Sonuç bulunamadı

ANKARA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ DOKTORA TEZİ DİSMORFİK HASTALIKLARIN SİNYAL İŞLEME YÖNTEMLERİ KULLANILARAK SINIFLANDIRILMASI Z. Merve ERKINAY ELEKTRONİK MÜHENDİSLİĞİ ANABİLİM DALI ANKARA 2012 Her hakkı saklıdır

N/A
N/A
Protected

Academic year: 2022

Share "ANKARA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ DOKTORA TEZİ DİSMORFİK HASTALIKLARIN SİNYAL İŞLEME YÖNTEMLERİ KULLANILARAK SINIFLANDIRILMASI Z. Merve ERKINAY ELEKTRONİK MÜHENDİSLİĞİ ANABİLİM DALI ANKARA 2012 Her hakkı saklıdır"

Copied!
110
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

DOKTORA TEZİ

DİSMORFİK HASTALIKLARIN SİNYAL İŞLEME YÖNTEMLERİ KULLANILARAK SINIFLANDIRILMASI

Z. Merve ERKINAY

ELEKTRONİK MÜHENDİSLİĞİ ANABİLİM DALI

ANKARA 2012

Her hakkı saklıdır 

(2)

DİSMORFİK HASTALIKLARIN SİNYAL İŞLEME YÖNTEMLERİ KULLANILARAK SINIFLANDIRILMASI

Z. Merve ERKINAY Ankara Üniversitesi Fen Bilimleri Enstitüsü

Elektronik Mühendisliği Anabilim Dalı Danışman: Doç. Dr. Ziya TELATAR

Dismorfik hastalıklar yüzde ve vücutta kendine özgü, ayırt edici fiziksel bozukluklara sebep olmaktadır. Dismorfik hastalıkların ön tanısı hekimler tarafından, hastaların sahip oldukları fiziksel bozukluklara bakılarak yapılmaktadır. Bu işlem bir hayli zaman almakta ve tanı başarısı tecrübeye bağlı olarak hekimden hekime değişiklik göstermektedir. Bu çalışmada dismorfik hastalıkların tanısında, tecrübeden bağımsız ve kısa sürede sonuca ulaşılmasını sağlayan bir sistem geliştirilmiştir. Sendromların yüzde sebep oldukları dismorfik bozukluklar dikkate alınarak elde edilen ayırt edici öznitelikler, Frajil X, Hurler, Prader-Willi, Down, Wolf Hirschhorn sendromlarının ve sağlıklı grubun tanısı ve sınıflandırılması için kullanılmıştır. Bu amaç için, öncelikle yüz görüntülerinden oluşan görüntü veri tabanındaki görüntülere önişlemler uygulanmıştır. Görüntü üzerinde, sendrom tiplerinin yüz üzerinde sebep olduğu dismorfik bozukluklar dikkate alınarak referans noktaları belirlenip işaretlenmiş, bu noktalar arasındaki mesafelerin birbirine oranı alınarak öznitelikler elde edilmiştir. Tanı ve sınıflandırma için, farklı Yapay Sinir Ağı (YSA) mimarileri, bu çalışma için geliştirilmiş YSA tabanlı Hiyerarşik Karar Ağacı yöntemi ve k En Yakın Komşu (kNN) yöntemleri kullanılarak bu yöntemlerin performansları karşılaştırılmıştır. Çalışma kapsamında sınıflandırıcı sistemlerinin testi için kullanılan görüntüler, sistemi test etmek için farklı iki uzman hekime gösterilmiş, sonuçlar karşılaştırılmıştır.

Bu doktora tez çalışmasında farklı sendrom tiplerini, hastanın yaşından, cinsiyetinden ve ırkından bağımsız bir şekilde sınıflandıran bir sistem geliştirilmiştir. Elde edilen sonuçlar sistemin dismorfik hastalıkların ön tanısında hekimlere yardımcı bir sistem olarak kullanılabileceğini göstermiştir.

Kasım 2012, 99 sayfa

Anahtar Kelimeler: Dismorfik hastalık, sınıflandırma, yapay sinir ağları, hiyerarşik karar ağacı, k en yakın komşu, ön tanı

(3)

CLASSIFICATION OF DYSMORPHIC SYNDROMES USING SIGNAL PROCESSING METHODS

Z. Merve ERKINAY Ankara University

Graduate School of Natural and Applied Sciences Department of Electronics Engineering

Supervisor: Assoc. Prof. Dr. Ziya TELATAR

Dysmorphic syndromes cause distinctive malformations both on the body and face.

Clinical experts diagnose the dysmorphic syndromes considering patients' physical malformations. This process takes long time and the diagnosis accuracy depends on clinical experts' experience and expertise. In this study, an efficient system is developed to recognize dysmorphic syndromes independent of experience. The system which reduces diagnosis time can be used for prediagnosis of the dysmorphic syndromes by clinical experts malformations and distinctive features on the faces of patients are used for recognition and classification of Fragile X, Hurler, Prader-Willi, Down, Wolf Hirschhorn syndromes and healthy group. Firstly, several preprocessing methods are implemented on the images. The reference points that are marked on the face images and ratios between certain feature points are taken into the consideration for the feature extraction. Classification processes are implemented with different artificial neural network (ANN) topologies, neural network based hierarchical decision tree method and k nearest neighbor (kNN) algorithm. The classification accuracies of these methods are compared. The same images are also shown to two clinical experts for their evaluations.

In this Ph.D dissertation, an efficient system is developed to recognize different syndrome types, which is independent from the patient's age, sex and race with high accuracy. This study shows that this approach can be used for prediagnosis of dysmorphic syndromes.

November 2012, 99 pages

Key Words: Dysmorphic syndrome, classification, artificial neural networks, hierarchical decision tree, k nearest neighbor, prediagnosis.

(4)

Çalışmanın birçok aşamasında bilgi, öneri ve yönlendirmeleriyle tezin bu aşamaya gelmesinde katkıda bulunan, akademik alanda gelişmemde yadsınamayacak katkılar sağlayan danışman hocam Sayın Doç. Dr. Ziya TELATAR'a (Ankara Üniversitesi, Mühendislik Fakültesi) ve eş danışman hocam Sayın Prof. Dr. Osman EROĞUL'a (GATA, Biyomedikal Mühendisliği Merkezi),

Tez konusunun belirlenmesinde ve planlanmasında yönlendirici olan Sayın Prof. Dr.

Yusuf TUNCA'ya (GATA, Medikal Genetik Bölümü),

Tez çalışması süresince yaptıkları değerli yorum ve katkılarla çalışmanın olgunlaşmasını sağlayan Tez İzleme Komitesi üyesi hocalarım, Sayın Doç. Dr. Bülent YILMAZ'a (Abdullah Gül Üniversitesi, Mühendislik ve Doğa Bilimleri Fakültesi) ve Sayın Yrd. Doç. Dr. Murat H. SAZLI'ya (Ankara Üniversitesi, Mühendislik Fakültesi),

Sayın Yrd. Doç. Dr. Murat H. SAZLI hocama, ayrıca tez çalışması sırasında sınıflandırma başarının arttırılması amacıyla her bir sendrom için farklı sınıflandırıcıların kullanılması önerisinden dolayı,

Çalışmaya katkılarından dolayı Sayın Prof. Dr. Davut GÜL'e (GATA, Tıbbi Genetik Bilim Dalı), Sayın Doç Dr. Sebahattin VURUCU'ya (GATA, Çocuk Nörolojisi Bilim Dalı),

Katkılarından dolayı değerli arkadaşım Arş. Gör. Deniz KARAÇOR'a (Ankara Üniversitesi, Mühendislik Fakültesi),

Bu süreçte manevi destekleriyle yanımda olan Sayın Ahmet ÖZDEMİR ve ailesine,

Bugüne kadar gösterdikleri eşsiz sevgi, destek, fedakarlık ve hoşgörü nedeniyle çok değerli annem babam Nevin - Mehmet ERKINAY’a ve kardeşim Yüksek Mimar Peyman Umre ERKINAY’a sonsuz teşekkürlerimi sunarım.

Merve ERKINAY Ankara, Kasım 2012

(5)

ÖZET... i

ABSTRACT... ii

TEŞEKKÜR... iii

SİMGELER DİZİNİ... vii

ŞEKİLLER DİZİNİ... vii

ÇİZELGELER DİZİNİ... ix

1. GİRİŞ... 1

1.1 Tanım ve Amaç... 1

1.2 Tezin Kapsamı ve Özgünlüğü... 4

2. KURAMSAL TEMELLER... 6

2.1 Dismorfik sendromlar... 6

2.1.1 Frajil X sendromu... 6

2.1.2 Hurler sendromu... 8

2.1.3 Prader Willi sendromu... 9

2.1.4. Wolf Hirschhorn sendromu... 10

2.1.5 Down sendromu... 11

2.2 Örüntü Tanıma... 12

2.2.1 Ön işleme... 14

2.2.2 Öznitelik çıkarma... 14

2.2.3 Sınıflandırma... 16

2.3 Otomatik Öznitelik Çıkarma Yöntemleri... 18

2.3.1 Gabor dalgacık dönüşümü... 18

2.3.2 Ölçekten bağımsız öznitelik dönüşümü (Scale Invariant Feature Transform SIFT)... 19

2.4 Sınıflandırma Yöntemleri... 21

2.4.1 Yapay sinir ağları (YSA)... 21

2.4.1.1 Aktivasyon fonksiyonları... 24

2.4.1.2 Çok katmanlı ileri beslemeli YSA... 24

2.4.1.3 Geri yayılım algoritması... 26

2.4.2 Olasılıksal yapay sinir ağları... 30

(6)

2.5 Sınıflandırıcının Performans Ölçümü... 36

2.6 k- Defa Çapraz Doğrulama... 38

3. MATERYAL VE YÖNTEM... 39

3.1 Hastalar ve Görüntü Veri Tabanı... 40

3.2 Görüntü Önişleme... 40

3.3 Referans Noktalarının İşaretlenmesi... 42

3.4. Özniteliklerin Çıkarılması... 44

3.5 Sınıflandırma... 47

3.6 Sınıflandırıcılar İçin Kullanılan Eğitim ve Test Setleri... 48

3.6.1 Eğitim ve test seti-I... 48

3.6.2 Eğitim ve test seti-II... 48

3.7 Eğitim ve Test Seti-I ile Sınıflandırma... 50

3.7.1 Sağlıklı, Frajil X Hurler sendromlu grupların sınıflandırılması... 51

3.7.2 Sağlıklı, Frajil X Hurler, Prader Willi sendromlu grupların sınıflandırılması ... 51

3.7.3 Sağlıklı, Frajil X Hurler, Prader Willi, Down sendromlu grupların sınıflandırılması... 52

3.7.4 Sağlıklı, Frajil X Hurler, Prader Willi, Down, Wolf Hirschhorn sendromlu grupların sınıflandırılması... 52

3.8 Eğitim ve Test Seti-II ile Sınıflandırma... 52

3.8.1 Çok katmanlı ileri beslemeli YSA ile sınıflandırma... 53

3.8.2 Olasılıksal YSA ile sınıflandırma... 53

3.8.3 YSA tabanlı hiyerarşik karar ağacı ile sınıflandırma... 53

3.8.3.1 YSA tabanlı hiyerarşik karar ağacı yapısındaki aşamalar... 56

3.8.4 kNN ile sınıflandırma... 60

3.8.5 Uzman hekim görüşü... 60

4. BULGULAR... 61

4.1 Eğitim ve Test Seti-I ile Sınıflandırma Sonuçları... 61

4.1.1 Sağlıklı, Frajil X, Hurler sendromlu grupların çok katmanlı ileri beslemeli YSA ile sınıflandırılmasının sonuçları... 61

(7)

katmanlı ileri beslemeli YSA ile sınıflandırılmasının sonuçları……... 64

4.1.3 Sağlıklı, Frajil X, Hurler, Prader Willi, Down sendromlu grupların çok katmanlı ileri beslemeli YSA modeli ile sınıflandırılmasının sonuçları... 66

4.1.4 Sağlıklı, Frajil X, Hurler, Prader Willi, Down, Wolf Hirschhorn sendromlu grupların çok katmanlı ileri beslemeli YSA modeli ile sınıflandırılmasının sonuçları... 69

4.2 Eğitim ve Test Seti-II ile Sınıflandırma Sonuçları... 72

4.2.1 Çok katmanlı ileri beslemeli YSA ile elde edilen sonuçlar... 73

4.2.2 Olasılıksal YSA ile elde edilen sonuçlar... 75

4.2.3 Uzman hekim görüşü... 77

4.2.4. YSA tabanlı hiyerarşik karar ağacı ile elde edilen sonuçlar... 79

4.2.4.1 YSA tabanlı hiyerarşik karar ağacının testleri sonucunda elde edilen sonuçlar... 81

4.2.5 kNN ile elde edilen sonuçlar... 84

4.2.6 Karşılaştırmalı sınıflandırıcı sonuçları... 86

5. SONUÇ... 90

5.1 Gelecekte Yapılabilecek Çalışmalar... 92

KAYNAKLAR... 93

ÖZGEÇMİŞ... 99

(8)

BBA Bağımsız Bileşen Analizi (Independent Component Analysis, ICA) DAA Doğrusal Ayırıcılık Analizi (Lineer Dicriminant Analysis, LDA) DN Doğru Negatif

DNA Deoksiribonükleik Asit

DP Doğru Pozitif

EBGM Elastik Yüz Demet Grafiği Yöntemi (Elastic Bunch Graph Method) HYK Hiyerarşik Karar Ağacı

JV Jet Voting

kNN k En Yakın Komşu (k Nearest Neighbor)

OYSA Olasılıksal Yapay Sinir Ağı (Probabilistic Neural Network, PNN) RTYSA Radyal Tabanlı Yapay Sinir Ağı

SIFT Ölçekten Bağımsız Öznitelik Dönüşümü (Scale Invariant Feature Transform)

YN Yanlış Negatif YP Yanlış Pozitif

YSA Yapay Sinir Ağları (Artificial Neural Networks, ANN)

TBA Temel Bileşen Analizi (Principal Compenent Analysis, PCA)

(9)

Şekil 2.1 Frajil X sendromlu hastalar... 7

Şekil 2.2 Hurler sendromlu hastalar... 9

Şekil 2.3 Prader Willi sendromlu hastalar... 10

Şekil 2.4 Wolf Hirschhorn sendromlu hastalar... 11

Şekil 2.5 Down sendromlu hastalar... 12

Şekil 2.6 Örüntü tanıma süreci... 13

Şekil 2.7 Farklı parametrelerle eğitilerek elde edilmiş karar fonksiyonlarını temsilen karar sınırları... 17

Şekil 2.8 Yapay nöron modeli... 21

Şekil 2.9 YSA'da yaygın olarak kullanılan aktivasyon... 24

Şekil 2.10 İleri beslemeli çok katmanlı bir YSA modeli... 25

Şekil 2.11 Olasılıksal YSA modeli... 31

Şekil 2.12 Dört boyutlu öznitelik uzayına sahip üç sınıftan oluşan basit bir karar ağacı yapısı... 34

Şekil 2.13 kNN örneği... 36

Şekil 3.1 Geliştirilen örüntü tanıma sisteminin blok diyagramı... 39

Şekil 3.2 a.orjinal görüntü, b.çalışılacak alanın kırpılmış hali, c.görüntünün yeniden boyutlandırılmış son hali... 41

Şekil 3.3 SIFT algoritması uygulanmış örnek görüntüler... 43

Şekil 3.4 Görüntü üzerinde işaretlenen referans noktaları... 44

Şekil 3.5 Tasarlanan hiyerarşik karar ağacı sistemi... 56

Şekil 4.1 Üç grup için YSA’ların doğruluk oranları... 63

Şekil 4.2 Dört grup için YSA'ların doğruluk oranları ... 66

Şekil 4.3 Beş grup için YSA'ların doğruluk oranları ... 68

Şekil 4.4 Altı grup için YSA’ların doğruluk oranları...71

Şekil 4.5 YSA’ların doğruluk oranları... 75

Şekil 4.6 OYSA’ların doğruluk oranları... 76

Şekil 4.7 k değerleri için doğruluk oranları... 85

Şekil 4.8 Sınıflandıcıların ve uzman hekimlerin doğru tanı sayılarının gruplara dağılımı... 87

Şekil 4.9 Sınıflandırıcıların ve uzman hekimlerin toplam doğruluk oranları... 88

(10)

Çizelge 2.1 Hata tablosu... 37 Çizelge 3.1 Görüntü sayılarının gruplara dağılımı... 40 Çizelge 3.2 Ölçülen uzunluklar ve açıklamaları... 45 Çizelge 3.3 Gruplardan basit tesadüfi örnekleme yöntemi ile test için seçilen

örneklerin numarası ve toplam sayısı... 49 Çizelge 3.4 Örneklerin seçilmesinden sonra geriye kalan görüntülerin gruplara

dağılımı... 50 Çizelge 4.1 Üç grup için farklı YSA parametreleri ve sınıflandırma

sonuçları... 62 Çizelge 4.2 YSA 9’un gruplara göre sınıflandırma sonuçları ve sınıflandırma

başarısı... 63 Çizelge 4.3 Dört grup için farklı YSA’ların parametreleri ve sınıflandırma

sonuçları... 64 Çizelge 4.4 YSA 8’in gruplara göre sınıflandırma sonuçları ve sınıflandırma

başarısı... 66 Çizelge 4.5 Beş grup için farklı YSA’ların parametreleri ve sınıflandırma

sonuçları... 67 Çizelge 4.6 YSA 10’nun gruplara göre sınıflandırma sonuçları ve sınıflandırma

başarısı... 69 Çizelge 4.7 Altı grup için farklı YSA’ların parametreleri ve sınıflandırma

sonuçları... 69 Çizelge 4.8 YSA 9’un gruplara göre sınıflandırma sonuçları ve sınıflandırma

başarısı... 71 Çizelge 4.9 Grupların sınıflandırma performansları... 72 Çizelge 4.10 Farklı YSA parametreleri ile elde edilen sonuçlar... 73 Çizelge 4.11 YSA 2’nin gruplara göre sınıflandırma sonuçları ve sınıflandırma

başarısı... 75 Çizelge 4.12 Farklı dağılım sabiti değerleri ile sınıflandırma sonuçları... 76 Çizelge 4.13 OYSA 4’ün gruplara göre sınıflandırma sonuçları ve sınıflandırma başarısı... 77 Çizelge 4.14 Test örnekleri için uzman hekim I’in doğru tanı dağılımı... 78 Çizelge 4.15 Test örnekleri için uzman hekim I’in doğru tanı dağılımı ... 78 Çizelge 4.16 Uzman hekimler için gruplara göre toplam doğru tanısı sayısı ve

doğruluk değerleri... 79

(11)

Çizelge 4.18 YSA tabanlı hiyerarşik karar ağacındaki YSA yapılarının

performansı ... 81 Çizelge 4.19 Sendrom tiplerinin görülme sıklıklarına göre sıralamaları... 82 Çizelge 4.20 Test 1-karar ağacındaki aşamaların, sendromların görülme sıklığının

azdan çoğa göre dizilmesi halinde elde edilen sonuçlar... 83 Çizelge 4.21 Test 2-karar ağacındaki aşamaların, sendromların görülme sıklığının

çoktan aza göre dizilmesi halinde elde edilen sonuçlar... 83 Çizelge 4.22 Test 3- karar ağacındaki aşamaların, hekimlerin teşhis koymada en

zorlandıkları sendromdan en az zorlandıkları sendrom tiplerine göre dizilmesi halinde elde edilen sonuçlar... 84 Çizelge 4.23 Farklı k değerleri ile sınıflandırma sonuçları... 85 Çizelge 4.24 k =4 için sınıflandırma başarısının gruplara dağılımı... 86 Çizelge 4.25 Literatüdeki benzer çalışmaların yöntemsel ve sonuç olarak

karşılaştırılması... 89

(12)

1. GİRİŞ

1.1 Tanım ve Amaç

Dismorfik, kelime anlamı olarak anormal şekilli, dismorfik hasta ise fiziksel olarak şekil bozukluğu olan kişi anlamına gelmektedir. Dismorfiklik, doğmadan önce anne karnında embriyonun yapısal olarak anormal gelişimi sonucunda oluşmaktadır. Bu şekilde oluşan dismorfiklikler bir tane olabileceği gibi birden fazla da olabilmektedir. Belirli ve birden fazla fiziksel, zihinsel ve yapısal farklılıkların kişide aynı anda görülmesi ile oluşan duruma sendrom denmektedir (Aase 1990). Bu tanımlara göre, dismorfik sendrom (hastalık) doğuştan oluşan, zihinsel, fiziksel ve yapısal olarak birden çok anormalliğin gözlemlendiği durum olarak tanımlanır.

Dismorfik hastalıklar hem vücutta hem de yüzde anormalliklere sebep olmaktadır. Aynı dismorfik hastalığa sahip olan hastaların etkilenen genleri, aynı dismorfik özelliklerin oluşmasına sebep olmaktadır. Her dismorfik hastalığı tanımlayan ve diğer dismorfik hastalıklardan ayırt eden şekilsel (dismorfik) bozukluklar bulunmaktadır. Uzman hekim dismorfik hastalığa ön tanıyı koymak için vücutta ve yüzde meydana gelen bu şekilsel bozuklukları değerlendirmektedir. Sendromların ilk klinik tanısı, hekim tarafından karşılaştırma yöntemi kullanılarak hastanın fiziksel muayenesi ile yapılmaktadır. Bu yöntemde, öncelikle hastada var olan fiziksel bozukluklar tek tek incelenmekte, mevcut kitaplardaki ve veri tabanlarındaki kesin tanısı konmuş hastalarla, tanısı konacak hastanın fiziksel özellikleri karşılaştırılmaktadır. Bu işlem bir hayli zaman alabilmekte ve yüksek derecede tecrübe gerektirmektedir. Bu şekilde tanı başarısı hekimden hekime ve tecrübeye bağlı olarak değişmektedir. Bu nedenle ön tanı için hekimlere yardımcı olabilecek, ön tanıyı tecrübeden bağımsız, daha kısa sürede ve maliyetsiz bir şekilde yapabilecek, bilgisayar tabanlı sistemlere ihtiyaç duyulmuştur.

Bu ihtiyaçtan yola çıkılarak bu tezde, Frajil X, Hurler, Prader-Willi, Wolf Hirschhorn, Down sendromları ve sağlıklı grup, yüz fotoğrafları kullanılarak sınıflandırılmış ve bu sendromların tanısı konulmuştur. Çalışmada, hekimlerin kalın kitapları ve geniş veri tabanlarını tarayarak ön tanı için kullandıkları karşılaştırma yönteminin subjektifliğini

(13)

ortadan kaldırabilecek ve tanıyı tecrübeden bağımsız yapabilecek, uzman hekimlere tanı koymada yardımcı bir sistem geliştirilmiştir.

Literatürde bazı dismorfik sendromları bilgisayar tabanlı sınıflandıran sistemler ve bununla ilgili çalışmalar yapılmıştır. Loos vd. (2003), Mukopolisakkaridoz Tip III, Cornelia de Lange, Frajil X, Prader-Willi ve Williams-Beuren sendromları olmak üzere 5 farklı sendrom tipini sınıflandırmışlardır. Hastaların yüz fotoğraflarının olduğu fotoğraf veri tabanı oluşturulmuştur. Fotoğrafların ön işlemesi ve öznitelik çıkarımı için Gabor dalgacık dönüşümü yöntemi kullanılmıştır. Öznitelik vektörleri jet voting yöntemi kullanılarak karşılaştırılmış, %76’lık doğruluk oranı ile hastalar sınıflandırılmıştır.

Boehringer vd. (2006) yaptıkları çalışmada, Frajil X, Cornelia de Lange, Williams- Beuren, Prader-Willi, Mukopolisakkaridoz Tip III, Cri-du-chat, Smith-Lemli-Opitz, Sotos, Microdeletion 22q11.2, Noonan sendromu olmak üzere 10 farklı dismorfik sendromu sınıflandırmışlardır. Fotoğraflara Gabor dalgacık dönüşümü uygulanmış ve elle öznitelikler elde edilmiştir. Doğrusal ayırıcılık analizi, destek vektör makinaları ve k en yakın komşu sınıflandırma yöntemleri uygulanmıştır. Sınıflandırma başarı oranı

%52,1 ile %75,7 arasında değişmiştir.

Vollmar vd. (2008), yukarıda bahsedilen çalışmaya Mukopolisakkaridoz Tip II, Progeria, Treacher Collins ve Wolf Hirschhorn sendromlarını ekleyerek sendrom sayısını 10’dan 14’e çıkarmışlardır. Fotoğraf veri tabanına hastaların yandan çekilmiş pozları da eklenerek geometrik verinin sınıflandırma başarısına etkisi incelenmiştir.

Fotoğraflardan öznitelikler Gabor dalgacık dönüşümü kullanılarak çıkarılmıştır.

Sınıflandırma için doğrusal ayırıcılık analizi, destek vektör makinaları, ve k en yakın komşu yöntemleri kullanılmıştır. Sadece önden çekilmiş pozlardan elde edilmiş öznitelikler kullanıldığında sınıflandırma başarısı %52,5 ile %76,1 arasında değişmiştir.

Aynı çalışmada hem önden hem de yandan çekilmiş pozlardan elde edilen öznitelikler kullanılarak, doğrusal ayırıcılık analizi yöntemi ile sınıflandırılma yapılmış ve

%93,1’lik başarı oranına erişilmiştir.

(14)

Hammond vd. (2004), Noonan ve Velo - Cardio- Facial sendromlarını ve sağlıklı grupları sınıflandırmıştır. Bunun için 3-boyutlu yüz fotoğrafları kullanılmış olup, fotoğrafların analizi için yoğunluk yüzey modeli (Density Surface Model) kullanılmıştır. Sınıflandırma için en yakın ortalama, C5.0 karar ağaçları, yapay sinir ağları, lojistik regresyon ve destek vektör makinaları kullanılmıştır. Bu çalışmada 2 farklı sınıflandırma yapılmıştır. Birincisinde Noonan sendromlu ve Sağlıklı grubun sınıflandırılması yapılmıştır. Sınıflandırma başarı oranı %83 ile %94 arasında değişen sonuçlar bulunmuştur. İkinci sınıflandırmada da Velo- Cardio- Facial sendromu ve sağlıklı grubun sınıflandırılması yapılmıştır ve başarı oranı %83 ile %92 arasında değişen sonuçlar bulunmuştur.

Hammond vd. (2005) yapmış oldukları diğer bir çalışmada, Noonan, 22q11, Williams, Smith- Magenis sendromlarını sınıflandırmışlardır. Yine yoğunluk yüzey modelini kullanmışlardır ancak bu çalışmada, yöntemi uygularken fotoğraf üzerinde kullandıkları yüzeyi genişletmişlerdir. Sınıflandırmayı 2 sendrom tipini sınıflandıracak şekilde 2’li gruplar halinde yapmışlardır. Sınıflandırma için en yakın ortalama, doğrusal ayırıcılık analizi ve destek vektör makineleri yöntemleri kullanılmıştır. Sınıflandırma başarı oranı

%76 ile %100 arasında değişmektedir.

Sipahi (2008), yapmış olduğu çalışmada Down sendromlu ve sağlıklı grupları sınıflandırmıştır. Elastik yüz demet grafiği yöntemini kullanarak öznitelikleri elde etmiştir ve Yapay Sinir Ağlarını kullanarak sınıflandırma gerçekleştirilmiştir.

Sınıflandırma başarı oranı %68,7 olarak elde edilmiştir.

Saraydemir vd. (2011), çalışmalarında Down sendromu ve sağlıklı grubun sınıflandırmasını yapmışlardır. Öznitelik çıkarımı için Gabor dalgacık dönüşümü yöntemi kullanılmıştır. Sınıflandırma için k en yakın komşu ve destek vektör makineleri kullanılmıştır. Sınıflandırma başarı oranı %96 ve %97,34 olarak elde edilmiştir.

(15)

1.2 Tezin Kapsamı ve Özgünlüğü

Bu tez kapsamında, geliştirilen sistem yardımıyla beş farklı dismorfik sendrom ve sağlıklı grubun yüz fotoğrafları kullanılarak tanınması ve sınıflandırılması gerçekleştirilmiştir.

Tez kapsamında sınıflandırılan dismorfik hastalıkların öncelikle, yüzde sebep olduğu şekilsel (dismorfik) bozukluklar literatürdeki verilere göre saptanmıştır. Bu şekilsel bozukluklar dikkate alınarak yüz üzerinde referans noktaları işaretlenmiş ve bu noktalardan öznitelik vektörleri elde edilmiştir. Her fotoğraftan elde edilen bu öznitelik vektörlerinden oluşan bir öznitelik veri tabanı oluşturulmuştur. Bu veri tabanı ile değişik Yapay Sinir Ağı (YSA) mimarileri kullanılarak sınıflandırma işlemi gerçekleştirilmiştir.

Daha sonra, sınıflandırma başarısını arttırmak amacıyla bu tez kapsamında geliştirilen YSA tabanlı hiyerarşik karar ağacı yöntemi uygulanmıştır. Bu yöntem ile hiyerarşik bir sistem tasarlanarak sistemin performansı arttırılmıştır. Bunun yanı sıra sınıflandırma için k en yakın komşu yöntemi de kullanılarak sınıflandırıcıların performansları karşılaştırılmıştır. Çalışma kapsamında sistemin testi için kullanılan görüntüler, sistemi test etmek için farklı iki uzman hekime gösterilmiş sonuçlar karşılaştırılmıştır. Elde edilen sonuçlar, geliştirilen sistemin sadece yüz görüntülerini kullanarak dismorfik sendromların ön tanısında hekimlere yardımcı bir sistem olarak kullanılabileceğini göstermiştir. Bu sistem ile standart ölçüler belirlenip teşhisin tecrübeden bağımsız bir şekilde olması ve ön tanı süresinin oldukça kısa bir sürede gerçekleştirilmesi sağlanmıştır.

Bu çalışmanın literatüre katkıları şu şekilde sıralanabilir:

• Bu çalışmada sınıflandırılan dismorfik hastalıklar, daha önceki çalışmalarda sınıflandırılan dismorfik hastalıklardan farklıdır.

• Yüz görüntülerinden öznitelik çıkarımı için geliştirilen yöntem bu çalışmanın özgün bir katkısıdır.

• Çoklu dismorfik sendromların sınıflandırılması için YSA kullanımı bu çalışmanın özgün bir katkısıdır.

(16)

• Sınıflandırma probleminin çözümü için bu çalışma için geliştirilen YSA tabanlı Hiyerarşik Karar Ağacı yöntemi yine bu çalışmanın literatüre özgün bir katkısıdır.

Bu çalışma için geliştirilen YSA tabanlı hiyerarşik karar ağacı yönteminin uyarlanabilir ve hiyerarşik olması bu çalışma için önemli derecede avantaj sağlamıştır. En büyük avantajı var olan sınıflandırma problemini daha küçük parçalara bölerek genel sınıflandırma başarısını arttırmasıdır. Tez kapsamında geliştirilen bu yapı başka sınıflandırma algoritmalarına ve soruna göre uyarlanabilir olması açısından oldukça kullanışlı bir modeldir. YSA tabanlı hiyerarşik karar ağacının aşamalı yapısı ile sisteme yeni hastalık türleri için sınıflandırıcılar kolaylıkla eklenebilir. Geliştirilen sistem, görüntülerin çözünürlüklerinden, ışıklandırılmasından ve pozdan bağımsızdır, ayrıca hastaların cinsiyetinden, yaşlarından ve ırklarından bağımsız olarak çalışmaktadır.

"Dismorfik Hastalıkların Sinyal İşleme Yöntemleri Kullanılarak Sınıflandırılması"

başlıklı bu tez toplam beş bölümden oluşmaktadır. Birinci bölümde, genel tanımlar ve bilgiler, literatürde daha önce yapılan benzer çalışmalar ve tezin özgünlüğü, literatüre katkıları verilmiştir. Tezin anlaşılırlığını arttırmak için çalışmada sınıflandırılması yapılan dismorfik hastalıklar hakkında genel bilgiler verildikten sonra, tez kapsamında bir örüntü tanıma sistemi geliştirildiği için, örüntü tanıma sistemleri hakkında bilgi ve çalışma kapsamında kullanılan yöntemler "Kuramsal Temeller" başlığı altında Bölüm 2’

de verilmiştir. Bölüm 3’te, çalışma için gerekli olan fotoğraf veri tabanının oluşturulması, fotoğraflar üzerinde yapılan önişlemler, öznitelik çıkarımı ve sınıflandırma yöntemleri incelenmektedir. Bölüm 4, önerilen yöntemler sonucunda elde edilen bulguların yanında; tez çalışmasında elde edilen diğer ara bulguları içermektedir.

Bulguların değerlendirilmesi ve gelecekte yapılabilecek çalışmalar ise Bölüm 5’te verilmiştir.

(17)

2. KURAMSAL TEMELLER

Bu bölümde tez kapsamında sınıflandırması yapılan dismorfik hastalıklar (sendromlar) hakkında genel bilgiler verildikten sonra bir örüntü tanıma sisteminin aşamaları ve bu aşamalarda tez çalışması kapsamında kullanılan yöntemler anlatılmıştır.

2.1 Dismorfik Hastalıklar

Bu çalışmada 5 farklı dismorfik hastalığın (sendromun) sınıflandırılması yapılmıştır.

Çalışmanın ilk safhalarında, Frajil X, Hurler, Prader-Willi, Angelman, Williams, Wolf Hirschorn, Cat Eye sendromları olmak üzere 7 farklı dismorfik sendrom tipinin sınıflandırmasının yapılması planlanmıştı, ancak Angelman, Williams ve Cat Eye sendromları için yeterli görüntü bulunamadığı için çalışmanın kapsamına Down Sendromu eklenerek, Angelman, Williams ve Cat Eye sendromları çalışmadan çıkarılmıştır. Bu şekilde Frajil X, Hurler, Prader-Willi, Wolf Hirschorn ve Down sendromları olmak üzere toplam 5 farklı sendrom tipi sınıflandırılmıştır.

2.1.1 Frajil X Sendromu

1969 yılında Lubs, frajil bölgesinde X kromozomunun uzun kolunda meydana gelen, erkekleri ve kadınları etkileyen sendromu bulmuştur (Jones 2006). Frajil X sendromu zihinsel, fiziksel ve davranışsal bozukluklara sebep olan bir hastalıktır. Erkeklerde görülme sıklığı kadınlarda görülme sıklığından daha fazladır. Frajil X sendromu erkeklerde yaklaşık olarak 3600 kişide 1 görülürken, kadınlarda 4000-6000 kişide 1 görülmektedir (http://tr. wikipedia. org/wiki/Frajil_X_ sendromu, 2012) .

Frajil X Sendromu FMR-1 adı verilen gendeki değişiklik ya da mutasyon nedeniyle meydana gelmektedir. Taşıyıcıların FMR-1 protein düzeyleri normal olduğu için genelde zihinsel olarak etkilenmezler. FMR-1 genindeki bozukluk bu genin düzgün çalışmamasına, üretmesi gereken proteini yeterli düzeyde ya da hiç üretememesine neden olur. Bu protein zihinsel gelişim ve işleyiş için kritik düzeyde önemlidir.

(18)

Kadın hastaların erkek hastalardan daha hafif belirtileri vardır. Kadınlar X genini annelerinden ya da babalarından kalıtsal olarak almış olabilirler. Kadınların iki adet X kromozomu olduğu için etkilenmemiş X kromozomu frajil X mutasyonunu taşıyan X kromozomunun eksikliğini giderebilir.

Frajil X sendromuna sahip hastalarda; dil ve konuşma problemleri, konuşmada gecikme, duygusal bilgileri algılamakta ve bunlara cevap vermede zorluk, otistik davranış bulguları, sinirlilik, hırçınlık, dokunulmaya tepki sık görülen özelliklerdir.

Bu hastalığı tanımlayan geniş alın, şaşılık, uzun yüz, büyük ve belirgin kulaklar gibi yüze ait dismorfik bulguların yanında, yüksek damak, kaslarda gevşeklik, büyük testisler, düztabanlılık sık görülen şekilsel bozukluklardır. Şekil 2.1’de Frajil X sendromlu hasta fotoğrafları gösterilmektedir.

Şekil 2.1 Frajil X sendromlu hastalar

Bu hastalıkta ön tanı, hastanın fiziksel, davranışsal ve aile hikâyesine bakılarak konulmaktadır. Kesin tanı kan örneği alınarak yapılmaktadır. Alınan kandan DNA analizi yapılır. Riskli ailelerde doğum öncesi tanı da konulabilmektedir.

(19)

2.1.2 Hurler Sendromu

Hurler sendromu 1919 yılında Hurler tarafından bulunmuş ve hastalığa kendi adı verilmiştir. Bu sendrom, 100.000’de 1 doğumda görülebilen, ağır klinik tablo gösteren doğumsal metabolizma hastalığıdır. Hurler Sendromunda temel bozukluk, L-iduronidaz enzimindeki yetmezlik sonucu tüm vücut sistemlerinde asit mukopolisakkaritlerin birikmesidir (http://en.wikipedia.org /wiki/Hurler_syndrome, 2012).

Hurler sendromu olan çocuklar doğumda normalken, 6. ile 12. aylarında yüz hatlarında kabalaşma başlamaktadır. Karaciğerde ve dalakta büyüme, korneada (gözün ön tabakası) bulanıklık, dişetlerinde kabarma görülmektedir. Bu hastalarda 2-3 yaşından sonra büyüme yavaşlamakta ve kemik gelişimi gecikmektedir. Zamanla kafanın genişlemesiyle birlikte, alın bölgesi öne çıkarak kafatasında şekil bozukluğuna sebep olmaktadır. Yaşamın ilk yıllarından sonra psikomotor gelişim duraklamakta ve zamanla gerilemektedir. Eklemlerdeki sertlik fiziksel aktiviteyi sınırlamaktadır. Birçok hasta tekerlekli sandalyeye bağımlı olmaktadır.

Bu hastalıkta yüze ait öne çıkan dismorfik bulgular; geniş kafa, alın bölgesinin öne çıkması, kafatasında şekil bozukluğu, kısa kalkık burun kökü, kalın kaşlar şeklinde sıralanabilir. Şekil 2.2’de Hurler sendromlu hastalara örnek fotoğraflar gösterilmektedir.

(20)

Şekil 2.2 Hurler sendromlu hastalar

Bu sendromun kesin tanısı fiziksel muayene sonrasında lökositlerde ve deri fibroblast kültürlerinde alfa-L-iduronidaz aktivitesindeki düşüklüğün gösterilmesi ile kesinleşmektedir.

2.1.3 Prader-Willi Sendromu

Hastalık adını ilk kez 1956 yılında sendromu tarif eden üç hekimden almaktadır (Prader, Labhart ve Willi). Hastalığın görülme sıklığı değişkenlikler göstermekle beraber ortalama her 15.000 canlı doğumda 1 olarak kabul edilebilir (Jones 2006, http://www.news-medical.net/health/What-is-Prader-Willi-Syndrome, 2012). Prader- Willi Sendromu çocuğun anne karnında döllendiği sırada, bilinmeyen sebeplerle 15.

kromozomun yanlış bölünmesinden kaynaklanan genetik bir hastalıktır, ancak doğumdan sonra hipotalamusa verilen bir zarar da bu sendromun oluşumuna neden olabilir.

Prader-Willi sendromu başta zekâ geriliği, duygusal dengesizlik, kaslarda güç kaybı ve kasların normalden gevşek olması, cücelik ve obezitenin gözlendiği kalıtsal bir hastalıktır.

(21)

Bu sendroma sahip hastalarda genel olarak, badem şekilli gözler, ince üst dudak, küçük ağız, belirgin ve dar yüz hatları gibi yüze ait dismorfik bulgulara rastlanmaktadır. Şekil 2.3’te Prader-Willi sendromlu hastaların fotoğrafları gösterilmektedir.

Şekil 2.3 Prader-Willi sendromlu hastalar

Bu hastalığın diğer dismorfik sendromlarda olduğu gibi kesin tanısı fiziksel muayene sonrasında genetik testler ile yapılmaktadır.

2.1.4 Wolf Hirschhorn Sendromu

Wolf Hirschhorn sendromu ilk kez 1967 yılında tanımlanmıştır. 4. kromozomun kısa kolunda bir parçanın kaybolmasıyla meydana gelmektedir. Ender rastlanılan bir sendromdur. Bu sendromun görülme sıklığı 50.000 doğumda 1 olarak tahmin edilmektedir (https://www.orpha.net/data/paths7GB/uk-WHS.pdf, 2012).

Bu hastalarda kalp problemleri görülmektedir, ayrıca üriner ve genital anormallikler de bulunmaktadır. El ve ayaklarda anormallik bu sendromun fiziksel belirtileridir. Beyin ve kaslarda anormalliklerde bu hastalığın seyrinde görülen diğer sağlık problemleridir.

Çıkık alın, geniş burun kökü, küçük kafa, yarık dudak ve damak, balık ağzı, kısa üst dudak, kafa asimetrisi, arka kafa orta hatta saçlı deri anomalisi, ayrık gözler Wolf

(22)

Hirschhorn Sendromunda öne çıkan genel yüze ait dismorfik bulgulardır. Bu hastalar ayırt edici yüz özelliklerine sahiplerdir. Şekil 2.4’te Wolf Hirschhorn sendromlu hastaların fotoğrafı gösterilmektedir.

Şekil 2.4 Wolf Hirschhorn sendromlu hastalar

Bu sendromda hastaların sahip olduğu yüz şekli teşhiste önemlidir. Genetik test teşhisi doğrulamaktadır.

2.1.5 Down Sendromu

Down sendromu 1866 yılında, J. Langdon Down tarafından tanımlanmıştır. Bu sendromun görülme sıklığının ortalama 800 ile 1000 doğumda 1 olduğu kabul edilebilir (Alp vd. 2007, http://downsyndrome.com/what-is-down-syndrome/, 2012).

Down sendromu genetik bir hastalık olup 21. kromozomun fazladan bulunması ile oluşan bir hastalıktır. Normalde 46 adet olması gereken kromozom sayısının 21.

kromozomdan iki yerine üç tane bulunması ile 47 adet kromozom bulunmasıyla meydana gelmektedir.

Down Sendromu fiziksel ve zihinsel gelişimin gecikmesine neden olmaktadır.

Dereceleri değişen zeka gerilikleri görülmektedir. Çocukluk dönemlerinde solunum

(23)

hastalıkları ve kalp bozukluklarına rastlanmaktadır. Bir çoğunda mide ve bağırsak problemleri görülmektedir.

Bu hastalarda görülen dismorfik bulgular; göz kenarlarında eğik göz çizgileri, kalın ve geniş ense, kafanın arkasının yassı olması şeklinde sıralanabilir. Basık burun kemeri, tekli el çizgisi, küçük ağız boşluğundan dolayı sarkan ve genişlemiş dil, kısa boyun, normalden düşük hizada bulunan kulaklar, birbirinden ayrık ve çekik gözler bu sendromda görülen yüze ait dismorfik bulgulardır. Şekil 2.5’te Down sendromlu hastaların fotoğrafları gösterilmektedir.

Şekil 2.5 Down sendromlu hasta

Bu sendromun tanısı öncelikle fiziksel muayene ile konmaktadır, bazı durumlarda kesin tanı hormon ve genetik testlerle konmaktadır.

2.2 Örüntü Tanıma

Yukarıdaki bölümlerde anlatılan dismorfik hastalıkların bilgisayar yardımı ile özniteliklerinin çıkarılması, sınıflandırılması ve tanı konulması, örüntü tanıma süreçleri ile gerçekleştirilebilir.

(24)

Örüntü, bir nesne veya olay kümesindeki elemanların ardışık olarak düzenli bir biçimde birbirlerini takip ederek gelişmesi, yenilenmesi olarak tanımlanır. Görüntü, ses sinyali, retina, parmak izi, biyomedikal veriler, bir metin içerisindeki karakterler örüntüye dair örneklerdir.

Örüntü tanıma, örüntüyü algılayıp, belirlenen kriterler doğrultusunda, çeşitli yöntemler ile tanımlayıp bir sınıfa atama işlemidir. İnsanların, yüz tanıma, ses ayırt edebilme, el yazısını tanıyabilme gibi günlük hayatlarında kolaylıkla yapabildikleri işlemleri makinelerin de yapabilmesi örüntü tanıma konusu içerisinde yer alır.

Sınıflandırma ve tanıma işlemlerinin otomatik hale getirilmesi ve insan duyularının yeterli olmadığı bazı durumlarda tanıma ve sınıflandırmanın yapılabilmesi için makina ortamında örüntü tanıma yapılması ihtiyacı ortaya çıkmıştır. Yarım yüzyılı aşkın süredir üzerinde çalışılmakta olan bu bilim kolunun önemi, her geçen gün ortaya çıkan yeni uygulama alanlarıyla birlikte giderek artmaktadır (Günal 2008). Örüntü tanımada amaç makinanın gördüğü örüntülerin özniteliklerini kullanarak daha önceden eğitildiği ya da öğrendiği şekilde bu örüntülerin sınıflandırmasını yapmaktır. Optik karakter tanıma, konuşma tanıma, konuşmacı tanıma, parmak izi tanıma, DNA kimliklendirme, fabrika üretim hata denetim sistemleri, yüz tanıma sistemleri, medikal tanı, örüntü tanıma uygulamalarının kullanıldığı alanlardır. Örüntü tanıma sürecinin temel öğeleri Şekil 2.6’da gösterilmiştir.

Örüntü Karar

Şekil 2.6 Örüntü tanıma süreci

Birçok örüntü tanıma sistemi şekil 2.6’da gösterildiği gibi temel olarak üç aşamadan oluşur. Ön işleme aşamasında, ilgilenilen sinyalin, beraberindeki diğer verilerden ayrılması, kullanılır hale getirilmesi sağlanır. Öznitelik çıkarma aşamasında ise veriden, sınıflandırma için gerekli özelliklerin çıkarılıp vektörel forma dönüştürülmesi işlemi

Öznitelik Çıkarma

Sınıflandırma Ön İşleme

(25)

gerçekleştirilir. Başka bir deyişle örüntü vektörel form ile temsil edilir hale getirilir.

Sınıflandırıcı ise bu öznitelikleri kullanarak örüntünün hangi gruba ait olduğunu tespit eder ve sistem kararı verir.

2.2.1 Ön işleme

Öznitelik çıkarma işlemine geçmeden önce örüntü üzerinde, öznitelik çıkarma için yanıltıcı etkileri ortadan kaldırmak üzere bazı işlemlerin yapılması gerekebilmektedir.

Gerek otomatik gerekse de elle yapılan öznitelik çıkarma işleminin güvenirliğinin artması için veri ön işleme yapılmaktadır.

Çok sayıda veri ön işleme tekniği bulunmaktadır. Bazı durumlarda bu tekniklerden birinin ya da birkaçının kullanılması gerekebilmektedir. Bu tekniklerden biri olan veri temizleme, verilerdeki gürültünün giderilmesi ve tutarsızlıkların düzeltilmesi için uygulanır. Bir diğer teknik olan veri indirgemede ise fazla olan bazı değişkenlerin atılması ve birleştirilmesi veya kümeleme yolu ile veri büyüklüğünün azaltılması amaçlanır (Oğuzlar 2003).

Doğru öznitelik çıkarılması için örüntüdeki hata ve gürültü doğru bir biçimde belirlenmeli ve yapılması gerekli işlemler örüntüye uygulanmalıdır. Örneğin örüntü bir görüntü ise, görüntü üzerinde görüntünün açısını değiştirmek için rotasyon, sadece gerekli alanda işlem yapılması, görüntü üzerinde ilgilenilen kısma odaklanılması için kırpma işlemi, renk dağılımı bozukluğunun giderilmesi için histogram eşitlemesi, görüntü üzerinde ölçekleme, görüntünün gri skalaya dönüştürülmesi gibi işlemler görüntü üzerinde öznitelik çıkarma işlemine geçmeden önce yapılabilecek ön işleme yöntemleridir.

2.2.2 Öznitelik çıkarma

Öznitelik, örüntüye dair ölçülebilir ya da gözlenebilir bilgidir. Öznitelik çıkarılması işlemi, örüntü tanıma sürecinde gerekli olmayan bilgiyi eleyerek örüntüye ait

(26)

karakteristik özelliklerin elde edilmesini sağlar. Başka bir deyişle, öznitelik çıkarma, bir sınıfa ait olan ve diğer sınıflarda bulunmayan karakteristik bilgilerin belirlenip çeşitli yöntemlerle elde edilmesi işlemidir. Sınıfları birbirinden ayıran doğru özniteliklerin tespit edilmesi, sınıflandırma performansını arttırmada önemli bir işlemdir.

Sınıflandırmanın performansı öznitelik seçimiyle doğru orantılıdır, bundan dolayı öznitelik seçme ve çıkarma işlemi çok önemlidir.

Bir örüntü birden fazla öznitelik ile temsil edilebilir, bu durumda "öznitelik kümesi"

kavramından söz edilir. Eğer bir örüntü, n adet özniteliğe sahipse, n boyutlu öznitelik vektörü ile temsil edilir.

Öznitelik çıkarımı için kullanılacak yöntem örüntü çeşidine göre değişmektedir.

Örneğin ses ve konuşma tanıma problemlerinde, sinyalin spektrumu incelenerek sinyalin tümü yerine çeşitli frekans bantlarındaki bilgiler öznitelik olarak kullanılabilir (Rabiner ve Juang 1993). Metin sınıflandırma uygulamalarında, metin içerisindeki kelime ve sembollerin frekansları öznitelik olabilir (Günal vd. 2006). Görüntü tanıma problemlerinde, görüntünün tamamı yerine, görüntünün spektrum bilgileri, görüntüye ait renk, parlaklık, köşe ve kenar gibi bilgiler öznitelik kümesini oluşturabilir (Gonzalez ve Woods 2007). Yüz tanıma için, görüntü üzerinde öznitelik çıkarma işlemi otomatik algoritmalarla ya da otomatik olmayan yöntemlerle yapılabilir.

Günümüzde sıklıkla kullanılan, öznitelik çıkarılmasına dayalı yüz tanıma algoritmaları için, Temel Bileşen Analizi (TBA) (Bahurupi vd. 2012), Bağımsız Bileşen Analizi (BBA) (Bartlett vd. 2002), Doğrusal Ayırıcılık Analizi (DAA) (Lu vd. 2003), Elastik Demet Grafik İşaretleme (EBGM) (Wiskott vd. 1999), Aktif Görünüm Modeli (AGM) (Cootes vd. 1998, Mora vd. 2007), Gabor dalgacık dönüşümü (Gabor 1946), Ölçekten Bağımsız Öznitelik Dönüşümü (SIFT) (Lowe 2004) gibi yöntemler örnek olarak verilebilir. Farklı bakış açılarında, farklı pozlarda ve farklı ışıklandırmalarda bulunan yüz görüntülerini ayırt etmek oldukça zor ve lineer olmayan problemlerdir. Bu tip yüz tanıma problemlerine TBA, DAA gibi doğrusal yöntemler güvenilir ve tutarlı çözümler sunamamaktadırlar (Lu vd. 2003). Bunun yanında elle ya da yarı otomatik olarak gerçekleştirilen öznitelik çıkarma yöntemleri bazı durumlarda, otomatik öznitelik

(27)

çıkarma yöntemlerine göre daha iyi sonuçlar verdiği için tercih edilmektedir (Aldridge vd. 2005, Boehringer vd. 2006).

2.2.3 Sınıflandırma

Sınıflandırma, örüntüye ait öznitelik vektörleri kullanılarak o örüntünün hangi sınıfa ait olduğunun, sınıflandırıcı yardımıyla belirlenmesi demektir (Duda vd. 2001). Örüntü tanıma sistemlerinin başarısında, sınıflandırma yöntemi de öznitelik çıkarma kadar önemlidir. Örüntü tanıma problemlerinde genel olarak hangi sınıflandırma yönteminin en iyi ya da en uygun olduğu kesin olarak söylenemez. Örüntünün çeşidi, örüntüden elde edilen özniteliklerin yapısı ve sayısı, işlem süresi ve karmaşıklığı gibi faktörlere göre tercih edilmesi gereken sınıflandırma yöntemi farklılık gösterebilir.

Bir sınıflandırıcıyı tasarlamak için örüntülerden elde edilen öznitelik veri tabanının bir kısmı sınıflandırıcıyı eğitmek, bir kısmı da test etmek için, “eğitim” ve “test” kümesi şeklinde ikiye ayrılmalıdır. Eğitim kümesi ile elde edilen karar ya da sınıflandırma fonksiyonları test kümesine uygulanıp sınıflandırıcının performansı ölçülmektedir.

Amaç; hangi sınıfa ait olduğu bilinen özniteliklerle yapılan modellemenin, bilinmeyen öznitelikler üzerindeki başarısını ölçmektir.

Sınıflandırıcıların temel görevi, sınıflar arasındaki sınıf sınırlarını oluşturmaktır. Eğer sınıflara ait öznitelikler doğru bir şekilde belirlenmişse sınıflayıcılar sınırları kolaylıkla belirleyebilir. Sınıflayıcıların yapısını karar fonksiyonları belirlemektedir ve sınıflandırıcının eğitim süreci bu fonksiyona ait parametrelerin bulunma süreci olarak tanımlanabilir. Eğitim algoritması için bir amaç fonksiyonu belirlenir ve bu amaç fonksiyonunu sağlayacak şekilde karar fonksiyonunun parametreleri adım adım değiştirilir (Ölmez ve Dokur 2009). Başka bir deyişle bahsedilen amaç fonksiyonu sınıflama hatasını en aza indirgeyen fonksiyon olarak tanımlanır ve bu şekilde eğitim ve karar fonksiyonlarının parametreleri, sınıflandırmayı en doğru şekilde yapacak duruma gelene kadar değiştirilerek çözüme ulaşılır. Şekil 2.7’de farklı parametrelerde karar fonksiyonlarını temsilen karar çizgileri gösterilmektedir. İnce çizgiler farklı iterasyonlarda bulunan hatalı karar sınırlarını göstermektedir. Şekilden de görüleceği

(28)

üzere hatalı karar sınırı, sınıflandırmanın hatalı olmasına neden olmaktadır. İnce çizgi ile gösterilmiş karar sınırları hatalı sınıflandırma yapmaktadır. Kalın çizgi ile gösterilmiş karar sınırı, parametreleri optimum düzeyde seçerek eğitimi iyi yapılmış bir karar fonksiyonunu temsil etmektedir ve en doğru sınıflandırmayı yapmaktadır.

Şekil 2.7 Farklı parametrelerle eğitilerek elde edilmiş karar fonksiyonlarını temsilen karar sınırları

Örüntü tanımada kullanılan çeşitli sınıflandırma yöntemleri bulunmaktadır. Bayes sınıflandırıcı, k en yakın komşu tahmini, yapay sinir ağları, destek vektör makineleri, karar ağaçları, genetik algoritmalar başlıca sınıflandırma yöntemlerine örnek olarak verilebilir.

Sınıflandırıcılar kendi içerisinde tasarım şekillerine göre, parametrik, parametrik olmayan, danışmanlı öğrenme ve danışmansız öğrenme gibi çeşitli kategorilere ayrılmaktadır. doğrusal ayırıcılık analizi, radyal tabanlı fonksiyonlar, parametrik ve danışmanlı öğrenme sınıflandırma algoritmalarına örnek olarak verilebilir. Parzen pencereleri, olasılıksal yapay sinir ağları, en yakın komşu sınıflandırıcıları parametrik olmayan danışmanlı sınıflandırıcılara örnek olarak verilebilir. k ortalamalı kümeleme algoritması, kendi kendini düzenleyen harita sınıflandırıcıları danışmansız sınıflandırıcılara örnek olarak verilebilir.

(29)

2.3 Otomatik Öznitelik Çıkarma Yöntemleri

Sınıfları birbirinden ayıran doğru özniteliklerin tespit edilmesi, sınıflandırma performansını arttırmada önemli bir işlemdir. Sınıflandırmanın performansı öznitelik seçimiyle doğru orantılıdır. Bu nedenle öznitelik çıkarma işlemi çok önemlidir. Örüntü üzerinde öznitelik çıkarımı için otomatik algoritmalar kullanılabileceği gibi, amaca uygun yöntemler de kullanılabilir. Bu çalışmada örüntü, görüntü olduğu için aşağıda anlatılan otomatik öznitelik çıkarma algoritmaları görüntü üzerinden açıklanacaktır.

2.3.1 Gabor dalgacık dönüşümü

Gabor dalgacıkları, gelişmiş canlılardaki konik görme sinirlerinin uzaysal frekans ve yönelim seçici özellikleri kullanılarak hazırlanmış, imgeleri etkin bir şekilde analiz etmeyi sağlayan süzgeçlerdir. Gabor filtreleri ilk olarak Dennis Gabor tarafından gürültülü bir boyutlu sinyal tespitinde kullanılmıştır (Gabor 1946) ve daha sonra yapılan çalışmalarla geliştirilmiştir (Daugman 1980, Manjunath vd. 1992, Lades vd. 1993, Wiskott vd. 1999).

Gabor dalgacıkları aydınlatma, ifade ve poz kaynaklı bozulmalara karşı dayanıklılığından dolayı yüz tanımada başarıyla kullanılmaktadır (Shen ve Bai 2006, Kepenekçi 2001, Shen ve Bai 2006). Frekans ve yönelim karakteristiklerine göre insan görsel sistemiyle büyük benzerlik göstermektedir. Gabor dalgacıkları gerek yönelim, gerekse uzaysal lokalizasyon için mükemmel bir filtre oluşturur (Ghosal vd. 2009).

Kompleks bir Gabor dalgacığı Gauss biçimli zarf fonksiyonu ile çarpılmış sinüsler olarak tanımlanabilir. 2 boyutlu bir Gabor dalgacık dönüşümü I(x,y) imgesinin katlanmasıyla ifade edilir. Dalgacıklar Eşitlik 2.1’de gösterilmektedir (Petkov vd.

1997). Burada , fonksiyonu Gabor filtresini ifade eder.

, , , (2.1)

(30)

, ; λ, , , , ex12 2y122 2 cos 2π

λ (2.2)

cos (2.3)

(2.4)

Yukarıdaki formülde belirtilen , kosinüs dalgasının dalga boyunu belirler. dalgacığın yönelimini, sinüsün fazını, Gauss biçiminin yarıçapını, Gauss biçiminin en boy oranını belirtmektedir.

2.3.2 Ölçekten Bağımsız Öznitelik Dönüşümü (Scale Invariant Feature Transform- SIFT)

Lowe (2004) tarafından geliştirilen bu algoritma tek bir görüntü dilimini giriş olarak alıp bu görüntü üzerindeki öznitelik bilgilerini vermektedir. Her bir öznitelik noktası, konum, ölçek, yönelim ve tanımlama vektörü içermektedir. Tanımlama vektörü ve tanımlanan nokta, bakış açısına ve ölçek değişimine ve kısmen ışık değişimlerine bağımlı değildir (Lowe 1999).

Görüntüdeki özniteliklerin belirlenmesi ve çoğunlukla görüntülerin eşleştirilmesinde kullanılmasından dolayı görüntü işleme algoritmaları arasında önemli bir yere sahiptir (Kocadere, 2010). Öznitelik belirleme, robotik sistemlerde nesne tanımlama ve takip etme (Hu vd. 2008), fotoğrafçılıkta mozaikleme gibi farklı birçok görüntü işleme uygulamasında kullanılabilir.

Bu algoritmanın dört ana aşaması bulunmaktadır. Birinci aşamada görüntüye I(x,y) farklı ölçeklerde (σ, kσ, k2 σ,…) Gauss biçimli süzgeç (G(x,y, σ)) uygulanır (2.5-2.6).

Ardışık ölçeklerden elde edilen görüntünün farkı hesaplanır (2.7-2.8) (Difference Of Gaussian-DOG). Her nokta, çevresindeki 8 piksel ve komşu ölçeklerdeki 9’ar piksel ile karşılaştırılır. Şayet piksel o bölgenin yerel maksimumu ya da yerel minimum ise aday öznitelik olarak belirlenir.

(31)

, , σ 21 2 2 /2 2 (2.5)

, , σ , , σ , (2.6)

, , σ , , kσ , , σ , (2.7)

, , σ , , kσ , , σ (2.8)

İkinci aşamada, adaylar içinde düşük kontrasta sahip olanların ve zayıf şekilde kenarlarda bulunan özniteliklerin elenmesi gerekmektedir. Eleme 2x2 Hessian matris (H) kullanılarak hesaplanan kararlılık durumuna göre yapılır (Yavuz 2008).

ı ı

2

2 1 2 , 2.9

Eşitlik 2.9’daki D, ölçek uzayındaki görüntünün türevi, r’de en büyük özdeğerin en küçüğe oranıdır ve kararlılığı kontrol etmek için kullanılmaktadır.

Üçüncü aşamada eleme sonrası kalan noktaların (özniteliklerin) komşu piksellerinde yönelim vektörleri ve bunların büyüklükleri hesaplanarak yönelim histogramı oluşturulur. Bu işlem özniteliklerin dönmeden bağımsız olmasını sağlar.

Dördüncü aşamada ise her nokta için tanımlayıcıların belirlenmesi aşamasıdır. Bu belirleme anahtar noktaların ışık değişiminden etkilenmemesini, bağımlı olmamasını sağlamaktadır. Her bir anahtar noktanın çevresindeki gradyant bilgisinden 4x4’lük çevresi alınarak tanımlayıcı histogram değerleri oluşturulur. Her histogram 45o açı farkı olan 8 yönelime sahiptir. 4x4’lük bir pencerede bunlardan 16 adet bulunmaktadır.

Böylece anahtar nokta tanımlayıcısının vektör uzunluğu 128’dir. Öznitelik noktasının görüntüdeki yeri (x,y), karakteristik ölçeği (σ), yönelimi (Ө) ve 128 uzunluğundaki betimleyici vektör, SIFT betimleyici özniteliğini oluşturur.

(32)

2.4 Sınıflandırma Yöntemleri

Örüntü tanıma sistemlerinin başarısında, sınıflandırma yöntemi çok önemlidir. Örüntü tanıma sistemlerinde hangi sınıflandırıcının kullanılacağı örüntünün çeşidi, örüntüden elde edilen özniteliklerin yapısı ve sayısı, işlem süresi ve karmaşıklığı gibi faktörler göz önüne alınarak belirlenmektedir. Buna rağmen örüntü tanıma problemlerinde genel olarak hangi sınıflandırma yönteminin en iyi ya da en uygun olduğu kesin olarak söylenemez.

2.4.1 Yapay sinir ağları (YSA)

Yapay Sinir Ağları, insan beyninden esinlenerek geliştirilmiş, ağırlıklı bağlantılar aracılığıyla birbirine bağlanan ve her biri kendi belleğine sahip işlem elemanlarından (nöron) oluşan paralel ve dağıtılmış bilgi işleme yapılarıdır (Elmas 2003). Bir nöron temel olarak, bağlantı ağırlıkları (sinaptik bağıntılar), toplayıcı fonksiyonu ve aktivasyon fonksiyonu olmak üzere üç bölümden oluşmaktadır (Şekil 2.8).

Şekil 2.8 Yapay nöron modeli

(33)

Şekil 2.8’den de görüleceği gibi girişler, bağlantı ağırlıkları ile çarpılarak toplayıcıya uygulanmakta, eşik değerinin de ( k) eklenmesiyle elde edilen ağırlıklı toplam (Ik), aktivasyon fonksiyonundan geçirilerek çıkışlar elde edilmektedir. Eşitlik 2.10 ve 2.11’de Ik’nın ve çıkışın (Ok) hesaplanması verilmiştir.

∑ (2.10)

(2.11)

İnsan beyninin ve düşünme yeteneğinin taklit edilmesi isteği oldukça eskiye dayanmaktadır ancak YSA hesaplama modelinin temelleri 1940’lı yıllarda atılmıştır.

McCulloch ve Pitts YSA hakkında yapılan çalışmaları mühendislik alanına kaydırmış ve günümüzdeki YSA’nın temelleri oluşturulmuştur (Caianiello 1961). 1949 yılında nörolog olan Hebb, beynin nasıl öğrendiği ile ilgili çalışmalar yapmış ve çalışmalarına beynin en temel birimi olan sinir hücresini ele alarak başlamıştır. Donald Hebb günümüzdeki birçok öğrenme kuralının da temelini oluşturan “Hebbian Öğrenme” adı verilen öğrenme kuralını geliştirmiştir. 1954 yılında Farley ve Clark tarafından rassal ağlar ile adaptif üretme kavramı ortaya atılmıştır ve bu kavram daha sonraları 1958 yılında Rossenblatt ve 1961 yılında Cainaello tarafından geliştirilmiştir. Rosenblatt tarafından geliştirilen algılayıcı model (perceptron) YSA tarihinde önemli bir gelişme olarak kabul edilmektedir (Rossenblatt 1958). Bu model daha sonraları geliştirilecek ve YSA’nda devrim niteliğinde olacak olan çok katmanlı algılayıcıların temelini oluşturmuştur (Sipahi 2008). 1960 yılında Widrow ve Hoff, Adaptif Lineer Nöron modelini ortaya atmışlardır (Widrow ve Hoff 1960). Yapay Zeka biliminin o dönemde önde gelen isimlerinden Minsky ve Pappert tarafından yazılan “Perceptrons” isimli bir kitap (Minsky ve Pappert 1969) YSA çalışmalarının duraklamasına neden olmuştur. Bu kitapta yazarlar özellikle YSA’na dayalı algılayıcıların bilimsel bir değerinin olmadığını ve doğrusal olmayan problemlere çözüm üretemediğini iddia etmişler ve bunu kanıtlamak için XOR probleminin çözülmesini örnek göstermişlerdir. 1982 ve 1984 yıllarında Hopfield tarafından yayınlanan çalışmalar, YSA’nın genelleştirilebileceğini ve özellikle geleneksel bilgisayar programlama ile çözülmesi zor olan problemlere çözüm üretebileceğini göstermiştir (Hopfield 1982). Rumelhart ve arkadaşları çok

(34)

katmanlı algılayıcı modelin temellerini atmışlardır ve daha sonra bu modeli geliştirmişlerdir (Rumelhart vd. 1986). Bu sayede tek katmanlı algılayıcının çözemediği XOR problemi çok katmanlı algılayıcı ile çözülmüştür. 1987 yılından bu yana yapılan çalışmalarla her yıl değişik sempozyumlarda ve konferanslarda YSA tartışılmakta ve yeni modeller ve öğrenme teknikleri ortaya atılmaktadır.

Günümüzde birçok alanda YSA uygulamalarına rastlamak olasıdır. Özellikle örüntü tanıma, işaret işleme, sistem tanımlama ve lineer olmayan denetim alanlarında YSA’nın farklı öğrenme stratejileri ve modelleri başarı ile kullanılmıştır.

YSA ile bir problemin çözümü yapılmadan önce en iyi sonuçları elde edebilmek için, ağın öğrenme mekanizmasını, mimarisini, öğrenme algoritmasını başlangıçta belirlemek gereklidir.

Literatürde, öğrenme mekanizması “Danışmanlı” ve “Danışmansız” olmak üzere iki gruba ayrılmıştır. Eğer çalışmada hedef çıkış değerleri var ise öğrenme mekanizması danışmanlı öğrenme, eğer yok ise danışmansız öğrenme olarak adlandırılır.

Ağın mimarisini belirlemek de yapılacak ikinci seçimdir. Verinin akış yönü ve sahip olabileceği yapısal farklılıklar bu bölümde seçilir.

Ağın öğrenme algoritması da üçüncü önemli seçenektir. Öğrenme olgusunu, matematik kuralları ile ölçülebilir büyüklüklere dönüştürerek, bir başarım ya da hata ölçütünün oluşturulmasını sağlarlar. Öğrenme algoritması, başarım ölçütünün zaman içinde artmasını ya da hata ölçütünün zaman içinde azalmasını sağlayacak parametre değişikliklerinin hesaplanmasına dayanır (Tezel 2007).

Bu çalışmada danışmanlı öğrenme mekanizması uygulanmış olup, çok katmanlı, ileri beslemeli YSA mimarisi kullanılmıştır. Öğrenme algoritması olarak Geri Yayılım algoritması uygulanmıştır. Ağırlık parametrelerinin güncellenmesi, her bir eğitim çifti

(35)

için hesaplanan hata değerine göre yapılmaktadır. Bu çalışmada ayrıca olasılıksal yapay sinir ağları da kullanılmıştır.

2.4.1.1 Aktivasyon fonksiyonları

Yapay sinir ağlarında aktivasyon fonksiyonlarının görevi, bir nöronun giriş değerinin genliğini istenilen değerler arasında sınırlamaktır. Şekil 2.9’da en çok kullanılan aktivasyon fonksiyonları gösterilmiştir.

Şekil 2.9 YSA’da yaygın olarak kullanılan aktivasyon fonksiyonları a.Doğrusal b.Rampa c).Basamak d.Hiperbolik Tanjant Sigmoid fonksiyonları

2.4.1.2 Çok Katmanlı ileri beslemeli YSA

Çok katmanlı model en çok kullanılan YSA modelidir. Çok katmanlı bir YSA modelinde, bir katmandaki nöronların çıkışları diğer katmanın nöronlarının girişlerini oluşturur. Giriş ve çıkış katmanının arasında kalan katmanlara gizli katmanlar denir.

Giriş ve çıkış katmanlarındaki nöron sayılarını hesaplamaları yapılacak verilerin sayıları belirlerken, gizli katmandaki nöronların sayıları probleme göre değişiklik gösterir.

(36)

İleri beslemeli bir ağda her bir katmandaki nöronlar sadece önceki katmanın nöronları ile beslenir ve bilgi akışı sadece ileri doğrudur. Çok katmanlı YSA’lar öğrenme ve genelleme yeteneği, düşük eğitim gereksinimleri, eğitimden sonra hızlı işlem yapabilme ve kolay gerçekleştirim gibi özelliklere sahiptirler. Tek katmanlı YSA ile çözülemeyen problemler çok katmanlı YSA modeli ile çözülebilmektedir. Şekil 2.10’da ileri beslemeli çok katmanlı bir YSA modeli gösterilmektedir.

Şekil 2.10 İleri beslemeli çok katmanlı bir YSA modeli

İleri beslemeli YSA’da nöronlar, katmanlar şeklinde düzenlenir ve bir katmandaki nöronların çıkışları bir sonraki katmana ağırlıklar üzerinden giriş olarak verilir. Giriş katmanı dış ortamdan aldığı bilgileri gizli katmandaki nöronlara iletir. Her nöronun birden fazla girişi ve sadece bir çıkışı vardır. Giriş nöronları hariç tüm nöronların her bir girişi, önceki katmanda bulunan bir başka nöronun çıkışı ile ilişkilidir. Çıkış sinyalleri, sonraki katmanda bulunan nöronlara iletilirken arada bulunan ağırlıklar ile çarpılır.

Çarpım, sonraki nöron için bir giriş sinyali niteliğindedir. Bir nöron çıkış üretirken kendisine iletilen tüm giriş sinyallerini toplar ve bu toplamı aktivasyon fonksiyonundan geçirir. Giriş katmanındaki nöronların ağrılıkları yoktur. Bu nöronlar girişlerini dışarıdan alır ve çıkış üretmek için aktivasyon fonksiyonu kullanmaz. Giriş katmanı nöronları dışındaki tüm nöronlar, yukarıda olduğu gibi çıkış değerleri üretir. Bilgi, gizli

(37)

katmanda ya da katmanlarda ve çıkış katmanında işlenerek ağ çıkışı belirlenir. Son katmanda bulunan nöronların çıkış değerleri ağın çıkışıdır.

Yapay sinir ağlarında kaç tane gizli katman kullanılacağı, her gizli katmanda kaç tane nöron olması gerektiği bugüne kadar belirlenememiştir. Probleme göre değişen bu nitelikler deneme yanılma yoluyla bulunmaktadır. En çok bilinen, danışmanlı öğrenmede kullanılan geri yayılım öğrenme algoritmasıdır ve bu algoritma YSA’nın eğitiminde etkin olarak kullanılmaktadır.

2.4.1.3 Geri yayılım algoritması

Geri yayılım algoritması YSA’da en çok kullanılan öğrenme algoritmasıdır. Katmanlar arasında tam bir bağlantının bulunduğu çok katmanlı, ileri beslemeli ve öğreticili olarak eğitilen bir eğitim algoritmasıdır ve hataları geriye doğru çıkıştan girişe azaltmaya çalışmasından dolayı bu ismi almıştır. Geri yayılım öğrenmesi sırasında ağ, her girişi, çıkış nöronlarında sonuç üretmek için gizli katmanlardaki nöronlardan geçirir. Daha sonra çıkış katmanındaki hataları bulabilmek için, beklenen sonuçla elde edilen sonuç karşılaştırılır. Çıkış hatalarının türevi çıkış katmanından geriye doğru gizli katmanlara geçirilir. Hata değerleri bulunduktan sonra, nöronlar hatalarını azaltmak için ağırlıklarını ayarlar. Bu durum özetlenecek olursa geri yayılım algoritması üç aşamadan oluşur; giriş eğitim verisinin ağda ileriye doğru yayılması, verilen hedef değerlerine karşılık hatanın hesaplanması ve bu hatanın geriye doğru yayılarak ağırlıkların ayarlanması şeklindedir. Bu üç aşamanın tamamına “çevrim” adı verilir.

Geri yayılım algoritmasına göre öncelikle eğitim setinin bir segmentinin (x1, x2,…,xm)

ağda işlenmesinden sonra, ağın üretmesi beklenen hedef çıkış (d1, d2,…, dp) ağa verilir.

Giriş katmanına uygulanan giriş değerleri yukarıda da bahsedildiği gibi hiçbir işlem uygulanmadan gizli katmana iletilir. Gizli katmanda bulunan herhangi bir i. nöronun ağırlıkları girişlerinin toplamı Eşitlik 2.12’deki gibi hesaplanır.

∑ (2.12)

(38)

Burada t, bir önceki katmanda bulunan düğüm sayısı, wji j. nöronun bir önceki katmanda bulunan i. nöron arasındaki bağlantı ağırlığının değeri, Oi bir önceki katmanda bulunan nöron çıkışı ve eşik elemanının değeridir. Bir nöronun ağırlıklı toplamı elde edildikten sonra Eşitlik 2.13’te gösterildiği gibi, Oj nöron çıkışını bulmak için, çıkış aktivasyon fonksiyonuna (ψ(.)) uygulanır.

ψ I n (2.13)

Bütün nöronların ağırlıklı giriş değerleri ( ) ve çıkış değerleri (Oj) Eşitlik 2.12 ve 2.13’teki gibi hesaplanır. Daha sonra ağın ürettiği çıkış değeri ile beklenen çıkış arasındaki fark bütün nöronlara yansıtılır. Başka bir deyişle Oj(n) ile dj(n) karşılaştırılır ve aralarındaki fark alınır. Aradaki fark (ej(n)), n. segment için j. çıkış nöronundaki hata değerini ifade eder. Bu değer Eşitlik 2.14’te gösterildiği gibi bulunur. Toplam hata, eğitim setindeki bütün segmentler için bulunan hataların toplanması ile bulunur. Eşitlik 2.15’te gösterildiği gibi toplam hata bulunur.

(2.14)

1 (2.15)

Çıkış katmanında bulunan bütün nöronlar için hata bulunduktan sonra ağırlıkların güncellenmesi için gerekli eğim değerleri çıkış katmanından gizli katmana doğru hesaplanır. Çıkış katmanında bulunan j. nöronun eğim değeri ( ), karesel hatanın nöron girişine göre birinci türevi alınarak bulunur (Mittchell 1997). Çıkış katmanındaki bir nöron için eğim, nöronun hata değeri ve aktivasyon fonksiyonunun türevi ile hesaplanır.

Eşitlik 2.16-2.20’de eğim değerinin nasıl hesaplandığı gösterilmektedir.

(2.16)

(39)

(2.17)

(2.18)

(2.19)

(2.20)

Çıkış katmanındaki bütün nöronlar için eğim hesaplandıktan sonra, gizli katmandaki nöronların eğim hesabı yapılır. Gizli katmanda bulunan herhangi bir nöronun çok katmanlı YSA mimarisine göre çıkış katmanındaki bütün nöronlarla bağlantısı vardır.

Bu nedenle herhangi bir gizli katman nöronunun eğimi hesaplanırken çıkış katmanındaki bütün nöronlar dikkate alınır (Tezel 2007). Yukarıdaki eşitliklerden yola çıkılarak gizli katmanda bulunan nöronlar için eğim ifadesi Eşitlik 2.21’deki gibi hesaplanmaktadır. Eşitlikteki p çıkış katmanında bulunan nöron sayısını, Ij gizli katman nöron girişini ifade etmektedir.

∑ (2.21)

Eşitlik 2.21’den de anlaşılacağı üzere, gizli katmandaki nöronların eğimi için öncelikle çıkış katmanındaki nöronların eğim değeri ile bağlantı ağırlıklarının çarpımlarının toplamı bulunarak, gizli katmandaki nöron aktivasyon fonksiyonunun türevi ile çarpılır (Tezel 2007).

Bu işlemlerden sonra, gizli katmanda ve çıkış katmanında bulunan nöronların eğim değerlerine bağlı olarak önce giriş katmanı ile gizli katman arasındaki ağırlıklar, daha sonra gizli katman ile çıkış katmanı arasındaki ağırlıklar güncellenir. Yeni ağırlık

(40)

değerini bulabilmek için önceki değer ile ağırlıktaki değişim miktarına ihtiyaç vardır, ağırlığın yeni değerinin bulunması Eşitlik 2.22’de verilmiştir.

Δ (2.22)

Δ (2.23)

(2.24)

Burada , bir sonraki çevrim için ağırlığın alacağı yeni değerini, ağırlığın önceki değerini, öğrenme oranını ve ağırlık değerlerinde olması gereken değişim miktarını ifade etmektedir. Ağırlık değişim miktarı Eşitlik 2.25’teki gibi bulunmaktadır.

Δ (2.25)

Burada , çalışılan katmandaki j. nöronun eğimidir, bir önceki katmanda bulunan i.

nöronun çıkış değerini ifade eder. Nöronların eşik ağırlık değerleri, nöronlar arasındaki bağlantı ağırlık değeri ile aynı şekilde, Eşitlik 2.26- 2.29’daki gibi hesaplanır.

∆ (2.26)

∆ (2.27)

(2.28)

(2.29)

(41)

Bir sonraki çevrimde kullanılacak yeni eşik ağırlık değeri Eşitlik 2.29’dan değişim hesaplanarak Eşitlik 2.26’daki gibi hesaplanır.

Bir çevrim boyunca, ağın girişine uygulanan eğitim veri segmenti ağırlıkların değerine göre ve nöronlarda bulunan aktivasyon fonksiyonuna göre, giriş katmanından başlayarak çıkış katmanının nöron çıkışları hesaplanıncaya kadar yayılır. Çıkış katmanından elde edilen nöron çıkış değerleri, beklenen çıkış değerleriyle karşılaştırılır.

Buradan elde edilen fark bütün ağa geriye yayılma şekliyle çıkış katmanından giriş katmanına doğru yansıtılır ve bütün nöronlar için eğim değerleri hesaplanır. Bu eğim değerlerine göre ağırlıklar güncellenir. Eğitim setinin tamamı için bilgi işleme aşamasının tamamlanmasına bir “iterasyon” denir (Haykin 1999). Eğitimin amacı ağın girişlere karşılık çıkışın hedef çıkış değerleriyle aynı olmasını sağlamaktır. Ağın eğitilmesi elde edilen ağ çıkışı ile hedeflenen ağ çıkışları arasındaki hata kabul edilebilir düzeye ininceye kadar devam eder. Çok katmanlı ileri beslemeli YSA yapısında maksimum iterasyon sayısı ve minimum hata değeri durdurma kriteri olarak belirlenmiştir.

Eğitim işlemi, önceden tespit edilmiş beklenen bir değere ulaşıncaya kadar devam eder, bu değere ulaşmak ağın uygun çıkış üretmesini sağlayan ağırlık değerlerinin bulunduğu anlamına gelir. Eğitim tamamlandıktan sonra ağın başarısı test veri seti ile ölçülmektedir.

2.4.2 Olasılıksal yapay sinir ağları

Olasılıksal YSA 1990’de Donald Specht tarafından geliştirilmiştir. Olasılıksal yapay sinir ağları radyal tabanlı yapay sinir ağları (RTYSA) yapısından türetilmiştir. RTYSA modellerinde en çok kullanılan aktivasyon fonksiyonu Gauss fonksiyonudur. Gauss fonksiyonunda olan dağılım (spread) sabiti (s) RTYSA’nın performansını önemli ölçüde etkilemektedir. Dağılım sabitinin değeri çok küçük ya da çok büyük seçilirse (yaklaşık olarak s=1) ağ iyi sonuç veremez (Wu vd. 2007).

Referanslar

Benzer Belgeler

Şimdi space-like vektör kısımlı birim time-like split kuaterniyonlar ile space-like koni üzerinde yatan space-like sabit eğimli yüzeylerin bağlantısını verelim... Bu ise

Yapılan testler ve çeşitli görüntüleme teknikleri ile elde edilen görüntüler; Hücre Dışı Matriks benzeri iskele yapı üzerinde ve tasarlanan yapay niş mikroçevrede,

Son bölümde ise 3 ve n−boyutlu Lorentz uzaylarında özel regle yüzeyler olan time- like B−scroll’lar tanıtılmı¸stır ve 3−boyutlu Lorentz uzayında dayanak e˘grisinin

Benzer şekilde korelasyon analizleri incelendiğinde, peyzaj değerleri alt boyutlarından manevi değer, yapısal çevre, rekreasyonel değer, donatı elemanları,

1) Ultrasonik etki ve iyonik jelleşme yöntemleri ile sentezlenen ilaç yüklü örneklerin yükleme etkinlikleri HPLC analizi ile % 66 olarak bulunmuştur. 2) Ultrasonik etki ve

Literatürde son yıllarda yapılmış bilineer modelleme çalışmaları incelendiğinde Fan (Fan vd. 2011) ve PPNM (Polynomial post-nonlinear model) (Altmann 2012)

Buna göre kalınlığa bağlı olarak doyum eşik şiddetindeki değişikliği görmek için farklı kalınlardaki (50, 58, 65 ve 75 nm) GaSe x S 1-x amorf ince filmlerinin

Test edilen sistem çok büyük olasılıkla böyle bir görüntüleme amacıyla kullanılacak olmamasına karşın, optik sistemin kaçak ışın performansının