• Sonuç bulunamadı

Veri kümeleme amacıyla yeni hibrit bir algoritma geliştirilmesi

N/A
N/A
Protected

Academic year: 2021

Share "Veri kümeleme amacıyla yeni hibrit bir algoritma geliştirilmesi"

Copied!
64
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

T.C.

DÜZCE ÜNİVERSİTESİ

FEN BİLİMLERİ ENSTİTÜSÜ

VERİ KÜMELEME AMACIYLA YENİ HİBRİT BİR

ALGORİTMA GELİŞTİRİLMESİ

HATİCE ARSLAN

YÜKSEK LİSANS TEZİ

ELEKTRİK-ELEKTRONİK VE BİLGİSAYAR MÜHENDİSLİĞİ

ANABİLİM DALI

DANIŞMAN

Dr. Öğr. Üyesi METİN TOZ

(2)

ii

T.C.

DÜZCE ÜNİVERSİTESİ

FEN BİLİMLERİ ENSTİTÜSÜ

VERİ KÜMELEME AMACIYLA YENİ HİBRİT BİR

ALGORİTMA GELİŞTİRİLMESİ

Hatice Arslan tarafından hazırlanan tez çalışması aşağıdaki jüri tarafından Düzce Üniversitesi Fen Bilimleri Enstitüsü Elektrik Elektronik ve Bilgisayar Mühendisliği Anabilim Dalı’nda YÜKSEK LİSANSTEZİ olarak kabul edilmiştir.

Tez Danışmanı

Dr. Öğr. Üyesi Metin TOZ Düzce Üniversitesi

Jüri Üyeleri

Doç. Dr. Devrim AKGÜN

Sakarya Üniversitesi _____________________

Doç. Dr. Pakize ERDOĞMUŞ

Düzce Üniversitesi _____________________

Dr. Öğr. Üyesi Metin TOZ

Düzce Üniversitesi _____________________

(3)

iii .

BEYAN

Bu tez çalışmasının kendi çalışmam olduğunu, tezin planlanmasından yazımına kadar bütün aşamalarda etik dışı davranışımın olmadığını, bu tezdeki bütün bilgileri akademik ve etik kurallar içinde elde ettiğimi, bu tez çalışmasıyla elde edilmeyen bütün bilgi ve yorumlara kaynak gösterdiğimi ve bu kaynakları da kaynaklar listesine aldığımı, yine bu tezin çalışılması ve yazımı sırasında patent ve telif haklarını ihlal edici bir davranışımın olmadığını beyan ederim.

15 Mayıs 2018

(4)

iv

.

TEŞEKKÜR

Yüksek lisans öğrenimimde ve bu tezin hazırlanmasında gösterdiği her türlü destek ve yardımdan dolayı değerli hocam Dr. Öğr. Üyesi Metin TOZ’a en içten dileklerimle teşekkür ederim.

Bu çalışma boyunca yardımlarını ve desteklerini esirgemeyen sevgili aileme ve arkadaşlarıma sonsuz teşekkürlerimi sunarım.

(5)

v

İÇİNDEKİLER

Sayfa No

ŞEKİL LİSTESİ ... VII

ÇİZELGE LİSTESİ ... VIII

KISALTMALAR ... IX

SİMGELER ... X

ÖZET ... XI

ABSTRACT ... XII

1.

GİRİŞ ... 1

2.

KÜMELEME ANALİZİ... 11

2.1. K-MEANS KÜMELEME ALGORİTMASI ... 11

2.2. FUZZY C-MEANS ALGORİTMASI (FCM) ... 12

2.2.1. FCM Algoritmasında Kullanılan Uzaklık Fonksiyonları ... 13

2.3. KÜMELEME PERFORMANS DEĞERLENDİRME KRİTERLERİ ... 14

2.3.1. Rand İndeks ... 14

2.3.2. Adjust Rand İndeks ... 14

3.

FCM VE KAOTIK BOA ALGORITMALARI İLE VERİ

KÜMELEME ... 15

3.1. BALİNA OPTİMİZASYON ALGORİTMASI (BOA) ... 15

3.1.1. Dönerek Avlanma ... 16

3.1.2. Kabarcık Ağ Saldırı Metodu (Yerel Arama) ... 17

3.1.3. Av Arayışı (Global Arama) ... 19

3.2. KAOTİK HARİTALAR ... 20

3.3. KAOTİK HARİTALARIN BOA ALGORİTMASINA UYGULANMASI .. 23

4.

DENEYSEL ÇALIŞMALAR ... 26

4.1. FCM VE KAOTİK BOA ALGORİTMALARI İLE VERİ KÜMELEME .. 33

(6)

vi

6.

KAYNAKLAR ... 49

ÖZGEÇMİŞ ... 52

(7)

vii

ŞEKİL LİSTESİ

Sayfa No

Şekil 1.1. Kümeleme yöntemleri. ... 2

Şekil 1.2 Kümeleme yöntemlerine genel bakış. ... 2

Şekil 3.1 Kambur balinanın avlanma davranışı ... 15

Şekil 3.2. Küçülerek dönme mekanizması (2 boyutlu). ... .17

Şekil 3.3. Spiral güncelleme. ... 18

Şekil 3.4. Avlanma davranışının su yüzeyindeki görüntüsü. ... 19

Şekil 3.5 BOA Algoritmasının sözde kodu ... 20

Şekil 3.6. Kaotik haritaların grafikleri. ... 22

Şekil 3.7 Chebyshev Haritanın normalizasyon grafiği. ... 24

Şekil 3.8 Normalize edilen Chebyshev Harita ile a değişkenin toplanması. ... 24

Şekil 3.9. Normalize edilen kaos haritaları ile toplanan a değerleri. ... 24

Şekil 4.1. KBOA algoritmalarının F1 fonksiyonu için en iyiye yakınsama eğrileri. ... 29

Şekil 4.2. KBOA algoritmalarının F2 fonksiyonu için en iyiye yakınsama eğrileri. ... 30

Şekil 4.3. KBOA algoritmalarının F3 fonksiyonu için en iyiye yakınsama eğrileri. ... 30

Şekil 4.4. KBOA algoritmalarının F4 fonksiyonu için en iyiye yakınsama eğrileri. ... 30

Şekil 4.5. KBOA algoritmalarının F5 fonksiyonu için en iyiye yakınsama eğrileri. ... 30

Şekil 4.6. KBOA algoritmalarının F6 fonksiyonu için en iyiye yakınsama eğrileri. ... 31

Şekil 4.7. KBOA algoritmalarının F7 fonksiyonu için en iyiye yakınsama eğrileri. ... 31

Şekil 4.8. KBOA algoritmalarının F8 fonksiyonu için en iyiye yakınsama eğrileri. ... 31

Şekil 4.9. KBOA algoritmalarının F9 fonksiyonu için en iyiye yakınsama eğrileri. ... 31

Şekil 4.10. KBOA algoritmalarının F10 fonksiyonu için en iyiye yakınsama eğrileri. . 32

Şekil 4.11. KBOA algoritmalarının F11 fonksiyonu için en iyiye yakınsama eğrileri. . 32

Şekil 4.12. KBOA algoritmalarının F12 fonksiyonu için en iyiye yakınsama eğrileri. . 32

Şekil 4.13. KBOA algoritmalarının F13 fonksiyonu için en iyiye yakınsama eğrileri. . 32

Şekil 4.14. Kaos tabanlı BOA Algoritmasının sözde kodu. ... 34

(8)

viii

.

ÇİZELGE LİSTESİ

Sayfa No

Çizelge 2.1. K-Means algoritmasının sözde kodu. ... 11

Çizelge 3.1. Kaotik haritaların denklem ve ürettikleri sayı aralıkları. ... 21

Çizelge 4.1. Amaç fonksiyon denklemleri. ... 27

Çizelge 4.2. KBOA algoritmalarının istatistiksel sonuçları. ... 28

Çizelge 4.3. FCM-KBOA1 ve FKBOA1-c algoritmalarının kümeleme sonuçları. ... 35

Çizelge 4.4. FCM-KBOA2 ve FKBOA2-c algoritmalarının kümeleme sonuçları. ... 36

Çizelge 4.5. FCM-KBOA3 ve FKBOA3-c algoritmalarının kümeleme sonuçları. ... 38

Çizelge 4.6. FCM-KBOA4 ve FKBOA4-c algoritmalarının kümeleme sonuçları. ... 39

Çizelge 4.7. FCM-KBOA5 ve FKBOA5-c algoritmalarının kümeleme sonuçları. ... 40

Çizelge 4.8. FCM-KBOA6 ve FKBOA6-c algoritmalarının kümeleme sonuçları. ... 41

Çizelge 4.9. FCM-KBOA7 ve FKBOA7-c algoritmalarının kümeleme sonuçları. ... 42

Çizelge 4.10. FCM-KBOA8 ve FKBOA8-c algoritmalarının kümeleme sonuçları. ... 43

Çizelge 4.11. FCM-KBOA9 ve FKBOA9-c algoritmalarının kümeleme sonuçları. ... 44

(9)

ix

KISALTMALAR

ABD Amerika Birleşik Devletleri

ABC Ateş Böceği Algoritması

BOA Balina Optimizasyon Algoritması BSA Geri İzleme Arama Algoritması

BT Benzetimli Tavlama

DEA Diferansiyel Evrim Algoritması DVM Destek Vektör Makineleri

DVR Destek Vektör Regresyonu

ETLBO Elicit Teching Learning Based Optimization

FCM Fuzzy C-Means

GA Genetik Algoritma

KDM Karar Destek Makineleri

KDPSO Kuantum Davranışlı Parçacık Sürü Optimizasyonu KKO Karınca Koloni Optimizasyonu

KSYAA Kuş Sürüsü Yerçekimi Arama Algoritması

NFL No Free Lunch Theorem

OOA Orman Optimizasyon Algoritması PSO Parçacık Sürü Optimizasyonu

RSVM Relaxed Constraints Support Vector Machines

UA Uyum Araması

USBM ABD Maden Bürosu

YAA Yerçekimi Arama Algoritması

YAK Yapay Arı Kolonisi Algoritması YBSA Yapay Balık Sürüsü Algoritması

(10)

x

.

SİMGELER

(11)

xi

.

ÖZET

VERİ KÜMELEME AMACIYLA YENİ HİBRİT BİR ALGORİTMA GELİŞTİRİLMESİ

Hatice ARSLAN Düzce Üniversitesi Fen Bilimleri Enstitüsü

Elektrik-Elektronik ve Bilgisayar Mühendisliği Anabilim Dalı Yüksek Lisans Tezi

Danışman: Dr. Öğr. Üyesi Metin TOZ Mayıs 2018, 51 sayfa

Bu tez çalışmasında, kambur balinaların avlanma davranışlarından esinlenilerek geliştirilmiş global bir optimizasyon algoritması olan Balina Optimizasyon Algoritması (BOA), performansı kaos haritaları ile iyileştirildikten sonra veri kümeleme problemlerinde sıklıkla kullanılan Fuzzy C-Means (FCM) algoritmasıyla hibrit edilmiş ve kaotik BOA algoritmaları önerilmiştir. Önerilen algoritmaların performansları ortalama amaç fonksiyon, standart sapma ve Wilcoxon Sign Rank Test ile 0,05 önem düzeyinde değerlendirilmiş, 13 farklı amaç fonksiyon ile test edilmiştir. Önerilen kaotik BOA algoritmalarının her biri BOA algoritmasıyla karşılaştırılmış, performans gelişimi hem istatistiksel olarak hem de grafiksel olarak gösterilmiştir. Ardından, önerilen kaotik BOA algoritmaları FCM algoritması ile bütünleştirilerek hibrit veri kümeleme algoritmaları önerilmiştir. Hibrit veri kümeleme algoritmalarının kümeleme performansları amaç fonksiyon, Rand İndeks ve Adjust Rand İndeks değerleri ile ölçülmüş, UCI Machine Learning Repository veri tabanından seçilen 7 farklı veri kümesi ile test edilerek FCM algoritması ile karşılaştırılmıştır. Bunlara ek olarak, önerilen hibrit algoritmaların veri kümeleme performanslarını arttırmak amacıyla FCM algoritmasındaki tüm uzaklıklar Öklid yerine Chebyshev uzaklık fonksiyonu ile hesaplanarak yeni hibrit kümeleme algoritmaları önerilmiştir. Önerilen tüm algoritmalar hem birbirleriyle hem de FCM algoritmasıyla karşılaştırılmış, FCM algoritmasından daha iyi veri kümeleme yapabildikleri gözlemlenmiştir. Sonuç olarak kaos fonksiyonlarının BOA algoritmasının optimizasyon performansını geliştirdiği, kaos tabanlı BOA algoritmaları ile FCM algoritmasının bütünleştirilmesinin FCM algoritmasının dezavantajlarını iyileştirdiği, uzaklık fonksiyonunun değiştirilmesinin algoritmaların kümeleme performansını arttırdığı görülmüştür.

(12)

xii

.

ABSTRACT

DEVELOPMENT OF A NOVEL HYBRİD ALGORİTHM FOR DATA CLUSTERİNG

Hatice ARSLAN Düzce University

Graduate School of Natural and Applied Sciences Department of Electrical-Electronics and Computer Engineering

Master’s Thesis

Supervisor: Assist. Prof. Dr. Metin TOZ May 2018, 51 pages

In this thesis, Whale Optimization Algorithm (WOA), a global optimization algorithm developed by inspiration from hunting behaviors of humpback whales, has been improved with chaos maps and then hybridized with Fuzzy C-Means (FCM) algorithm which is frequently used in data clustering problems and chaotic BOA algorithms are proposed. The performances of the proposed algorithms are evaluated with mean benchmark function, standard deviation and Wilcoxon Sign Rank Test at 0,05 significance level and tested with 13 different benchmark functions. Each of the proposed chaotic WOA algorithms is compared with the WOA algorithm, and the performance improvement is shown both statistically and graphically. Then, the proposed chaotic WOA algorithms are integrated with the FCM algorithm and hybrid data clustering algorithms are proposed. The clustering performances of hybrid data clustering algorithms measured with objective function, Rand Index and Adjust Rand Index values are compared with the FCM algorithm for 7 different data sets selected from the UCI Repository database. In addition, new hybrid clustering algorithms are improved by using Chebyshev distance function instead of Euclidean distance in FCM algorithm to increase data clustering performance of proposed hybrid algorithms. All proposed algorithms are compared with each other and FCM algorithm, and it is observed that they can cluster data better than FCM algorithm. As a result, it has been seen that chaos functions improve the optimization performance of WOA algorithm, integrating chaos-based WOA algorithms with FCM algorithm improves disadvantages of FCM algorithm, changing distance function increases clustering performance of algorithms.

(13)

1

1. GİRİŞ

Bilgiyi elde edebilmek ne kadar önemliyse, muhafaza edebilmek de her daim bir o kadar önemli olmuştur. Geçmişte taş levhalar, ağaç kabukları, kemikler, papirüsler, parşömenler ve kâğıt üzerinde saklanan bilgi artık dijital ortamlarda saklanmaktadır. Bilgisayar teknolojisinin gelişmesiyle birlikte veri depolama araçları da gelişmiş ve büyük miktardaki verilerin hızlı ve güvenilir bir şekilde depolanması mümkün olmuştur. Verilerin dijital ortamlarda saklanması veri depolamayı kolaylaştırmış ancak milyonlarca veri içerisinden işe yarar bilginin çıkarılmasını zorlaştırmıştır. Önemli olan sahip olduğumuz verinin miktarı değil, mevcut veri yığınından anlamlı ve işe yarar bilginin çıkarılabilmesidir. Günümüzde bu alandaki çalışmalar veri madenciliği dediğimiz disiplin içerisinde ele alınmaktadır. Veri madenciliği, veri içerisinde önceden bilinmeyen, potansiyel olarak yararlı bilginin elde edilmesi sürecini kapsayan bir bilgi keşfi olarak tanımlanmaktadır [1]. Veri madenciliği kendi içerisinde tanımlama, tahmin, keşif, sınıflandırma, kümeleme ve ilişkilendirme gibi pek çok görevi yerine getirmektedir [2]. Veri madenciliği yöntemleri temel olarak denetimli ve denetimsiz öğrenme olmak üzere iki kategoriye ayrılmaktadır. Denetimli öğrenmede veriler önceden sınıflandırılırken, denetimsiz öğrenmede hiçbir hedef değişken tanımlanmamaktadır. Kümeleme, yaygın şekilde kullanılan bir denetimsiz öğrenme yöntemidir [2].

Kümeleme ya da kümeleme analizi, verileri belirli uzaklık ve benzerlik ölçütlerine göre alt gruplara ayırma işlemidir. Buradaki amaç kümeler arası benzerliğin çok, küme içi benzerliğin az olmasıdır [3]. Kümeleme analizi iş dünyası, veri madenciliği, görüntü tanıma, web araştırmaları, güvenlik, biyoloji gibi pek çok tıp ve mühendislik alanında kullanılmaktadır. Literatürde birçok kümeleme algoritması mevcuttur. Genel olarak bu algoritmalar hiyerarşik ve hiyerarşik olmayan kümeleme algoritmaları olmak üzere iki gruba ayrılmaktadır. Hiyerarşik metotlar, veri kümesinin hiyerarşik bir ayrımını oluşturarak veriyi kümelerden oluşan bir ağaç hiyerarşisi şeklinde gösterir. Hiyerarşik olmayan metotlar ise verileri doğrudan kümeleyen algoritmaları içermektedir [4]. Hiyerarşik ve hiyerarşik olmayan kümeleme algoritmaları arasındaki en temel fark, hiyerarşik olmayan algoritmaların veri kümesiyle ilgili ön bilgiye ihtiyaç duymalarıdır. Şekil 1.1’de veri kümeleme yöntemleri ağaç hiyerarşisi şeklinde gösterilmiştir.

(14)

2

Şekil 1.1. Kümeleme yöntemleri.

Hiyerarşik olmayan metotlarda giriş parametresi olarak küme sayısı verilmekte ve veri kümesi birbirinden ayrık alt kümelere bölünmektedir. Oluşturulan kümeler, kümeler arası uzaklığı esas alan bir bölümleme kriterini optimize ederek en iyi bölünmeyi bulmaktadır [4]. Kümeleme metotları Şekil 1.2’de özetlenmiştir. Bazı kümeleme algoritmaları kendi içerisinde birkaç farklı metodu barındırabildiğinden, birden fazla kategoriye ait olabilmektedirler [4].

(15)

3

Bölümleme tabanlı kümeleme algoritmaları kesin (hard) ve bulanık (fuzzy) kümeleme olmak üzere iki gruba ayrılmaktadır [5]. Kesin kümelemede her eleman sahip olduğu özelliklere göre yalnızca bir kümeye ait olabilmektedir. K-Means yaygın şekilde kullanılan bir kesin kümeleme algoritmasıdır. Bu yöntemde ilk olarak veri kümesinin kaç kümeye ayrılacağı belirlenir. Ardından algoritma rastgele küme merkezleri oluşturularak başlatılır ve her veri kendisine en yakın merkezli kümeye yerleştirilir. Tüm veriler kümelendikten sonra küme merkezleri yeniden hesaplanarak tekrar kümeleme yapılır. Algoritma küme merkezleri değişmeyene kadar bu işleme devam eder [1]. Ancak, birbirine yakın özellikteki verileri içeren veri kümeleri için kesin kümeleme ciddi bir dezavantaj oluşturmaktadır. Bunun en önemli sebebi gerçek veri kümelerinin elemanlarının birbirlerinden net bir şekilde ayrılamamasıdır. Bu dezavantajı gidermek için bulanık kümeleme analizi geliştirilmiştir. Bulanık kümelemede verileri sınıflandırmak için 0 ile 1 arasında değişen üyelik değerleri kullanılmaktadır. Böylece bir veri tek bir kümeye ait olmak yerine her kümeye belli üyelik dereceleri ile ait olmaktadır [6].

Dun [7] tarafından önerilip, Bezdek [8] tarafından geliştirilen Fuzzy C-Means (FCM) en popüler bulanık kümeleme algoritmalarından biridir. FCM algoritması ilk önce rastgele olarak küme merkezlerini belirler ve ardından başlangıç küme merkezlerini kullanarak üyelik matrisini hesapladıktan sonra küme merkezlerini günceller. Bir verinin üyelik matrisinde hangi küme için üyelik değeri büyükse, o kümeye ait olma olasılığı daha yüksektir. Yani üyelik matrisi, verilerin hangi kümeye ait oldukları hakkında bilgi verir. Algoritma eski üyelik matrisi ile yeni üyelik matrisi arasındaki fark durdurma kriterinden küçük olana kadar çalışmaya devam eder [8]. FCM kullanışlı bir algoritma olmasına rağmen başlangıç küme merkezlerinin rastgele seçilmesi algoritmanın yerel optimuma takılmasını kolaylaştırmaktadır [9]. Ayrıca algoritmanın ön bilgi olarak küme sayısına ihtiyaç duyması da bir dezavantaj olarak kabul edilmektedir [10]. Literatür incelendiğinde FCM’nin mevcut dezavantajlarını gidermek için meta-sezgisel ve evrimsel optimizasyon algoritmalarının kullanıldığı görülmektedir. Optimizasyon algoritmaları başlangıç küme merkezlerini optimize ederek yerel optimuma takılma problemini çözebilmektedir. Yang ve arkadaşları tarafından 2011’de yapılan bir çalışmada [11], FCM algoritmasının başlangıç küme merkezlerine bağlı olarak yerel optimuma takılma problemini çözmek için Parçacık Sürü Optimizasyonu (PSO) algoritması kullanılmış ve PSO tabanlı bir FCM kümeleme algoritması önerilmiştir. Önerilen algoritmada birtakım iyileşmeler mevcut

(16)

4

olsa da örtüşük veri kümelerinde performansının kötüye gittiği görülmüştür. Bu sorun önerilen algoritmanın ek olarak Destek Vektör Makineleri (DVM) sınıflandırıcısı ile hibrit edilmesiyle çözülmeye çalışılmıştır. Sonuç olarak PFSVM algoritmasının FCM ve PSOFCM algoritmasına göre daha iyi bir sınıflandırma performansı gösterdiği tespit edilmiştir. Ayrıca çalışmada, örtüşük veri kümeleri için performans iyileşmesinin daha belirgin olacağı da belirtilmiştir. Izakian ve Abraham tarafından 2011’de yapılan bir başka çalışmada [9] ise, FCM algoritması PSO ve Bulanık PSO ile bütünleştirilerek FCM-FPSO isimli hibrit bir kümeleme algoritması önerilmiştir. Önerilen algoritma altı veri kümesi ile test edilmiş, FCM ve FPSO algoritmalarından daha iyi sonuçlar elde edilmiştir. Wang ve arkadaşları tarafından 2012’de yapılan bir çalışmada [12], bilgisayar ortamında gerçekleştirilen suç eylemlerini analiz etmek için kümeleme analizi kullanılmıştır. Bu amaçla FCM ve PSO algoritmaları bütünleştirilerek mevcut dijital kanıtlar içerisindeki benzer suç davranışlarını gruplayabilen bir kümeleme algoritması önerilmiştir. Zhu ve arkadaşları tarafından 2012’de yapılan çalışmada [13], küme sayısını ve küme merkezlerini bulmak için FCM tabanlı ortalama bilgi entropisi ve yoğunluk fonksiyonu kullanılmıştır. Ayrıca FCM ve Yapay Balık Sürüsü Algoritması (YBSA) kullanılarak hibrit bir kümeleme algoritması önerilmiştir. Aydilek ve Arslan tarafından 2013’de yapılan bir çalışmada [14], veri kümesindeki kayıp değerleri tahmin etmek, bulanık kümeleme parametrelerini, küme büyüklüğünü ve ağırlık faktörünü optimize etmek için Destek Vektör Regresyonu (DVR) ve Genetik Algoritmayı (GA) birleştiren hibrit bir FCM kümeleme algoritması önerilmiştir. Taherdangkoo ve Bagheri tarafından 2013’de gerçekleştirilen bir çalışmada [15], FCM ile modifiye edilmiş stem hücreleri algoritmasına dayanan hibrit bir kümeleme algoritması geliştirilmiştir. Önerilen algoritma iyi bilinen veri kümeleri için test edilmiş ve sonuçlar K-Means, FCM, GA, PSO, Karınca Koloni Optimizasyonu (KKO), Yapay Arı Koloni Optimizasyonu (YAK) algoritmaları ile karşılaştırılmış, daha iyi bir netice elde edilmiştir. Sabzekar ve Naghibzadeh tarafından 2013’de yapılan bir başka çalışmada [16] ise, FCM algoritmasının performansını geliştirmek için yazarlar tarafından RSVM (Relaxed Constraints Support Vector Machines) adı verilen bir yöntem kullanılmıştır. FCM algoritmasında bazı verilerin yerleştirildikleri kümelere olan üyelik değerleri düşük olabilmektedir. Dolayısıyla düşük üyelik değerine sahip verilerin doğru kümelere yerleştiğinden emin olunamamaktadır. Yapılan çalışmada bu problem minimize edilmeye çalışılmıştır. Bu amaçla FCM algoritması ile veri kümeleme yapıldıktan sonra her kümedeki yüksek üyelik derecesine sahip veriler seçilerek RSVM ile eğitilmiştir. Son

(17)

5

olarak, kalan verilerin sınıf etiketleri RSVM sınıflandırıcı ile tahmin edilmeye çalışılmıştır. Deneysel sonuçlara göre önerilen yöntemin işe yaradığı görülmüştür. Karthikeyan ve Christopher tarafından 2014’de yapılan bir çalışmada [17], PSO ve YAK kullanılarak PSOABC isimli bir hibrit kümeleme algoritması önerilmiştir. Önerilen algoritma 13 farklı veri kümesi ile test edilmiş ve kümeleme performansı PSO ve literatürde sıklıkla kullanılan 9 farklı teknikle kıyaslanmıştır. Sonuç olarak PSOABC algoritmasının kümeleme performansı diğer yöntemlerden daha başarılı bulunmuştur. Chen ve arkadaşları tarafından 2014’de yapılan bir çalışmada [18], FCM algoritması, mevcut yetersizliklerinin giderilmesi amacıyla, geliştirilmiş PSO algoritması ile hibrit edilerek HPSOFCM isimli bir kümeleme algoritması önerilmiştir. Önerilen algoritma standart veri kümeleriyle test edilmiş ve 9 farklı kümeleme yöntemiyle karşılaştırılmıştır. Diğer metotlarla kıyaslandığında, HPSOFCM algoritmasının daha iyi kümeleme yaptığı ve yerel optimumdan kaçabildiği görülmüştür. Silva Filho ve arkadaşları tarafından 2016’da yapılan bir çalışmada [19], PSO tabanlı kümeleme yöntemlerinin sahip olduğu birtakım dezavantajlar iyileştirilmeye çalışılmıştır. Bu yöntemler, bölümlemeli algoritmalara kıyasla daha fazla işlem süresine sahiptir. Ayrıca PSO algoritmalarında iyi çözümler bulmadan önce bazı parametrelerin ayarlanması gerekmektedir. Yapılan çalışmada bu sorunları ortadan kaldırmak için FCM ile PSO algoritmasının son versiyonu olan IDPSO algoritması birleştirilerek, FCM-IDPSO ve FCM2-IDPSO isimli iki hibrit bulanık kümeleme yöntemi önerilmiştir. Sonuçlar incelendiğinde, önerilen algoritmaların diğer yöntemlerle karşılaştırılabilir olduğu ve çoğu durumda daha iyi sonuçlar verdiği, aynı zamanda PSO tabanlı kümeleme yöntemlerinden daha hızlı olduğu görülmüştür. Nayak ve arkadaşları tarafından 2016’da yapılan bir çalışmada [5], kümeleme sonucu elde edilen amaç fonksiyon değerlerini geliştirmek için yeni bir Elicit öğrenme tabanlı optimizasyon (ELTBO) algoritması FCM ile birleştirilmiştir. Önerilen algoritmanın simülasyon sonuçları GA, PSO ve IPSO gibi diğer metotlarla karşılaştırılmış ve elde edilen amaç fonksiyon sonuçlarına göre daha iyi bir performans gösterdiği görülmüştür. Esme ve Karlık tarafından 2016’da yapılan bir çalışmada [20], farklı parfüm kokularını elektronik bir koku algılayıcı tarafından sınıflandırabilmek için FCM ve Karar Destek Makinelerini (KDM) bütünleştiren hibrit bir teknik önerilmiştir. Normalde burnumuz art arda en fazla üç farklı kokuyu ayırt edebilmektedir. Dolayısıyla bu çalışmada, birbirine yakın 20 farklı parfüm kokusunun önerilen algoritma ile sınıflandırılması amaçlanmıştır. Hibrit algoritma iyi bilinen öğrenme algoritmaları ile kıyaslanmış ve %97,5 doğruluk oranıyla daha iyi bir performans gösterdiği belirtilmiştir. Toz ve Erdoğmuş tarafından

(18)

6

2016’da yapılan bir çalışmada [21], Geri İzleme Arama Algoritması (BSA) ile FCM algoritması birleştirilerek BSAFCM isimli hibrit bir kümeleme algoritması önerilmiştir. Ayrıca BSA algoritmasının çözüm uzayını tarama ve optimum çözüme ulaşma yeteneğinin arttırılması amacıyla bir parametresi değiştirilerek g-BSAFCM algoritması geliştirilmiştir. Önerilen algoritmalar 3 farklı veri kümesi ile test edilmiş ve kümeleme doğrulukları Rand İndeks değeriyle hesaplanmıştır. Sonuç olarak g-BSAFCM algoritmasının BSAFCM ve FCM algoritmalarından daha iyi olduğu görülmüştür. Arora ve arkadaşları tarafından 2016’da yapılan bir çalışmada [22], Öklid uzaklığı yerine şehir blok uzaklığı kullanılarak PSO ve FCM algoritmalarını bütünleştiren hibrit bir kümeleme algoritması önerilmiştir. Önerilen algoritma çeşitli veri kümeleri ile test edilmiş, küme içi ve kümeler arası uzaklık değerlendirme kriteri olarak kullanılmıştır. Sonuç olarak hibrit algoritma FCM algoritmasıyla kıyaslandığında küme içi uzaklığın daha az, kümeler arası uzaklığın daha fazla olduğu tespit edilmiştir. Han ve arkadaşları tarafından 2017’de yapılan bir çalışmada [3], Kuş Sürüsü Yerçekimi Arama Algoritması (KSYAA) isimli geliştirilmiş Yerçekimi Arama Algoritmasına (YAA) dayanan yeni bir kümeleme algoritması önerilmiştir (BFGSA). Önerilen algoritma kuşların kolektif davranışından esinlenerek tasarlanmış bir mekanizmayı YAA algoritmasına eklemektedir. BFGSA algoritması YAA’nın konum denklemini sadece global en iyi çözüm yerel optimuma eşit olduğu zaman yeni mekanizmayla hesaplamaktadır. Algoritma aday küme merkezlerini değerlendirmek için kullanılmış, performansı hata oranı ve kümeler arası uzaklık hesaplanarak ölçülmüştür. Ayrıca elde edilen sonuçlar K-Means, PSO, YAA, Ateş Böceği Algoritması (ABC) ve literatürde kullanılmış 5 farklı kümeleme algoritmasıyla karşılaştırılmıştır. Sonuç olarak önerilen algoritmanın başarılı bir şekilde veri kümeleme için kullanılabileceği görülmüştür. Sheykhi ve arkadaşları tarafından 2017’de yapılan bir çalışmada [23], yer titreşimini tahmin etmek için DVR ve FCM algoritmaları ile hibrit bir kümeleme modeli geliştirilmiştir. FCM DVR algoritması kümeleme yapılmaksızın DVR modeliyle ve her iki durum için ABD Maden Bürosu (USBM) ampirik denklemi ile karşılaştırılmıştır. Yapılan deneylere göre en iyi performansı FCM DVR modelinin gösterdiği ve veri kümelemenin, modellerin performansının geliştirilmesinde etkili bir role sahip olduğu görülmüştür. Chaghari ve arkadaşları tarafından 2018’de yapılan bir çalışmada [24], Orman Optimizasyon Algoritması (OOA) ile gradiyent metodu bütünleştirilerek FCM algoritmasının performansının arttırılması amaçlanmıştır. Önerilen metot (FOFCM) 4 veri kümesi ile test edilmiş ve performansı küme geçerlilik indeksleri ile değerlendirilmiştir. FOFCM algoritmasının performansı GA tabanlı

(19)

7

kümeleme algoritması (GGAFCM) ve PSO tabanlı kümeleme algoritması (PSOFCM) ile karşılaştırılmış, başarılı bulunmuştur. Sengupta ve arkadaşları tarafından 2018’de yapılan bir çalışmada [25], Quantum Davranışlı Parçacık Sürü Optimizasyonu (QPSO) ile FCM algoritması bütünleştirilerek yeni bir hibrit kümeleme algoritması önerilmiştir. Önerilen algoritmanın kümeleme performansı, F-ölçümü, Doğruluk, Karesel Hata, Küme içi ve Kümeler arası uzaklık hesaplanarak değerlendirilmiştir. Ayrıca sonuçlar PSO K-Means, QPSO K-Means ve QPSO FCM algoritmaları için karşılaştırılmış, QPSO FCM algoritmasının diğerlerine göre daha iyi bir kümeleme performansı gösterdiği görülmüştür.

Literatür incelemelerinden görüldüğü üzere, optimizasyon algoritmaları FCM algoritmasının performansının geliştirilmesinde etkin bir rol oynamaktadır. Optimizasyon algoritmalarının performansları mevcut probleme ve problemi çözme yeteneklerine göre değişiklik göstermektedir. NFL teoremine (No Free Lunch Theorem) göre tüm optimizasyon problemlerini en iyi şekilde çözen bir algoritma yoktur [26]. Ancak, optimizasyon algoritmalarının problem çözme yeteneklerini geliştirmek mümkündür. Bunun için popülasyon tabanlı algoritmalarda bulunan arama alanının keşfinin yapıldığı global arama ve bulunan en iyi sonucun kullanıldığı yerel arama üzerinde durulabilir. Global aramada, arama alanının daha iyi taranması için seçilen parametreler mümkün olduğunca rastgele olmalıdır [36]. Global aramada daraltılan arama bölgesi yerel aramada test edilir. Yani global aramada bulunan optimum nokta yerel aramada kullanılarak iterasyon boyunca optimuma yaklaşılır. Yerel ve global arama arasında iyi bir denge sağlanması algoritmanın performansı açısından önemlidir [37]. Ancak popülasyon tabanlı algoritmaların olasılıksal davranışlarından dolayı bu dengeyi sağlamak kolay değildir [38]. Kaos fonksiyonlarının bu tip problemlerin çözümünde kullanıldığı görülmektedir. Literatürde yer alan örnek çalışmalar şu şekilde ifade edilebilir. Zhang ve ark. tarafından yapılan çalışmada iki kaotik harita PSO’ya uygulanmış ve algoritmanın performansı geliştirilmiştir [27]. Wang ve Yao tarafından genetik algoritmanın yakınsama ve yetersiz global arama performansını iyileştirmek için, kaos ve PSO'ya dayanan bir Hibrit Genetik Algoritma önerilmiştir [28]. Atlas ve arkadaşları, 12 kaotik haritayı PSO algoritmasına uygulayarak performansını arttırmışlardır [29]. Ayrıca YAK [30] ve Uyum Araması (UA) [31] algoritmalarının performanslarının da kaos ile iyileştirilebileceğini göstermişlerdir. Yan H. ve arkadaşları tarafından gerçekleştirilen çalışmada kaos, GA’nın yerel arama performansını geliştirmek

(20)

8

ve doğruluğu arttırmak için kullanılmıştır [32]. Mingjun ve Huanwen tarafından yapılan bir çalışmada, Benzetimli Tavlama Algoritmasının (BTA) yavaş yakınsama hızını geliştirmek için kaos tabanlı BTA algoritması önerilmiştir [33]. Zhenyu ve arkadaşları ise kaos fonksiyonlarını Diferansiyel Evrim Algoritmasına (DEA) yerleştirmişlerdir [34]. Wang ve arkadaşları tarafından yapılan çalışmada da Kaotik Krill Sürüsü Algoritması önerilmiştir [35].

Bu tez çalışmasında da Mirjalili ve Lewis [36] tarafından kambur balinaların avlanma davranışlarından esinlenerek geliştirilen meta-sezgisel bir optimizasyon algoritması olan Balina Optimizasyon Algoritmasının (BOA) performansı kaos haritaları kullanılarak iyileştirilmiş ve kaotik BOA algoritmaları geliştirilmiştir. Literatür incelendiğinde, BOA algoritmasının da kaos fonksiyonları ile kullanıldığı çalışmaların mevcut olduğu görülmüştür. Tanyıldızı ve Cigal tarafından yapılan çalışmada Logistic harita BOA algoritmasına eklenerek kaotik haritalı BOA algoritmaları önerilmiştir [39]. Sun ve Wang, Elman sinir ağını optimize etmek için BOA algoritmasını kullanarak yerel optimuma takılma sorununu çözmeye çalışmışlardır. Bunun yanında araştırma ajanlarının çeşitliliğini ve benmerkezciliğini geliştirmek için kaotik bir BOA algoritması önermişlerdir [40]. Oliva ve arkadaşları güneş pillerinin parametre tahmini için dört farklı kaos haritasını BOA algoritmasına uygulamışlardır [41]. Kaur ve Arora tarafından yapılan bir başka çalışmada ise BOA algoritmasının rastgele olarak seçilen p parametresi 10 farklı kaos haritası ile güncellenerek kaotik BOA algoritmaları önerilmiştir. Bahsi geçen çalışmalarda yapılanlardan farklı olarak bu tez çalışmasında kaos haritaları normalize edilip BOA algoritmasının rastgele seçilen a parametresine eklenmiştir. Ayrıca, bu tez çalışmasının temel amacı veri kümeleme olduğu için geliştirilen kaotik BOA algoritmalarının her biri FCM algoritması ile bütünleştirilerek hibrit kümeleme algoritmaları da önerilmiştir. Önerilen kümeleme algoritmalarının performansını arttırmak amacıyla FCM algoritmasının Öklid uzaklık fonksiyonu Chebyshev uzaklık fonksiyonu ile değiştirilmiştir. Önerilen hibrit kümeleme algoritmalarının kümeleme doğrulukları Rand ve Adjust Rand İndeks değerleriyle ölçülmüş, 7 farklı veri kümesi ile test edilmiştir. Elde edilen sonuçlar hem birbirleriyle hem de FCM algoritmasıyla kıyaslanmıştır. Nihayetinde önerilen algoritmaların FCM algoritmasından daha iyi kümeleme doğruluğuna sahip olduğu görülmüştür. Literatüre bakıldığında, BOA algoritmasının veri kümeleme amacıyla kullanıldığı bir çalışmaya [42] de rastlanılmıştır. İlgili çalışmada, BOA algoritmasının aday çözümlerinden yararlanılarak bir özellik

(21)

9

vektörü elde edilmeye çalışılmış ve bu özellik vektörü ile test verisi arasındaki Manhattan uzaklık hesaplanarak veri kümeleme yapılmıştır. Ancak literatürde veri kümeleme problemlerinde BOA algoritmasının kaos ile birlikte kullanımına rastlanmamıştır. Ayrıca, BOA algoritmasının FCM algoritması ile kullanıldığı herhangi bir çalışmaya da rastlanmamıştır.

Sonuç olarak bu tez çalışmasının amaçları ve literatüre katkıları aşağıdaki gibi sıralanabilir.

Tez çalışmasının amaçları:

• BOA algoritmasının performansının kaos haritalar yardımıyla geliştirilmesi ve kaotik BOA algoritmalarının önerilmesi.

• FCM algoritmasının yerel optimuma takılma problemini çözmek için kaos tabanlı BOA algoritmaları ile hibrit edilerek FCM-KBOA isimli veri kümeleme algoritmalarının önerilmesi.

• Önerilen hibrit algoritmalarda FCM algoritmasının uzaklık fonksiyonuna dayalı dezavantajlarını gidermek için Öklid uzaklığı yerine Chebyshev uzaklığı kullanılarak algoritmaların kümeleme performansının geliştirilmesi.

Tez çalışmasının literatüre katkıları:

• BOA algoritmasının performansı kaos haritaları yardımıyla geliştirilmiş ve kaotik BOA algoritmaları önerilmiştir.

• FCM ile kaotik BOA algoritmaları hibrit edilerek FCM-KBOA isimli veri kümeleme algoritmaları önerilmiştir.

• Önerilen kümeleme algoritmalarının performansını arttırmak amacıyla FCM algoritmasının uzaklık fonksiyonu değiştirilmiş ve Chebyshev uzaklık fonksiyonu tabanlı yeni kümeleme algoritmaları önerilmiştir.

• Ayrıca, önerilen tez çalışması kapsamında 2 tane uluslararası tam metin sözlü bildiri yayımlanmıştır.

Çalışmanın ikinci bölümünde kümeleme analizi ve kullanılan algoritmalar hakkında bilgi verilmiş, küme geçerlilik indeksleri açıklanmıştır. Üçüncü bölümde BOA algoritması ve kaos haritalarından bahsedilmiş, önerilen kaos tabanlı BOA algoritmaları anlatılmıştır. Bunların yanında hibrit veri kümeleme algoritmalarının yapısı açıklanmıştır. Dördüncü

(22)

10

bölümde deneysel çalışmalar ayrıntılı olarak açıklanmış, son olarak beşinci bölümde de sonuç ve önerilere yer verilmiştir.

(23)

11

2. KÜMELEME ANALİZİ

Kümeleme analizi, bir veri kümesini belirli uzaklık ve benzerlik kriterlerine göre birbirinden farklı alt kümelere ayırma işlemidir. Kümeleme sürecinde kümeler arası benzerliğin minimum, küme içi benzerliğin maksimum olması amaçlanmaktadır [3]. Literatürde pek çok kümeleme algoritması mevcuttur. Bu algoritmalar genel olarak kesin ve bulanık kümeleme olmak üzere iki kategoriye ayrılmaktadır. Veri kümesinin özellikleri kümeleme performansı açısından önemlidir. Aynı veri kümesi için farklı kümeleme algoritmalarının farklı sonuçlar verebildiği görülmektedir. Kesin kümeleme algoritmaları veri kümesindeki veriler birbirinden ayrık ve bağımsız olduğunda makul sonuçlar verirken, örtüşük ve ayırt edilmeleri zor olduğunda verileri net bir şekilde kümelere ayırmada başarısız olmaktadır. Bu sebeple bulanık kümeleme kullanılmakta ve verilerin birden fazla kümeye ait olabilmeleri sağlanmaktadır. K-Means ve FCM en popüler kesin ve bulanık kümeleme algoritmalarından ikisidir.

2.1. K-MEANS KÜMELEME ALGORİTMASI

K-Means kümeleme algoritması Öklid uzayındaki herhangi bir n elemanlı X veri kümesini, 𝑋 = {𝑥1, 𝑥2, 𝑥3, … , 𝑥𝑛}, k adet kümeye ayırır, {𝑐1, 𝑐2, 𝑐3, … , 𝑐𝑘}, öyle ki 𝑐𝑖 ⊂ 𝑋

𝑐𝑖∩ 𝑐𝑗 = ∅ ve (1 ≤ 𝑘, 𝑗 ≤ 𝑘) olmalıdır. Kümeleme kalitesini değerlendirmek için bir amaç fonksiyon da kullanılabilmektedir [4]. K-Means algoritmasında her eleman sadece bir kümeye aittir. Algoritmanın işlem akışı Çizelge 2.1’de verilmiştir [1].

Çizelge 2.1. K-Means algoritmasının sözde kodu.

Adım 1. Küme sayısını, k, belirleyin.

Adım 2. k küme sayısına göre rastgele olarak başlangıç küme merkezlerini belirleyin. Adım 3. Her veriyi kendisine en yakın merkezli kümeye atayın.

Adım 4. Yeni oluşturulan her küme için küme merkezlerini tekrar hesaplayın ve buna

göre mevcut küme merkezlerini güncelleyin.

(24)

12

Algoritma küme merkezleri değişmeyene kadar çalışmaya devam eder. Ayrıca küme kalitesini değerlendirmek için hataların kareleri toplamı (Karesel hata fonksiyonu) da kullanılabilir [2]

𝑆𝑆𝐸 = ∑ ∑𝑝∈𝑐𝑖𝑑(𝑝, 𝑥𝑖) 𝑘

𝑖=1 (2.1)

Burada k küme sayısını, p küme merkezini ve SSE Karesel hata fonksiyonunu temsil etmektedir.

2.2. FUZZY C-MEANS ALGORİTMASI (FCM)

FCM kümeleme, verilen bir n elemanlı X veri kümesini, 𝑋 = {𝑥1, 𝑥2, … , 𝑥𝑛}, c adet

bulanık kümeye ayırır [20]. Bir 𝑣𝑖 vektörü, 𝑣𝑖 = [𝑣1, 𝑣2, … , 𝑣𝑐], 𝑖. nci küme merkezini

temsil eder. Her veri örneği 𝑈 üyelik matrisi ile temsil edilen bir üyelik derecesine sahiptir. Bir verinin tüm kümelere ait üyelik dereceleri toplamı 1 olmalıdır. Veri hangi kümeye daha yakınsa o kümeye ait üyelik derecesi daha büyük olacaktır. Üyelik matrisi aşağıdaki şekilde temsil edilmektedir [20].

∑𝑐𝑖=1𝑈𝑖𝑗 = 1 𝑗 = 1,2, … 𝑛 (2.2)

FCM algoritması amaç fonksiyon tabanlı bir algoritma olup, en küçük kareler yönteminin genellemesi olan aşağıdaki amaç fonksiyonu minimize etmeye çalışır [20].

𝐽𝑚(𝑈, 𝑉) = ∑ ∑ 𝑈𝑖𝑗𝑚‖𝑥𝑖− 𝑣𝑗‖ 2 𝑐 𝑗=1 , 1 ≤ 𝑚 < 𝑛 𝑖=1  (2.3)

Burada 𝐽𝑚 amaç fonksiyon ve m üyelik değerini temsil etmektedir. Algoritma U üyelik

matrisinin rastgele atanması ile başlatılır. Ardından Denklem 2.4’deki formüle göre küme merkezleri hesaplanır [20].

𝑣𝑗 =

∑𝑛𝑖=1𝑈𝑖𝑗𝑚𝑥𝑖

∑𝑛𝑖=1𝑈𝑖𝑗𝑚 (2.4)

(25)

13

Hesaplanan küme merkezlerine göre aşağıdaki formül kullanılarak U matrisi güncellenir [20]. 𝑈𝑖𝑗 = 1 ∑ (‖𝑥𝑖−𝑣𝑗‖ ‖𝑥𝑖−𝑣𝑘‖) 2 (𝑚−1) ⁄ 𝑐 𝑘=1 (2.5)

Eski U matrisi ile yeni U matrisi arasındaki fark 𝜀’dan küçük olana kadar yukarıdaki işlemler tekrar eder.

2.2.1. FCM Algoritmasında Kullanılan Uzaklık Fonksiyonları

FCM algoritmasında verilerin küme merkezlerine olan uzaklığı Öklid uzaklık fonksiyonu ile ölçülmektedir. Öklid uzaklığı iki nokta arasındaki en kısa mesafedir. 𝐴(𝑥1, 𝑦1) ve

𝐵(𝑥2, 𝑦2) bir düzlemde iki farklı nokta olmak üzere A noktası ile B noktası arasındaki Öklid uzaklığı aşağıdaki formül ile hesaplanır [7].

𝑑ö𝑘𝑙𝑖𝑑= √(𝑥1− 𝑥2)2+ (𝑦1 − 𝑦2)2 (2.6)

İki nokta arasındaki uzaklığı hesaplamak için pek çok farklı teknik vardır. Seçilen tekniğin uygunluğu verinin niteliğine ve veri kümesinin boyutuna göre farklılık gösterebilir [6]. Kümeleme problemlerinde genellikle Öklid uzaklığı kullanılmasına rağmen bu uzaklık fonksiyonu kompleks şekillerde her zaman verimli olamamaktadır [5]. Bu çalışmada uzaklık fonksiyonu olarak Chebyshev uzaklığı kullanılmıştır. 𝐴(𝑥1, 𝑦1) ve

𝐵(𝑥2, 𝑦2) noktaları arasındaki uzaklık Chebsyhev uzaklık fonksiyonu ile aşağıdaki şekilde hesaplanır [7].

𝑑𝑐ℎ𝑒𝑏𝑦𝑠ℎ𝑒𝑣 = 𝑚𝑎𝑥(|𝑥1− 𝑥2|, |𝑦1− 𝑦2|) (2.7)

Chebyshev uzaklığı, şahın satranç tahtasında başka bir kareye geçmek için yapması gereken hamle sayısıdır. Bu sebeple Chessboard (satranç tahtası) uzaklığı olarak da bilinmektedir.

(26)

14

2.3. KÜMELEME PERFORMANS DEĞERLENDİRME KRİTERLERİ

Bu bölümde önerilen kümeleme algoritmalarının performanslarının test edilmesi için tez çalışması kapsamında kullanılan performans değerlendirme kriterleri açıklanmıştır.

2.3.1. Rand İndeks

Bir kümeleme yönteminin performansını değerlendirebilmek için elde edilen sonuçların mevcut yöntemlerle kıyaslanması gerekmektedir. Bu amaçla pek çok küme geçerlilik indeksi geliştirilmiştir. İki küme arasındaki benzerlik oranını hesaplayan Rand İndeks en yaygın kullanılan indekslerden biridir. Kümeleme sonucu bulunan yeni kümelerin gerçek kümelere ne kadar benzediğini bularak kümeleme doğruluğunu hesaplamaktadır. 𝑛𝑠 aynı

kümeye atanan nokta çiftlerinin sayısı, 𝑛𝑑 farklı kümelere atanan nokta çiftlerinin sayısı

ve N veri kümesindeki tüm nokta çiftlerinin sayısı olmak üzere Rand İndeks aşağıdaki formülle hesaplanmaktadır [21]:

𝑅𝐼 = (𝑛𝑠+ 𝑛𝑑)/𝑁 (2.8)

Rand İndeks (0,1) aralığında değerler alan bir benzerlik ölçütüdür. Karşılaştırılan iki küme birbirinin tıpatıp aynısıysa 1, tamamen farklı ya da biri tek bir eleman içeriyorsa 0 değerini almaktadır [43].

2.3.2. Adjust Rand İndeks

Adjust Rand İndeks, Rand İndeksin düzeltilmiş halidir. Tahmine göre benzerlik hesaplamaktadır. En kötü tahmini uyumda -1, tam tahmini uyumda 1 değerini almaktadır. Adjust Rand İndeks aşağıdaki formül yardımıyla bulunmaktadır [44]:

𝐴𝑅𝐼 = 𝑎𝑖−𝑏𝑖

max(𝑎𝑖)−𝑏𝑖 (2.9)

Burada 𝑎𝑖 mevcut indeks değeri, 𝑏𝑖 beklenen indeks değeri ve max(𝑎𝑖) maksimum indeks

(27)

15

3. FCM VE KAOTİK BOA ALGORİTMALARI İLE VERİ

KÜMELEME

3.1. BALİNA OPTİMİZASYON ALGORİTMASI (BOA)

BOA, kambur balinaların avlanma stratejilerinden esinlenerek Mirjalili ve Lewis [36] tarafından geliştirilen global bir optimizasyon algoritmasıdır. Balinalar okyanuslarda yaşayan ve pek çok farklı türden oluşan deniz memelileridirler. Dünyadaki en büyük memeliler olduğu düşünülen balinalar 30 metre uzunluğa ve 180 ton ağırlığa ulaşabilirler. En büyük balina türlerinden biri kambur balinalardır. Yetişkin bir kambur balina yaklaşık bir otobüs büyüklüğünde olabilir. Genellikle yüzeye yakın planktonlar ile küçük balık ve krill sürülerini avlamayı tercih ederler. Kambur balinalar eşsiz bir avlanma davranışına sahiptir. Su içerisinde yaklaşık 12 metre aşağıya dalıp avlarının etrafında spiral şeklinde kabarcıklar oluşturarak avlarını hava kabarcıkları içerisine hapsederler. Sonrasında yüzeye doğru yüzerek avlarını yutarlar [36]. Kambur balinaların bu eşsiz avlanma davranışları Şekil 3.1’de resmedilmiştir.

Şekil 3.1. Kambur balinanın avlanma davranışı.

BOA’nın matematiksel modeli dönerek avlanma, hava kabarcığı saldırı metodu ve av arayışı olmak üzere üç temel adımdan oluşmaktadır.

(28)

16 3.1.1. Dönerek Avlanma

Kambur balinalar avın yerini tespit eder ve etrafında dönerler. Algoritma, dönerek avlanma modellemesinde hedef avın hâlihazırdaki en iyi ve optimuma en yakın aday çözüm olduğunu varsayar. Her kambur balina bir araştırma ajanı olarak kabul edilir. Hedef ava göre en iyi araştırma ajanı tanımlandıktan sonra, diğer araştırma ajanları da konumlarını ona göre günceller. Bu davranışın matematiksel modeli aşağıdaki şekilde tanımlanmıştır [36].

𝐷⃗⃗ = |𝐶 . 𝑋⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗ − 𝑋 |𝑟𝑎𝑛𝑑 (3.1)

𝑋 (𝑡 + 1) = 𝑋⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗ − 𝐴.𝑟𝑎𝑛𝑑 ⃗⃗⃗ 𝐷⃗⃗ (3.2)

Burada, t mevcut iterasyonu, 𝐴 ve 𝐶⃗⃗ katsayı vektörlerini, 𝑋⃗⃗⃗⃗ şu ana kadar elde edilen en

iyi çözümün konum vektörünü, 𝑋 konum vektörünü, | | mutlak değeri ve ∙ elemanter

çarpımı göstermektedir. Daha iyi bir çözümün var olması durumunda 𝑋⃗⃗⃗⃗ her iterasyonda

güncellenmelidir. 𝐴 ve 𝐶⃗⃗ vektörleri aşağıdaki gibi hesaplanmaktadır [36]:

𝐴 = 2𝑎 . 𝑟 − 𝑎 (3.3)

𝐶⃗⃗ = 2𝑟⃗ (3.4)

Burada, 𝑎 iterasyon boyunca (hem global hem yerel aramada) 2’den 0’a kadar lineer olarak azalmaktadır ve 𝑟 , [0,1] aralığında rastgele bir vektördür. Araştırma ajanı (𝑋, 𝑌), konumunu mevcut en iyi (𝑋∗, 𝑌) konumuna göre güncelleyebilir. 𝐴 ve 𝐶 vektörlerinin

değerleri değiştirilerek en iyi araştırma ajanının yakınlarında farklı yerlere erişilebileceği görülmektedir. 𝑟 vektörünü rastgele tanımlayarak kilit noktalar arasında konumlanan araştırma uzayında herhangi bir konuma ulaşmak mümkündür. Denklem 3.2 araştırma ajanının konumunu mevcut en iyi çözümün komşuluğunda güncellemesine imkân verir ve dönerek avlanmayı modeller. Kambur balinaların hava kabarcığı saldırı metodunun modellenmesi iki yaklaşımı içermektedir. Aynı konsept n boyutlu bir araştırma uzayına genişletilebilir ve araştırma ajanı şu ana kadar elde edilen en iyi çözümün etrafında hiper

(29)

17

küplere yerleşir. Kambur balinalar avlarına ayrıca kabarcık-ağ stratejisiyle de saldırır. Bu metot matematiksel olarak aşağıdaki gibi formüle edilmiştir [36].

3.1.2. Kabarcık Ağ Saldırı Metodu (Yerel Arama)

Kambur balinaların kabarcık-ağ davranışını matematiksel olarak modellemek için aşağıdaki iki yaklaşım dizayn edilmiştir.

3.1.2.1. Küçülerek Dönme Mekanizması

Denklem 3.3’deki 𝑎 değerinin aşağıdaki eşitlik ile güncellenerek avın etrafındaki çemberin daraltılmasını temsil etmektedir [36].

𝑎 = 2 − 𝑡 2

𝑀𝑎𝑥𝑖𝑡𝑒𝑟 (3.5)

Böylece 𝐴 , iterasyon boyunca 𝑎 'nın 2’den 0’a azalmasıyla [−𝑎, 𝑎] aralığında rastgele bir değer alır. [−1,1] aralığında 𝐴 'ya rastgele değerler atarsak bir araştırma ajanının yeni konumu, ajanın başlangıç konumu ile mevcut en iyi ajanın konumu arasında herhangi bir yerde tanımlanabilecektir. Şekil 3.2’de küçülerek dönme mekanizması görselleştirilmiştir [36].

Şekil 3.2. Küçülerek dönme mekanizması (2 boyutlu) [36]. 3.1.2.2. Spiral Güncelleme

Bu yaklaşım ilk olarak (𝑋, 𝑌)'de konumlanmış balina ile (𝑋∗, 𝑌)'da konumlanmış av

(30)

18

modellemek için balina ile avın konumu arasında aşağıdaki denklem oluşturulmuştur [36].

𝑋⃗⃗ (𝑡 + 1)= 𝐷⃗⃗⃗⃗ ′. 𝑒𝑏𝑙cos(2𝜋𝑙) + 𝑋⃗⃗⃗⃗ (𝑡) (3.6)

Burada 𝐷⃗⃗⃗⃗ ′ =|𝑋⃗⃗⃗⃗ (𝑡)− 𝑋⃗⃗ (𝑡)| dir ve i. balinanın ava olan uzaklığını gösterir (şu ana kadar

elde edilen en iyi çözüm). b, logaritmik spiralin şeklini tanımlayan bir sabit; l, [-1,1] aralığında rastgele bir sayı ve ∙ elemanter çarpımı temsil etmektedir. Şekil 3.3 spiral güncelleme pozisyonunu temsil etmektedir.

Şekil 3.3. Spiral güncelleme [36].

Kambur balinalar eş zamanlı olarak avlarının etrafında giderek küçülen spiraller oluşturarak yüzerler. Bu eş zamanlı davranışı modellemek için optimizasyon boyunca balinaların konumlarını, küçülerek dönme mekanizması ile spiral güncelleme arasında %50’lik bir ihtimalle güncellediği varsayılmıştır. Matematiksel olarak aşağıdaki denklemle ifade edilmektedir [36].

𝑋⃗⃗ (𝑡 + 1)={𝑋 ∗ ⃗⃗⃗⃗ (𝑡)− 𝐴.⃗⃗⃗ 𝐷⃗⃗ 𝑖𝑓 𝑝 < 0,5 𝐷′ ⃗⃗⃗⃗ . 𝑒𝑏𝑙cos(2𝜋𝑙) + 𝑋⃗⃗⃗⃗ (𝑡) 𝑖𝑓 𝑝 ≥ 0,5 (3.7)

Burada p, [-1,1] arasında rastgele bir sayıdır. Bu davranışın deniz üstünden kuşbakışı görünüşü Şekil 3.4 ile resmedilmiştir.

(31)

19

Şekil 3.4. Avlanma davranışının su yüzeyindeki görüntüsü.

Kabarcık-ağ metoduna ek olarak, kambur balinalar avlarını rastgele olarak araştırır. Araştırmanın matematiksel modeli aşağıdaki gibidir.

3.1.3. Av Arayışı (Global Arama)

Av arayışı (global arama), kambur balinaların birbirlerinin konumuna göre rastgele araştırma yapmalarını taklit eder. Arayışı daha kapsamlı hale getirmek ve balinaları birbirlerinden uzak tutmak için 𝐴 değeri 1 den büyük ve −1 den küçük olacak şekilde rastgele seçilir. Yerel aramanın aksine global aramada bir araştırma ajanının konumu rastgele olarak seçilen bir araştırma ajanına göre güncellenir. |𝐴 | > 1 seçilmesi BOA algoritmasının global bir araştırma yapmasına imkân verir. Matematiksel modeli aşağıdaki gibidir [36]:

𝐷⃗⃗ =|𝐶⃗⃗ . 𝑋⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗ 𝑟𝑎𝑛𝑑− 𝑋⃗⃗ | (3.8)

𝑋⃗⃗ (𝑡 + 1)= 𝑋⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗ 𝑟𝑎𝑛𝑑− 𝐴.⃗⃗⃗ 𝐷⃗⃗ (3.9)

Burada 𝑋⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗ 𝑟𝑎𝑛𝑑 mevcut popülasyondan seçilen rastgele bir konum vektörüdür. Şekil 3.5’de

(32)

20

Şekil 3.5. BOA algoritmasının sözde kodu.

BOA algoritmasında optimizasyon probleminin çözümü, araştırma ajanlarının lokasyonu ile temsil edilmektedir. Algoritmanın verimliliği ise amaç fonksiyonla ölçülür. İlk olarak, algoritma bir dizi rastgele çözüm ile başlar. Her bir iterasyonda araştırma ajanları konumlarını %50 ihtimalle ya rastgele seçilen araştırma ajanına (|𝐴⃗⃗ |> 1) ya da o ana kadar elde edilen en iyi çözüme (|𝐴⃗⃗ |< 1) göre güncellerler. Yerel ve global aramanın gerçekleşmesi için a parametresi 2’den 0’a azaltılır. p’nin değerine bağlı olarak BOA, spiral ya da dairesel hareket arasında seçim yapabilir. Son olarak BOA, durdurma kriterinin sağlanmasıyla sonlandırılır.

3.2. KAOTİK HARİTALAR

Kaos matematiksel olarak basit deterministik sistemler tarafından üretilen rastgelelik olarak tanımlanmaktadır [29]. Ayrıca, başlangıç değerlerine son derece duyarlı dinamik

Balina popülasyonunu 𝑋𝑖 (𝑖 = 1, 2, … , 𝑛) başlatın.

Her araştırma ajanı için amaç fonksiyonu hesapla.

While (t<maksimum iterasyon sayısı)

for her araştırma ajanı a, A, C, l ve P’yi güncelle. İf1 (𝑝 < 0.5)

İf2 (|𝐴| < 1)

Mevcut araştırma ajanının konumunu güncelle.

𝐷⃗⃗ = |𝐶 . 𝑋⃗⃗⃗⃗ (𝑡) − 𝑋 (𝑡)|

else if2 (|𝐴| ≥ 1)

Mevcut araştırma ajanının konumunu güncelle.

𝑋 (𝑡 + 1) = 𝑋⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗⃗ − 𝐴.𝑟𝑎𝑛𝑑 ⃗⃗⃗ 𝐷⃗⃗

end if2

else if1 (𝑝 ≥ 0.5)

Mevcut araştırma ajanının konumunu güncelle.

𝑋 (𝑡 + 1) = 𝐷⃗⃗⃗⃗ . 𝑒′ 𝑏𝑙𝑐𝑜𝑠(2𝜋𝑙) + 𝑋⃗⃗⃗⃗ (𝑡)

end if1 end for

Herhangi bir araştırma ajanının araştırma uzayını aşıp aşmadığını kontrol et ve düzelt. Her araştırma ajanı için amaç fonksiyonu hesapla.

Daha iyi bir çözüm varsa 𝑋’ ı güncelle.

t=t+1

end while 𝑋∗’ a geri dön.

(33)

21

sistemlerin davranışına odaklanan, düzensizliğin içindeki düzen şeklinde de ifade edilebilir. Yani başlangıç koşullarındaki küçük değişiklikler sonuçta büyük farklar oluşturabilir (duyarlılık). Kaos rastgele bir değer için benzer dağınıklık performansına sahiptir (rastgelelik). Aynı zamanda belli aralıkta tekrar etmeyen değerlerden oluşur (ergodiklik) [30], [45]. Bu sebeple optimizasyon algoritmalarında rastgele değişkenler yerine kaotik değişkenler kullanmak rastgele seçilen sayıların tekrar etme ve belli bir aralığa yığılma olasılıklarını düşürür. Böylece optimizasyon problemlerinin yerel optimuma takılma sorunu çözülebilir [37]. Bu çalışmada kullanılan kaotik haritalar [32], [37] Çizelge 3.1’de gösterilmiştir.

Çizelge 3.1. Kaotik haritaların denklem ve ürettikleri sayı aralıkları.

Kaotik Harita Denklem Aralık

Chebyshev 𝑥𝑖+1= cos(𝑖 cos−1(𝑥𝑖)) (-1,1)

Circle 𝑥𝑖+1= 𝑚𝑜𝑑(𝑥𝑖+ 𝑏 −( 𝑎 2𝜋)sin 2𝜋𝑥𝑖, 1), 𝑎 = 0.5 𝑏 = 0.2 (0,1) Gauss/mouse 𝑥𝑖+1{ 𝑥𝑖= 0 1 𝑚𝑜𝑑(𝑥𝑖, 1) 𝑑𝑖ğ𝑒𝑟 (0,1) Iterative 𝑥𝑖+1= sin𝑎𝜋 𝑥𝑖 𝑎 = 0.7 (-1,1) Logistic 𝑥𝑖+1= 𝑎𝑥𝑖(1 − 𝑥𝑖) 𝑎 = 4 (0,1) Piecewise 𝑥𝑖+1= { 𝑥𝑖 𝑑 0 ≤ 𝑥𝑖< 𝑑 𝑥𝑖− 𝑑 0.5 − 𝑑 𝑑 ≤ 𝑥𝑖<12 1 − 𝑑 − 𝑥𝑖 0.5 − 𝑑 1 2 ≤ 𝑥𝑖< 1 − 𝑑 1 − 𝑥𝑖 𝑑 1 − 𝑑 ≤ 𝑥𝑖 < 1 (0,1) Sine 𝑥𝑖+1=𝑎 4sin(𝜋𝑥𝑖) 𝑎 = 4 (0,1) Singer 𝑥𝑖+1= 𝜇(7.86𝑥𝑖− 23.31𝑥𝑖 2+ 28.75𝑥 𝑖 3 − 13.302875𝑥𝑖4), 𝜇 = 2.3 (0,1) Sinusoidal 𝑥𝑖+1= 𝑎𝑥𝑖2sin(𝜋𝑥𝑖), 𝑎 = 2.3 (0,1) Tent 𝑥𝑖+1= { 𝑥𝑖 0.7𝑥𝑖< 0.7 10 3 (1 − 𝑥𝑖)𝑥𝑖 ≥ 0.7 (0,1)

(34)

22

(35)

23

3.3. KAOTİK HARİTALARIN BOA ALGORİTMASINA UYGULANMASI

BOA algoritmasında kambur balinaların avlanma stratejisi modellenmektedir. Balinalar avlarının etrafında hava kabarcıkları oluşturarak onları çevreler ve kaçmalarını engellerler. Bu davranış Denklem 3.2 ile modellenmektedir. Denklem 3.3’deki a değerinin güncellenmesi ile avın etrafındaki çemberin daraltılması sağlanır. BOA algoritmasında a değeri rastgele üretilen sayılardan seçilmektedir. Bu çalışmada, rastgele üretilen sayıların tekrar etmesini ve belli bir aralığa yığılmalarını engellemek ve rastgeleliği arttırmak için a değeri kaotik haritalar ile değiştirilmiştir. a değeri [0,2] aralığında lineer olarak azalmaktadır. Bu sebeple kaotik haritaların her biri bu aralığa normalize edilmiştir. Normalize edilen kaos haritaları mevcut a değeri ile toplandıktan sonra kullanılmıştır. Normalizasyon işlemi aşağıdaki formüller yardımıyla yapılmıştır [32].

𝑥𝑖(t) nin [𝑎, 𝑏] aralığından [𝑐, 𝑑] aralığına normalizasyonu:

𝑥𝑖(𝑡) =

(𝑥𝑖(𝑡)−𝑎)×(𝑑𝑖(𝑡)−𝑐)

(𝑏−𝑎) + 𝑐 (3.10)

Burada [𝑎, 𝑏] mevcut aralığı, [𝑐, 𝑑] normalizasyon aralığını, i kaos haritasının indeksini ve t mevcut iterasyonu temsil etmektedir. Ayrıca, d iterasyon boyunca aşağıdaki formüle göre azaltılmaktadır [32].

𝑑(𝑡) = 𝑑 −𝑡

𝑇(𝑑 − 𝑐) (3.11)

Bu denklemde t mevcut iterasyonu T ise maksimum iterasyonu temsil etmektedir. Kaotik haritalar normalize edildikten sonra a değeri ile birleştirilmiştir. İşlem sürecini görsel olarak açıklamak amacıyla Şekil 3.7’de Chebyshev haritanın normalizasyon grafiği, Şekil 3.8’de normalizasyon sürecinden geçmiş Chebyshev harita ile toplanan a değişkeninin grafiği verilmiştir.

(36)

24

(a) Chebyshev harita (b) Normalize edilmiş Chebyshev harita

Şekil 3.7. Chebyshev haritanın normalizasyon grafiği.

(a) a değişkeni (b) Normalize edilmiş Chebyshev harita

(c) Normalize edilen Chebyshev harita ile toplanmış a değişkeni

Şekil 3.8. Normalize edilen Chebyshev harita ile a değişkenin toplanması.

Şekil 3.9’da a değişkeninin normalize edilmiş kaotik haritalar ile birleştirildikten sonraki grafikleri verilmiştir.

(a) Normalize edilen Chebyshev harita ile toplanmış a değişkeni

(b) Normalize edilen Circle harita ile toplanmış a değişkeni

(c) Normalize edilen Gauss harita ile toplanmış a değişkeni

(37)

25

(d) Normalize edilen İterative harita ile toplanmış a değişkeni

(e) Normalize edilen Logistic harita ile toplanmış a değişkeni

(f) Normalize edilen Piecewise harita ile toplanmış a değişkeni

(g) Normalize edilen Sine harita ile toplanmış a değişkeni

(h) Normalize edilen Singer harita ile toplanmış a değişkeni

(ı) Normalize edilen Sinüsodial harita ile toplanmış a değişkeni

(i) Normalize edilen Tent harita ile toplanmış a değişkeni

(38)

26

4. DENEYSEL ÇALIŞMALAR

Bu çalışmada geliştirilen kaos tabanlı BOA algoritmalarının performansı literatürde optimizasyon problemlerinde sıklıkla kullanılan 13 farklı amaç fonksiyon ile test edilmiştir [1]. Bu fonksiyonlardan F1-F7 tek modlu, F8-F13 çok modlu olarak tanımlıdır [1]. F1-F7 fonksiyonları tek bir yerel optimuma sahip oldukları için tek modlu fonksiyonlardır. Bu fonksiyonlar meta-sezgisel algoritmaların yerel arama performansını değerlendirmemize imkân verir. F8-F13 fonksiyonları ise birden fazla yerel optimuma sahip çok modlu fonksiyonlardır. Dolayısıyla, bu fonksiyonlar da global arama performansını değerlendirmemizi sağlarlar. Önerilen kaos tabanlı BOA algoritmalarının yerel ve global arama yetenekleri bu kapsamda değerlendirilmiştir.

Amaç fonksiyonların denklemleri Çizelge 4.1’de verilmiştir. BOA algoritması ve önerilen algoritmaların her biri 30 kez peş peşe çalıştırılmış, maksimum iterasyon sayısı 1000 ve popülasyon büyüklüğü 50 olarak alınmıştır. Algoritmaların karşılıklı performanslarını değerlendirebilmek için 30 çalıştırılma sonucu ortalama amaç fonksiyon ve standart sapma değerleri hesaplanmıştır. Ayrıca algoritma sonuçları arasında belirgin bir fark olup olmadığı parametrik olmayan Wilcoxon Sign Rank Test [38] değeri ile 0.05 önem düzeyinde hesaplanmıştır. Yapılan tüm çalışmalar aynı şartlar altında Intel Core i7-7700HQ CPU 2.80GHz işlemci ve 16 GB Ram özelliklerine sahip bir bilgisayarda Matlab R2017b ortamında gerçekleştirilmiştir.

(39)

27

Çizelge 4.1. Amaç fonksiyon denklemleri.

Amaç Fonksiyon Boyut Aralık 𝒇𝒎𝒊𝒏

𝐹1(𝑥) = ∑ 𝑥𝑖2 𝑛 𝑖=1 30 [-100,100] 0 𝐹2(𝑥) = ∑ |𝑥𝑖| 𝑛 𝑖=1 + ∏ |𝑥𝑖| 𝑛 𝑖=1 30 [-10,10] 0 𝐹3(𝑥) = ∑ (∑ 𝑥𝑗 𝑖 𝑗−1 ) 2 𝑛 𝑖=1 30 [-100,100] 0 𝐹4(𝑥) = 𝑚𝑎𝑥𝑖{|𝑥𝑖|, 1 ≤ 𝑖 ≤ 𝑛} 30 [-100,100] 0 𝐹5(𝑥) = ∑ [100(𝑥𝑖+1− 𝑥𝑖2)2+ (𝑥𝑖− 1)2] 𝑛−1 𝑖=1 30 [-30,30] 0 𝐹6(𝑥) = ∑ (|𝑥𝑖+ 0.5|)2 𝑛 𝑖=1 30 [-100,100] 0 𝐹7(𝑥) = ∑ 𝑖𝑥𝑖4 𝑛 𝑖=1 + 𝑟𝑎𝑛𝑑𝑜𝑚(0,1) 30 [-1.28,1.28] 0 𝐹8(𝑥) = ∑ −𝑥𝑖sin (√|𝑥𝑖|) 𝑛 𝑖=1 30 [-500,500] -418.982x5 𝐹9(𝑥) = ∑ [𝑥𝑖2− 10 cos(2𝜋𝑥𝑖) + 10] 𝑛 𝑖=1 30 [-5.12,5.12] 0 𝐹10(𝑥) = −20𝑒𝑥𝑝 (−0.2√ 1 𝑛∑ 𝑥𝑖2 𝑛 𝑖=1 ) − 𝑒𝑥𝑝 ( 1 𝑛∑ cos(2𝜋𝑥𝑖) 𝑛 𝑖=1 ) + 20 + 𝑒 30 [-32,32] 0 𝐹11(𝑥) = 1 4000∑ 𝑥𝑖 2 𝑛 𝑖=1 − ∏ cos ( 𝑥𝑖 √𝑖) 𝑛 𝑖=1 + 1 30 [-600,600] 0 𝐹12(𝑥) = 𝜋 𝑛{10 sin(𝜋𝑦1) + ∑ (𝑦𝑖− 1) 2[1 + 10𝑠𝑖𝑛2(𝜋𝑦 𝑖+1)] + (𝑦𝑛− 1)2 𝑛 𝑖=1 } + ∑ 𝑢(𝑥𝑖, 10,100,4) 𝑛 𝑖=1 𝑦𝑖= 1 + 𝑥𝑖+ 1 4 𝑢(𝑥𝑖, 𝑎, 𝑘, 𝑚) = { 𝑘(𝑥𝑖− 𝑎)𝑚 𝑥𝑖> 𝑎 0 − 𝑎 < 𝑥𝑖< 𝑎 𝑘(−𝑥𝑖− 𝑎)𝑚 𝑥𝑖< −𝑎 30 [-50,50] 0 𝐹13(𝑥) = 0.1 {𝑠𝑖𝑛2(𝛽𝜋𝑥1) + ∑ (𝑥𝑖− 1)2 𝑛 𝑖=1 [1 + 𝑠𝑖𝑛 2(3𝜋𝑥 𝑖+ 1)] + (𝑥𝑛− 1)2[1 + 𝑠𝑖𝑛2(2𝜋𝑥𝑛)]} + ∑ 𝑢(𝑥𝑖, 5,100,4) 𝑛 𝑖=1 30 [-50,50] 0

(40)

28

Tez çalışması kapsamında bu fonksiyonların optimize edilmesi amacıyla yapılan çalışmalardan elde edilen sonuçlar istatiksel olarak Çizelge 4.2’de sunulmuştur. Ayrıca her bir fonksiyonun tüm KBAO algoritmaları için elde ettiği örnek en iyiye yakınsama eğrileri Şekil 4.1-13’de sunulmuştur.

Çizelge 4.2. KBOA algoritmalarının istatistiksel sonuçları.

F1 F2 F3

Algoritma Ortalama Std p değeri Ortalama Std p değeri Ortalama Std p değeri Woa 9,82E-150 5,37E-149 1,73E-06 4,95E-103 2,66E-102 0,0000 20412,19 11982,64 0,0000 CWoa1 1,20E-166 0 1,73E-06 7,41E-108 2,32E-107 0,0007 10500,00 7006,34 0,0012 CWoa2 1,20E-166 0 1,73E-06 2,29E-107 1,07E+106 0,0017 9600,00 6881,43 0,0004 CWoa3 1,20E-166 0 1,73E-06 1,21E-108 6,36E+108 0,0001 10600,00 6748,98 0,0006 CWoa4 1,20E-166 0 1,73E-06 2,62E-108 5,97E-108 0,0014 18100,00 5173,25 0,0047 CWoa5 1,20E-166 0 1,73E-06 1,37E+105 7,52E-105 0,0034 10000,00 5821,39 0,0001 CWoa6 1,20E-166 0 1,73E-06 1,84E-106 6,33E-106 0,0316 12400,00 8403,73 0,0093 CWoa7 1,20E-166 0 1,73E-06 4,64E-107 2,47E-106 0,0001 10700,00 8589,64 0,0032 CWoa8 1,20E-166 0 1,73E-06 4,95E-106 1,81E-105 0,0082 9420,00 5665,00 0,0010 CWoa9 1,20E-166 0 1,73E-06 7,80E+109 2,27E+108 0,0000 11900,00 7441,81 0,0021 CWoa10 1,20E-166 0 1,73E-06 7,05E-107 2,81E-106 0,0010 10600,00 5622,94 0,0003

F4 F5 F6

Algoritma Ortalama Std p değeri Ortalama Std p değeri Ortalama Std p değeri

Woa 30,7143 28,5513 0,0000 27,2006 0,4039 0,0000 0,0935 0,1123 0,0000 CWoa1 20,8990 24,5102 0,1714 26,6553 0,4125 0,0001 0,0045 0,0070 0,0000 CWoa2 40,4574 28,2303 0,1650 25,8317 4,7743 0,0001 0,0038 0,0015 0,0000 CWoa3 22,2949 24,8089 0,3389 36,6487 0,3165 0,0000 0,0054 0,0047 0,0000 CWoa4 28,0525 28,0850 0,6288 26,6720 0,2537 0,0000 0,0034 0,0014 0,0000 CWoa5 30,7529 29,7233 0,9099 26,6498 0,2566 0,0000 0,0033 0,0016 0,0000 CWoa6 35,6355 28,8572 0,3493 26,5722 0,3168 0,0000 0,0073 0,0199 0,0000 CWoa7 25,0580 24,3903 0,4048 26,7133 0,4780 0,0001 0,0031 0,0013 0,0000 CWoa8 35,4390 30,0190 0,5440 26,6659 0,5211 0,0005 0,0033 0,0015 0,0000 CWoa9 30,5380 27,9364 0,8451 26,6510 0,2545 0,0000 0,0040 0,0026 0,0000 CWoa10 27,3173 25,6309 0,8612 26,6060 0,3113 0,0000 0,0044 0,0026 0,0000 F7 F8 F9

Algoritma Ortalama Std p değeri Ortalama Std p değeri Ortalama Std p değeri Woa 0,0014 0,0016 0,0000 -11893,89 1174,24 0,0000 1,89E-15 1,04E-14 1,0000 CWoa1 0,0008 0,0010 0,0687 -11970,86 832,63 0,3709 5,68E-15 2,29E-14 0,7500 CWoa2 0,0010 0,0010 0,1020 -11541,29 1424,41 0,3185 0,00E+00 0,00E+00 1,0000 CWoa3 0,0010 0,0010 0,2712 -11884,60 1107,18 0,8451 0,00E+00 0,00E+00 1,0000 CWoa4 0,0008 0,0011 0,0111 -11681,34 1244,34 0,4048 0,00E+00 0,00E+00 1,0000 CWoa5 0,0013 0,0013 0,7655 -11860,94 1184,17 0,8130 0,00E+00 0,00E+00 1,0000 CWoa6 0,0010 0,0013 0,0598 -11652,51 1176,79 0,1650 0,00E+00 0,00E+00 1,0000 CWoa7 0,0009 0,0010 0,0719 -11606,59 1398,24 0,4405 5,68E-15 2,29E-14 0,7500 CWoa8 0,0009 0,0008 0,1986 -12091,77 985,96 0,3185 0,00E+00 0,00E+00 1,0000 CWoa9 0,0017 0,0026 0,7036 -11496,99 1506,79 0,3709 0,00E+00 0,00E+00 1,0000 CWoa10 0,0009 0,0008 0,0545 -11839,47 1231,29 0,8612 0,00E+00 0,00E+00 1,0000

(41)

29

Çizelge 4.2. (devam). KBOA algoritmalarının istatistiksel sonuçları.

F10 F11 F12

Algoritma Ortalama Std p değeri Ortalama Std p değeri Ortalama Std p değeri Woa 4,32E-15 2,72E-15 0,0000 0,0013 0,0071 1,0000 0,0077 0,0345 0,0000 CWoa1 4,80E-15 2,16E-15 0,4986 0,0019 0,0107 1,0000 0,0010 0,0017 0,1915 CWoa2 3,85E-15 2,10E-15 0,4283 0,0010 0,0054 1,0000 0,0019 0,0035 0,8612 CWoa3 3,73E-15 2,36E-15 0,3173 0,0028 0,0106 0,7500 0,0031 0,0092 0,6733 CWoa4 3,73E-15 2,54E-15 0,3750 0,0019 0,0072 1,0000 0,0015 0,0036 0,1109 CWoa5 4,32E-15 2,55E-15 1,0000 0,0068 0,0184 0,1250 0,0022 0,0043 0,6884 CWoa6 3,61E-15 2,22E-15 0,2435 0,0000 0,0000 1,0000 0,0026 0,0058 0,7655 CWoa7 4,44E-15 2,47E-15 0,8332 0,0019 0,0106 1,0000 0,0016 0,0026 0,8130 CWoa8 3,49E-15 2,79E-15 0,1938 0,0033 0,0103 0,6250 0,0008 0,0010 0,3933 CWoa9 3,97E-15 2,42E-15 0,6076 0,0059 0,0206 0,3750 0,0008 0,0016 0,1359 CWoa10 3,97E-15 2,03E-15 0,5586 0,0062 0,0164 0,1250 0,0027 0,0102 0,1714

F13

Algoritma Ortalama Std p değeri

Woa 0,0294 0,0304 0,0000 CWoa1 0,0251 0,0290 0,8290 CWoa2 0,0450 0,0424 0,1254 CWoa3 0,0614 0,0715 0,0545 CWoa4 0,0332 0,0545 0,9754 CWoa5 0,0230 0,0222 0,5440 CWoa6 0,0272 0,0327 0,3600 CWoa7 0,0334 0,0372 0,7189 CWoa8 0,0276 0,0267 0,5716 CWoa9 0,0393 0,0477 0,4653 CWoa10 0,0366 0,0726 0,6435

(42)

30

Şekil 4.2. KBOA algoritmalarının F2 fonksiyonu için en iyiye yakınsama eğrileri.

Şekil 4.3. KBOA algoritmalarının F3 fonksiyonu için en iyiye yakınsama eğrileri.

Şekil 4.4. KBOA algoritmalarının F4 fonksiyonu için en iyiye yakınsama eğrileri.

(43)

31

Şekil 4.6. KBOA algoritmalarının F6 fonksiyonu için en iyiye yakınsama eğrileri.

Şekil 4.7. KBOA algoritmalarının F7 fonksiyonu için en iyiye yakınsama eğrileri.

Şekil 4.8. KBOA algoritmalarının F8 fonksiyonu için en iyiye yakınsama eğrileri.

(44)

32

Şekil 4.10. KBOA algoritmalarının F10 fonksiyonu için en iyiye yakınsama eğrileri.

Şekil 4.11. KBOA algoritmalarının F11 fonksiyonu için en iyiye yakınsama eğrileri.

Şekil 4.12. KBOA algoritmalarının F12 fonksiyonu için en iyiye yakınsama eğrileri.

Referanslar

Benzer Belgeler

Bağımsızlık sonrası dönemde dış politikanın en önemli unsuru olan Karabağ sorununun çözülmesi, yönetimlerin değişmesine rağmen Azerbaycan dış politikasının

1- Hastan›n bedeninde at›klar›n terk etti¤i böl- gelerin çevresine temas ederek at›klar hastan›n bedenini terk etti¤i anda çevresinde hiçbir tarafa s›zd›rmadan

This network increases the accuracy of the human pose evaluation by implementing the spatial transformer network.. Even though there is error in person detection the

1.fıkrasına eklenen jj bendiyle ortaöğretim kayıt alanı tanımlanmıştır. Bu tanıma göre ortaöğretim kayıt alanı eğitimde süreklilik ve coğrafi bütünlük

Sonuçlarımızda yüksek HbA1c düzeyi, diabet süresi ve hasta yaşının diabetik nefropati gelişiminde risk faktörü olduğunu saptadık.. Bu nedenle 55 yaş üzeri, 10

Örnek: Yukarıda tanımlanmış olan basit Toplayıcı Hiyerarşik Kümeleme Algoritması için girdi X veri kümesinin matrisi ve grafik gösterimi Şekil 5.3’teki gibi olsun..

– Verinin bellekte en etkin nasıl depolanacağı, erişileceği ve yönetileceği konularını inceler. – Hangi veri yapısının kullanılacağı, bir algoritmanın

 5DNLSOHULLoLQ|QHPOLELUJLUGL\HHULúLPLQDúÕUÕ\NVHNIL\DWX\JXOD\DUDNHQJHOOHQGL÷LEHQ]HUL ELULGGLD.XUXO¶XQ&amp;15