• Sonuç bulunamadı

Bölüm 2: Öncelikle giriş uzayında ayrıştırma yapılmasının nedeni incelenerek, yeni küre ve elipsoit biçimli çekirdekler önerilmiş, başarımı ve geçerliliği tartışılmıştır Daha sonra

2. GİRİŞ UZAYINDA KÜRE ve ELİPSOİT BİÇİMLİ AYRIŞTIRICI YÜZEYLER KULLANARAK SINIFLAMA

2.3. Önerilen İki Aşamalı Formülasyon

2.4.1. Veri Kümeler

İki sınıflı sınıflama ile ilgili örneklerde, yüksek boyutlu ve veri sayısı farklı olan sekiz veri kümesi kullanılmıştır. Kullanılan veri kümelerinin dördü California, Irvine Üniversitesi’nin (UCI) makine öğrenme veritabanları arşivinden alınmıştır [72]. Diğerleri Fisher’in zambak çiçeği veri kümesi [9], [75]’den Galaksi/Yıldız ayrıştırıcı veri kümesi ve yapay olarak oluşturulan veri kümeleridir. Ayrıca çoklu sınıflama ile ilgili örneklerde UCI’den üç veri kümesi kullanılmıştır. Bu veri kümeleri hakkında ayrıntılar aşağıda verilmiştir:

Wisconsin Göğüs Kanseri (WGK) veri kümesi: W. H. Wolberg tarafından Wisconsin Üniversitesinde toplanan, UCI’deki göğüs kanseri verilerinden biridir. Hastanın göğsünden alınan doku örneğinin, kötü huylu veya iyi huylu olup olmadığını belirleme problemleridir. 13 sayısal özellikli iki sınıf vardır. 41 kötü huylu ve 69 iyi huylu toplam 110 gözlem vardır.

BUPA Karaciğer Bozuklukları (BUPAKB) veri kümesi: Bu UCI veri kümesi, R. S. Forsyth tarafından BUPA Tıp Araştırma Şirketinde toplanmıştır. Bir erkek hastanın, kan testleri ve alkol tüketimine göre toplam 6 sayısal özelliğe dayanarak karaciğer bozukluğunun olup olmadığını belirleme problemleridir. Karaciğer bozukluğunun şiddetine göre iki sınıf vardır. Bunlar, 200’ü bir sınıftan ve 145’i diğer sınıftan olan, toplam 345 hastadır.

Cleveland Kalp Hastalıkları (CKH) veri kümesi: Bu UCI veri kümesi, R. Detrano tarafından Amerika Birleşik Devletleri'ndeki Cleveland kalp merkezinden toplanmıştır. Hasta üzerinde yapılan çeşitli tıbbi testlerin sonuçları verildiği zaman, kalp hastalığının varlığını veya yokluğunu belirleme problemleridir. 7’si sayısal, 6’sı kategorik olmak üzere 13 özellikli iki sınıf vardır. 83’ü kalp hastası ve 214’ü de hasta olmayan, toplam 297 gözlem vardır.

Galaksi/Yıldız Ayrıştırıcı (GYA) veri kümesi: Bu veri kümesi, Odewahn’ın [75]’deki çalışmasından alınmıştır. Minnesota Üniversitesi’nde Otomatik Plaka Tarayıcı (OPT) kullanılarak toplanmıştır. OPT tarafından fark edilen nesnelerin 14 görüntü parametresine dayanarak, galaksi mi yoksa yıldız mı olduğunu tespit ederek onları ayrıştırma problemleridir.

Bu veri kümesinde 2110 galaksi ve 2082 yıldız bulunmaktadır.

İyonosfer veri kümesi: İyonosfer radar yansımaları verisidir. Bu radar verisi Goose Bay, Labrador anten sistemi ile toplanmıştır. Sistem, toplam iletim gücü 6.4 KW olan 16 yüksek frekanslı dizi antenden oluşmaktadır. Hedefler iyonosferdeki serbest elektronlardır. “İyi” radar dönüşleri, iyonosferdeki elektronların varlığını, “Kötü” radar dönüşleri ise yokluğunu göstermektedir. Alınan sinyaller; bağımsız değişkenleri, dönüş sinyali sıra numarası sayısı ve dönüş süresi olan bir öz ilişki işlevi kullanılarak işlenmiştir. Goose Bay sisteminde, 17 dönüş sinyali kullanılmıştır. Bu veri tabanındaki her bir örnek, dönüş sayısı başına değerleri karmaşık sayılar ile verilen iki elektromanyetik sinyalle tanımlanmıştır. Bu nedenle iyonosfer veri kümesi 34 girişle verilmektedir. Toplam 351 örnekten oluşmaktadır. Bu örneklerin 225’i “iyi”, 126’sı “kötü” olarak etiketlenmiştir.

Zambak çiçeği veri kümesi: Zambak çiçeği verisi ilk olarak, 1936’da Fisher tarafından yayınlanmıştır [9]. Bu veri kümesi, her biri 50 örnekten oluşan 3 sınıf içerir. Her bir sınıf zambak çiçeğinin farklı bir tipini göstermektedir. Zambak çiçeğinin farklı tiplerini ayrıştırmak için 4 karakteristiğine bakmak yeterlidir. Bu karakteristikler; santimetre olarak verilen çanak yaprağı uzunluğu, çanak yaprağı genişliği, taç yaprağı uzunluğu ve taç yaprağı genişliğidir. Zambak çiçeğinin bir sınıfı diğerlerinden doğrusal olarak ayrıştırılabilir, diğerleri ise ayrıştırılamaz.

Yapay Veri kümesi-1 (YV1): Bu veri kümesi, önerilen sınıflayıcıların başarımını göstermek için ilk olarak [100]’de oluşturulmuştur. Birim dairenin içindeki ve dışındaki verileri bulma problemidir. Birim daire içindeki veriler bir sınıftan, dışındakiler ise diğer sınıftan olmak üzere, iki özelliği bulunan iki sınıf vardır. 141 pozitif olarak etiketlenen ve 353 negatif olarak etiketlenen, toplam 494 örnek vardır.

Yapay Veri kümesi-2 (YV2): Bu veri kümesi, YV1 veri kümesinden sadece x=[0.9 0;0.18 -0.3; 0.36 0.3; -0.18 0.15; -0.22 -0.24;1.1 0;1.11 0.96; 1.17 -0.915;-0.96 -1.1] y=[1 1 1 1 1 -1 -1 -1 -1]';

verileri alınarak oluşturulmuştur. Öncekine benzer şekilde birim dairenin içindeki ve dışındaki verileri bulma problemidir.

Ayrıca YV2 veri kümesinin küre olarak ayrıştırılmaması için sırasıyla, 1 etiketli {1.25, 0.75} ve {10, 10} verileri eklenerek yeni veri kümeleri oluşturulmuştur. Elde edilen veri kümeleri uygulamalarda sırasıyla YV21 ve YV22 olarak isimlendirilmiştir.

Şarap veri kümesi: Bu veri kümesi, C.Blake tarafından Eczacılık ve Yiyecek Analizi ve Teknolojileri Enstitüsü'nde toplanmıştır. İtalya’nın özel bir alanında üretilen şarapların kimyasal analizinin sonuçları kullanılarak şarapların üç farklı tipini belirleme problemidir. Toplan 178 örneğin her biri için 13 kimyasal analiz yapılmıştır.

Cam veri kümesi: Bu veri kümesi, B. German tarafından USA Adli Bilim Servisi’nde suçun işlendiği olay yerinde bulunan camların kanıt olarak kullanılması amacıyla toplam 214 örnek toplanmıştır. Camın oksit içeriğine bakarak (magnezyum, alüminyum, silikon, potasyum, kalsiyum, baryum, demir, sodyum, ışığı kırma indeksi gibi) işlenmiş veya işlenmemiş bina pencere camı, işlenmiş veya işlenmemiş araba camı, şişe camı, masa camı ve far camı olup olmadığını belirleme problemidir.

Uydu görüntüleri veri kümesi: Bu veri kümesi Avusturya Uzaktan Algılama Merkezi tarafından NASA’dan satın alınmıştır. 4 elektromanyetik izgel (spektral) bant ve komşuluktaki 9 piksel değerlendirilerek alanın kırmız toprak, gri toprak, nemli gri toprak, çok nemli gri toprak, pamuk ürününe veya bitki örtüsüne sahip toprak olup olmadığını belirleme problemidir.

2.4.1.2. İki Sınıflı Sınıflayıcılar İçin Uygulamalar

Aşağıda verilen ilk iki örnekte, bu tezde önerilen küre ve elipsoit biçimli sınıflayıcıların eğitim yöntemlerinin başarımları incelenmiştir. İlk örnekte, zambak çiçeği verisi ve oluşturulan yapay veri kümeleri üzerinde, yöntemlerin eğitim başarımları ve eğitim süreleri önce birbirleriyle ve daha sonrada RTİ çekirdekli ve küre çekirdekli DVM ile kıyaslanmıştır. İkinci örnekte ise zambak çiçeği verisinin farklı boyutları ile üç sınıf için ayrı ayrı sınıflayıcılar oluşturarak, hem eğitim hem de test başarımları DVM ile kıyaslanmıştır. Üçüncü örnekte ise bilimsel yazında bilinen veriler kullanılarak; önerilen sınıflayıcılar ile hem DVM tabanlı hem de diğer sınıflayıcılar, eğitim ve test kümesi üzerindeki başarımları ve eğitim süreleri açısından kıyaslanmıştır.

Benzer Belgeler