BCO algoritmasının öbekleme kalitesi - Bulanık C-Ortalamalar Algoritması

2. BULANIK C-ORTALAMALAR İLE VERİ ÖBEKLEME ve SÖZEL ÇİTLİ

2.3. Bulanık C-Ortalamalar Algoritması

2.3.6. BCO algoritmasının öbekleme kalitesi

BCO algoritması işletildikten sonra veri kümesinde yer alan her bir örneklem c adet öbek içine yerleştirilmiştir. Örneklemlerin her bir öbeğe hangi oranda ait olduğu öbek aidiyet/ üyelik derecesi ile ifade edilmektedir. Örneklemin en büyük öbek aidiyet/üyelik derecesine sahip olduğu öbek, atandığı öbek olarak işlem görmektedir. Belirlenen öbeklerdeki örneklem nitelikleri benzer özellikler sergilerler. Aynı öbek

içindeki örneklem niteliklerinin koordinat sisteminde de birbirlerine yakın olması beklenmektedir. Aynı şekilde, farklı öbeklere atanan örneklem nitelikleri ise koordinat sisteminde birbirlerine uzak olmaları beklenmektedir. Aynı öbekteki örneklemlerin birbirine yakın, farklı öbekteki örneklem niteliklerinin birbirine uzak olması prensibinden hareketle BCO algoritmasının başarımı değerlendirilmektedir. Örneklem niteliklerinin yakınlık değerlendirmesine ilave olarak, öbek ve örneklemlerin anlam bakımından da incelenmesinde fayda vardır. Yani niteliklerin birbirlerine olan mesafelerine göre oluşturulan öbeklerin, içerik/anlam açısından da uyumlu olması gereklidir. Anlam açısından uygun örneklemler, problemin çözümüne olumlu katkı sağlar.

Öbekleme algoritmalarında doğru öbek/grup tabela değerleri olmadığı için anlam değerlendirmesinde uzman görüşünden yararlanmak yaygın bir yaklaşımdır. Anlam değerlendirmesinden, öbek adları ile öbeğe atanan örneklemlerinin uyumluluğu ifade edilmektedir. Değerlendirmenin alan uzmanı tarafından her bir örneklemin incelenmesi yöntemi ile yapılması önerilmektedir.

Anlamların sayısallaştırılması mümkün olması halinde anlam değerlendirmesinin BCO algoritması içinde modellenmesi söz konusudur. Fakat anlam sayısallaştırmasının ATEKA yönteminde olduğu gibi uzman bağımlı ve öznel değerlendirmeler içereceği düşünülmüştür. Öznelliği ortadan kaldırmak için örneklem niteliklerinin kullanılmasının daha tutarlı sonuçlar üreteceği değerlendirilmiştir. İşletmeye bu kapsamda destek sunmak amacıyla örneklem niteliklerini kullanan ve Öbek Uyumluluk Fonksiyonu olarak adlandırılan bir fonksiyon geliştirilmiştir.

2.3.6.1. Öbek tutarlılığı değerlendirmesi

Eğiticisiz öbekleme sonuçlarının değerlendirilmesi, doğru öbek etiket değerinin olmaması nedeniyle oldukça zordur. Kullanılan öbekleme algoritmasına uygun öbek kalitesini değerlendiren algoritmalar geliştirilmiştir. Bölütlemeli algoritmalar için Rousseeuw’in geliştirdiği Silhouette (Karartılar) yöntemi oldukça iyi sonuçlar vermektedir [57].

Silhouette, her bir öbeğin kendi içindeki benzerlikleri ve farklılıklarını bulmada kullanılmaktadır. Silhouette’nin kullanılması için örneklem nitelikleri ve atandıkları

öbek etiket verisine ihtiyaç duyulmaktadır. Sıralanan girdiler ile öbek içi ve öbekler arası mesafeler hesaplanarak karşılaştırma yapılır.

Standart Silhouette hesaplamalarında örneklemler arası mesafenin hesaplanmasında Öklid Yöntemi kullanılmaktadır. Ancak istenirse Öklid haricinde Şehir Blokları Yöntemi, Kosinüs Yöntemi, Hamming Mesafe Yöntemi, Jakkard Yöntemi ya da özel mesafe ölçme algoritmaları da kullanılabilir.

Her bir i örneklem için Silhouette Yöntemi ile s(i) öbek kalitesi değeri hesaplanır. Sonrasında tüm örneklemlerin atandıkları öbekler ve hesaplanan s(i) değerleri şekil üzerinde sergilenir. Böylelikle, öbek kalitelerinin görsel olarak da incelenmesi mümkün olmaktadır.

Silhouette Yönteminde öncelikle öbek içi, sonrasında ise öbekler arası mesafeler hesaplanmaktadır. Hesaplamalar için yapılan işlemlerin Şekil 2.5.’deki canlandırma üzerinden takip edilmesi, anlaşılabilirliği kolaylaştıracaktır. Şekil 2.5.’de gösterim amaçlı A,B ve C öbekleri oluşturulmuştur. A öbeğinde beş, B öbeğinde üç ve C öbeğinde dört adet örneklem atanmıştır.

Şekil 2.5. Silhouette hesaplamasındaki parametrelerin canlandırması

A öbeği içindeki her bir örneklemin sırasıyla kendi dışındaki tüm örneklemlere olan mesafelerinin ortalaması hesaplanır. Şekilde A öbeğinde yer alan i örneklemi için a(i) ortalama mesafesi, i örnekleminden diğer A öbeği örneklemlerine çizili kırmızı renkli uzunlukların ortalaması alınarak hesaplanmaktadır. Sonrasında, A öbeğindeki

i örnekleminin B ve C öbeklerinin tüm örneklemlerine olan ortalama mesafe d(i,B) ve

Öbek ≠A olan tüm örneklemler için mesafeler hesaplandıktan sonra i örneklemine en yakın olan ortalama öbek mesafesi tespit edilir. En yakın öbek, komşu öbek olarak b(i)’ye atanır.

b i minimum d i,B),d(i,C)… , (Öbek≠A) (2.18) Elde edilen a(i) ve b(i) parametreleri kullanarak öbek kalitesi olarak belirlediğimiz s(i) ifadesi aşağıdaki gibi hesaplanmıştır:



           b(i) a(i) ki, 1 b(i)/a(i) b(i) a(i) ki, 0 b(i) a(i) ki, a(i)/b(i) 1 i s (2.19)

Denklem (2.19) tek bir eşitlik şeklinde aşağıdaki gibi ifade edilebilir:



a(i),b(i)



max

a(i) b(i)

s(i)  (2.20)

Denklem (2.20)’de kendi dışındaki en yakın öbek mesafesinden öbek içi mesafelerin farkı alınmaktadır. s(i)’nin eksi değer alması, incelenen i örneklemin komşusuna daha yakın olduğu anlamına gelir. Bu istenmeyen durum öbek oluşturma kalitesinde sorun olduğunun işareti olarak değerlendirilir. Öbeklerin, birbirlerine göre olan konumlarının tutarlılığı bu şekilde değerlendirilmektedir.

2.3.6.2. Öbeklerin problemin amaçlanan çözümüne etkinliği açısından değerlendirilmesi

BCO algoritması, hat, parça no ve grup niteliklerini kritiklik indeksleri ve imalatı durdurma süresi niteliklerine göre üç öbeğe ayıracaktır. Oluşturulacak öbeklerdeki örneklemlerin, anlam bakımından öbek içeriği ile ne derece uyumlu olduğunun hesaplanması için Öbek Uyumluluk Fonksiyonu geliştirilmiştir.

Shilhouette yaklaşımına benzer bir yaklaşımdan hareket ile geliştirilen fonksiyonda, Shilhouette’de mesafe bulmada kullanılan Öklid Yöntemi yerine, her bir örneklem niteliğinin uyumluluklarını ifade eden aşağıdaki denklem kullanılmıştır:

 

3 N 1 i 2 i u n n Ö



   (2.21)

Denklem (2.21)’de Öu, örneklem uyumluluğunu, n örnekleme ait niteliklerin ortalama değerlerini, ni ise örneklemin her bir nitelik değerini ifade etmektedir. Her bir

örneklem için öbek içi Öu değer ortalaması s(i) değerindeki gibi a(i) değerine; tüm diğer öbeklerden hesaplanan en küçük ortalama Öu değeri ise b(i) değerine atanarak Denklem (2.20) eşitliğinden Öbek Uyumluluk Parametresi hesaplanır. Eksi çıkan değerler, öbek içindeki örneklem niteliklerinin uyumsuzluğunu ifade eder. Benzer değerlendirme yöntemleri YSA, Genetik Algoritmalar gibi farklı Yumuşak Hesaplama Algoritmaları kullanılarak da geliştirilebilir.

2.4. Sözel Çitli Uyarlanabilir Bulanık Sinir Ağları ile Sınıflandırma Algoritması

Belgede Kritik bakım parçalarının yumuşak hesaplama algoritmalarıyla belirlenmesi (sayfa 54-58)