• Sonuç bulunamadı

Araştırma Verilerinin Elde Edilmesi ve Kullanılacak Program

Araştırmanın ilk adımı olarak JAVA dilinde ECLIPSE üzerinde geliştirilen kod ile veriler online şikayet sitelerinden elde edilmiştir. Internet üzerinde kamuya açık sitelerden, Türkiye’de faaliyet gösteren tüm bankaların online şikayetleri herhangi bir ayrım söz konusu olmadan toplanmıştır. Şikayetlerin konularının zamana bağlı olarak değişme olasılığı göz önüne alınarak, araştırmada iki ayrı veri

seti kullanılmıştır. İlk veri seti, 14 Temmuz 2015-14 Aralık 2015 arasındaki ve ikinci veri seti ise 14 Aralık 2015-6 Eylül 2016 arasındaki toplam 100.000 müşteri şikayetinden oluşturulmuştur. Çalışmada, ilk veri seti Temmuz-Aralık verisi, ikinci veri seti Aralık-Eylül verisi olarak adlandırılmıştır. ECLIPSE ekranı Şekil 14’de gösterilmiştir.

Şekil 14: ECLIPSE Programında Geliştirilen Kod

Oluşturulan veri seti örneği Tablo 6’da gösterilmiştir. Veri setinde yer alan şikayet başlığı veya metninin tamamı, yapılandırılmamış veridir. Bu veriyi yapılandırılmış hale dönüştürmek ve analiz yapabilmek için her kelime, uygulamada bir öznitelik (attribute) olarak kullanılır.

RapidMiner, WEKA ve R, açık kaynak kodlu VM programları arasında en çok kullanılanlarıdır. Kullanım kolaylığı, 3D görsellerinin fazlalığı ve diğer programlardan daha fazla özellik barındırması sebebiyle bu araştırmada, RapidMiner kullanılması tercih edilmiştir. RapidMiner Studio 7.2 (Educational Licence) programı test verisi ve gerçek veri analizi için kullanılmıştır.

RapidMiner-Studio, YALE üniversitesi bilim insanlarının, Java dili kullanılarak geliştirdiği, veri ve metin madenciliği programıdır. Aml, arff, att, bib, clm, cms, cri, csv, dat, xml, ioc, log, mat, mod, obf, bar, per, res, sim, thr, txt, wgt, wls, xrff uzantılı dosyaları desteklemektedir. Diğer VM programlarına göre daha fazla format desteklemekte ve RapidMiner ve eklentileri, VM’nin tüm yönleri için 400’den fazla operatör sunmaktadır. Ayrıca, meta operatörler deneysel tasarımları otomatik olarak optimize etmektedir.

RapidMiner, makine öğrenme algoritmaları olarak destek vektör makinelerini içeren büyük veri öğrenme modelleri için ise birçok sınıflandırma ve regresyon algoritma içermektedir. Ayrıca RapidMinerin, kümeleme ve birliktelik kuralları konusunda algoritmaları da mevcuttur. Veri ön işlemleme konusunda en iyi VM programı olarak işaret edilen WEKA’nın, RapidMiner’a entegre çalışması, programın en önemli avantajlarından biridir. Özellikle WEKA’da çalışan, veri önişleme için ayırma, normalleştirme, filtreleme gibi özellikler, genetik algoritma, yapay sinir ağları, 3D ile verileri analiz etme gibi birçok özellik de bu çalışmada RapidMiner üzerinde çalıştırılacaktır.

Dener ve diğerleri (2009), açık kaynak kodlu VM programlarından olan RapidMiner (YALE), WEKA ve R programlarının karşılaştırmasını, örneklerle analiz ederek WEKA’nın en çok kullanılan program olduğunu belirtmiştir. Ancak WEKA’nın arff formatı, veri analizinde yeterince esnek değildir. Büyük verilerde, format kaynaklı sorunlar araştırmacılara zaman kaybettirmektedir.

2010 yılında yapılan başka bir çalışma ise VM uzmanlarının ziyaret ettiği bir websitesi tarafından gerçekleştirilmiştir. VM uzmanlarından, son 12 ayda gerçek projelerde en çok kullandıkları açık kaynak kodlu VM programını belirtmeleri istenmiştir. Çalışma sonucunda sıralama, RapidMiner (%37,8) , R (%29,8), Knime (%19,2), Weka (%14,3) ve Orange (%2,7) olarak belirlenmiştir (Tekerek, 2011).

Araştırmada, RapidMiner ve WEKA programı eklentisi birlikte kullanılacaktır. Böylece veri ön işleme konusunda, WEKA’nın avantajlarından ve

algoritma çeşitliliği konusunda da RapidMiner’ın avantajlarından yararlanılması sağlanacaktır.

Tablo 6: Müşteri Şikayeti Veri Seti Örneği

ID Şikayet Başlığı Şikayet Yazar Görüntülenme

Sayısı

2564825 Q Bank islemi Saglayamiyorlar.

Telefon numaram baska kisi tarafindan bankaya kayit edilmis hem baskasinin adina hem benim adima benim telefon numaram gozukuyor. Üç haftadir bankaya git cik musteri temsilcisini ara nedir bu ya oyun mu oynuyoruz burada. üç haftadir sistemden telefon numarasini silemediniz. Ariyorum dosya aciliyor, ariyorum dosya kapali, musteri temsilcisi subeden diyor, subeye gidiyorum musteri temsilcisinden silinecek diyor. Subeden dilekce yaziyoruz subeden silinemedigine dair bir uyarisi veriyormus bunu da anlattık anlasilamiyor herhalde bilgisiz personel mi calistiriliyor anlamiyorum. Bir an once bu olayi cozemiyorsaniz size ait olan her seyi kapatiyorum bunla mi ugrasacagim yeter.

Hanife S 264 7254648 Fbank Hesap isletim Ucretimin iadesini istiyorum!

Danistay idari Dava Daireleri, sayilari 112 milyonu asan banka hesabindan "isletim ucreti" alinmasinin yurutmesini durdurdu. "Aciklanan nedenlerle, davacinin itirazinin kismen kabulu ile 2577 sayili idari Yargilama Usulu Kanunu'nun 27. maddesinde ongorulen kosullar olustugundan, davaya konu yonetmeligin 13. maddesinin 1. Fikrasi ve Ek-1 listesinde bulunan '2.1 Hesap isletim Ucreti' yonunden yurutmesinin durdurulmasina" karar verdi. Bu karar neticesinde haksiz yere alinan hesap isletim ucretinin iadesini talep ediyorum.

Özge d.

365

787976 Yuklenmeyen Kampanya Puani!

4.12.2017 tarihinde ve 17:47 saatinde cep telefonuma gelen otuz yazip 6635 e kart numaramin son 6 hanesini gonderdigimde 27 Aralik ta toplam 300 TL alisverise 10 TL worldpuan kampanyasi kapsaminda hem SMS katilimimi sagladim hem de harcamayi yaptim fakat puan yuklemesi yapilmadi. Yuklenmeyen 10 TL puani yukleyiniz.

Kemal E.

455

Metinler, çeşitli veritabanlarından toplanırken birçok farklı formatta depolanabilmektedir. Örneğin; xml, csv, txt, pdf, xls, rtf, img vb. Burada önemli nokta; kullanılacak metin madenciliği programının, verileri işleyebileceği programın belirlenmesidir.

WEKA programı; arff, csv, xrff vb. birçok formatı kullanmaktadır. Oluşturulan ilk veriler, csv formatında toplanmıştır. Ancak Türkçe karakter ve imla işaretleri konusunda WEKA programında hatalar oluşmuştur. Hataların bir diğer nedeni ise csv formatını tekrar arff çevirme gerekliliğidir. WEKA, kullandığı dil nedeniyle hassas bir programdır. Araştırmadaki veri sayısının yüksek olması nedeniyle RapidMiner programının, WEKA eklentisi ile kullanılmasına karar verilmiştir. İkinci kez yapılan veri toplama işleminde, xls formatında ve Türkçe karakter kullanılmadan veriler toplanmıştır.