• Sonuç bulunamadı

Veri Madenciliği

BÖLÜM 2: ENDÜSTRİ 4.0 VE YENİ NESİL TEKNOLOJİLER

2.3. Endüstri 4.0 ve Sistemsel Yapısı

2.3.4. Veri Madenciliği

Geçmişe dönük bilgiler sunan raporların aksine analizler aracılığıyla geleceğe dönük veri madenciliği teknikleri kullanmak işletmelerin rekabet gücü elde etmelerini, sürdürülebilirliklerini sağlamalarını ve karar alma mekanizmalarını güçlendirmelerini sağlamaktadır. Başka bir ifadeyle veriler içindeki örüntülerin, ilişkilerin, değişikliklerin ve istatistiksel açıdan önem arz eden yapıların keşfedilmesi faaliyetleridir (Ulucan vd., 2009: 71).Şekil 24’te veri madenciliği teknolojisinin tarihsel gelişimi gösterilmiştir.

Şekil 24: Veri Madenciliğinin Tarihsel Gelişimi

Kaynak: Savaş, Serkan, Nurettin Topaloğlu, Mithat Yılmaz. “Veri Madenciliği ve

Türkiye’deki Uygulama Örnekleri”. İst. Tic. Üni., Fen Bilimleri Der., 2012, s. 21

Günümüzde emek, doğa, sermaye ve girişimciden oluşan üretim kaynaklarına bilgide eklenmiştir. Teknolojinin gelişmesiyle büyük miktarda veriler elde etmek ve depolamak mümkün olmaktadır.Konunun önemini ve boyutunu vurgulamak için Acxiom, Epsilon, Rapleaf, Flurry, Bluekai gibi şirketlerin veri simsarlığı ile ilgili faaliyetlerine bakmak

1950’lar 1960’lar 1970’ler 1980’ler 1990’lar 2000’ler - İlk bilgisayarlar - Verilerin depolanması

- İlişkisel veri tabanı yönetim sistemleri - Basit kurallara dayanan uzman sistemler - Büyük miktarda veri içeren veri tabanları - SQL sorgulama dili

- Veri tabanlarında bilgi keşfi çalışma grubu - Veri madenciliği için ilk yazılım

90

gerekmektedir. Bu şirketler pek çok amaçla kullanılmak üzere verilerimizi toplar, analiz eder ve analiz sonuçlarını reklamcılık ve pazarlama sektörlerine satar. Bu faaliyetle ilgili en güncel örneklerden biriside 2018 yılında yaşanan Facebook’un elinde bulunan verileri Cambridge Analytica şirketiyle paylaşarak başkanlık seçimlerinde kullanması örnek verilebilir. Bir başka açıdan yaklaşıldığında 2012 yılında Instagram uygulamasının Facebook tarafından 1 milyar dolara satın alınması da bu konudaki önemli bir diğer noktadır. Bu fiyatın nedeni Instagram uygulamasının yazılımsal yapısından ziyade, uygulamadan elde edilebilecek verilerin boyutudur. Yani günümüzde veri simsarlığı yapan şirketler uygulamalardan ziyade bu uygulamaların kullanıcılarından gelir elde etmektedirler. Yapılan bir araştırmaya göre hemen hemen herkesin bildiği Twitter’da her bir kullanıcının değeri 48 dolar, bu değer Facebook’ta 253 dolar, Google’da 359 dolar ve Amazon’da ise bu değer 1793 dolardır. Her ne kadar kişiler kullanıcı ve tüketici olarak görülse de esasında kişiler ürüne dönüşmüştür.

İşletmelerin sahip oldukları bu büyük miktarlı verilerden anlamlı sonuçlar çıkarabilmek ve işletme amaçları doğrultusunda kullanabilmek amacıyla verilerin analiz edilmesi, veriler arasındaki uyumun ve farklılıkların tespit edilmesi, anormal durumların keşfedilmesi oldukça önemlidir (Çağıltay, 2010: 9). Veri madenciliği bu noktada işletmeler açısından hayati bir konum teşkil etmektedir.

Veri madenciliği büyük hacimli, çeşitli ve karmaşık veriler arasından işletme için değerli olan bilgiyi ortaya çıkarma işidir. Veri madenciliği aracılığıyla veriler arasındaki korelasyon ortaya çıkarılmakta ve geleceğe yönelik kararlar alınmasına yardımcı olmaktadır (Özkan, 2013: 11). Veri madenciliği veriler arasındaki ilişkilerin karmaşık bir yapı sergilediği durumlarda ilişkilerin keşfedilmesi amacıyla özel yöntemler sunmaktadır (Çağıltay, 2010: 220).

Veri madenciliğinin amacı büyük hacimli verileri üst düzey modelleme yöntemleriyle bilgiye dönüştürmektir (Tsiptsis ve Chorianopoulos, 2009: 2). Veri modellerinin kullanılmasıyla çok daha kapsamlı analizler gerçekleştirilmesini sağlar. Bu sayede veri ambarındaki büyük hacimli verilerin analiz edilerek bilinmeyen, gizli ve yararlı bilgilerin ortaya çıkarılmasında kullanılır (Çağıltay, 2010: 221).

Veri madenciliği ile amaçlanan karmaşık veriden bilgi üretme ve kanıya varma süreci Şekil 25’de gösterilmiştir.

91

Şekil 25: Veri, Bilgi ve Kanı Süreci

Kaynak: Kürşat Taşkın, Marmara Üniversitesi, Bilgisayar Destekli Denetim Araç ve

Teknikleri Ders Notları, 2012.

2.3.4.1. Veri Madenciliği Süreci

Veri madenciliği süreçlerinin tam olarak belli olmaması, veri hacminin büyük olması ve verilerin karmaşık yapısı süreçte yapılacak bir hatanın ciddi zaman ve maddi kayıplarla sonuçlanmasına neden olabilmektedir. Bu sebeple veri madenciliğinden etkin bir şekilde yararlanabilmek için sürecin bir standarda oturtulması gerekmektedir. “The Cross Industry Standard Process For Data Mining” konsorsiyumunu altı başlık altında ve her biri bir diğerinin sonucu niteliğinde olan veri madenciliği sürecine standartlar getirmeye çalışmıştır.

Tablo 3

Veri Madenciliği Süreci ve Süreçlerin Görevleri 1. Problemin Tanımlanması 4.Modelleme

İş ihtiyaçlarını ve amacı anlamak Durum değerlendirmesi

İş amacını veri madenciliği sürecine tanımlamak

Proje planının geliştirilmesi

Uygun modele karar verme Veri setlerini ayırarak anlamayı kolaylaştırma

Alternatif modelleri test etme ve değerlendirme

Modelin performansını arttırma çalışmaları

2.Verinin Anlaşılması 5.Modelin Değerlendirilmesi

Veri ihtiyaçlarına karar vermek Veri toplama ve zenginleştirme Veri kalitesi çalışmaları

Başarı kriterlerine göre modeli değerlendirme

Modelin doğrulanması

VERİ

(DA

TA)

Karar vermeye yarayan soyut simge dizileri - Sayısal değerler - Sözcükler - Mantıksal değerler

B

İL

Gİ (INF

OR

MA

TI

ON)

- Veriyi özetle - Ortalamaları izle - Belli bir bölümüne bak - Grafiğe aktar - İçerik ekle - Değer ekle

KANI

(K

NO

WLEDGE)

- Bilgi sonuçları nasıl etkiliyor?

- Bilgide belirli bir patern var mı? - Hangi bilgi sorunla ilintili?

- Bilgiyi kullanmanın en iyi yolu nedir? - Bu bilgiye başka ne değer katabilirim? - Eksikler neler, etkileri neler, doğru mu?

92

3. Verinin Hazırlanması 6.Modelin Kullanılması

Gerekli verinin seçilmesi Veriyi elde etme

Veri entegrasyonu ve formatlama Veri temizleme

Veri dönüşümü ve veri zenginleştirme

Sonraki süreçleri planlamak

Bulguları yayınlama

Uygulama sürecini planlama ve geliştirme

Modelin uygulamaya alma Sonuçları operasyonel CRM sistemi ile entegre etme Bakım ve güncelleme için süreçlerin tasarlanması Projeyi gözden geçirme

Kaynak: Tsiptsis ve Chorianopoulos, Data Mining Techniques in CRM, 1.bs., (Londra:

John Wiley & Sons. Ltd, 2009), 11.

Veri madenciliği faaliyetlerini gerçekleştirmek için kullanılan yöntemleri şu şekilde sınıflandırabiliriz (Hormozi ve Giles, 2004: 64):

1) Kümeleme/Bölümleme (Clustering/Segmentation): Verilerin kümelenmesi

ve bölümlenmesi, verileri nitelikleri itibariyle benzer olanları ve alakasız olanları ayırma yöntemidir. Kümeleme/Bölümleme faaliyetlerinin amacı anormal davranışları işaret eden verilerin tespit edilmesidir.

2) Verilerin Grafiksel Gösterimi (Visualization): Verilerin grafik araçları

yardımıyla gösterilmesi ve çok boyutlu grafikler aracılığıyla veri setindeki gizli anormallikler ortaya koyulmaya çalışılmaktadır.

3) Öngörü Modellemesi (Predictive Modeling): Öngörü modellemesi

yönteminin amacı öngörü aracılığıyla anormallikleri tespit etmektir.

4) Bağlantı Analizi (Link Analysis): Bir veri setindeki işlemler arasında ilişki

kurarak analiz yapılmasıdır. Başka bir ifadeyle veriler arasındaki korelasyonun ortaya çıkartılmasıdır.

5) Sapma Tespiti (Deviation Detection): Analizin sonuçlarından beklentiler

göz önünde bulundurularak analiz edilmesidir. Bu sayede veriler arasında beklentilerden sapması yüksek olan veriler anormal olarak tanımlanmaktadır.

6) Bağımlılık Modellemesi/Analizi (Dependency Modeling/Analysis): Veri

madenciliğinin bu yönteminde veriler arasındaki bağımlılıklar ortaya çıkarılmaktadır.

7) Özetleme (Summarization): Bu yöntem veri analizinden elde edilen

sonuçların ilgili kişilerin kullanabilmeleri için daha basit ve açık bir şekilde raporlanmasıdır.

93

2.3.4.2. Veri Madenciliği Kullanım Alanları

Veri madenciliği, günümüzde işlem verilerine incelemek, fiyat belirlemek, müşteri tercihlerini ve ürün konumlandırması araştırmak, müşteri memnuniyeti ve şirket karlarını tespit etmek amacıyla kullanılmaktadır. Veri madenciliği, farklı alanlarda yaygın olarak kullanılmaktadır. Bu başlık altında, veri madenciliği uygulamalarını ve eğilimlerini birkaç örnekle ele almaya çalışılmıştır.

Finansal Data Analizi: Bankacılık ve finans sektöründeki finansal veriler genellikle

sistematik veri madenciliğini ve analizi kolaylaştıracak şekilde güvenilir ve yüksek kalitededir. Finansal alanda kredi ödeme tahmini ve müşteri kredi politikası analizi ve müşterilerin pazarlama faaliyetleri için sınıflandırılması ve kümelenmesi gibi konularda veri madenciliği kullanılmaktadır.

Parakende Sektörü: Parakende satış sektöründe, müşterilerin satın alam dönemleri,

mal taşımacılığı, tüketim ve diğer hizmetlerden çok miktarda veri toplanabilmesi nedeniyle veri madenciliği uygulaması için elverişli bir sektördür. Veri madenciliği, müşteri hizmetlerinin kalitesinin artmasına, müşteri memnuniyetinin artmasına, müşteri eğilimlerinin belirlenmesine yardımcı olmaktadır. Satışların, müşterilerin, ürünlerin, zamanın ve bölgenin çok boyutlu analizi ve satış kampanyalarının etkinliği analiz edilebilmektedir.

Telekomünikasyon Sektörü: Günümüzde telekomünikasyon sektörü, faks, çağrı

cihazı, cep telefonu, e-posta, web veri iletimi gibi çeşitli hizmetler sunan güncel sektörlerden birisidir. Telekomünikasyon sektöründeki veri madenciliği, telekomünikasyon kalıplarının belirlenmesinde, hileli faaliyetlerin ortaya çıkartılmasında, kaynakların daha verimli kullanılmasında ve hizmet kalitesinin arttırılmasında kullanılmaktadır.

Sağlık Sektörü: Veri madenciliği, sağlık sistemlerinin iyileştirilmesinde büyük bir

potansiyele sahiptir. Çok boyutlu veri tabanları, veri görselleştirme ve istatistik gibi veri madenciliği yaklaşımları sağlık sektörünü iyileştiren ve maliyetleri azaltan uygulamalardandır. Veri madenciliği ile her kategorideki hastaların hacminin tahmin edilmesinde ve hastaların doğru yerde ve doğru zamanda bakım almasında kullanılmaktadır. Veri madenciliği aracılığıyla sağlık sigortasının dolandırıcılık ve kötüye kullanımını önüne geçilmesine yardımcı olmaktadır.

94

Eğitim: Eğitim ortamlardan elde edilen verilerle öğrencilerin gelecekteki öğrenme

davranışlarını tahmin etmek, eğitim desteğinin etkilerini analiz etmek ve öğrenmeyle ilgili bilimsel verileri iletmek için veri madenciliği kullanılmaktadır. Eğitim kurumlarının doğru kararlar almasına ve öğrencinin durumu hakkında doğru tahminler edilmesine yardımcı olmaktadır. Böylelikle eğitim kurumları neyin, nasıl ve ne zaman öğretileceğine odaklanabilir, öğrencilerin öğrenme örüntüsünü yakalayabilir ve yeni teknikler geliştirebilirler.

Üretim: Veri madenciliği, karmaşık üretim sürecinde kalıpları keşfetmek için oldukça

yararlı olmaktadır. Veri madenciliği, ürün mimarisi, ürün portföyü ve müşteri ihtiyaçları arasındaki ilişkileri ortaya çıkarmak için kullanılmaktadır. Ürün geliştirme süresi, maliyeti ve diğer görevler arasındaki bağımlılıkların tahmin edilmesine yardımcı olmaktadır.

Hile Tespiti: Veri madenciliği, anlamlı desenler sağlamada ve verileri bilgiye

dönüştürmede kullanılmaktadır. Mükemmel bir hile tespit sistemi, tüm kullanıcıların bilgilerini korumalıdır. Veri madenciliği kullanıcılardan elde ettiği verilerin hileli olanların sınıflandırılmasında, veriler arasındaki anormalliklerin tespitinde kullanılabilmektedir.

2.3.4.3. Veri Madenciliğinin İşletmelere Etkisi

Büyük veri teknolojisi ile işletmeler piyasa sektörler hakkında her zamankinden daha fazla bilgiye erişebilmektedir. Bu veriler toplandığında, analiz edildiğinde ve doğru bir şekilde kullanıldığında işletmeler için müşteriler ve faaliyetler hakkında doğru kararlar verilmesini ve süreçlerin tutarlı olmasını sağlamaktadır. Verilerin analiz edilmesinde proaktif olan işletmeler büyük öneme sahip fırsatlar elde etmektedir.

Veri madenciliğinin işletmeler açısından yararları şu şekilde sıralanabilir:

- Müşteri analizinin daha etkili bir şekilde gerçekleştirilmesi ve müşteri hareketlerinin modellenerek sınıflandırılarak verimli bir pazarlama politikasının oluşturulması

- Müşterilerin ödeme performansları analiz edilerek, verimli bir risk yönetim politikasının oluşturulması

95

- Günümüz rekabet ortamında işletmelerin doğru kararlar vermesi ve karar verme sürecini hızlandırması

- İşletmeyle ilgili taraflardan elde edilen verilerin analiz edilmesiyle işletme performansı hakkında doğru veriler elde edilmesi ve performans arttırmak için yeni politikalar belirlenmesi.