• Sonuç bulunamadı

4. Karar Destek Sistemleri Teknolojileri

4.5. Veri Madenciliği

Büyük miktarda veri barındıran veri ambarlarında analistlerin tespit edemedikleri ilişkiler, desenler ve trendler bulunmaktadır. Analistlerin belirleyebildikleri ilişkilerin ispatlanması ve bilinmeyen ilişki, desen ve trendlerin ortaya çıkarılması için “Veri Madenciliği” (Data Mining) denen teknolojinin yardımına ihtiyaç vardır. Çok büyük veri yığınlarından değerli enformasyonun ortaya çıkarılması süreci için kullanılan “Veri Madenciliği” tabiri, yer altından değerli taşların ortaya çıkarılması metaforundan türemiştir. [2]

Veri madenciliği, eldeki verilerden üstü kapalı, çok net olmayan, önceden bilinmeyen ancak potansiyel olarak kullanışlı bilginin çıkarılmasıdır. Başka bir deyişle, veri madenciliği, verilerin içerisindeki desenlerin, ilişkilerin, değişimlerin, düzensizliklerin, kuralların ve istatistiksel olarak önemli olan yapıların yarı otomatik olarak keşfedilmesidir. [9]

Veri madenciliği yazılımından, hangi soruyu soracağımızı bilemediğimiz durumlarda cevapları bulmasını bekleriz, veri madenciliğinin OLAP‟tan en önemli farkı da burada ortaya çıkmaktadır. OLAP‟ta özet verilerden detaya gidilerek soruların cevapları bulunmaya çalışılır. Halbuki veri madenciliğinde detay veriden gidilerek hangi soruların sorulması gerektiğine ulaşılır. [2]

Temel olarak veri madenciliği yazılımı, veri setleri arasındaki desenleri ya da düzeni, istatistik yöntemler kullanarak tespit eder, ardından bu desenlerden çeşitli kuralların modellemesini yapar. Modellenen bu kurallar daha fazla veri kullanılarak yazılım tarafında test edilir ve kabul göremeyecek olanlar elenerek, karar vericinin karar verme sürecine yardımcı olabilecek desenler ve kurallar açığa çıkarılmış olur. [1]

Veri madenciliği şirketlerin çok büyük veri yığınlarından kritik bilgileri elde etmelerini sağlar. Böylelikle şirketler, normal şartlar altında uzun zaman süren araştırmalarla doğruluğu kesin olmayacak şekilde elde edecekleri bilgiyi veri madenciliği sayesinde kısa sürede ve kesin olarak elde ederler. Elde ettikleri bu bilgiyi objektif değerlendirmeler yaparak ya da şirketle ilgili stratejik kararlar almada kullanırlar. Bu bilgiler kurumsal veri kaynaklarının iyi analiz edilmesine ve iş dünyasındaki yaklaşımlara ilişkin tahminlerde bulunulmasına yardımcı olur.

43

Gelişmiş veri madenciliği uygulamaları sayesinde ilaç şirketleri etkili ilaçlar üretmek için hangi kimyasal kombinasyonları kullanmaları gerektiği ile ilgili çalışmalar yürütmüşler ve bu sayede milyonlarca dolar tasarruf sağlamışlardır. Yine veri madenciliği sayesinde şirketler, kârlı müşterilerinin alışveriş alışkanlıklarını analiz edip, kârlı olması muhtemel diğer müşterileri tespit ederek, onları uzun süre müşterileri olarak tutmak için stratejiler geliştirmektedirler. Bu örneklerde görülmektedir ki, veri madenciliği rekabetin giderek arttığı iş hayatında önemli bir rekabet avantajı sağlamaktadır. [2]

Veri madenciliğinin bunca faydasına rağmen çok yaygınlaşmamış olmasının bazı sebepleri vardır. Bunlardan en önemlisi anlamlı sonuçlar elde edebilmek için gerekli olan büyük miktardaki verinin saklanması ve işlenmesinde yaşanan sıkıntılardır. Veri ambarı ve veritabanı mimarisindeki gelişmesinin yanı sıra donanım performanslarının da artmasıyla bu problem aşılmıştır. Bir diğer önemli engel olan veri madenciliğinin komplike ve maliyetli bir süreç olduğu düşüncesi, kolay kullanımlı ve düşük maliyetli ürünlerin piyasaya çıkmasıyla geçerliliğini kaybetmektedir. Bu yeni uygulamalar şirketlerin sistemlerine hem daha kolay implemente edilebilmekte, hem de istatistiki bilgisi çok fazla olmayan son kullanıcılar için de anlamlı olan sonuçlar üretebilmektedirler. [2]

4.5.1. Veri Madenciliği Algoritmaları

Veri madenciliğinde çeşitli algoritmalar kullanılır. Bazı algoritmalar tanımsal olup, veriler arasındaki görünmeyen ilişkileri tespit etmeyi ve tespit edilen bu ilişkilerin kullanıcıların yardımıyla anlamlılık düzeylerinin belirlenmesini amaçlar. Tahminsel algoritmalar ise, varolan veriden elde edilen bulgulara istinaden yeni verilerin işlenmesini ve yorumlanmasını sağlar. “İlişkilendirme analizi” ve “kümeleme” tanımsal algoritmalara, “ardışık desenler” ve “sınıflandırma” ise tahminsel algoritmalara örnek olarak verilebilir. Sık kullanılan bu algoritmalardan kısaca bahsetmek faydalı olacaktır. [2]

İlişkilendirme Analizi (Associations / Link Analysis): Veri ambarında bulunan işlemsel veriler arasındaki ilişkilerin tespit edilmesine yarayan bir algoritmadır. Bir veri grubu ile değişken diğer bir veri grubu arasındaki korelasyon tespit edilerek anlamlılık düzeyleri belli bir değerin üzerinde olanlar birbirleri ile ilişkilendirilirler. Çapraz satışa uygun ürünlerin tespitinde bu yöntemden faydalanılır. [2]

Kümeleme (Clustering): Bu algoritmada, veriler benzerliklerine göre daha önceden tanımlanmamış olan kriterlere göre küçük gruplara bölünerek anlamlılık düzeyleri belli bir değerin üzerinde olanlar gruplar oluştururlar. Kredi kartını iptal eden bir müşterinin özelliklerini belirleyip, aynı kümede yer alan ve kredi kartlarını iptal etmeleri muhtemel diğer müşterilerin tespiti bu algoritma tarafından yapılır. [9]

Ardışık Desenler (Sequential Patterns): İlişkilendirme analizine benzer bir algoritmadır, ancak bu defa veri ambarında bulunan ilişkilerin ve desenlerin zaman kavramıyla olan bağlantıları da tespit edilir. Bu algoritma sayesinde bir ürünü alan müşterinin belli bir zaman sonra başka bir ürün grubundan satın alma yaptığının tespit edilebilmesini sağlar. [9]

Sınıflandırma (Classification): Yeni verilerin, varolan veriye istinaden yapılan modellemeye göre belirlenen sınıflardan hangisine ait olduğunun tespiti için kullanılır. Kredi kartı kabul sürecinde daha önceki müşterilerin davranışlarına istinaden, yeni başvuru yapan bir müşterinin riskini belirlemek amacıyla kullanılan bir uygulamada, sınıflandırma algoritmasından yararlanılır. [2]

45

4.5.2. Veri Madenciliği Uygulamaları

Veri madenciliği çok çeşitli alanlarda kullanılmaktadır. Özellikle sağlık sektöründe genetik biliminin hizmetinde önemli faydalar sağlamaktadır. Bunun yanı sıra perakendecilik ve telekomünikasyon alanında da veri madenciliği uygulamalarına rastlamak mümkündür.

Genetik araştırmalar için veri madenciliği uygulamaları ile, sağlıklı ve hastalıklı deneklerden alınan gen örnekleri karşılaştırılarak, kritik farklar tespit edilir ve hastalığa neden olan gen sıra deseni bulunmaya çalışılır. Pek çok hastalık sadece bir genin değil birden fazla genin beraber çalışmasıyla harekete geçer. Çeşitli veri madenciliği algoritmaları kullanılarak, beraber aktive olan genlerin tespiti ve bu sayede gen gruplarının tanımlanması ve birbiriyle etkileşiminin ortaya çıkarılması sağlanır.

Perakendecilik sektöründe veri madenciliği uygulamaları, müşterilerin tüketim alışkanlıklarının incelenerek, süpermarketlerdeki ürünlerin raflarda konumlandırılması veya telekom operatörlerinin müşteri segmentlerine ait tarifelerinin fiyatlandırılması gibi pazarlama odaklı kararların verilmesinde yardımcı olur. [38]

Özellikle telekomünikasyon sektöründe, ilgili şirketin hizmetlerini almayı bırakıp rakip şirkete geçen müşterilerin demografik bilgileri, konuşma süreleri, fatura tutarları ve şikayet sayıları gibi çeşitli verileri incelenip, ayrılması muhtemel müşterilerin tespit edilmesi çalışmaları yapılabilmektedir. “Churn analizi” adı verilen bu yöntem, telekomünikasyon sektörünün yanı sıra, finans sektöründe de kredi kartları müşterileri için uygulanmakta ve etkin promosyon yöntemleri ile müşterinin ilgili firmadan ayrılması engellenmeye çalışılmaktadır. [36]

Veri madenciliğinin finans sektöründeki diğer uygulama alanları kredi verilecek müşterinin değerlendirilmesi, kârlı müşterilerin sınıflandırılması, hisse senedi, bono ve fon gibi finansal enstrümanların gelirlerinin performans analizi, çapraz satış olanaklarının belirlenmesi ve sahtekârlıkların tespiti şeklinde sıralanabilir.

Veri madenciliğinin gücünü kullanarak, müşterilere daha iyi önerilerle gitmek ve kampanyaya olumlu yanıt vermesi muhtemel müşterilere ulaşarak operasyonel maliyetleri aşağı çekmek mümkündür. [25]

Benzer Belgeler