• Sonuç bulunamadı

2. WEB MADENCİLİĞİ

2.3. Web Yapı Madenciliği

2.4.2. Uygulama Alanları

İnternet kullanıcı talepleri ile ilgili hizmetlerin yeterliliği, Web sayfalarının kullanma durumları, kullanıcı oturumları ve kullanıcı davranışlarıyla üretilen erişim kayıtlarının analiz edilmesi gibi birçok konu Web kullanım madenciliğinin uygulama alanlarına girmektedir. Bu konular ise kişiselleştirme, sistem geliştirme, Web sitesi yenileme, iş zekâsı ve kullanım karakteristiği başlıkları altında toplanmaktadır. Web kullanım madenciliği, sunucu erişim kayıtlarının yanı sıra, hareket şablonu, site topolojisi, kavram hiyerarşileri gibi arka plan veya alan bilgilerini de kullanmaktadır. Web kullanım madenciliği için başlıca uygulama alanları Şekil 2.3’de gösterilmiştir [10].

Şekil 2.3. Web kullanım madenciliğinin başlıca uygulama alanları

Kişiselleştirme: Bir Web kullanıcısının kişiselleştirilmesi, ziyaret ettiği Web sitesi üzerindeki kullanım davranışları, kullanıcı profili gibi bilgilere göre sınıflandırma yaparak, sonraki davranışları için tahminler yaparak bu kullanıcıya istekleri doğrultusunda öneriler sunabilmektir. Örneğin, elektronik ticaret yapan bir Web sitesi üzerinde alışveriş yapan kayıtlı bir kullanıcının aldığı ürünlere ve site üzerindeki davranışlarına göre bir sonraki ziyarette bu kullanıcının davranışlarına yönelik tahminler yapılabilmektedir. Web kullanım madenciliği bu uygulamaları gerçekleştirmek için mükemmel bir yaklaşımdır. Tablo 2.3’de görüldüğü gibi kişiselleştirilme amacıyla WebWatcher [73], Letizia [74], Krishnapuram [75], Analog [40], WebPersonalizer [76], SiteHelper [77] gibi birçok projeler geliştirilmiştir. Bu yazılım projelerinde, kullanıcıların sahip olduğu benzer erişim örüntülerinin kümelemelerini keşfetmek için Web sunucu kayıtları kullanılmıştır.

Sistem Geliştirme: Web kullanıcı memnuniyetini ve Web kullanım aktivitelerini yüksek kaliteye çıkarmak için Web sunucu başarımını ve diğer servis özelliklerini arttırmak gerekmektedir. Benzer şekilde, bir yerleşke ağındaki kullanıcıların Web servisleri ve sistem sunucularının hizmetlerindeki kaliteyi arttırmakla mümkündür [65].

Web kullanım madenciliği bir yerleşke ağındaki sisteme yönelik ağ iletimi, Web yükleme, yük dengeleme, ağ güvenliği veya veri dağıtımı gibi Web trafik davranışlarını anlamak için temel anahtar görevini teşkil etmektedir. Bunlara ilave olarak, yerleşke ağı içinden ya da dışından sunuculara yapılan saldırı ve ataklar ile sisteme zarar veren, dolandırıcılık ve hile ile kullanıcı şifrelerini elde etmeye çalışan kötü niyetli kullanıcıların tespitinde Web kullanım madenciliği ile keşfedilen örüntülerle destek vermektedir. Özellikle ağ sistemi üzerine yerleştirilen güvenlik duvarı cihazının tutmuş olduğu kullanım kayıtlarından sistem ve kullanıcılar hakkında birçok anlamlı bilgiler çıkarılabilir. Ağın kullanımı ile ilgili genel bilgiler, ağ trafik raporları, kullanılan bant genişliği oranları, sisteme saldırı ve atak yapan kullanıcılar, virüs kaynaklı kullanıcılar gibi birçok detay bilgi ve grafikler çıkarılabilir. Elde edilen bu anlamlı bilgiler ile sistem üzerindeki problemli noktalar veya sistemin aksayan yanları

çıkarılarak çözüm sağlanabilir. Sonuçta ağ sisteminin gelişimine ve başarımının artırılmasına büyük ölçüde katkı sağlanmaktadır. Tablo 2.3’de görüldüğü gibi sistem geliştirme alanında da yapılmış bir çok çalışmalar mevcuttur.

Web Sitesi Yenileme: Birçok Web uygulamalarının işleyişi, gerekliliği ve kullanımı açısından Web sitesinin çekiciliği hem içerik hem de yapı bakımından çok önemlidir. Örneğin; şirketlerin e-ticaret için kullandıkları bir ürün katalogu, çevrimiçi satış modülleri, üniversitelerin Web sitesi üzerinde aktif olarak kullandıkları öğrenci işleri otomasyonu, personel maaş otomasyonu, akademik bilgi sistemleri veya bankaların yaygın olarak kullandıkları İnternet bankacılığı Web modüllerinin etkili, yararlı ve son derece önemli oldukları aşikârdır. Bu Web sitelerini değerlendirmek ve geliştirmek için İnternet kullanıcılarından detaylı geri dönüş bilgileri almak gerekmektedir. Web kullanım madenciliği İnternet kullanıcı davranışlarını derin bir şekilde inceleyip, Web sitelerinin güncellenmesi ya da yeniden tasarlanması konusunda Web tasarımcılara, Web yöneticilerine ayrıntılı olarak rapor sunmaktadır.

Uyarlamalı Web sitesi projesi, [78, 79] bir sitenin içeriği ve yapısının yeniden tasarlanması için Web erişim kayıtlarından SCML algoritması ile otomatik olarak bilgi çıkarmaya yönelmiştir. Bu projede, sayfaların kümelenmesi direk olarak bağlantılı olan sayfaları tanımlamak için kullanılmıştır.

İş Zekâsı: Elektronik ticaretle uğraşan şirketlerin Web sitesini hangi müşteri kitlesi nasıl

kullanıyor sorusuna cevap veren bilgilerin tespit edilmesi için araştırmalar yaptığı bir çalışma alanıdır. Buchner ve diğ. [80, 81], Web kayıtlarından akıllı alışveriş işlemlerini tespit etmek için bir bilgi keşfi uygulaması geliştirmişlerdir. Geliştirdikleri bu elektronik ticaret uygulamasında çok büyük olan alışveriş verileri ile aşırı derecede büyük olan kullanım veri kümelerini birleştirmişlerdir. Uygulamalarında geliştirdikleri bilgi keşfi teknikleri müşteri ilişkileri yaşamında müşterinin ilgisi, müşterinin devamlılığı, çapraz satış ve müşterinin Web sitesinden ayrılışı olmak üzere dört ayrı basamak tanımlamışlardır. Blue Martini çalışmasında, karar ağacı kuralları örüntülerini keşfetmek için içerik sunucusundan direk olarak elde ettiği fare klik verilerini kullanmıştır. Elektronik ticarette iş zekâsının amacına ulaşması için İnternetteki Web trafiklerini analiz eden SurfAid, Accrue , NetGenesis, Aria, Hitlist, WebTrends 14 gibi birçok ticari yazılımlar mevcuttur [65]. Ayrıca son yıllarda SAS Base [82] ve SPSS Clementine [83] yazılımları ticari şirketler tarafından iş zekası alanında aktif olarak kullanılmaktadır. Bununla birlikte Accrue, NetGenesis ve Aria yazılımları kullanım istatistiklerini kullanarak elektronik ticaret yapan site üzerindeki fare klikleri, ürün alışverişleri ve reklâmlar gibi olayları analiz etmek için geliştirilmişlerdir. Accrue yazılımı aynı zamanda Yol analizini görselleştiren bir

araçtır. IBM tarafından geliştirilen SurfAid yazılımı ise, sayfa görünüm istatistiklerinin yanı sıra kullanıcıların kümelenmesi ve veri küpü yoluyla OLAP işlemlerini desteklemektedir. Han ve diğ. [84] geliştirdikleri WebLogMiner sistemleri ile zaman serisi analizi (örneğin; eğilim analizi, değişim analizi, sıralı analiz gibi) sınıflandırma uygulamaları ve birliktelik kurallarını çıkarmak için kullanılmaktadır. İş zekâsı çözümünde SAS Enterprise BI yazılımı [83], kolay kullanımı ile raporlama, sorgulama, analiz, OLAP, görselleştirme ve ofis verilerinin birleşimi gibi uygulamalarla madencilik alanında çözümler üretmektedir. Tablo 2.3’de görüldüğü gibi iş zekası alanında da yapılmış çalışmalar mevcuttur.

Kullanım Karakteristiği: Web kullanım madenciliği ile Web karakterizasyon araştırması arasında büyük oranda bir örtüşme vardır. Pitkow ve diğ. [85, 86, 87] Georgia Teknoloji Enstitüsü’nde geliştirmiş oldukları Xmosaic adlı Web tarayıcı yazılımı ile istemci taraflı aktivitelerin kaydetme işlemlerini gerçekleştirmişlerdir. Özellikle tarayıcılar aracılığıyla bir Web sitesiyle etkileşim halinde bulunan kullanıcılardan elde edilen kayıtların sonuçları, kullanıcıların davranışları, kullanım karakteristiği hakkında detaylı bilgiler sunmaktadır. Tablo 2.3’de gösterildiği gibi kullanım karakteristiği alanında da yapılmış birçok çalışmalar bulunmaktadır [65].

Web kullanım madenciliği ile ilgili yapılmış araştırma projelerinde birbirinden farklı birçok yazılım geliştirilmiştir. Bu araştırma projelerini uygulama alanlarına, kullandıkları veri kaynaklarına ve veri tiplerine göre sınıflandırmak mümkündür. Tablo 2.3’de geliştirilen yazılımların çoğu sunucu temelli verileri kullanmaktadır. Tabloda görüldüğü üzere yazılım projelerinin tümü kullanım verilerini, birkaçı ise kullanımın yanı sıra yapı, içerik veya profil verilerini kullanarak analiz yapabilmektedir. Tek kullanıcılı projeler genellikle kişiselleştirme uygulama alanını içermektedir. Çoklu site analizini destekleyen projelerde ise birden fazla Web sitesinin kullanım verilerine kolayca erişebilmek için ya istemci ya da vekil sunucu seviyesinde giriş verileri kullanılmaktadır. Çoğu Web kullanım madenciliği projelerinde tek ve çok kullanıcılı siteler, Web sunucu kayıtları gibi sunucu temelli kullanım verileri kullanılmaktadır.

Tablo 2.3. Web kullanım madenciliği araştırma projeleri ve yazılımları [65]

Veri Kaynağı Veri Tipi Kullanıcı Site

Proje Adı Uygulama Alanları

Sunucu Vekil İstemci Yapı İçerik Kullanım Profil Tek Çok Tek Çok

WebSIFT Genel X X X X X X SpeedTracer Genel X X X X WUM Genel X X X X X Shahabi Genel X X X X X Site Helper Kişiselleştirme X X X X Letizia Kişiselleştirme X X X X Web Watcher Kişiselleştirme X X X X X Krishnapuram Kişiselleştirme X X X X Analog Kişiselleştirme X X X X Web Personalizer Kişiselleştirme X X X X X Tuzhilin İş X X X X SurfAid İş X X X X Buchner İş X X X X X WebTrends,Hitlist,Accrue İş X X X X WebLogMiner İş X X X X PageGather,SCML Site Yenileme X X X X X Manley Karakterize etme X X X X Arlitr Karakterize etme X X X X Pitkow Karakterize etme X X X X X Almeida Karakterize etme X X X X Rexford Sistem Geliştirme X X X X X Sxhechter Sistem Geliştirme X X X X Aggarwal Sistem Geliştirme X X X X

Benzer Belgeler