• Sonuç bulunamadı

Dalgacık Dönüşümü (Wavelet) ile Sinyal Analizi

Fourier dönüşümü temel fonksiyon kullanarak bir fonksiyonun analizini ve tekrar elde edilmesini gerçekleştirmektedir. Dalgacıklar ise durağan olmayan sürekli sinyallerin genişletilebilmesi ve ayrıştırılabilmesi için uygunlaştırılmış fonksiyonlardır. Yani zaman boyutundan zaman-frekans boyutuna eşleşmeye olanak tanır [4, 24].

Sinyal işlemede kullanılan Fourier temelli sinyal analizi; bir sinyali zaman alanından frekans alanına dönüştüren ve frekans bileşenlerinin önemli olduğu zaman sıkça başvurulan bir tekniktir. Fourier analizinde frekans alanına geçildiğinde zaman alanı yok olur. Durağan sinyallerde Fourier analizi iyi bir yöntem olmaktadır. Fakat çoğu sinyaller durağan olmayan yapıya sahiptirler. Dalgacık analizi farklı frekanslarda durağan olmayan güce sahip zaman serisi sinyalleri analizinde kullanılabilir [10].

Dalgacık analizi KZFD’nin bir alternatifi olarak, çözünürlük probleminin üstesinden gelmek için ortaya çıkmıştır. KZFD’de zaman-frekans alanında elde edilen bilgiler sınırlı bir hassasiyette elde edilebilmektedir. Bu hassasiyet pencerenin büyüklüğüne

bağlıdır. Çoğu sinyaller daha hassas yaklaşıma ihtiyaç duyar ve bu pencerenin büyüklüğünün sürekli değişmesi gerekmektedir. KZFD’de zaman penceresi bütün frekanslarda değişmeyen büyüklüktedir [4].

Dalgacık analizi ise KZFD’den ileri bir yöntem olup, pencereleme tekniği büyüklüğü değiştirilebilir. Dalgacıklar; durağan veya durağan olmayan sinyallerin zaman-ölçek analizi için olanak sağlar. Dalgacıklar sonlu sürelidirler. Bu yüzden yerel sinyal özelliklerinin analizini mümkün kılarlar. Dalgacık dönüşümleri tüm sinyalin frekans-zaman bilgisini korurlar. Bu sebeplerden dolayı durağan olmayan, gerçek doğal sinyallerin dalgacık temelli metotlarla işlenmesi, geleneksel metotlardan daha iyi sonuçlar sağlarlar. Dalgacığın en önemli avantajlarından birisi, büyük işaretlerin yöresel analizine olanak tanımasıdır [4, 21].

Fourier analizi sayesinde bir sinyalin sinüzoidal birçok frekanstan oluştuğu bilinmektedir. Dalgacık ise bir sinyalin, orijinal dalgacığın kaydırılmış ve ölçeklendirilmiş formundan oluşturulur. Sürekli Dalgacık Dönüşümü (SDD) bütün zaman aralığı boyunca dalgacık fonksiyonunun ölçeklenmiş ve kaydırılmış sekliyle sinyalin çarpımından oluşur. Sürekli dalgacık dönüşümünün sonucunda birçok dalgacık katsayısı elde edilir. Bunlar ölçek ve pozisyon fonksiyonlarıdır [4].

Gözle fark edilemeyecek kadar küçük süreksizliği olan işaretlerle gerçek hayatta sürekli karsılaşırız. Süreksiz sinüzoidal bir işareti ele alacak olursak, işaretin FD’de sadece işaretin uç noktalarında pik değerleri oluşurken, dalgacık dönüşümü ile süreksizlik civarındaki değişimi de gerçek zamanlı olarak gözlemlenebilir. Süreksizlik gösteren ve keskin sıçramalar içeren sinyallerin analizinde dalgacık dönüşümünün Fourier dönüşümüne göre avantajları vardır. Dalgacık analizi, başka analiz yöntemlerinin yakalayamadığı eğilimleri, bozulma noktalarını, yüksek dereceli türevlerde süreksizlikleri ve benzerlikleri çıkarmada başarılıdır [4, 25].

Dalgacık analizinin altında yatan temel düşünce, sinyali ölçeğe göre analiz etmektir. Fourier temelli analizde olduğu gibi sinüs temel fonksiyonları değil de dalgacık fonksiyonları kullanıldığından keskin süreksizlikleri içeren veri yaklaşıklıkları için

çok uygundur. Dalgacık dönüşümleri ile analiz sonuçları teorik olarak sonsuz sayıda kümeden oluşur.

Farklı dalgacık ailelerinin aralarında dayanaklı temel fonksiyon olmaları, uzayda nasıl yer aldıkları ve düzgünlük dereceleri açısında farklılık gösterirler. Böylece yapılacak analiz niteliğine göre seçilebilirler.

Şekil 4.2. Daubechies dalgacığı [4, 18].

Bazı temel dalgacık fonksiyonlar fraktal yapıya sahiptirler. Şekil 4.2’de bir örneği verilen Daubechies dalgacık ailesi bu konuya iyi bir örnektir [4, 18]. Daubechies dalgacık fonksiyonu görüldüğü gibi düz ve yumuşak değildir. Esasında fraktal bir yapıya ve her yerde türevlenemez özelliğe sahiptir [4, 25].

Dalgacık dönüşümü ile gürültüden arındırma işlemi önemlidir ve dört adımda gerçekleştirilir:

1. Dalgacık temel fonksiyonu ile sinyal ayrıştırma: Dalgacık detay sabitlerinin (veya ölçek yaklaşıklık) sabitlerinin bulunması.

2. Her ayrıştırma derecesi için gürültü eşiğinin seçimi. 3. Detay sabitlerinin eşik süzgeçlenmesi

4. Sinyalin son güncellenmiş detay sabitleri kullanılarak yeniden oluşturulması yani ters dalgacık dönüşümünün uygulanması [4].

Genel olarak dalgacığın ve ayrıştırma derinliğinin seçimi kesinlikle sinyal özelliklerine bağlıdır. Bu durumda yumuşak (smooth) dalgacıklar sinyalin daha yumuşak yaklaşımını oluşturur tersi ise yani kısa dalgacıklar sıçramaları daha iyi takip ederler [4].

BÖLÜM 5. VERĐ MADENCĐLĐĞĐ METODOLOJĐSĐ

Bilgi çağında, her türlü karar biriminin en önemli girdisi bilgidir. Ekonomik birim olarak firma açısından rekabet avantajı sayılabilecek bilgiyi incelemek, modellemek ve karar destek sistemlerinde kullanabilmek için güçlü araçlara ihtiyaç vardır. Kuramsal tabana oturtulmuş bilgi destek sistemleri, bilişim teknolojilerinde, özellikle son yıl ardaki hem yazılım hem de donanım açısından gelişmelere paralel olarak, büyük miktardaki verileri işleme ve çıktı olarak elde edilen bilgiyi karar destek sistemlerinde kullanabilme olanağına kavuşmuştur [26].

Bilgisayarların ucuzlaması ile sayısal teknoloji daha yaygın olarak kullanılmaktadır. Veriler doğrudan sayısal olarak toplanmakta ve saklanmaktadır. Bunun sonucu olarak ayrıntılı ve doğru bilgiye ulaşabilinmektedir [27].

Örneğin eskiden süper marketteki kasa basit bir toplama makinesinden ibaretti. Müşterinin o anda satın almış olduğu malların toplamını hesaplamak için kullanılmaktaydı. Günümüzde ise kasa yerine kullanılan satış noktası terminalleri sayesinde bu hareketin bütün detayları saklanabilmektedir. Saklanan bu binlerce malın ve binlerce müşterinin hareket bilgileri sayesinde her malın zaman içindeki hareketlerine ve eğer müşteriler bir müşteri numarası ile kodlanmışsa bir müşterinin zaman içindeki verilerine ulaşmak ve analiz etmek mümkün olabilmektedir. Bütün bunlar marketlerde kullanılan barkot, bilgisayar destekli veri toplama ve işleme cihazları sayesinde mümkün olmaktadır [28].

Verilen market örneğinde olduğu gibi ticari, tıp, askeri, iletişim, vb. birçok alanda benzer teknolojilerin kullanılması ile veri hacminin yaklaşık olarak her yirmi ayda iki katına çıktığı tahmin edilmektedir [29,30].

Veri madenciliği; verideki trendleri, ilişkileri ve profilleri belirlemek için veriyi sınıflandıran bir analitik araç ve bilgisayar yazılım paketidir. Spesifik veri madenciliği yazılımları; kümeleme, doğrusal regresyon, sinir ağları, Bayes ağları, görselleştirme ve ağaç tabanlı modeller gibi pek çok modeli içermektedir.

Veri madenciliği uygulamalarında yıllar boyu istatistiksel yöntemler kullanılmıştır. Bununla birlikte, bugünün veri madenciliği teknolojisinde eski yöntemlerin tersine büyük veri kümelerindeki trend ve ilişkileri kısa zamanda saptayabilmek için yüksek hızlı bilgisayarlar kullanılmaktadır. Böylece veri madenciliği, gizli trendleri minimum çaba ve emekle ortaya çıkarmaktadır [31].

Literatürde veri madenciliği ile ilgili olarak aşağıda yer alan farklı tanımlar ile karşılaşılmaktadır:

1. Jacobs (1999), veri madenciliğini, ham verinin tek başına sunamadığı bilgiyi çıkaran veri analizi süreci olarak tanımlamıştır [32].

2. David (1999), veri madenciliğinin büyük hacimli verilerdeki örüntüleri araştıran matematiksel algoritmaları kullandığını söylemiştir. David’e göre veri madenciliği hipotezleri keşfeder, sonuçları birleştirmek için insan yeteneğini kullanır. Veri madenciliğinin bir bilim olmadığı, aynı zamanda bir sanat olduğu da söylenebilir [33].

3. DuMouchel (1999), veri madenciliğinin geniş veritabanlarındaki birliktelikleri araştırdığını belirtmiştir [34].

4. Hand (1998), veri madenciliğini istatistik, veritabanı teknolojisi, örüntü tanıma, makine öğrenme ile etkileşimli yeni bir disiplin ve geniş veritabanlarında önceden tahmin edilemeyen ilişkilerin ikincil analizi olarak tanımlamıştır [35]. 5. Kitler ve Wang (1998), veri madenciliğini oldukça tahminci anahtar

değişkenlerin binlerce potansiyel değişkenden izole edilmesini sağlama yeteneği olarak tanımlamışlardır [36].

6. Bransten (1999), veri madenciliğinin insanın asla bulmayı hayal bile edemeyeceği trendlerin keşfedilmesini sağladığını belirtmiştir [37].

Sonuç olarak veri madenciliği, önceden bilinmeyen ilişki ve trendlerin bulunması için bugünün endüstrisinde yaratılan büyük miktarlardaki veriyi analiz eden bir yoldur. Yüksek güçlü bilgisayarlara ve gereken yazılımlara kolay ve düşük fiyatlarla ulaşılabilmesi bu teknolojinin işlemesini olanaklı kılmıştır. Internet ise birçok noktadaki verinin toplanmasını sağlamaktadır. Bilgisayar üzerinde çalışma aynı zamanda emek ve zaman tasarrufunu sağlamıştır [31].

Şekil 5.1. Veri madenciliği aşamaları [38].

Şekil 5.1.’de veri madenciliğine ait aşamalar verilmiştir. Süreç bu aşmalara uygun olarak sürdürülmelidir. Veri ambarı, organizasyonun ihtiyaçları ile uyumlu büyük miktarlardaki verinin kolay erişilebilir bir yapıda tutulmasını sağlayan bilgisayar tabanlı depolama sistemleridir [39]. Veri ambarları organizasyonel veriye kolay bir şekilde ulaşılmasını sağlayan yapılardır. Veri ambarları 1990’lı yıllarda ortaya çıkmıştır. Veri ambarları veriyi kullanılabilir trend, ilişki ve profillerde sınıflandırmazlar, sadece potansiyel bilgiye sahip veritabanlarıdırlar. Veride saklı bilgiyi keşfetmeyi sağlayan ise veri madenciliği gibi tekniklerdir. Veri ambarından veriyi çekebilmek için hangi verinin gerekli olduğunu ve bu verinin nerede olduğunu tespit etmek önemlidir. Çoğunlukla gerekli veri, farklı sistemler üzerinde olup, farklı formatlardadır. Bu nedenle, ilk aşamada veri temizleme ve düzenleme işlemi gerçekleştirilmelidir. Veri ambarının

yaratıcısı W.H. Immon’a göre veri ambarı verinin temizlendiği, birleştirildiği ve yeniden düzenlendiği merkezi ve entegre bir depodur [31,40].

Benzer Belgeler