• Sonuç bulunamadı

Öznitelik çıkarımı, sıkıştırılmış karakteristik bilgiler için haritalama ya da dönüştürme yöntemi ile yüksek boyutlu karakteristik bilgiyi düşük boyutlu karakteristik bilgiye

12

çevirir. Öznitelik çıkarma, orijinal duyumsal sinyali potansiyel olarak ayırıcı özelliklere dönüştüren bir işlemdir (Liao 2010). Akustik sinyal bir rastgele veri türüdür. Büyüklük, zaman ve frekans bölgelerinden oluşan bütünleşik tanımlamalar stokastik dinamik parametrelerin veri işlemesinde analiz edilmiştir (Devi 2013). İstatiksel olarak toplanan veriler ve olasılığa dayalı hesaplamalar kullanılarak belirli bir sınıflandırma algoritması oluşturulabilir.

Öznitelik çıkarma yöntemlerinin çoğu, sesi iki perspektiften analiz eder: spektral içerik ve spektral bileşenlerin zaman evrimi. Ses sinyali durağan olmayan stokastik süreçtir, spektral içerik analizi genellikle sürecin sabit olarak kabul edilebildiği çerçeve bazında gerçekleştirilir. Çerçeve spektrumu algısal açıdan alakalı iki görüş açısından tanımlanabilir: spektral zarfın şekli ve harmonik yapısı. Spektral bileşenlerin zaman gelişimi, istatistiksel ve yapısal yaklaşımlar kullanılarak karakterize edilebilir (Kiktova vd. 2013).

2.4.1 Mel frekansı kepstral katsayıları

Mel frekansı kepstral katsayıları (MFCC'ler), otomatik konuşma ve konuşmacı tanımada yaygın olarak kullanılan bir özelliktir. 1980'lerde Davis ve Mermelstein tarafından tanıtıldılar ve o zamandan beri en son teknolojiye sahipler. MFCC'lerin uygulanmaya başlamasından önce, lineer öngörüm katsayıları (LPC'ler) ve lineer öngörüm kepstral katsayıları (LPCC'ler) otomatik konuşma tanıma uygulamaları için öncelikli öznitelikti.

Mel skalası, saf bir tonun algılanan frekansını veya perdesini gerçek ölçülen frekansıyla ilişkilendirir. İnsanlar düşük frekanslarda ses perdesindeki küçük değişiklikleri ayırt etmede yüksek frekanslarda olduklarından daha iyidir. Ayrıca Mel frekansı kepstral katsayıları insan sesi dışında sesler için de öznitelik olarak kullanılmış ve sınıflandırma çalışmalarında başarı elde edilmiştir. Mel frekansı kepstral katsayıları, tüm çerçevelerden çıkarılan özniteliklere sahip olduğu için yapılan çalışmalarda sınıflandırıcıya öznitelik olarak verildiğinde başırılı sonuçlar elde edildiği görülmüştür (Küçükbay ve Sert 2015, Uzunkent 2012, Anand ve Saxena 2016).

13 2.4.2 Doğrusal öngörüm katsayıları

LPC yöntemleri konuşma kodlama, konuşma sentezi, konuşma tanıma, konuşmacı tanıma ve doğrulama ve konuşma saklama için en yaygın kullanılan yöntemlerdir. LPC yöntemleri, konuşma parametrelerinin son derece doğru tahminlerini sağlar ve son derece verimli bir şekilde yapar. Doğrusal Öngörü'nin temel fikri: güncel konuşma örneği, geçmiş örneklerin doğrusal bir kombinasyonu olarak yakından yaklaşılabilir.

Doğrusal öngörüm katsayıları hesaplamak için bu formül kullanılabilir:

s(n) = ∑𝑝𝑘=1𝑠(𝑛 − 𝑘)𝑎𝑘 s(n) = orijinal sinyalin LPC ile yeniden elde edilmiş hali 𝑎𝑘 = doğrusal öngörüm katsayıları

p = örnek sayısı

LPC katsayıları konuşma sinyalleri dışındaki sinyallerde de hesaplanarak farklı amaçlar için kullanılmıştır. Bu katsayılar vektörler halinde bir sınıflandırıcıya öznitelik olarak verilebilir.

2.4.3 Temel frekans

T periyodunu, f = 1 / T frekansını veya verilen sinüzoidal veya karmaşık üstel sinyalin açısal frekansını ω = 2πf = 2π / T olarak tanımlamak için, aşağıdaki formlardan herhangi birinde yazmak her zaman yararlı olacaktır:

sin(ωt) = sin(2πft) = sin(2πt / T)

Bir sinyalin temel frekansı, bir sinyalin içerdiği tüm frekans bileşenlerinin en büyük ortak bölenidir ve eşdeğer olarak, temel periyod, bileşenlerin her bir periyodunun en az ortak katıdır. MATLAB üzerinde temel frekans pitch() fonksiyonu kullanılarak hesaplanır. Bu fonksiyon ses sinyalinin temel frekansını tahmin eder. Temel frekans değeri, yan kanal sinyallerinden elde edilerek bir sınıflandırıcıya öznitelik olarak verilebilir. Burada temel frekans değerinin öznitelik olarak kullanılabileceği fikri bilgisayarın farklı işlemler için farklı çınlamalar üreteceği düşünülerek elde edilmiştir.

14 2.4.4 Sinyalin enerjisi

Sinyal enerjisi ve sinyal gücü terimleri bir sinyali karakterize etmek için kullanılır.

Onlar aslında enerji ve güç ölçüsü değiller. Sinyal enerjisinin ve gücünün tanımı, karmaşık değerler alan sinyaller de dahil olmak üzere herhangi bir sinyale (tx) karşılık gelir. Sinyalin enerjisi sinyallerin ayrıştırılmasında da kullanılabilir. Eğer farklı grupta olan sinyallere ait enerjiler de bir farklılık oluşturuyorsa sinyalin enerjisi bu sinyalleri ayrıştırmakta da kullanılabilir. Dijital bir sinyalin enerjisi şu şekilde hesaplanabilir:

E = ∑

n= −∞

|x(n)|2

Sinyalin enerjisi sinyalin bir özniteliği olarak hesaplanabilir ve bu katsayılar sınıflandırmada kullanılabilir.

2.4.5 Logaritmik güç spektrumu

Güç spektrumu “sinyalin ne kadarı ω frekansında ?” sorusunu yanıtlar. Uygulamada her zaman sınırlı veri uzunluğu ve örnekleme sıklığı sınırlamaları vardır ve bu sınırlamaların güç spektrumunun görünümünü nasıl etkilediğini araştırmak önemlidir.

Güç spektrumu hesaplandığında ortaya çıkan sayılar ondalık uzay yerine logaritmik uzayda incelenebilir. Logaritmik uzay değişimlere daha duyarlıdır; veriler arası ilişkiler daha yakından incelenebilir. Güç spektrumu tipik olarak sinyalin FFT işleminden sonra elde edilen vektörün mutlak değerinin karesi ile hesaplanabilir. Hesaplanan bu değer logaritmik uzayda gösterilirse logaritmik güç spektrumu elde edilmiş olur.

Farklı gruptaki sinyaller bazı frekans aralıklarında daha fazla yayılım yapıyor ise bu öznitelik o sinyallerin ayrıştırılmasında da kullanılabilir.

2.4.6 Spektral entropi

Bir sinyalin spektral entropisi, spektral güç dağılımının bir ölçüsüdür. Kavram, bilgi teorisinde Shannon entropisine veya bilgi entropisine dayanmaktadır. Spektral entropi, sinyalin frekans alanındaki normalize edilmiş güç dağılımını olasılık dağılımı olarak değerlendirir ve Shannon entropisini hesaplar. Bu bağlamda Shannon entropisi, sinyalin spektral entropisidir. Bu özellik, arıza tespitinde ve teşhiste özellik çıkarımı için faydalı

15

olabilir. Spektral entropi ayrıca konuşma tanıma ve biyomedikal sinyal işlemede bir öznitelik olarak yaygın olarak kullanılmaktadır.

Spektral entropi için denklemler, güç spektrumu ve bir sinyal için olasılık dağılımı denklemlerinden oluşmaktadır. Bir sinyal x(n) için, güç spektrumu S(m) = |X(m)|2 olup, burada X(m) x(n) 'in ayrık Fourier dönüşümüdür. O halde olasılık dağılımı P(m):

P(m) = S(m)

𝐻𝑛 ise 𝑙𝑜𝑔2𝑁 ile bu denklemin normalize edilmiş halidir. N toplam frekans noktasıdır.

Sinyalin normalize edilmesi, frekans bölgesinde düzgün bir şekilde dağıtılmış, beyaz gürültünün maksimum spektral entropisini temsil eder.

Bir zaman frekanslı güç spektrogramı S(t,f) biliniyorsa, olasılık dağılımı şu denkleme dönüşür(spektrogramın hesaplandığı varsayılıyor):

P(m) = ΣtS(t, m) ΣfΣtS(𝑡, 𝑓)

Bir zaman frekansı güç spektrogramı S(t,f) verilen zamandaki anlık spektral entropiyi hesaplamak için, t zamanındaki olasılık dağılımı:

P(t, m) = S(t, m) ΣfS(𝑡, 𝑓) Son olarak t anındaki spektral entropi:

H(t) = − ∑ P(t, m)𝑙𝑜𝑔2P(t, m)

N

M=1

16

MATLAB’da pentropy() fonksiyonu kullanılarak, belli frekansta örneklenen sinyalin spektral entropisini bir vektör olarak elde edilir. Bu vektörler bir öznitelik olarak sinyalin sınıflandırılmasında kullanılabilir.

Benzer Belgeler