• Sonuç bulunamadı

Bu tezde, konuşma tanıma sistemlerinin genel yapısı incelenmiş, metine bağımlı ve metinden bağımsız veya kişiye bağımlı ve kişiden bağımsız sistemler için kullanılmakta olan yöntemler özelliklerine göre sınıflandırılmış ve her biri ayrı ayrı incelenmiştir.

Çalışmadaki ilk hedef, geliştirilecek uygulamanın konuşma doğrulama sistemi olarak tasarlanmasıdır. Daha sonraki aşama da ise metin bağımlı ve metin bağımsız sistem arasında bir tercih yapılması gerekmiştir. Gerek daha kolay gerçekleştirilebileceği gerekse de daha fazla başarım sağlayacağı düşüncesiyle metin bağımlı bir sistem tasarımı tercih edilmiştir. Metin bağımlı konuşmacı doğrulama uygulamasının gerçekleşmesi sırasında her bir işlem basamağı incelenmiştir.

Öznitelik vektörlerinin belirlenmesinde MFKK yöntemi ile birlikte, kıyaslama yapmak amacıyla DD uygulanmıştır. DD’ yi kullanmadaki amaç sinyalin önişleme aşamasındaki gürültüleri temizlemektir. Daha sonra DD ile elde edilen veri dizilerinin entropi değerleri hesaplanmıştır. Modelleme aşamasında ise YSA ve USBA gibi yapay zekâ metotları ile modelleme yapılmıştır.

Yapay zekâ tabanlı modelleme çalışmalarında yapılan ölçümler ve hesaplamalar sonucunda elde edilen veriler herhangi bir ön işleme tabi tutulmadan kullanıldığı için sistemin akıllı modelini oluştururken çok sayıda örnek sayısına ihtiyaç duyulmaktadır. Çok sayıda örnek kullanıldığında ise hesaplama süresinin ve hafıza gereksinimin artması ve eğitilen sistemin sistem davranışını ezberlemesi gibi bazı sorunlar ortaya çıkmıştır. Giriş veri dizisine birden çok perspektiften bakılarak elde edilen her bir veri- işaret bileşeninin entropi değerleri hesaplanmıştır.

MFKK katsayıları elde edilerek yapılan YSA ve UBSA tabanlı modelleme çalışmalarında, gürültünün tanımayı az denemeyecek kadar etkilediği görülmüştür. Sonuçta istenilen test başarımını gösterememiştir.

DD ile elde edilen entropi katsayıları kullanılarak yapılan YSA ve USBA tabanlı modelleme çalışmalarında ise gürültünün YSA akıllı metodu kullanıldığında tanımayı gerçekleştiremediği, UBSA akıllı metodu kullanıldığında ise gürültünün az denemeyecek kadar tanımayı etkilediği görülmüştür. Tanıma başarımını etkileyen faktörler olarak entropi türü, dalgacık tipi, dalgacığın seviyesi gibi parametreler olduğu tespit edilmiştir. Aynı zamanda veri dizisi oluştururken kullanılan konuşmacı sayısı ile konuşulan kelime sayısının artışı tanıma başarısını etkileyerek sistem performansını düşürmüştür. Konuşma veritabanımızdaki 6 kişilik konuşma kümesi ile yapılan testler göstermiştir ki önerilen MFKK ve YSA tabanlı tanıma sistemi gerek tanıma gerek güvenirlik açısından önceki algoritmalara göre daha iyi sonuçlar vermiştir.

Bundan sonraki yapılacak olan çalışmalarda, kullanılacak ve geliştirilecek algoritmalarda veri alma, özellik çıkarma ve sınıflama işlemlerini daha hızlı yapabilecek aynı zamanda gürültünün ya da çevresel şartların tanıma başarımını etkilemeyeceği, güvenirli farklı yöntemler geliştirilebilir.

KAYNAKLAR

[1] Mengüşoğlu, E., (1999), Bir Türkçe Sesli İfade Tanıma Sisteminin Kural Tabanlı Tasarımı ve Gerçekleştirimi, Yüksek Mühendislik Tezi, Hacettepe Üniversitesi.

[2] Uslu, E., (2007), Gizli Markov Modeli İle Geniş Sözlüklü Sürekli Konuşma Tanıma, Yüksek Lisans Tezi, Yıldız Teknik Üniversitesi.

[3] Aygün O. 2006,Konuşmacı tanıma sistemlerinde dalgacık dönüşümü , Yüksek Lisans Tezi, Selçuk Üniversitesi

[4] Artuner, H., 1994, “Bir Türkçe Fonem Kümeleme Sistemi Tasarımı ve Gerçekleştirimi”,Doktora Tezi, Hacettepe Üniversitesi Fen Bilimleri Enstitüsü.

[5] İnternet1:http:// http://www.emo.org.tr/ekler/b613c6dda6b52b5_ek.pdf. erişim tarihi:Nisan 2011

[6] S. Davis, P. Mermelstein, 1980 "Comparison of parametric representations formonosyllabic word recognition in continuously spoken sentences," IEEE Acoustics, Speech, and Signal Processing, vol. 28, no. 4, pp. 357- 366,

[7] Ningping Fan, Justinian P. Rosca, 2003, "Enhanced VQ-Based Algorithms for Speech Independent Speaker Identification," Audio and Video based Biometric Person Authentication, pp.

[8] T. Kinnunen,2005, et al. "Real-Time Speaker Identification and Verification," IEEE Transactions on Speech and Audio Processing vol. PP, no. 99, pp. 1-12

[9] S. Molau, et al. 2001, "Computing Mel-frequency cepstral coefficients on the power spectrum," IEEE Int. Conf. Acoustics, Speech, and Signal Processing, vol. 1, pp. 73-76,

[10] H. Gish and M. Schmit, 1994, “Text-Independent Speaker Identification,” IEEE Signal Processing Magazine, vol. 11, pp. 18-32,

[11] Thomas F.,2002, Quatieri, Discrete-Time Speech Signal Processing: Principles and Practice, Prentice Hall, MIT Lincoln Laboratory.

[12]İnternet2:http://courses.cit.cornell.edu/ece576/FinalProjects/f2008/pae26_jsc59/pae 26_jsc59/index.html.erişim tarihi:Nisan 2011

[13] Türkoğlu, İ., 2002. Durağan Olmayan İşaretler İçin Zaman-Frekans Entropilerine Dayalı Akıllı Örüntü Tanıma, Doktora Tezi, Fırat Üniversitesi Fen Bilimleri Enstitüsü, , Elazığ.

[14] Keeton, P. I. J. and Schlindwein, F. S., 1997, Application of wavelets in Doppler ultrasound,Sensor Review, MCB University Press, .

[15] Toprak İnayet,2007, EEG sinyallerinin dalgacık dönüşümü ve yapay sinir ağları ile analizi,Yüksek lisans tezi,Süleyman DEMİREL Üniversitesi.

[16] Principe, J. C., Euliano, N. R. and Lefebvre, W. C., 2000, Neural and Adaptive Systems. John Wiley & Sons, New York, 656p

[17]Elmas, Ç., 2007. Yapay Zekâ Uygulamaları, Seçkin Yayınları, Ankara.

[18] Toprak İnayet,2007, EEG sinyallerinin dalgacık dönüşümü ve yapay sinir ağları ile analizi,Yüksek lisans tezi,Süleyman DEMİREL Üniversitesi.

56

ÖZGEÇMİŞ Mehmet Bilal ŞAŞMAZ

Fırat Üniversitesi Teknik Eğitim Fakültesi

Elektronik ve Bilgisayar Eğitimi Bölümü Elazığ

Tel: 424 – 2334883

E.posta: sasmazbilal@hotmail.com

Mehmet Bilal ŞAŞMAZ, 1984 yılında Malatya’ da doğmuştur. İlk, orta ve lise öğrenimini sırasıyla, Rahmi akıncı İlköğretim okulu, Şehit Kemal Özalper Anadolu Meslek Lisesinde tamamlamıştır. 2005 yılında, Fırat Üniversitesi Teknik Eğitim Fakültesi Elektronik Bilgisayar Eğitimi Elektronik Öğretmenliği bölümüne girmeye hak kazanmıştır. 2009 yılında lisans eğitimini tamamladıktan sonra aynı yıl F.Ü Fen Bilimleri Enstitüsüne bağlı Elektronik Bilgisayar Eğitimi Anabilim Dalı, Telekomünikasyon Programında yüksek lisans öğrenimine başlamıştır. Mezun olduğu tarih olan 22 Haziran 2009’dan bu güne kadar Malatya Asansör Doğalgaz Ltd.Şti bünyesinde Elektronik ve Bilgisayar teknisyenliği görevini yürütmektedir. Yabancı dili İngilizcedir.

Benzer Belgeler