• Sonuç bulunamadı

5. SONUÇ

5.3 Değerlendirme

kıyaslanmış olmasıdır. Burada amaç, konuşma tanıma problemine çözüm üretilmesinin yanı sıra çeşitli ağ yapılarının tasarım aşamalarının öğrenilmesi, bu ağların birbirleri ile mukayese edilmesi ve tüm bunların sonucu olarak YSA konusunun daha iyi anlaşılabilmesidir.

kelimelerin örüntülerinin daha detaylı modellenmesi gibi işlem yükünü arttırıcı açılımlara tolerans sağlayabileceğini göstermiştir.

Bu avantajlarının yanı sıra, YSA’nın tasarımcının deneyimlerine göre şekillendirilen yapısı ve sistem tasarımında sıklıkla başvurulan deneme-yanılma yönteminin metodolojik bir iyileştirme sürecine göre hayli fazla zaman alması bazı dezavantajlar olarak karşımıza çıkar. Ayrıca deneme-yanılma yöntemi tasarımcının geçmiş tecrübeleri ile çok ilişkilidir.

Bu nedenle, tasarımcının ağ yapısı üzerindeki çalışmalarına ve ağın davranışlarına açıklık getirmesi büyük ölçüde sınırlanır. Önemli bir diğer husus ise YSA’nın, yapısal özellikleri sabit tutulmasına rağmen farklı eğitim süreçlerinde farklı sonuçlar üretebilmesidir.

Dolayısıyla YSA’nın her zaman en iyi sonucu vereceği düşünülmemeli, problemin muhtemel sonuçlarından bir seti kullanıcıya sunduğunun bilincinde olunmalıdır.

Bununla beraber YSA, pek çok firma tarafından üretilen ağ benzeticileri ile endüstriyel uygulamalar anlamında da tercih edilen bir teknolojidir. İlaveten Hitachi, Inova, Philips, Siemens gibi firmaların spesifik YSA modelleri için geliştirdikleri çeşitli işlemciler de mevcuttur. Tüm bu donanımsal imkanlar literatürün ağ uygulamaları açısından zengin oluşuyla birleştiğinde, YSA sürekli güncel kalan ve uygulama alanı, günlük hayatta kullanılan endüstriyel uygulamalardan mühendisliğe, tıp biliminden finansal konulara kadar uzanan köklü bir disiplin olarak karşımıza çıkmaktadır.

Genel olarak, konuşma tanıma probleminin çözümüne yönelik çalışmalarda:

• Ağ yapısının geliştirilmesi için literatürde yer alan yeni tasarımların (Genetic Algorithm, Self-Organizing Maps vb.) incelenmesi,

• Daha geniş veri tabanı kullanan uygulamalar oluşturulması,

• Sese duyarlı akıllı ev uygulamaları ve çeşitli alarm sistemleri tasarlanması,

• Yetkilendirme, sistem erişimi gibi güvenlik uygulamaları,

• Biometrics olarak adlandırılan ve her birey için farklı olan parmak izi, iris yapısı

• SSİ entegrelerinin kullanımı ile gömülü uygulamalar gerçekleştirilmesi,

• Matlab ve C programlarının entegre kullanımı ile bilgisayardan bağımsız cihazlar tasarlanması

gibi hususlar önerilebilir.

Bunların yanı sıra, eğitim ve test seslerine ilişkin kayıtların stüdyo gibi gürültüden yalıtılmış bir ortamda alınması ve takiben, ses sinyallerinde akustik iyileştirme yapılması da sistem performansını arttıracak diğer önemli hususlardır.

KAYNAKLAR

Ahad, A., Fayyaz, A., Mehmood, T. 2002. Speech recognition using multilayer perceptron.

Proc. of the IEEE Conference ISCON’02, vol. 1, pp. 103-109.

Alotaibi, Y.A. 2003. High performance Arabic digit recognizer using neural networks.

Proc. of the IEEE International Joint Conference on Neural Networks, pp. 670-674.

Alotaibi, Y.A. 2004. Spoken Arabic digit recognizer using recurrent neural networks. Proc.

of the 4th IEEE International Symposium on Signal Processing and Information Technology, pp.195-199.

Alotaibi, Y.A. 2005. Investigating spoken Arabic digits in speech recognition setting.

Information Sciences, vol.173, pp.113-129.

Azam, S.M., Mansoor, Z.A., Mughal, M.S. and Mohsin, S. 2007. Urdu spoken digits recognition using classified MFCC and backpropagation neural network. Computer Graphics, Imaging and Visualization Conference.

Elman, J.L. 1990. Finding structure in time. Cognitive Science, vol.14, pp.179-211.

Farley, B.G. and Clark, W.A. 1954. Simulation of self-organizing systems by digital computer. IRE Trans., vol. PGIT-4, pp. 76-84.

Fukushima, K. 1975. Cognitron: A self-organizing multilayered neural network. Biological Cybernetics, vol. 20., pp. 121-136.

Haykin, S. 1999. Neural networks: A comprehensive foundation. Prentice-Hall Inc. (2nd ed.), Englewood Cliffs, NJ.

Hebb, D.O. 1949. The organization of behavior. Wiley Interscience, New York.

Hopfield, J.J. 1982. Neural networks and physical systems with emergent collective computational abilities. Proc.of the National Academy of Sciences, vol. 79, pp.

2554-2558.

Kohonen, T. 1982. Self-organized formation of topologically correct feature maps.

Biological Cybernetics, vol. 43, pp. 59-69.

Kohonen, T. 1987. State of the art in neural computing. IEEE First International Conference on Neural Networks, vol. 1, pp. 79-90.

Lim, C.P., Woo, S.C., Loh, A.S. and Osman, R. 2000. Speech recognition using artificial neural networks. 1st International Conference on Web Information Systems Engineering, vol. 1, p. 419.

Lippmann, R. 1989. Review of neural networks for speech recognition, Neural computation. MIT press, Cambridge.

Makal, S. 2007. Sonsuz uzun mükemmel iletken düz yüzeyler üzerindeki silindirik hedeflerin yapay sinir ağları kullanılarak tanımlanması ve sınıflandırılması. Yüksek Lisans Tezi, Yıldız Teknik Üniversitesi, İstanbul.

Marven, C. and Ewers, G. 1996. A simple approach to digital signal processing. Wiley Interscience, New York.

MEC 409 Lecture notes 2004. Web sitesi.

http://www.dynamics.group.shef.ac.uk/people/keith/mec409.htm. Erişim Tarihi:

01.05.2008.

Minsky, M. and Papert, S. 1969. Perceptrons: An introduction to computational geometry.

MIT press (expanded edition), Cambridge.

Öztemel, E. 2006. Yapay sinir ağları. Papatya Yayıncılık, İstanbul.

Polur, P.D., Zhou, R., Yang, J., Adnani, F. and Hobson, R.S. 2001. Isolated speech recognition using artificial neural networks. 23rd Annual EMBS Conference.

Rabiner, L. and Samber, M. 1975. An algorithm for determining the endpoints of isolated utterances, The Bell System Technical Journal, vol. 54, pp. 297–315.

Rabiner, L. and Juang, B.H. 1993. Fundamentals of speech recognition. Prenctice-Hall Inc., Englewood Cliffs, NJ.

Rochester, N., Holland, J.H., Haibit, L.H. and Duda, W.L. 1956. Tests on a cell assembly theory of the action of the brain, using a large digital computer,” IRE Trans., vol. IT-2, pp. 80-93.

Rosenblatt, F. 1958. The perceptron: A probabilistic model for information storage and organization in the brain. Psychological Review, vol. 65, pp. 386-408.

Rothkrantz, L.J.M. and Nollen, D. 1999. Speech recognition using Elman neural networks.

Text, speech and dialogue, vol. 1692, pp. 146-151.

Rumelhart, D.E., Hinton, G.E. and Williams, R.J. 1986. Learning representations by back-propagating errors. Nature, vol. 323, pp. 533-536.

Soytürk, M.A. 2005. Sayısal kenar çıkarma ve yapay sinir ağları ile araç tanıma. Yüksek Lisans Tezi, Erciyes Üniversitesi, Kayseri.

Specht, D.F. 1988. Probabilistic neural networks for classification, mapping or associative memory. Proc. IEEE International Conf. on Neural Networks, vol. 1, pp. 525-532.

Specht, D.F. 1990. Probabilistic neural networks. Neural Networks, vol. 3, pp. 109-118.

Stevens, S.S. , Volkman, J. and Newman, E.B. 1937. A scale for the measurement of the psychological magnitude pitch. The Journal of the Acoustic Society of America, vol. 8, pp. 185-190.

Widrow, B. 1960. An adaptive Adaline neuron using chemical memistors. Technical Report, no. 1553-2, Stanford Electronics Laboratories.

Widrow, B. and Hoff, M.E. 1960. Adaptive switching circuits. IRE Wescon Convention Record: Part 4, Computers: Man-machine systems, pp. 96-104, Los Angeles.

Widrow, B. (Editor) 1988. DARPA Neural Network Study, AFCEA International Press.

Yalçın, N. 2006. İlköğretim birinci sınıf öğrencilerine konuşma tanıma teknolojisi yardımıyla ilkokuma yazma öğretimi. Doktora Tezi, Gazi Üniversitesi, Ankara.

Benzer Belgeler