• Sonuç bulunamadı

Sistem, kullanıcıya, konuşma sinyaline ses ilave etme (farklı Ses Sinyal Oran değerleri (SSO)) olanağı vermektedir

N/A
N/A
Protected

Academic year: 2021

Share "Sistem, kullanıcıya, konuşma sinyaline ses ilave etme (farklı Ses Sinyal Oran değerleri (SSO)) olanağı vermektedir"

Copied!
2
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

ÖZET

Bu tezde, Yalıtılmış Kelimelerin Konuşma Tanıma sistemi dizayn edilmiştir. Özellik bulma yöntemleri olarak, Linear Öngörülü Kodlama (LÖK), Mel Frekansı Kepstrum Katsayıları (MFKK), ve Spektrogram yöntemleri kullanılmıştır. Konuşulan kelimeleri farklı modellere sınıflandırmada kullanılan bir teknik olarak Yapay Sinir Ağı (YSA), bilinmeyen konuşulan kelimeleri bu modellere göre farkına varılıp tanımak için kullanılmıştır.

Geliştirilen sistemin; kullanıcının gerekli yöntemin seçimine, ağın terbiye edilmesine, terbiye edilmiş veya terbiye edilmemiş konuşulan kelimelerin seçimine olanak veren ve bu kelimelerin farkına varıldığı birçok butonu ihtiva eden bir Grafiksel Kullanıcı Arabirimi (GKA) vardır. Sistem, kullanıcıya, konuşma sinyaline ses ilave etme (farklı Ses Sinyal Oran değerleri (SSO)) olanağı vermektedir. 30 adet konuşulan kelime, Ses Mikrofon AH–112 kulaklık seti kullanarak yazarın kendi sesi ile kaydedilmiştir. Kelimelerin özelliklerini bulmak için farklı yöntemler kullanılmış ve daha sonra, sinir ağının terbiyesi için 30 kelimenin özellikleri kullanılmıştır. Sistemin test edilmesi, üç basamak şeklinde bölünmüştür. Birinci basamak, terbiye edilmiş kelimelerle sistemin test edilmesi, ikinci basamak, terbiye edilmemiş kelimelerle sistemin test edilmesi, ve üçüncü basamak ise, terbiye edilmiş ve daha sonra ses ilave edilmiş kelimelerle sistemin test edilmesidir. Sistem, muhtelif sayıda gizli katman kullanılarak test edilmiştir. Elde edilen sonuçlar, terbiye edilmiş kelimeler test edildiği zaman, gizli katman sayısının, sistemin Tanıma Hızı (TH) üzerinde herhangi bir etkisinin olmadığını göstermektedir. LÖK metodu için en iyi TH, terbiye edilmemiş kelimelerde

%73.3 olmuştur. MFKK yöntemi kullanıldığında, terbiye edilmemiş kelimelerde TH % 83.33 olmuştur. Spektrogram yönteminde TH, terbiye edilmemiş kelimeler için, %73.33 olmuştur.

Her yöntemin özellik bulma işleminde, farklı çıktı veri/bilgiler vermesi dolayısıyla, sinir ağı girdi katmanındaki nöron sayısı, her yöntem için farklıdır. LÖK yöntemi kullanıldığında sinir ağı girdi katmanındaki nöron sayısı 420 adet, MFKK yöntemi kullanıldığında 613 adet ve Spektrogram yöntemi kullanıldığı zaman ise bu rakam 4235 adet olmuştur. Sistemin, terbiye edilmiş kelimelerle test edilmesinden elde edilen en iyi TH, tüm metodlarda %100 olmuştur.

MFKK yönteminde elde edilen en iyi TH, konuşma sinyaline düşük ses (30 dB SSO) ilave edildiği zaman %100 iken, konuşma sinyaline yüksek ses (5dB SSO) ilave edildiğinde ise söz konusu rakam %96.67 olmuştur. LÖK yönteminde en iyi TH, konuşma sinyaline ses eklendiği zaman %70 olmuştur. Spektrogram yönteminde TH, konuşma sinyaline düşük ses (30 dB SSO) ilave edildiği zaman, %70 çıkmıştır; ancak bu sonuç, konuşma sinyaline yüksek ses (5 dB SSO) ilave edildiğinde, % 86.67’ye azalma göstermiştir. Son olarak, simülasyon iii

(2)

sonuçları, özellik bulmadaki en iyi kullanılan yöntemin, LÖK ve Spektrogram yöntemleri ile karşılaştırıldığında, MFKK yöntemi olduğunu göstermektedir. Spektrogram yöntemi ile karşılaştırıldığında, MFKK yönteminin üretilen az sayıda çıktı verisi mevcuttur.

Anahtar Kelimeler: Konuşma Tanıma Sistemi, LÖK, MFKK, Spektrogram, Sinir Ağları.

iv

Referanslar

Benzer Belgeler

In the study the purpose was to calculate the unit costs of scarves woven with in- sect silk, floss silk, cotton and linen yarn on hand and automatic looms, as well as to compare

Adomo bu miizik anlay$mr miizilin kendi iginde nesnel olarak igkin bulunan elilimlerin; yani kar- maqrk ve dolayh yollarla toplurnsal yiinsemeleri pekala

Ülkelerin dünya siyaset arenasınfla ekonomik ve politik olarak güçlü olmaları, matematik ve özel konumlarından en üst düzeyde istifade edebilmeleriyle olduğu gibi, başta

The element levels in the content of fruit vegetables should be within the limit levels determined by the World Health Organization (WHO). Because while the minerals and

Yerel çeşitlere ait 20 adet meyvede; meyve ağırlığı, meyve boyu, meyve eni, meyve kalınlığı, meyve sapı uzunluğu, meyve sapı kalınlığı, çiçek çukuru

Yakın Doğu Üniversitesi Eğitim Bilimleri Enstitüsü Eğitimde Yaratıcı Drama Ana Bilim Dalı’nda yürütülen bu tez çalışmasının genel amacı; Sahne Sanatları

Kitap, Türkçenin ünlü ve ünsüz dizgesinin, bir yandan akustik özelliklerini, diğer yandan ise ses değişimlerine ilişkin temel görünümlerini okuyucuya sunması yönünden,

Deli Hüseyin paşanın kabri ortasında mor çiçekler açan şu lâtif ağaç