• Sonuç bulunamadı

3. TÜRKÇE ĠÇĠN METĠN SESLENDĠRME SĠSTEMĠ VE GERÇEKLENMESĠ

3.3 Türkçe Metin Seslendirme Sistemi

3.3.5 Yazılımın diğer yetenekleri

Gerçeklenen Türkçe Metin Seslendirme yazılımda ayrıca aşağıdaki yetenekler de bulunmaktadır. Uygulamaya erişildiğinde, “Dosya” ana adımı

altında Şekil 3.20‟de gösterildiği üzere “Yeni, Kaydet, Aç, Kapat, Yazdır ve Çıkış” adımları listelenmektedir. Bu alt adımların işlevi sırasıyla aşağıda özetlenmiştir.

Yeni : Tüm ekranları temizler ve yeni dosya ile çalışılmasını sağlar.

Kaydet : Ekranda yazılı olan metin veya XML‟in dosya sistemine kaydedilmesini sağlar. Düz metin seçili ise metin formatında kaydedilebilirken, XML seçili ise “.tms” uzantılı olacak şekilde kaydedilebilmektedir.

Aç : Ekrana, daha önceden kaydedilmiş dosya içeriğinin gösterilmesini sağlar. Bu dosya, düz metin veya “.tms” uzantılı dosya olabilir.

Kapat : O an ekranda gösterilen metine ait kullanılan sistem kaynaklarının geri verilmesini ve kullanılmak üzere yeni sayfa açılmasını sağlar.

Yazdır : Ekranda görüntülenen bilgilerin yazıcıya yönlendirilmesini sağlar.

ÇıkıĢ : Programın kapatılarak sistem kaynaklarını geri vermesi sağlanır.

ġekil 3.20 : Dosya menüsü adımları

“Düzenle” sekmesinin altındaki adımlar Şekil 3.21‟de listelenmiştir.

Geri Al : Son yapılan işlemin geri alınmasını sağlar.

Tümünü Seç : Metin kutusunda bulunan tüm metnin seçili hale gelmesini sağlar.

Kes : Seçili bulunan metnin silinip, tekrar kullanılma ihtimaline karşın bellekte (clipboard) tutulmasını sağlar.

Kopyala : Seçili olan metnin belleğe (clipboard) kaydedilmesini sağlar.

YapıĢtır : Belleğe (clipboard) kopyalanmış son metnin, imlecin bulunduğu yere kopyalanmasını sağlar.

ġekil 3.21 : Düzenle menüsü adımları 3.3.6 Yazılımın çalıĢabilmesi için gerekli donanım

Gerçeklenen yazılımın çalışabilmesi için gerekli olan donanım aşağıdaki maddelerle özetlenebilir.

 Windows işletim sistemi

 150Kbyte boş bellek alanı

 Her ses veritabanı için 50Mbyte boş sabit disk alanı

 Ekran kartı

 Ses kartı

 Hoparlör

4. TÜRKÇE METĠN SESLENDĠRME UYGULAMASININ DEĞERLENDĠRĠLMESĠ

Türkçe Metin Seslendirme çalışmasında ana hatlarıyla çift-ses eklemeli ve hece eklemeli olmak üzere iki yöntem denenmiştir. Çift-ses ekleme yöntemine göre daha fazla ses kaydı ve bununla ters orantılı şekilde daha az ekleme noktası gerektiren hece ekleme yönteminin daha doğal ve anlaşılır olması için alt çalışmalar gerçekleştirilmiştir. Farklı ses uzunluklu hecelerin eklenmesi yönteminde her sesin farklı uzunlukta oluşturulabilmesi yoluna gidilmiş iken, farklı genlik değerleri ile ekleme yönteminde ise hecelere ve dolayısıyla kelimelere vurgu verilmeye çalışılmıştır.

Her bir yöntem için değerlendirmenin yapılabilmesi amacıyla 10 cümle belirlenmiştir. Her bir yöntem ile üretilen sesler farklı yaş gruplarındaki altı kişiye farklı zamanlarda dinletilmiştir. Dinleyicilerden gelen cevaplar üzerine anlaşılırlık hesabı yapılmıştır.

4.1 AnlaĢılırlığın hesaplanması

Ses kalitesini değerlendirmek için dünyada kullanılan en yaygın ve basit yöntem MOS (Mean Opinion Score)‟tur. MOS‟ta, 1-kötü ve 5-mükemmel arasında beş farklı seviye vardır ve bu seviyeler Çizelge 4.1‟de listelenmiştir. Dinleyiciler, dinledikleri sesleri değerlendirerek beş seviyeden birini uygun görürler[20].

Çizelge 4.1 : MOS seviyeleri MOS seviyeleri

5 Mükemmel Excellent

4 İyi Good

3 Normal Fair

2 Zayıf Poor

1 Kötü Bad

Ancak, dinleyicilerin sadece beş seviyeden birini seçmesi çoğu zaman anlamlı sonuç veremeyebilir. Özellikle seviyeler dinleyiciden dinleyiciye değişkenlik gösterebilir.

yapılmıştır. Dinleyici seslendirilen cümleyi doğru olarak tekrar edememişse, cümle tekrar seslendirilir ve bu işlem en fazla üç kere tekrar edilir.

Değerlendirmeye ve dolayısıyla anlaşılırlığın hesaplanmasına dahil olması gereken parametreler aşağıda özetlenmiştir.

doğru harf sayısı : dinleyicinin anladığı cümle ve gerçek cümledeki çakışan harf sayısını gösterir. (Anlaşılırlık ile doğru orantılı)

önceki doğru harf sayısı : Bir önceki tahminde bulunan doğru harf sayısı. İlk tahmin için bu değer 0 (sıfır)‟dır. (Doğru harf sayısı ile farkı, anlaşılırlık ile doğru orantılı) toplam harf sayısı : Seslendirilen cümlede bulunan harf sayısı (Doğru bilinen harf sayısı ile bereber düşünüldüğünde, sonuç ile ters orantılı)

deneme numarası (n) : Aynı cümle için kaçıcı denemenin olduğunu gösterir. (Cümle llk seferde doğru bir şekilde bilinemediyse, diğer denemelerde verilen cevapların değeri daha az olmalıdır, bu yüzden deneme numarası, sonuç ile ters orantılıdır) Tüm parametreler göz önüne alındığında (4.1) anlaşılırlık formülü elde edilmiştir.

(4.1) Örnek olarak, “Çok fazla kar yağdığı için annem işe gidemedi” cümlesi dinleyiciye dinletilmiş ve üç denemede şu sonuçlar alınmış olsun:

1. Deneme : Çok fazla kar vardı anne işe gidemedi. (29 harf doğru) 2. Deneme : Çok fazla kar yağdı annem işe gidemedi. (31 harf doğru) 3. Deneme : Çok fazla kar yağdığı için annem işe gidemedi. (38 harf doğru) Asıl cümlede 38 harf bulunmaktadır ve yukarıdaki değerler formüle yerleştirildiğinde birinci denemeden gelen sonuç %76,32 iken ikinci ve üçüncü denemelerden gelen sonuçlar %2,63 ve %6,14 olmaktadır. Toplamda ise %85,09 değeri elde edilmiştir.

4.2 Cümlelerin belirlenmesi

Test sonucunun daha anlamlı olması için, (3 ve 7 yaşında dinleyicilerin de olduğu düşünülerek), her yaştaki insana hitap edecek, net cümleler seçilmeye gayret edilmiştir. Seçilen bu cümleler Çizelge 4.2‟de gösterilmektedir.

Çizelge 4.2 : Dinleyicilere dinletilen 10 cümle

Sıra Numarası Cümleler

1 Bu sabah erken kalktım

2 Bu akşam çok yemek yedim

3 Çok fazla kar yağdığı için annem işe gidemedi 4 Parkta oynayan çocuklar uçurtma uçurdu 5 Akşam yatmadan önce süt içerim 6 Televizyonda çizgi film seyretmeyi çok severim

7 Babamla futbol oynadık

8 Artık yatma vakti geldi

9 Polis hırsızı yakaladı

10 Dişlerinizi her gün iki kere fırçalamalısınız 4.2.1 Cümlelerin dinleyicilere dinletilmesi

Belirlenen her cümle dinleyicilere aynı ortamda ve farklı zamanlarda dinletilmiştir.

Tüm yöntemlerin test edilebilmesi amacıyla, daha önceden dinletilmiş yönteme ait cümlenin hatırlanmaması için bir ay gibi bir sürenin beklenmesi öngörülmüştür.

Cümlelerin hatırlanmaması için bir ay gibi bir sürenin de yetersiz olabileceğinden yola çıkarak, her dinleyicide denenen yöntemlerin sırası karışık olacak şekilde ayarlanmıştır. Örneğin, birinci dinleyiciye ilk olarak çift-ses eklemeli yöntem ile üretilen sesler dinletilmiş iken, ikinci dinleyiciye ilk olarak hece eklemeli yöntem dinletilmiştir. Aynı şekilde üçüncü dinleyiciye de farklı uzunluklu ses ve farklı genlik değerleri içeren yöntem ile üretilen sesler dinletilmiştir. Bir ay gibi bir süre sonra ise, her dinleyici için diğer yöntemlere geçilmiştir. Sonuç olarak her yöntemin aynı sayıda birinci, ikinci ve üçüncü olarak dinleyicilere dinletilmesine gayret edilmiştir.

4.2.2 Sonuçların değerlendirilmesi

Altı farklı yaş grubundaki dinleyicilerle yapılan deney neticeleri, formülden geçirildikten sonra Çizelge 4.3‟te oluşturulan not dağılımı ortaya çıkmıştır. Her bir dinleyicinin, tüm cümleler için vermiş olduğu cevaplara ilişkin yüzde cinsinden notu, yine her bir yöntem için belirtilmiştir. Ayrıca her bir yöntem için ayrı ayrı cümlelerin ara ortalaması da hesaplanmış ve en sonunda da her bir yöntemin almış olduğu genel ortalama not değeri Çizelge 4.4‟deki gibi bulunmuştur. Çift-ses eklemeli yöntem kullanılarak yapılan deneyde anlaşılırlık oranı %91.5 iken bu değer hece eklemeli yöntemde %96.1‟e yükselmiştir. Genlik ve ses uzunluğu değişimi ile vurgu çalışmasında ise anlaşılırlık %98 olarak ölçülmüştür.

Çizelge 4.3 : Dinleyici cevaplarından oluşturulan not dağılımı

Çizelge 4.3 (devam) : Dinleyici cevaplarından oluşturulan not dağılımı

Batu (3 yaş) 68,69918699 93,90243902 100

Arda (7 yaş) 100 100 100

Bahar (15 yaş) 100 100 100

Tarık (32 yaş) 100 100 100

Pınar (34 yaş) 100 100 100

Mebrure (60 yaş) 100 100 100

Ortalama 94,78319783 98,98373984 100

7 Babamla

Ortalama 100 97,91666667 100

8 Artık yatma

Ortalama 94,58333333 100 100

9 Polis hırsızı

Ortalama 87,91666667 94,16666667 97,29166667

Çizelge 4.4 : Genel ortalamalar Genel Ortalamalar

Çift-ses eklemeli yöntem (65ms) 91,5 Hece eklemeli yöntem (65ms) 96,16

Vurgulu (ses uzunluk, genlik) 98,13

Çizelge 4.5‟de ise kişi bazında cümlelere verilen cevaplara göre değerlendirme yapılmıştır. Sırasıyla çift-ses eklemeli, hece eklemeli ve vurgulu (ses uzunluğu ve genlik değişimi ile) yöntemler değerlendirildiğinde, anlaşılırlığın arttığı açıkça gözlemlenmiştir. Hemen hepsinde yöntemlerde sağa doğru geçildikçe anlaşılırlık artmıştır.

4.2.3 ÇalıĢmanın yaptığı katkılar

İncelenmiş olan diğer çalışmalardaki anlaşılırlığın artırılması için özetle aşağıdaki çalışmalar gerçeklenmiştir.

Ulama : Türkçe Metin Seslendirme sisteminde anlaşılırlığın daha da arttırılması için Türkçe dilbilimi çatısı altında çalışmalar yapılmıştır. Bunlardan birisi

3.3.3.1 Metin İşleme ve 3.3.3.2 Ses İşleme bölümlerinde de anlatıldığı üzere ulama çalışmasıdır. Bu çalışma ile az da olsa anlaşılırlığın ve doğallığın artması sağlanmıştır.

Ses dosyalarının dengelenmesi : 3.3.2.4 Oluşturulan ses dosyalarının genliklerinin dengelenmesi çalışması ile ekleme noktalarındaki patlamalar engellenmeye çalışılmıştır. Bu doğrultuda kaydedilen tüm ses dosyalarının genlikleri arasında önemli farklar olmaması sağlanmıştır.

Ses uzunluklarının ve genliklerinin değiĢtirilebilmesi : Türkçedeki tüm heceler, farklı kelimelerde farklı uzunlukta söylenebilmektedir. Kelimenin başında veya sonunda, cümlenin başında veya sonunda olmasına göre farklı uzunluklarda okunabilmektedir. Hecelerin doğrudan eklenmesi ile bu özellik sağlanamazken, bu çalışmada her ses için istenen uzunluk milisaniye cinsinden verilebilmekte ve dolayısıyla üretilen ses daha doğal ve anlaşılır hale gelebilmektedir. Aynı şekilde hecelerin genliklerinin belli kurallar doğrultusunda artırılması ile vurgu sağlanmaya çalışılmış ve anlaşılırlık için etkili olmuştur.

Ayrık bileĢenler ile esneklik kazandırılması : Metinden XML ve XML‟den ses üretme bileşenleri tamamen birbirinden bağımsız çalışabildiği için, yapılacak olan dilbilimsel çalışmalar ile uygulamaya kolay bir şekilde yeni özellikler eklenebilecektir. Gevşek bağlaşım sayesinde her iki bileşen tamamen ayrılmış ve üstüne görme engelliler için düzenleyici uygulaması kolaylıkla eklenebilmiştir.

Çizelge 4.5 : Dinleyici cevaplarına göre oluşturulan başarı oranları

Batu (Yaş : 3) Arda (Yaş : 7) Bahar (Yaş : 15) Tarık (Yaş : 32) Pınar (Yaş : 34) Mebrure (Yaş : 60) Bu sabah erken kalktım 86,84 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 Bu akşam çok yemek yedim 100 100 100 100 100 100 92,5 100 100 100 100 100 100 100 100 100 100 100 Çok fazla kar yağdığı için annem işe gidemedi 77,63 76,32 77,63 16,23 22,37 77,63 82,89 92,11 82,89 100 100 100 100 100 100 82,02 98,68 100 Parkta oynayan çocuklar uçurtma uçurdu 66,67 55,88 100 23,53 100 67,16 77,94 89,71 100 95,59 100 100 100 100 100 91,18 97,06 100 Akşam yatmadan önce süt içerim 83,97 100 100 100 100 100 100 100 100 100 100 100 100 100 100 98,08 100 100 Televizyonda çizgi film seyretmeyi çok severim 68,7 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 Babamla futbol oynadık 100 87,5 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 Artık yatma vakti geldi 100 100 100 87,5 100 100 90 100 100 100 100 100 100 100 100 90 100 100 Polis hırsızı yakaladı 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 Dişlerinizi her gün iki kere fırçalamalısınız 83,75 84,17 92,5 56,25 80,83 91,25 91,25 100 100 100 100 100 100 100 100 96,25 100 100 ORTALAMA 86,76 90,39 97,01 78,35 90,32 93,6 93,46 98,18 98,29 99,56 100 100 100 100 100 95,75 99,57 100

Görme engelliler için düzenleyici uygulaması : Türkçe metin seslendirme uygulamasının yanısıra, görme engelliler için özel metin yazma/düzenle uygulaması geliştirilmiştir ve kullanımlarına sunulmuştur. Görme engelliler için metin düzenleyici uygulaması Bölüm 4.3‟te detaylı olarak anlatılmaktadır.

4.2.4 Görme engelliler için metin düzenleyici program

Türkçe metin seslendirme sisteminin her iki bileşeni de kullanılarak görme engelliler için metin düzenleyici program geliştirilmiştir. Bu programın asıl hedefi, görme engellilerin diledikleri metinleri yazıp, sesli olarak dinlenebilmesinin sağlanmasıdır.

Görme engelli kişi, tuştakımını kullandıkça, yazdığı herşey sesli olarak kendisine dinletilmesi tasarlanmış ve geliştirilmiştir.

Görme engelliler için metin düzenleyici programının yeteneklerini aşağıdaki maddelerle özetleyebiliriz.

 Tuştakımından girilen her harf, sayı veya noktalama işareti kullanıcıya sesli olarak bildirilmektedir. Harf tuşlanması durumunda seslendirme, sessiz harflerin sonuna “E” seslisi eklenerek, seslilerin ise olduğu haliyle seslendirilmesi sağlanmıştır. Örneğin “MERAK” kelimesinin yazımı sırasında, tuştakımından tuşlanan “M”, “E”, “R”, “A” ve “K” harfleri sırasıyla “ME”, “E”, “RE”, “A”, ve “KE” şeklinde seslendirilmektedir.

Rakamlar tuşlandıkça seslendirilmesi sağlanmıştır. Örneğin tuştakımından girilen “12” sayısı için sırasıyla “BİR” ve “İKİ” seslendirmesi yapılmaktadır.

Noktalama işaretleri tuşlandıkça, Çizelge 4.6‟da tanımlandığı şekliyle seslendirilme yapılmaktadır.

Çizelge 4.6 : Noktalama işaretlerinin seslendirilmesi Noktalama işareti Seslendirme

 Ok tuşları tuşlandığı takdirde imlecin geldiği yerdeki harf, rakam veya noktalama işareti seslendirilmektedir. Örneğin “BUGÜN OKULA GİTTİN Mİ?” cümlesi yazılıyken imleç “?” karakterinin sağında bulunsun (Şekil 4.1).

ġekil 4.1 : Görme engelliler için metin düzenleyici programı

İmleci sola götürmek için  tuşlandığında imleç “İ” harfi ile “?” arasına gelir ve program “İ” seslendirmesini yapar. Sonra,  tuşlandığında imleç tekrar

“?” karakterinin sağına gelir ve bu sefer “SORU İŞARETİ” seslendirmesi yapılır.

 Shift, Backspace, Delete, Page Up, Page Down, Home, End tuşları; normal programlarda olduğu işlevleriyle kullanılmaktadırlar ve bu tuşlar yardımı ile metin üzerinde imleç hareket ettirilebilmektedir. İmlecin yeri değiştiğinde, gelinen yerdeki karakter sesli olarak bilgilendirilmektedir.

 (ALT + S) tuş birlikteliği ile seçili olan metnin, eğer seçili olan metin yoksa tüm metnin seslendirilmesi sağlanmaktadır.

 Metin yazılırken boşluk (SPACE) tuşuna basıldığı takdirde son kelimenin seslendirilmesi sağlanmaktadır.

5. SONUÇ VE ÖNERĠLER

Bilgisayarla insan ve makine arasındaki sözel iletişim, son yıllarda önemi gittikçe artan bir konudur. Dünyada bu alanda uzun süredir yapılan çalışmalar sonucu, anlaşılırlığı oldukça iyi söz sentezleyiciler geliştirilmiştir. Son yıllarda Türkiye‟de de bu alanda yapılan çalışmalar meyvelerini vermeye başlamıştır. Her dilin kendine özgü ses özellikleri mevcut olduğundan, İngilizce söz sentezleyicileri Türkçe söz sentezi için kullanmak mümkün olmamaktadır. İşte bu çalışma, Türkiye‟de eksikliği duyulan, anlaşılır Türkçe söz sentezleyiciler konusundaki çalışmalara katkıda bulunabilmek amacıyla yapılmıştır. Çalışma sonucunda, çoklu ortam uygulamaları, konuşma engellilere gerekli iletişim araçlarının temini, görme engellilere okuma araçlarının yapımı gibi konularda kullanılabilecek bir yazılım ortaya çıkmıştır.

Türkçenin söz sentezlemede bilinmesi gereken önemli dilbilgisi kuralları ve sesçil özelliği incelenmiş, birkaç sentez yöntemi tartışılmıştır. Sonuçta, Türkçenin sesçil olması, sondan birçok ek alması ve hece sayısının oldukça fazla olması dikkate alınarak en uygun yöntem belirlenmeye çalışılmıştır. Bu noktada, her bir yöntem için ses üretebilir bir sistemin kurulması ve Şekil 5.1‟deki gibi girilen metnin tüm yöntemler doğrultusunda, ses üretebilmesi sağlanmıştır.

Türkçedeki ikisi dış kaynaklı olan sekiz farklı hece tipi üzerinde çeşitli incelemeler yapılmıştır. Her bir hece tipinin ekleme yöntemleri üzerinde formüller gerçeklenmiştir.

Sözcükler arasındaki “ulama”, daha heceleme sırasında gerçekleştirilerek, çıkan sesin daha doğal ve anlaşılır olması yolunda olumlu tesir etmiştir.

Çalışmada 65-120 ms uzunlukta 7.845 adet ses dosyası oluşturulmuştur. Bu 16 bitlik kayıtlarda iniş ve çıkışların sert olmaması için algoritma ile tüm dosyalar otomatik olarak elden geçirilmiştir.

Vurgu ve tonlama gibi etkiler, Türkçede anlaşılırlığı önemli derecede değiştiren ses olaylarıdır. Ancak, her yerde geçerli kuralları olmadığı için matematiksel modelini oluşturmak oldukça güçtür. Bu yüzden en çok bilinen özellikleri ile vurgu çalışması

yapılmıştır. Çalışmada asıl ağırlıklı amaç, metinden fonetik seviyede oluşturulan XML dosyası ile XML dosyasından ses üreten iki bileşenin birbirinden tamamen bağımsız çalışabilmesidir. Bu gevşek bağlaşımlı yapı sayesinde, yapılacak doğal dil işleme çalışmaları, bu çalışmaya eklenebilecek ve daha doğal sesler çıkartılabilecektir.

ġekil 5.1 : “Parkta oynayan çocuklar uçurtma uçurdu” cümlesinin farklı yöntemlerle oluşturulmuş ses dalga şekilleri

Karşılaşılan bir diğer sorun da, hecelerin, sözcüğün içindeki konumlarına bağlı olarak değişiklik göstermesidir. Yani, eğer bir heceye ait ses dosyası, sözcük başından çıkartılarak elde edilmiş ise, aynı ses dosyasının, sözcük sonunda veya ortasında kullanılması istenmeyen vurgulara ve bozulmalara yol açabilmektedir. Bu yüzden ses dosyaları mümkün olduğunca kelimeler içinden seçilerek değil de tamamen tekdüze ve ayrı bir şekilde oluşturulmalıdır. Bu da vurgu ve tonlamayı oldukça zorlaştırmaktadır.

Türk alfabesindeki harflerin, Türkçedeki tüm sesleri karşılamaması da başka bir sorundur. Bu durumlara, özellikle, yabancı kökenli Türkçeleşmiş sözcüklerde rastlanmaktadır. Örneğin, “lale” sözcüğündeki “la” sesi ile “pala” sözcüğündeki “la”

sesi birbirinden çok farklıdır. Bunun için öncelikle Türkçe fonetik alfabesi çıkartılmıştır ve “lale” gibi sözcüklerde hangi sesin kullanılacağının, aykırı kelimeler sözlüğünden elde edilmesi hedeflenmiştir.

Sonuç olarak, çalışmadan daha doğal sesler elde etmek için frekans alanı üzerinde çalışma yapılmalıdır. Pitch değerleri üzerinde durularak ve doğal dil işleme desteğinin de alınması ile çok doğal sonuçların elde edilebileceği çalışma sonucunda ispatlanmıştır.

KAYNAKLAR

[1] Rıfat YAZICI ve Cemal KÖSE, "Kısıtlamasız Türkçe Ses Sentezi" Sinyal İşleme Uygulamaları (SİU) Konferansı, 1992

[2] Juergen Schroeter, Text to-Speech (TTS) Synthesis, AT&T Laboratories, 2005 [3] Flanagan J., Speech Analysis, Synthesis, and Perception, Springer-Verlag,

Berlin-Heidelberg-New York, 1972

[4] Schroeder M., A Brief History of Synthetic Speech, Speech Communication vol.13 pp.231-237, 1993

[5] Güldalı K., Türkçe Metin Seslendirme, İstanbul Teknik Üniversitesi, 2009

[6] <http://www.haskins.yale.edu/featured/heads/SIMULACRA/kempelen.html>, alındığı tarih 20.02.2010

[7] Klatt D., Review of Text-to-Speech Conversion for English, Journal of the Acoustical Society of America, JASA vol.82(3)737-793,1987

[8] <http://www.haskins.yale.edu/featured/heads/SIMULACRA/wheatstone.html>, alındığı tarih 20.02.2009.

[9] Eker B., Turkish Text To Speech System, 2002

[10] Dutoit T., “An Introduction to Text to Speech Synthesis”, pp 26-32, 1997 [11] Rosen G., The DAVO articulatory synthesizer, MIT, 0.28, 1958

[12] Allen, J., Hunnicutt, S., Klatt, D, From Text to Speech: The MITalk System, Cambridge University Press, 1987

[13] Dutoit T., A Short Introduction to Text-to-Speech Synthesis

<http://tcts.fpms.ac.be/synthesis/introtts_old.html>, alındığı tarih 25.02.2010

[14] <http://www.acapela-group.com> , alındığı tarih 25.02.2010

[15] Ljungqvist M., Lindström A., Gustafson K., A New System for text-to-Speech and Its Applications to Swedish, ICSLP94 (4) : 1779-1782, 1994

[16] Mönius B., Schroeter J., Santen J., Sproat R., Olive J., Recent Advances Multilingual Text-to-Speech Synthesis, Fortschritte der Akustik, DAGA, 1995

[17] <http://www.research.att.com/~ttsweb/tts/index.php> , alındığı tarih 26.02.2010 [18] <http://www.nuance.com/realspeak> , alındığı tarih 26.02.2010

[19] Festival Project Homepage <http://www.cstr.ed.ac.uk/projects/festival>, alındığı tarih 26.02.2010

[20] Lemmetty S., Review of Speech Synthesis Technology, Helsinki University of

[21] MBROLA Project Homepage <http://tcts.fpms.ac.be/synthesis/mbrola.html>, alındığı tarih 26.02.2010

[22] Sestek Anasayfası <http://www.sestek.com.tr/gvztts.html>, alındığı tarih 01.03.2010

[23] Adalı E., Doğal Dil İşleme, 2010

[24] Türkçe İmla Kılavuzu - Türk Dil Kurumu, 2000

[25] Prof. Dr. Muharrem ERGĠN, "Üniversiteler İçin Türk Dili", Bayrak Basım/Yayın/Tanıtım, İstanbul, 1992

[26] Flanagan J. L., Allen J. B., M. A. Hasegawa-Johnson, “Speech Analysis Synthesis and Perception”, ch6, ch2., 2008

[27] Güner L. Ergenç D., Sesin Doğası ve Oluşumu

<http://www.jandarma.tsk.tr/kriminal/turkish%20internet/anasayfa/bil arinde_dosyalar/yazilar_dosyalar/bilarinde5.pdf>, alındığı tarih 03.03.2010

[28] Ergenç Ġ., Konuşma Dili ve Türkçenin Söyleyiş Sözlüğü, 1995

[29] Kröger B., Minimal Rules for Articulatory Speech Synthesis, Proceedings of EUSIPCO92(1):331-334, 1992

[30] Rahim M., Goodyear C., Klejin B., Schroeter J., Sondhi M., On the Use of Neural Networks in Articulatory Speech Synthesis, Journal of the Acoustical Society of America, JASA vol.93(2):1109-1221,1993 [31] ErtaĢ F., Eskidere Ö., Yazılım Tabanlı Sözcük Sentezleyici, DEÜ Fen ve

Mühendislik Dergisi Cilt:3 Sayı:1 sh.1-27, 2001

[32] Klatt, D. H., “Review of text-to-speech conversion for English”, MIT, 1987,

<http://americanhistory.si.edu/archives/speechsynthesis/dk737a.htm>

, alındığı tarih 01.03.2010

[33] Jurafsky and Martin, Speech and Language Processing, 2ed (Draft), 2000 [34] "Pitch-Synchronous Waveform Processing Techniques for Text-to-Speech

Synthesis Using Diphones" Speech Communication (Elsevier Science Publishers, Amsterdam, Netherlands), vol. 9, Nos. 5/6, pp. 453-467,

[38] SWT Homepage <http://www.eclipse.org/swt>, alındığı tarih 17.03.2010 [39] How to Call Native (DLL) Code From Java Using JNI

<http://support.microsoft.com/kb/222092>, alındığı tarih 15.11.2009 [40] Audacity Homepage <http://audacity.sourceforge.net>, alındığı tarih

17.03.2010

[41] HSQLDB Homepage <http://www.hsqldb.org>, alındığı tarih 17.03.2010

ÖZGEÇMĠġ

Ad Soyad: Tuncay ġENTÜRK

Doğum Yeri ve Tarihi: Of / 1978

Adres: Gardenya 5-1B Daire 32 AtaĢehir / ĠSTANBUL

Lisans Üniversite: Ġstanbul Teknik Üniversitesi Kontrol ve Bilgisayar Mühendisliği

Benzer Belgeler