• Sonuç bulunamadı

Slav Dilleri ve Türkçe arasında çeviri

N/A
N/A
Protected

Academic year: 2021

Share "Slav Dilleri ve Türkçe arasında çeviri"

Copied!
47
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

İÇİNDEKİLER

İÇİNDEKİLER ... I ÖZET...II SUMMARY ...IV TEŞEKKÜR ... V 1. GİRİŞ VE AMAÇ ... 1

2. BİLGİSAYARLI ÇEVİRİ HAKKINDA KISACA ... 3

2.1. GIRIŞ... 4

2.2. ÇEVIRI İŞLEMININ TARIHÇESI... 4

2.3. ÇEVIRI İŞLEMI... 5

3. TEORİK BİLGİLER ... 7

3.1. DILBILIMIN TEMEL KAVRAMLARI VE DISIPLINLERI... 7

3.2. EVRENSEL GRAMER TEORISI... 8

3.3. ÜRETICI DILBILGISI VE DILBILIM... 10

4. BULGARCA’NIN DİLBİLGİSİ ÖZETİ ... 12

4.1. GIRIŞ... 12

4.2. GENEL TERMINOLOJI... 13

4.3. BULGARCA IÇIN BAZI BILGILER... 14

4.4. ÖBEK YAPILARI... 14

4.4.1. İsim Öbeği... 14

4.4.2. Sıfat Öbeği ... 17

4.4.3. Edat Öbeği... 19

4.4.4. Fiil Öbeği... 22

4.4.6. Genelleştirilmiş Yapı İncelemesi ... 25

4.5. BULGARCA IÇIN ÖRNEKLER... 26

5.SİSTEM TASARIMI ... 28

5.1. ÜST DÜZEY TASARIM... 28

5.2. AYRINTILI TASARIM... 29

5.2.1. Sözlük... 29

5.2.2. Öbek Oluşturma Kuralları... 30

5.2.3.Ayrıştırıcı ... 33

6. SİSTEM GERÇEKLEMESİ... 34

6.1. SÖZLÜK ÖZELLIKLERI... 35

6.2. SÖZLÜKTEKI KELIME TÜRLERI... 35

6.2.1. İsimler... 36

6.2.2. Sıfatlar ... 36

6.2.3. Fiiller... 37

6.2.4. Belirteçler ... 37

6.2. ÖBEK OLUŞTURMA KURALLARI... 38

6.3. AYRIŞTIRICI... 38

7. SONUÇ... 39

(2)

ÖZGEÇMİŞ... 42

Yüksek Lisans Tezi

Trakya Üniversitesi Fen Bilimleri Enstitüsü

ÖZET

Bu çalışmada Bulgarca ve Türkçe arasında bir çeviri programı yapılması amaçlanmaktadır. Kelime, öbek yapıları ve “basit” olarak nitelendirdiğimiz cümle yapıların çevirisi gerçekleşmektedir. Bulgarca olarak girilen yapının çeviri işlemi üç temel aşamada gerçekleşmektedir:

- Biçimbirimsel analiz, - Sözdizimsel analiz,

- Türkçe olarak çevirilmiş cümlenin üretilmesi.

Çevirilecek metin öncelikle biçimbirimsel analizden geçirilir sözdizimsel olarak analiz edilerek Bulgarca Gramere uygun olup olmadığı tespit edilir. Gramere uygun olarak belirlendikten sonra her yapının Türkçe’de bir karşılığı aranır. Çeviri ifadesi öncelikle kelime bazında, daha sonra öbek yapısı halinde, daha sonra da bir cümle olarak oluşturulur. Böylelikle Türkçe karşılıkları ve Türkçe sözdizim kurallarına uygun çıktı olarak çevirilen metin elde edilir.

Bu çalışma ile bilgisayarlı çeviri çalışmaları yanında Türkçe ve Bulgarca üzerine karşılaştırmalı dilbilimsel çalışmalara da katkımız olacaktır.

Anahtar Kelimeler: biçimbirimsel analiz, sözdizimsel çözümleme, mantıksal çıkarım,

(3)

Yıl : 2005 Sayfa : 50

(4)

Master Thesis

Trakya University Graduate School of Natural and Applied Sciences

Department of Computer Engineering

SUMMARY

In this study the aim is to build a translation program from Bulgarian to Turkish. The input to the translation process consists of words, groups of words and sentences which are determined as “simple”. Bulgarian inputs can be translated in 3 main stages:

- Morphological Analysis, - Syntactic Analysis,

- Türkçe olarak çevirilmiş cümlenin üretilmesi.

Even though the processes above are designated as stages, they are carried out not in a consecutive manner but in tandem: after a sufficient number of words are morphologically analysed, they are combined into a phrase; meanwhile, starting from each word a translation is built up for the thus obtained phrase.

We hope that this study whill contribute to both comparative analyses of Bulgarian and Turkish and to translation technology in general.

Key words : morphological analysis, syntactic analysis, translation, machine

translation, Universal Grammer, Generative Grammar

Year : 2005 Page : 50

(5)

TEŞEKKÜR

Çalışmamızın başladığı günden itibaren bana yol gösteren, teşvik eden, sabırla sorularımı cevaplayıp daima destekleyen, bilgi ve birikimini paylaşan danışman hocam Yrd. Doç. Dr. Yılmaz KILIÇASLAN‘a teşekkürlerimi sunarım. Beni en iyi tez hocasına sahip bir öğrenci yaptığınız için önünüzde saygıyla eğiliyorum.

Trakya Üniversitesi Bilgisayar Mühendisliği Bölümündeki hocalarıma, araştırma görevlileri Emel Özoğul Aslan, Özlem Aydın ve Fatma Akgün’e her türden yardımlarını esirgemedikleri için teşekkür ederim.

İstanbul Teknik Üniversitesi Rek. Yrd. Prof. Dr. Nasiye Talınlı, Doç. Dr. Özkan Sezer, Genel Sekreter Nevzat Özkök ve tüm Personel Daire Başkanlığı personeline teşekkürlerimi iletiyorum.

Hayatım boyunca desteklerini esirgemeyen ailem ve eşim Volkan Özdikililer’e de teşekkürü bir borç bilirim.

(6)

1. GİRİŞ VE AMAÇ

Günümüzde, insanlar birbirleriyle her geçen gün biraz daha fazla iletişim kurma ihtiyacı duyuyorlar. İnsanın doğuştan getirdiği iletişim aracı olan dil uluslarası iletişimde bu işlevini dil farklılıkları nedeniyle yerine getirmekte güçlükle karşılaşmaktadır. Bu sorunu aşmak için birçok insan bir ya da daha fazla yabancı dil öğrenme yoluna gitmektedir.

Dil insan yaşamı için öylesine önemli ve vazgeçilmez bir unsur haline gelmiştir ki, nerdeyse insanın varoluşu için bir ön-koşul olarak nitelendirilebilir. İnsanı diğer canlılardan farklı kılan özelliğin dil olduğu düşüncesi Aristoteles zamanından beri dikkat çekmiştir:

“Bütün canlılar içinde yalnızca insan konuşma kabiliyetine sahiptir.” (Aristoteles) İnsanlar arasındaki iletişimi kurulan anlamlı cümle ve cümleler sağlamaktadır. Karşılıklı anlaşmayı, konuşmayı, fikir alışverişini sağlayan doğru cümlelerdir. Bunun yanında, konuşulan dilin de aynı olması gerekir. Farklı dilleri kullanan iki kişi arasındaki iletişim ise ancak konuşulanların, kişilerin anlayabileceği bir dile çevrilmesi ile sağlanabilir. Bu da bizi diller arasındaki çeviri işleminin gerekliliği ve önemine yöneltir. Ancak çeviri yapabilmek için her iki dili de iyi bilmek gerekir. Bu da her zaman olanaklı değildir. Bu düşünce de çeviriye yönelik çalışmalar üzerinde her geçen gün daha fazla yoğunlaşmayı sağlamıştır.

Ünlü filozof I.A.Richards (1939), çeviriyi “evrenin oluşumundan bu yana karşılaşılan en zorlu işlem” olarak niteler. Yaptığımız çalışmadaki temel amacımız yukarıda da değindiğimiz gibi, bir makineye çeviri yaptırmaktır. Yani, çalışma Makine Çevirisi (Machine Translation) uygulaması olacaktır. Fakat, çalışmada kullanılacak olan makine bilgisayar olduğundan, bu terimi çalışmanın devamında Bilgisayarlı Çeviri (BÇ) olarak kullanacağız.

(7)

Yaptığımız Bilgisayarlı Çeviri üzerinde bu tür uygulamaların fazla yapılmadığı iki dili kapsamaktadır: Bulgarca ve Türkçe. Bulgarca için, Türkçe için de olduğu gibi, çeviri modelleri hep İngilizce ile ortak düşünülmüştür. Bu durum İngilizce’nin bir evrensel dil olarak kabul edilmesinden kaynaklanmaktadır (bkz. Swaan, 2001). Fakat günümüzün şartları göstermektedir ki, Bulgaristan ve Türkiye insanları gittikçe yakınlaşmakta ve birçok alanda birlikte projeler ve çalışmalar yürütmektedirler. Böyle bir çeviri modeli günümüzde bir “lüks” olmaktan çıkmış, ihtiyaç haline dönüşmüştür.

Bilindiği üzere Slav dilleri Kiril ve Metodiy kardeşler tarafından ileri sürülen ve daha sonra “Kiril Alfabesi” adını alan alfabeyi kullanmaktadırlar. Bu nedenle bir Slav dili olan Bulgarca’dan bir Altay dili olan Türkçe’ye metin tabanlı çeviriye öncelikle alfabe farklılığın aşılması ile başlanmalıdır. Ancak çalışmamızda bu alfabe farklılığını göz ardı edilerek her iki dil için de Latin alfabesi kullanılacaktır.

Bu çalışmada bir başlangıç olarak Bulgarca’dan Türkçe’ye bir çeviri modeli tasarlanmaktadır. Kelime çevirisinden başlayarak, öbek çevirisi ve son olarak da günlük hayatta sık sık kullanılan ‘basit’ olarak nitelediğimiz cümle çevirisine değinilecektir. Örneğin, geliştireceğimiz sistem aşağıdaki cümleleri çevirebildiği gibi

(1) Edno dete spi.

bir.tk.nötr çocuk.tk.nötr uyu-yor.şz.tk. Bir çocuk uyuyor.

(2) Az imam malka çervena topka.

ben.1tk. var-olmak.şz.1.tk. küçük.tk.dişil kırmızı.tk.dişil top.tk.dişil

Benim küçük kırmızı topum var.

(3)’de örneklenen türde öbekleri de çevirecektir.

(3) malka çervena topka

küçük.tk.dişil kırmızı.tk.dişil top.tk.dişil

küçük kırmızı top

Çalışmada belirlenen temel amaç bu iki dil arasında bir çeviri modeli oluşturmaktır. Bu işlemi gerçekleştirebilmek için her iki dilin dilbilgisi model ve kurallarını iyi tanımak gerekir. Genel anlamda bu çalışma bir Doğal Dil İşleme (Natural Language Processing) uygulaması olarak gerçekleştirilmiştir. Geliştirilen model konsept olarak Evrensel Gramer Teorisi’ne (Bölüm 3) dayanmaktadır.

(8)

Her iki dilin de gramer teorisini incelemeden bir çeviri modeli oluşturmak anlaşıldığı üzere olanaksızdır. Tasarladığımız program da, açıkladığımız çalışma da bu doğrultuda ilerleyecektir.

Çalışmanın giriş bölümünde genel bilgi verilerek incelenecek konular belirtilmiştir. İkinci bölümde çeviri işlemin tarihcesi ve günümüzdeki gelişimi ile ilgili bilgi verilmiştir. Üçüncü bölümde çalışma boyunca değindiğimiz teori ve prensipler anlatılmıştır. Dördüncü bölümde kullandığımız genel terminoloji ve Bulgar dilinin dilbilgisi açıklaması yapılmış ve bu dil Türkçe ile karşılaştırılmıştır. Beşinci bölümde öncelikle çeviri modelinin genel tasarımı daha sonra ayrıntılı tasarımı verilmiştir. Altıncı bölümde çalışma Prolog’da tasarlanan program örnekleri ile tanıtılmıştır. Son olarak yedinci bölümde çalışmanın genel bir özeti ve sağlayabileceği yararlara değinilmiştir.

Şu ana kadar yazdıklarımızdan da fark edilebileceği gibi birçok terim ve kural İngilizce isim ve tanımlamaları ile kullanılmıştır. Genellikle kullanılan her yabancı terimin yanında parantez içinde Türkçe açıklaması ya da her teknik Türkçe terimin yanında parantez içinde İngilizce karşılığı verilmiştir.

A A A A A A D Dd D D D D

2. BİLGİSAYARLI ÇEVİRİ HAKKINDA KISACA

Bu bölümde Bilgisayarlı Çevirinin başladığı günden günümüze kadar olan gelişimine çok ayrıntılı olmaksızın değinilmiş, örnek çalışmalar belirtilmiştir.

(9)

2.1. Giriş

Bilgisayar Bilimlerinde (Computer Science) Doğal Dil İşleme konusu araştırılacak olan dilin dilbilgisi ayrıntılı incelendikten sonra, oluşturulan kuralları bilgisayara uygun bir şekilde aktarıp programını yapmakla sona erer. Fakat bilinmesi gerekir ki, Doğal Dil İşlemenin ayrıntı kapsamı çalışmanın boyutlarıyla sınırlıdır. Örneğin bir Robot tasarımında Doğal Dil İşlemenin yanı sıra elektrik-elektronik bilgisi gerektirecek ses algılayıcı ve çözümleyicilere ihtiyaç duyulabilir.

2.2. Çeviri İşleminin Tarihçesi

Kullanıcı dostu yazılımlara duyulan ihtiyaç, başvurulan bilgisayarlı dilbilimin geleceğini belirlemiş ve belirleyecektir. Bu doğrultuda yapılan çalışmalar hiç göz ardı edilemeyecek kadar ilerlemiştir. Henüz makine (bilgisayar) insan ilişkisi, bir insan -insan ilişkisi gibi olmasa bile günlük yaşamı kolaylaştıracak cinsten sayısız çalışmayı içermektedir. Genellikle çok kullanılan batı dilleri baz alınarak yapılmış olsa bile birçok dilin dilbilgisi incelenmiş, ortak noktalar tespit edilmiştir. Bu çalışmalar her geçen gün insan hayatında daha fazla yer almaktadır.

1930’lu yıllarda başlayan çeviri denemeleri, 1946’da ENIAC (Electronical Numerical Integrator and Calculator) adı verilen elektronik çeviri cihazının İkinci Dünya Savaşı sonrasındaki yeniden yapılanma sürecinde önemli bir rol oynaması, çeviri alanına elektroniğin ve bilgisayarın girmesine öncülük etmiştir. MAT (Machine – Assisted Translation) adı verilen bu sistemler kendi başına çeviri yapamasalar da, bitmiş bir çeviriyi belleğinde bulunan kelime yapıları ile karşılaştırarak “hata ayıklayabilmektedirler”. Yine de çevirmenlerin işini biraz da olsa hafifletmişlerdir (Mekhrabov, 2000, Bali, 2001).

Esperanto’nun gündeme gelmesiyle ortak dil anlayışı farklı boyutlara ulaşmıştır. Esperanto, Hollanda’nın Rotterdam kentinde başlayan bir hareketle, dünyadaki uluslar arasındaki iletişimi kolaylaştırmak amacı ile yaratılmış yapay bir dildir. Pratikte yüz yıldan fazla kullanılmış olması Esperanto’yu yaşayan bir dil haline getirmiştir.

(10)

Esperanto milletler arası ve tarafsız bir dildir. O dünyadaki tüm halklara aittir ve dünyanın tüm halklarının birbiriyle iletişimine olanak sağlar. Herhangi bir kültüre, politik, dinsel veya ekonomik egemenliğe eğilimli değildir.

Kolay ve mantıklı dilbilgisinden, uzun sözcüklerin kolayca bitiştirilebilmelerinden ve uluslararası sözcük hazinesinden dolayı Esperanto herhangi bir yabancı dilden çok daha kolay öğrenilebildiği söylenir. Esperanto ile insan, her türlü düşüncesini zorlanmadan ifade edebilir.

Esperanto’yu öğrenen, birbirini etkileyen ve zenginleştiren iki uygarlığın zevkine varmak ayrıcalığına sahiptir, ki bunlardan ilki, içinde doğduğumuz bizim kendi uygarlığımızdır. Esperanto kendi halkımızın adet ve geleneklerinden, inançları ve ahlaki değerlerinden etkilenir, ki bunlar bizim kendi yöresel kültürümüzdür.

Esperanto’nun kendine ait bir bilgisayar uygulaması vardır. Programın son geliştirilen versiyonu 3.03’tür. Program genellikle Esperanto dilinin öğrenilmesinde kullanılmaktadır. Şu anda Esperanto 23 dile çeviri yapabiliyor. Kendine ait bir Unicode kodlama sistemine sahip. Esperanto eğitimi 12 dersten oluşuyor. Bu dersleri iyi anlaşılması amacı ile çok sayıda çeşitli örnekler ve şarkılar mevcuttur. Tellafuz dersleri çeşitli ırk ve ses örnekleri ile oluşturulmuştur (bkz.www.esperanto.net).

2.3. Çeviri İşlemi

Çeviri yöntemlerin temelinde bir dilde verilen “girdiyi” başka bir dilde “çıktı” olarak alabilmek yatmaktadır. Bunun için mutlaka bir doğal dil işleme mekanizması oluşturulmalıdır (Kılıçaslan vd., 2003). Verilen girdi bu mekanizmada işlenerek, gerek sözdizimsel, gerek anlamsal açıdan incelendikten sonra soyutlanarak, en sonunda da hedef dile “çevrilerek” çıktı olarak sunulmalıdır. Bizim çalışmamızda çeviri yapılacak iki temel dilin Bulgarca ve Türkçe olduğunu daha önce söylemiştik. Verilen “Bulgarca

girdi”’nin, “Çeviri İşlemi” olarak adlandırdığımız doğal dil işleme “mekanizma”sı

tarafından sözdizimsel olarak işlendikten sonra “Türkçe çıktı” alındığı Şekil 2.1’de gösterilmektedir.

(11)

Şekil 2.1. Çeviri İşlemi

Bu tür çalışmaların arayüzleri genellikle önceden oluşturulmuş veritabanı veya farklı formatta “hazır” bilgi kullanırlar. Bizim çalışmamızda da her iki dildeki kelimeler ve karşılıkları, kelimenin gramatikal özellikleri ile birlikte önceden verilmektedir. Çeviri işlemi daha önce de bahsedildiği gibi kelime bazında, öbekler bazında ve basit cümleler bazında gerçekleşmektedir. Tekrar örnekleyecek olursak, aşağıda Bulgarca bir sözcük, bir öbek ve bir cümle ile birlikte bunlara karşılık gelen Türkçe ifadeleri görmekteyiz: (4) dete çocuk.tk.nötr çocuk (5) edno dete bir.tk.nötr çocuk.tk.nötr bir çocuk

(6) Edno malko dete spi.

bir .tk.nötr küçük.tk.nötr çocuk.tk.nötr uyu-yor.şz.3tk. Bir küçük çocuk uyuyor.

Belirtmeliyiz ki, yaptığımız çeviri tamamen sözdizimsel tabanlıdır ve bazı çok anlamlılık durumları içerebilmektedir. İşlem aşağıda kısaca özetlenen adımlar izlenerek gerçekleşmektedir.

Kelime bazında çeviri Bulgarca – Türkçe çeviri çalışması olduğundan Bulgarca kelimenin (4)’de olduğu gibi (‘dete’) girdi olarak verilmesinden sonra programın sözlük bölümünde karşılığı bulunup ekrana çıktı (‘çocuk’) olarak yazdırılmasıyla sona erer.

Öbek bazında yaptığımız çeviride dikkat edilmesi gereken hususlar özetle şunlardır: Burada öncelikle kelime türlerinin birleşerek oluşturdukları öbek yapısı daha

Türkçe Çıktı Çeviri İşlemi

Bulgarca Girdi

(12)

önce belirlemiş olduğumuz Öbek Oluşturma Kurallarına uymalıdır. Öbek Oluşturma Kurallarına ilişkin ayrıntılı bilgi tezin Teorik Bilgiler bölümünde verilecektir. (5)’de olduğu gibi bir belirteç ve isimden oluşan bir kuralımız olmalıdır. Bu kuralın varlığı onaylandıktan sonra “yapı taşlarının” da özellikleri birbirine uymalıdır. (5)’de olduğu gibi ismin (dete) nötr ve tekil olma özellikleriyle uyumlu özellikleri yapısında barındıran bir belirteç olmalıdır. Bu kurallar yerine gelirse öbeği oluşturan kelimelerin karşılıkları alınır ve ekrana sonuç olarak yazılır. Aksi halde bir neticeye ulaşılamaz.

Aynı durum (6) için de geçerlidir. Metin girişi yapılıp kelime alındıktan sonra bir öbeğin parçası ise diğer kelimelerle bir ortak öbek yapısı sağlanmaya çalışılır. Öbek yapıları birleştirilerek daha üst yapı olan cümlelere erişilir. Henüz bu işlem kelimelerin klavyeden girişi ve çeviri metninin de tekrar ekrana yazılışıyla gerçekleşmektedir.

egnar egnar

egnar

egnar

3. TEORİK BİLGİLER

Bu bölümde yaptığımız çalışmada yararlandığımız ve dayanak olarak göz önünde bulundurduğumuz prensipler hakkında bilgi verilecektir.

3.1. Dilbilimin Temel Kavramları ve Disiplinleri

Dilbilimin birkaç temel disiplini vardır. Bunların arasında Syntax (Sözdizim), Semantics (Anlambilim), Pragmatics (Pragmatik), Morphology (Biçimbilim),

(13)

Phonology / Phonetics (Sesbilim, Fonetik / Fonoloji) yer almaktadır. Sırayla bu disiplinlerle ilgili bilgi aşağıda verilmiştir.

Fonetik ve Fonoloji, Sesbilim çatısı altında birleştirilebilirler. Her ikisi de

kelimelerin “sesleri” ile ilgilenirler. Fakat fonetik sesi anlamdan bağımsız olarak incelerken, fonoloji anlama bağımlı olarak inceler.

Biçimbilim veya Morfoloji, kök ve takılar arasındaki ilişkiyi inceleyen disiplin

olarak tanımlanabilir. Adını “morfem” (Lat.) kelimesinden almıştır ve kelimenin bölünemeyen en küçük parçasıdır.

Sözdizim, sözcüklerin bir araya gelip kurdukları yapıyı inceleyen, cümlenin

oluşum kurallarını “belirleyen” disiplindir.

Anlambilim, kelimelerin anlamını ve cümlenin anlamını bir bütün olarak

inceleyen disiplindir. Bir başka deyişle dilin yapısından gelen anlamı inceleyen disiplindir.

Pragmatik, bağlama bağımlı olarak cümleyi inceleyen ve cümleler arası ilişkiyi

analiz eden disiplindir.

3.2. Evrensel Gramer Teorisi

Evrensel Gramer Teorisi Noam Chomsky tarafından ortaya atılmıştır. Günlük yaşantımızda kurduğumuz cümlelerin çok az bir kısmını tekrar ettiğimiz gerçeğine ilk dikkat çeken dilbilimcidir. Chomsky’e göre herkes için dil doğuştan gelen bir yetidir ve zaman içinde bulunduğumuz ortama paralel olarak gelişmektedir (bkz. Chomsky, 1957).

Bir dizi evrensel prensibin mevcut olduğunu ve birçok dilin bu prensiplere dayandığı düşünülmektedir. Teori evensel bir gramerin yeryüzündeki bütün dillerin yapısal temelini oluşturduğunu, diller arasındaki yüzeysel farklılaşmanın bazı parametrik varyasyonlardan kaynaklandığını ileri sürmektedir. Bu teorik düşünceyi göz önünde bulundurarak bir otomatik çeviri modeli tasarlamak mümkündür. Ancak bu çalışmada ayrıntılı bir araştırma yapılmamış ve bu teori bütün yönleriyle

(14)

uygulanmamaktadır. Aşağıdaki yıldız görünümlü şekilde, bazı dil ve dil gruplarının birbirine olan yakınlıklarını görmekteyiz.

Şekil 3.1. Noam Chomsky’nin Evrensel Gramer Teorisi

Birbirine daha yakın olan diller aynı dil grubuna ait olduğunu kabul edersek biri için geçerli özelliklerin çok küçük farklarla diğer diller için de uygulamak mümkündür. Ancak Bulgarca ve Türkçe gibi farklı gruplarda olan diller arasında büyük yapısal farklılıkların bulunduğu tahmin edilebilir.

Bu teoriye göre, insan doğuştan getirdiği bu evrensel gramer anlayışını bulunduğu ortama ve kullandığı dil grubu ve dile göre geliştirmektedir. Bu doğrultuda Doğuştan Getirme Hipotezi olarak adlandırılan düşünce öne sürülmüştür (bkz. Putnam, 1971, Hoekstra, 1988 ).

Belirli bir yaşın üzerinde başka bir dili öğrenmeye çalışan kişi, çoğu zaman belirli bir noktanın ötesine geçememektedir. Çok az kişi sonradan öğrendiği dili kendi ana dili gibi etkin ve akıcı kullanabilmektedir. Genellikle çocukluk döneminden sonraki yaşlarda dil öğrenmeye başlayan bireyler bu konuda tam bir yetkinliğe ulaşamamaktadır. Yapılan çalışmalar dil öğreniminde 6-12 yaştan öncesinin tercih edilmesi gerektiğini gösteriyor. Bu yaşlar aynı zamanda insan sinir sisteminin de belirli bir olgunluğa ulaştığı yaşlardır. Bu bilgiler dilin, Chomsky’nin iddia ettiği, doğuştan

Türkçe EVRENSEL GRAMER Japonca Korece İngilizce Hollandaca Almanca Yunanca İtalyanca Fransızca . . . . . . Rusça Bulgarca Çekçe . . . . . .

(15)

getirdiğimiz bir biyolojik organ olduğu ve uygun bir ortama kavuşunca geliştiği tezini desteklemektedir.

3.3. Üretici Dilbilgisi ve Dilbilim

Chomsky’nin Doğuştan Getirme Hipotezinde (Innatenes Hypothesis) öne sürdüğü Evrensel Gramer’i bir programın içindeki bir fonksiyon olarak düşünebiliriz. Bu fonksiyonun argümanlarına verilen farklı değerlere karşılık farklı sonuçlar alınması, bireyin bulunduğu ortama, kültüre göre farklı dil öğrenmesine benzetilebilir. Bu program Üretici Dilbilgisi (Generative Grammer) yaklaşımı içinde analiz edilebilir (bkz. King, 1969). Fakat, dillerdeki bazı fenomenlerin bu tarz formel yaklaşımlarla açıklanamayacağını da eklemeliyiz. (*)

Bu yaklaşım ilk olarak bir modelin oluşturulmasını önerir. İyi tanımlanmış bir yasalar dizisinden başlayarak, istenen ardışıklıklar “mekanik” olarak üretilir. Sadece üç sözcüğe sahip bir dil düşünelim. Bu dili bildiğimiz farklı dillerde oluşturalım ve aradaki benzerliği tespit etmeye çalışalım (Chomsky, 2002).

DİL: John, Jules, loves

Bu dili konuşanlar, bu sözcüklerden oluşan bileşenlerin bu dile ait olduğunu ya da olmadığını “kendilliğinden” bilirler. Burada sözkonusu dil İngilizce’dir. Aşağıda bu sözcüklerden oluşan bileşenlerden yalnızca birinin (‘Topikalizasyon’ fenomeninin bir kenara bırakacak olursak) gramatikal bir cümle olduğu görülmektedir (bkz. Kılıçaslan vd., 2003).

(7) John loves Jules. John sev-iyor.3tk.şz. Jules John Jules’u seviyor. * John Jules loves.

* Jules John loves.

*Her dil için bazı belirgin sistematik nitelik taşımayan kurallar vardır. Bunların genelde ezberlenmesi gerekir.

Örneğin, Fransızca konuşan birisi için loyal / loyaux ikilisini naval / navals’tan ayıran yapma kuralını ezbere bilmek gerekir. Bulgarca için de bu tür örnekler gösterilebilir. Örneğin masa / masi, vrıh / vırhove ikilisini ele alalım. Normal çoğul oluşumu “-i” takısının eklenmesiyle oluşur (masa, -a düşer yerini -i alır). Fakat vrıh kelimesinde çoğul takısı değiştiği gibi r ve ı yer değiştirirler. Hece değişikliginden (rı Æ ır) sonra ‘-ove’ ekiyle çoğul vırhove oluşur. Bu gibi kelimelerin çoğul oluşumları ezbere bilinmesi gerekmektedir.

(16)

Jules loves John.

Burada, ‘*’ dile ait olmadığını belirtir

‘John’ v e ‘Jules’ isim türünde sözcüklerdir; ‘loves’ ise bir fiildir.

Kelime ya da olası diğer kelime öbeklerinin bir araya gelerek oluşturduğu kelime öbekleri, dilbilimsel nesnelerin ikinci alt grubunu teşkil etmektedirler. Kelime öbeklerinin nasıl oluşturulacağı Öbek Oluşturma Kuralları tarafından belirlenmektedir. Ancak Öbek Oluşturma Kuralları hakkında ayrıntılı bilgi ilerleyen aşamalarda verilecektir.

Gramerimizdeki Öbek Oluşturma Kurallarının temeli olan iki kural aşağıdaki gibidir:

(8) S Æ noun + VP S Æ noun + VP VP Æ verb + noun VP Æ noun + verb

Burada S, VP, noun ve verb, sırasıyla, cümle (Sentence), yüklem öbeği, isim ve fiil için kullanılan sembollerdir.

Bu gösterim ile, okun solundaki elemanın sağındaki elemanlardan meydana geldiği ifade edilmektedir. noun ve verb sözlüksel, S ve VP öbeksel sınıf sembolleridir. Örnek olarak aldığımız (7)’deki cümle için sistemimizde bir kategoride kelime öbeği bulunmaktadır. Bu Fiil Öbeği’dir (Verb Phrase). (8)’de bu kelime öbeklerinin nasıl oluşturulduğunu tanımlayan kurallar gösterilmektedir.

Aşağıda öbek oluşturma kurallarının uygulaması sonucu elde edilen analizin bütününün ağaç gösterimi yer almaktadır:

(9) S noun VP noun verb Jo lo Ju

(17)

Bu ağaç, bir cümledeki öğelerin birbirleriyle doğrusal ve hiyerarşik ilişkisini belirler. Anlaşıldığı üzere hiyerarşinin en üst sviyesinde S durmaktadır. Bir sonraki kademe özne rölündeki noun ve VP ye aittir. Burada denebilir ki S, noun ve VP’nin babasıdır. Başka bir deyişle noun ve VP S’in oğullarıdır. VP ve noun, aynı verb ve nesne rolündeki noun gibi kardeştirler. Fiil öbeği için de verb ve noun’nin babasıdır denebilir. Burada baba – oğul ilişkisi hiyerarşik, kardeş ilişkisi ise doğrusaldır.

ar

4. BULGARCA’NIN DİLBİLGİSİ ÖZETİ

4.1. Giriş

Slav dilleri ve Türkçe arasında yaptığımız bu örnek çalışmada Slav dillerine örnek olarak Bulgarca’yı kullanacağımız için bu bölümde Bulgar dilinin dilbilgisi özellikleri verilecektir. Bunun yanısıra yapıları Türkçe ile birlikte incelenerek, aralarındaki benzerlik ve farklılıklar tespit edilerek analiz yapıldıktan sonra bir model sunulacaktır.

Bir çeviri programı tasarlamak için öncelikle kullanılacak dillerin morfolojik analizlerinin iyi yapılması gerekir. Aksi takdirde kullanılacak ilişkiler ve gerekli kurallar belirlenemez. Bunu başarabilmek için metinden, kelimeyi oluşturan en küçük parçalara, hecelere kadar inmek gerekir. Bir kelimeyi ‘kök + ekler’ olarak analiz edebiliriz. Bulgarca için morfolojik analizi kolaylaştıran bir sistem geliştirilmiştir. Bu ‘ABV’ sistemi adı altında bir ‘Interprogram’dır (Totkov, 1990). Verilen kelimeyi veya cümleyi hecelere ayırarak morfolojik analiz yapmaktadır. Fakat kendi çalışmamızda bu aşamaya gelmeden çeviriyi gerçekleştirmeye çalışacağız. Burada biz sadece kelime bazında ve morfolojik değil, sentaktik düzeyde kelimeleri inceleyeceğiz

(18)

Bulgarca’nın sözdizimsel yapısını tanımlarken kelimelerin aralarında birleşerek oluşturdukları öbek yapılarını, hatta o öbek yapılarının da birleşerek cümleleri oluşturmalarının proseslerini inceleyeceğiz.

4.2. Genel Terminoloji

Öbek (Phrase) ve Cümle (Sentence) yapıların oluşum ve özelliklerine bakmadan önce bazı genel ve sık kullanacağımız terimleri tekrar hatırlatma ihtiyacı duymaktayız. Bundan sonra bu yapıların genellikle İngilizce isimlerini kullanacağız. İnanıyoruz ki, çalışma boyunca alışılagelmiş tanımlamaları içeren incelemeler daha anlaşılır olacaktır.

Cümlelerin kelimelerden oluştuğunu ve bu kelimelerin cümlede belli bir fonksiyona ve gramatik özelliğe sahip oldukları biliniyor. Örneğin:

(10) İvan puşi.

İvan.tk.eril iç-iyor.şz.3.tk. İvan (sigara) içiyor.

cümlesi özne ve yüklem içermektedir. Burada isim (İvan) özne işlemini, fiil (puşi) ise yüklem işlemini üstlenmiştir.

Bir cümlenin üçüncü önemli yapı taşı nesnedir: (11) İvan puşi tsigari.

İvan.tk.eril iç-iyor.şz.3.tk. sigara.çğ. İvan sigara içiyor.

(11) cümlesinde sigara isimdir, fakat cümlede nesne rolü almaktadır. Burada özne ve nesne yüklemin argümanlarıdır, işlemde yer alan parçalardır.

Bulgarca’da argümanları diğer tümleçlerden ayırmanın en belirgin ve kolay akılda tutulan yolu pozisyona bakmaktır. Bulgarca, İngilizce, İtalyanca gibi ‘padej’ olmayan dillerde genellikle işlemin nesnesi fiilden sonra, yani fiilin sağ tarafında yer almaktadır (Krıpova, 1998, Krushkova vd., 1996). Türkçe’de ise fiile daha yakın bulunan nesne olacaktır. Cümle bunlardan farklı yapılar da içerebilir. Örneğin:

(12) Prezidentıt puşi tsigari sled veçerya.

Başbakan.tk.eril içi-yor.şz.3tk. sigara.çğ. sonra akşam yemeği.tk.dişil Başbakan akşam yemeğinden sonra sigara içiyor.

(19)

Burada ‘sled veçerya’ (akşam yemeğinden sonra) bu işlemi gerçekleştiren şahıslarla doğrudan bağlı değil, sadece sigaranın ne zaman içildiğinin ek bilgisini vermektedir. Bu gibi yapılar zarf (adverb) yapılarıdır. Zarflar gerçekleşen olayın yerini, nasıl işlendiğini, amacı ve nedeni gibi olaylar hakkında bilgi vermektedir.

Cümlede argüman – zarf ilişkisi aşağıdaki gibi gösterilebilir: (13) Argüman Zarf

Prezidentıt sled veçerya.

Başbakan.tk.eril sonra akşam yemeği.tk.dişil Başbakan akşam yemeğinden sonra

4.3. Bulgarca için bazı bilgiler

Genellikle değişilebilirlik açısından Bulgarca’daki kelimeler iki gruba ayrılırlar:

(14) Değişebilenler Değişmeyenler (sabitler)

özne (sıştestvitelno) zarf (nareçie)

yüklem (glagol) bağlaç (sıyuz)

sıfat (prilagatelno) ) edat (mejdumetie) v.s. zamir (mestoimenie) v.s

Örneğin “değişebilenler”den cümle içinde bir özne rolü gören kojuh (deri(palto)), sondan eklemeli morfem kullanarak değişebilir.

(15) kojuh --- kojuha, kojuhıt, kojusi, kojusite v.s palto --- palto-nun, palto-su, paltolar, paltolar

4.4. Öbek Yapıları

Öbekler cümleden daha küçük olabilen yapılardır. Bünyesinde yapısı farklı birden fazla kelime içermektedirler. Bu anlamda cümle öbekler bütünüdür.

4.4.1. İsim Öbeği

İsim öbekleri kendi bünyesinde en az bir isim ve o isme farklı özellikler getiren sıfat ve zamir gibi yapı taşları içerebilirler.

(20)

(16) zeleni yabılki

yeşil.çğ. elma-lar.çğ.dişil yeşil elmalar

(17) golemi zeleni yabılki

büyük.çğ. yeşil.çğ. elma-lar.çğ.dişil büyük yeşil elmalar

(18) tezi golemi zeleni yabılki

bu.çğ. büyük.çğ. yeşil.çğ. elma-lar.çğ.dişil bu büyük yeşil elmalar

(19) vsiçki tezi golemi zeleni yabılki

bütün.çğ. bu.çğ. büyük.çğ. yeşil.çğ. elma-lar.çğ.dişil bütün bu büyük yeşil elmalar

Yukarıdaki örnekler bir İsim Öbeğidir ve biz bu tür yapıları NP (ingilizce Noun

Phrase) ile işaretleyeceğiz. İsim Öbeği Bulgarca’da İmenna Fraza olarak adlandırılır.

Burada isim olan yabılki (elmalar) ana sözcüktür ve öbeğin özelliklerini belirlemektedir. İsim öbeğinin isim olmadan var olamayacağı açıktır. Başka hiçbir kelime kategorisi (örn. fiil, zarf v.b.) burada ana sözcük rolünü alamaz. Anlaşılıyor ki, sadece bu örnekte değil, bütün öbek yapılarında ana sözcük öbeğin kategorisini ve gramatikal yapısını belirlemektedir. Bu örnekte yabılki sözcüğünün taşıdığı gramatikal özellik bütün yapıya aktarılmaktadır. Örneğin burada yabılki (elmalar) çoğuldur, bundan dolayı bütün yapı çoğul olmuştur. Aynı zamanda cinsiyeti (gender) dişildir ve bütün yapı dişil olmak durumundadır.

(20) yabılka Æ yabılki elma.tk.dişil elma-lar.çğ.

Bundan dolayı bütün sözcükler ona uymaktadır ve dişil halleri ile öbek oluştururlar. (21) zelen (eril ) temel yapı yeşil.tk.eril

zelen + a (dişil) zelena yeşil.tk.dişil zelen + o (nötr ) zeleno yeşil.tk.nötr zelen + i : çoğul yeşil.çğ.

(22) golyam (eril) büyük.tk.eril

golyama (dişil) büyük.tk.dişil

(21)

golemi çogul büyük.çğ. (23) tozi (eril) bu.tk.eril tazi (dişil ) bu.tk.dişil tova (nötr ) bu.tk.nötr tezi çogul bu.çğ. (24) vseki (eril) bütün.tk.eril vsyaka (dişil) bütün.tk.dişil vsyako (nötr) bütün.tk.nötr

vsiçki çogul bütün.çğ.

Türkçe için böyle bir durum söz konusu değildir, çünkü sıfatlar, zamirler ve zarflar Türkçe’de çoğul takısı almazlar. Bu bilgiler önemlidir, çünkü buradaki ana öğe (yabılka ismi) bu yapıyı kullanan ve sadece fiil eklenerek oluşturulan cümlenin de yapısının üzerinde etki göstererek, fiili de çoğul yapmaktadır.

(25) Vsiçki tezi golemi zeleni yabılki izgni-ha.

bütün.çğ. bu.çğ. büyük.çğ. yeşil.çğ. elma-lar.çğ.dişil çürü-dü.dgz.3çğ. Burada izgniha fiili çoğul olarak kullanılmıştır.

(26) izgni (fiilin mastar hali, tekil) – izgniha (dgz., çoğul) Bir başka isim öbeğini ele alalım.

(27) golemi yabılki i kruşi büyük.çğ. elma-lar.çğ. ve armut-lar.çğ büyük elmalar ve armutlar

Yukarıdaki NP sadece elmaların mı, yoksa elma ve armutların mı, yani hepsinin mi büyük olduğunu açık olarak belirtmemektedir. Dolayısıyla, bu yapıyı çift anlamlı olarak nitelemekteyiz. Bir matematiksel gösterime benzetecek olursak, aşağıdaki gibi bir görüntü elde ederiz:

(28) golemi (yabılki i kruşi) büyük (elmalar ve armutlar) (29) (golemi yabılki) i kruşi

(22)

Aslında her zaman sıfat ona daha yakın olan ismi niteler, fakat her ikisini de kast etmiş olabiliriz.

Aslında denebilir ki, sözdizimsel yapıların oluşumu, kelimeleri ‘beyin’ sözlüğümüzden alarak, bir hiyerarşik yapıya oturtarak dilbilgimizi ve konuşmamızı oluşturmaktadır. Bir öbek (phrase) oluşturabilmek için en az iki kelimenin bulunması gerekmez. Aslında sadece yabılki başlı başına bir NP olabilir:

(30)

4.4.2. Sıfat Öbeği

İsimler tek başına bir öbek oluşturabildiklerini gördük. Çıkarımla diğer kategorilerin de böyle bir özelliğe sahip olduklarını tahmin edebiliriz. Örneğin aşağıdaki soruya:

(31) - Kakvi yabılki brahte vçera? nasıl. elma-lar.cğ. topla-mış-t-ınız.gz.2çğ. dün

- Dün nasıl elmalar toplamıştınız?

Aşağıdaki gibi tek bir sözcükle cevap verebiliriz: (32) - Golemi.

büyük.çğ. - Büyük.

Bu durum Bulgarca’da da aynıdır ve dilbilimciler arasında ‘elips’ olarak bilinir (Popov, 1972). Burada sıfatın açıkladığı isim metin içeriğinden anlaşılmaktadır.

Tek başına kullanılmış sıfatlar ingilizcede olduğu gibi yardımcı fiillerden sonra görülmektedir ve bu sıfatlar yüklem olarak belirlenirler.

(33) Yabılkite sa golemi. NP

N yabılki (elmalar)

(23)

elma-lar.çğ y.f.’tür büyük.çğ. Elmalar büyüktür.

Cümlede kullanılan her kelime bir öbeğin ana öğesi olabilir. Sıfat Öbeğinin (Adjective Phrase) görevi ismin (noun) anlamını belirlemek, daraltmak veya öbeğin ana kelimesini güçlendirmek olabilir:

(34)

Bir öbeğin ana kısmını güçlendiren herhangi bir kategoriye belirleyici (specifier) diyoruz. Semantik anlamda belirleyici, öbeğin ana kısmının anlamını güçlendirmektedir. Sentaktik bakış açısıyla ise Bulgarca’da genellikle öbeğin sol uzantısı olurlar ve öbeğin sol kısmının sınırlarını belirlerler.

Başka dillerde de görülebileceği gibi, Bulgarca’da belirleyicinin de kendisine ait bir belirleyicisı olabilir:

(35) tvırde golemi yabılki

aşırı büyük.çğ. elma-lar.çğ.

aşırı büyük elmalar (36) dosta sposobni uçenitsi

bayağı başarılı.çğ. öğren-ci-ler.çğ. bayağı başarılı öğrenciler

Bir sıfatın kendi belirleyicisi aşırı, bayağı, çok fazla, az, oldukça, büyük, daha

büyük gibi derece sözcükleri olabilir:

(37) NP AP N Adj golemi (büyük) yabılki (elmalar)

(24)

Sıfatlar belirleyici dışında cümlede tamamlayıcı (complement) olarak da görülürler. Bulgarca’da tamamlayıcılar ana sözcüğün sağ tarafında yer alır ve anlamları genellikle ana sözcük olan isimden belirlenir. Aşağıdaki örnekler bu durumu göstermektedir:

(38) Upravitel na Plovdiv Başkan.tk.eril ’in Plovdiv Plovdiv’in Belediye Başkanı

Türkçe’de ise nesnenin önünde değil arkasında ek olarak yer almaktadırlar: (39) Student po kompyutri

öğrenci.tk.eril ‘ın bilgisayar.tk.eril

Bilgisayar’ın öğrencisi (Bilgisayar - bölüm olarak kullanılmıştır)

4.4.3. Edat Öbeği

Edat’lar Bulgarca’da tek başına kullanılmazlar: (40) - Kıde sloji knigata? nereye koy-dun.2tk.dgz. kitap.tk.dişil - Kitabı nereye koydun?

(41) - Na ...ta. ya

- ...ya.

(41)’de noktaların yerinde mutlaka bir isim veya isim öbeği bulunmalıdır. Edat (Preposition) + İsim (Noun)‘den oluşan bir öbek yapısı Edat Öbeği (ingilizce

Prepositional Phrase (PP)) olarak adlandırılacaktır. Bu öbeğin vazgeçilmez bileşeni

anlaşıldığı üzere edat’tır. Aşağıda Edat öbeği örnekleri görülmektedir: NP AdjP N elmalar Deg aşırı Adj büyük NP AdjP N yabılki Deg tvırde Adj golemi

(25)

(42) - Na masata. masa.tk.dişil

masada (masanın üzerinde) (43) na krıglata masa

yuvarlak.tk.dişil masa.tk.dişil yuvarlak masada

Ayrıca burada değinilmesi gereken önemli bir unsur da sıfatın da isim ve edata göre ek almasıdır. Burada na (edat) krıgla – ta (sıfat) masa (isim)’dir.

(44)

‘Masa’ kelimesinin özelliklerinden yola çıkarak alınacak takının ‘-ta’ olacağını belirlemekteyiz. ‘Masa’ kelimesi dişil’dir ve bu kategori için geçerli olan takıyı almaktadır. Ancak yuvarlak olan masa değil de sandalye (stol) olsaydı alınacak olan takı değişerek ‘krıgliyat stol’ olacaktı:

(45) na krıgliyat stol

yuvarlak.tk.eril sandalye.tk.eril yuvarlak sandalyede

Daha önce İsim öbeğinin anlatımında birkaç sıfat örneğini analiz etmiştik ve burada sadece belirterek konu üzerinde durmadan geçilecektir.

PP Prep yuvarlak NP masada PP Prep na NP AdjP krıglata N masa

(26)

(46) krıgıl (eril) yuvarlak.tk.eril krıgla (dişil) yuvarlak.tk.dişil krıglo (nötr) yuvarlak.tk.nötr

krıgli çogul yuvarlak.çğ.

Bu durum Bulgarca’nın temel kurallarından biridir ve takı alacakken sessizden önceki “sessiz” sesli (örn: ı) harf düşer ve sessizin yanına bir başka “sesli” harf eklenir. (47) krıg-ı-l Æ krıgl-a

Edat öbeğinin bazı özellikleri aşağıdaki gibi sıralanabilir.

- Edat öbeğindeki edat’ın tamamlayıcısı hiçbir zaman bir sıfat olamaz: (48) *kısen v deset çasa (olanaksız öbek) bulg.

geç ‘da 10 saat.tk.eril

geç saat 10’da / saat 10’da geç

Bir sıfat (Adj) Edat öbeğinde belirleyici rolü alamaz. Bu işlem ancak bazı derece gösteren kelimeler için olanaklıdır. (örneğin: nerdeyse, gibi, tam v.b.).

Bir Sıfat öbeği (AP) Edat öbeğinin belirleyicisi veya oluşturucu yapı taşı olamaz. Ayrıca edatı değiştiremez, yapılandıramaz:

(49)

Bir isim (noun) tek başına bir Edat öbeğinde yer alamaz, ancak bir NP’nin yapı taşı olarak görülebilir.

Şimdi aşağıdaki örneği inceleyelim :

(50) Rabotya vırhu proekta u doma. çalışıyorum.1tk.şz. üzerinde proje.tk.eril ‘de ev.tk.eril

NP N upravitel başkanı PP P na in NP N Plovdiv

(27)

Evde proje üzerinde çalışıyorum. (51)

Bu örnekte çok belirgin olarak fiil ve tanımlayıcı sıralaması görülmüştür.

4.4.4. Fiil Öbeği

Bu bölümde, çalışmanın devamında VP (Verb Phrase) olarak belirteceğimiz, Fiil Öbeğini ele alacağız. Şu ana kadar incelediğimiz örneklere (örn (50)) dayanarak özetleyebiliriz ki, Bulgarca’da her zaman fiil kendi tamamlayıcısından (NP veya PP) önce gelir (Krushkov vd., 2002). Bu durum bütün diller için geçerli değildir. Örneğin Japonca, Korece, Hollandaca, Türkçe v.b. gibi dillerde fiil kendi tamamlayıcısından sonra gelmektedir.

(52) Detsa-ta sçupi-ha statuya-ta. çocuk-lar.çğ.nötr kırdı-lar.3çğ.dgz. heykel.tk.dişil Çocuklar heykeli kırdılar.

(53) IP NP Çocuklar VP PP heykeli V’ V kırdılar Türkçe Bulgarca IP NP N Detsata VP V’ V scupiha PP statuyata V’ PP doma evde V Rabotya çalışıyorum PP virhu proekta proje üzerinde V’

(28)

Birçok durumda olduğu gibi bu durumda da istisnalar vardır. Fakat bu istisnaları önceden belirlemek uzun zaman alacaktır.

(54)

Fiiller iki ana gruba ayrılırlar. Bunlar Geçişli Filler (Transitive Verbs) ve Geçişsiz Fiiller (Intransitive Verbs) olarak bilinirler. Biz geçişli fiilleri Vt, geçişsiz fiilleri ise Vi ile işaretleyeceğiz.

Geçişli fiiller mutlaka bir argüman (complement) içermek zorundadırlar. Ancak bu şekilde anlam taşıyabilirler, aksi halde cümlede kullanılamazlar. Örneğin, “tutuklamak” fiili, sadece “tutukladılar” şeklinde kullanılamaz. Mutlaka bir argüman (“zanlı”) içermek durumundadır. Bu durumda oluşan VP (fiil öbeği)

(55) Arestuvaha prestıpnika. tutuklamak.3çğ.şz. zanlı.tk.eril Zanlıyı tutukladılar.

halini alır. Genellikle bu argüman kendini öbekte isim olarak göstermektedir. (56) VP N V VP NP V’ N Zanlıyı V tutukladılar V+NP VP V’ V dade NP knigata NP+V VP V’ V verdi NP kitabı

(29)

Bulgarca’da, nadir de olsa, geçişli fiil’ler argumansız kullanılabilirler. Fakat, bu tür durumlarda argüman sadece sese dönüşmemiştir ve ne olduğu bağlamdan tahmin edilebilmelidir.

(57) - Hodi li na ribolov? gittin.gz.2tk mi balıkavı-na.tk.eril Balıkavına gittin mi?

- Hodih.

Gitmek.gz.1tk. Gittim.

Örnekteki soruya, “Hodih” (gittim) şeklinde cevap verilebilir ancak sadece bu metin bütünlüğünde geçerli olacaktır: Gidilecek yerin balıkavı (ribolov) olduğu metinden anlaşılmaktadır.

Geçişsiz fiiller de bir tamamlayıcı (complement) içerebilirler. Ancak, tamamlayıcı isim öbeği yerine edat öbeği olacaktır. Örnek olarak ‘razgovaryam’ (konuşuyorum), ‘pomagam’ (yardım ediyorum), ‘rabotya’ (çalışıyorum) fiilleri gösterilebilir:

(58) Razgovaryam s İvan. Konuş-ıyor-um.şz.1tk. ile İvan.tk.eril İvan ile konuşuyorum.

(59) Pomagam na horata. yardım ed-iyor-um.şz.1tk. ‘a insan-lar.çğ. İnsanlara yardım ediyorum.

V’ Æ Vint PP bazıları için zorunlu Æ yardım etmek PP burada işlemi yapılanı belirliyor.

Bazı fiiller kendine argüman değil zarf alırlar. Bunlara örnek olarak ‘idvam’ (gelmek), ‘smeya se’ (gülmek), ‘tantsuvam’ (dans etmek), ‘spya’ (uyumak) fiillerini verebiliriz. Zarflar (örneğin erken, dün, geç gibi) fiilin sağ ve sol kısmında görülebilirler.

(60) smeya se kato lud gül-üyor-um.şz.1tk. gibi deli deli gibi gülüyorum

(30)

gibi deli.tk.eril. gül-üyor-um.şz.1tk. deli gibi gülüyorum

Bulgarca’da fiilin argüman olmayan sağ uzantısı veya uzantıları ek (adjunct) olarak belirlenirler. Aşağıda bu durum örneklenmiştir:

(62) nov upravitel na Plovdiv s obitsa na uhoto

yeni başkan.tk.eril. ‘in Plovdiv ile küpe.tk.dişil ‘nda kulak.tk.nötr Plovdiv’in yeni belediye başkanı kulağında küpeyle

4.4.6. Genelleştirilmiş Yapı İncelemesi

En çok kullanılan öbek yapılarını inceleyerek her biri için belli bir yapı tanımladık. Aşağıdaki yapı ise bütün öbek türleri için geçerlidir. Öbek yapısı ne olursa olsun bir XP denince, öbek olan X, herhangi bir türden kelime ve tamamlayıcı olan ZP için belirlenebilir.

(64)

Burada YP başka bir öbek yapısıdır. Altındaki üçğen ise YP yapısının tam olarak açıklanmadığını gösterir. Bu tür bir öbek içeren XP, YP, ZP gibi öbek yapıları

IP AP nov yeni N’ N’ N upravitel başkanı PP s obitsa na uhoto kulağında küpeyle PP na Plovdiv Plovdiv’in (63) XP X öbek ZP Z YP tamamlayıcı

(31)

maksimal öbek yapılarıdır. Her projeksiyon ağaçta bir noktaya karşılık gelir. X ve Z gibi

noktalar terminal olarak adlandırılırlar.

XP, X’in maksimal projeksiyonudur, Xbar ise ara projeksiyonudur. (65)

Bütün öbek yapıları yukarıda anlatılan X-yapısına uygun olarak çözümlenmektedir.

4.5. Bulgarca için örnekler

Öbek gruplarına geçmeden kelimelerin incelemesi yapıldı. Bulgarca’da cinsiyet (gender) olarak belirttiğimiz özellik mevcut olduğundan örneğin bir sıfatı tanıtırken eril, dişil ve nötr cinsi için üç ayrı sıfat kategorisi tanıtmak durumunda kaldık. Örneğin, “kırmızı top” öbeğini elde etmek için “kırmızı” ve “top” kelimelerin karşılığı ile programa giriş yapmalıyız. Üç ‘farklı’ öbek yapısı inceleyelim:

(66) çerven moliv kırmızı.tk.eril kalem.tk.eril kırmızı kalem (67) çervena topka kırmızı.tk.dişil top.tk.dişil kırmızı top (68) çerveno more kırmızı.tk.nötr deniz.tk.nötr kırmızı deniz XP Xbar X Comp Spec

(32)

Gördüğümüz gibi her üç öbekte de “kırmızı” sıfatı yer almaktadır. Bulgarca’da bu sıfatın üç farklı ‘versiyonu’ vardır.

Topka (top) ((73)) kelimesi Bulgarca’da dişil olduğu için oluşturduğumuz öbek

de dişil cinsten olmalı. Burada “çervena” dişil yapılar için kullanılan “kırmızı”dır. Böylece “çervena topka” öbeğini oluşturarak “kırmızı top” karşılığını elde ediyoruz. Diğer cinsiyetler ve çoğul kullanım için de aynı durum söz konusudur.

(69) çerveni obuvki kırmızı.çğ. ayakkabı.çğ. kırmızı ayakkabı

Bulgarca’da sıfat her zaman ismin cinsini (gender) almak zorundadır. Bu şekilde kullanılması mümkün değildir zaten. Programda bu durumu ancak her tür için “kırmızı” anlamını önceden tanıttık, bunun bir diğer türü de kurallar verilerek kelimenin köküne ek ekleyerek oluşturmaktır. Ancak bu durumu çalışmamızın daha ileriki aşamasında oluşturacağız. Şu anki hedefimiz sadece Bulgarca’dan Türkçe’ye olabildiğince en az hata ile çeviri yapabilmektir. Fazla sayıda kelime kullanmadığımız için sıfat tanıtımını da bu şekilde yapmak mümkün oldu (Krushkov, 1996, 2003).

Eğer bir öbek içinde aynı anda sıfat, ek, belirteç kullanıldıysa onlar belli bir sırada yer almak zorundadır:

(70) Gotov za ispit s profesora po Ezikoznanie. hazır.tk.eril için sınav.tk.eril ile profesör.tk.eril Dilbilim Dilbilim profesörü ile sınav olmaya hazırlıklı.

(33)

(71)

Bulgarca’nın cümle yapısında her zaman aşağıdaki şemaya uyulmalıdır. belirleyici ana kelime tamamlayıcı egnar

egnar egnar

5.SİSTEM TASARIMI

Bu bölümde geliştirdiğimiz çeviri projesinin tasarım bilgilerini vereceğiz. Bölüm 5.1 de sistemin Üst Düzey Tasarımını, Bölüm 5.2 de ise Ayrıntılı Tasarımını sunacağız.

5.1. Üst Düzey Tasarım

Tasarladığımız sistem üç temel bileşeni olan bir Doğal Dil İşleme mekanizmasıdır. Bu yapı Şekil 5.1.’de gösterilmiştir.

AdjP conj NP s CP Adj gotov PP PP N profesora Adj za P po NP PP ispit NP PP ezikoznanie

(34)

Şekil 5.1. Doğal Dil İşleme Mekanizması

Şekil 5.1.’i inceleyecek olursak sisteme Bulgarca cümle (girdi) verilerek Türkçe cümle (çıktı) alınmaktadır. Doğal Dil İşleme mekanizması üç temel birimden oluşmaktadır. Bunlar Sözlük (Lexicon), Öbek Oluşturma Kuralları (Phrase Structure

Rules) ve Ayrıştırıcıdır (Parser). Sözlük biriminde çeviri işleminde kullanılacak

Bulgarca kelimeler ve Türkçe karşılıkları yer almaktadır. Öbek Oluşturma Kuralları biriminde adından da anlaşılacağı gibi çeviri işleminin gerçekleşebilmesi için bir dilbilim formatına uyup uymadığına ilişkin ve Türkçe çeviride kullanılacak kurallar yer almaktadır. Ayrıştırıcı bölümünde ise çeviri işleminin gerçekleşebilmesi için kullanılacak metod belirlenmiştir.

Yaptığımız çalışma Türkçe ve Bulgarca’nın bütün kelimelerini içermemektedir. Bu yapıyı eksiksiz bir sözlük kullanarak oluşturmak mümkün değildir. Bundan dolayı sözlüğümüzü belirli bir sayıda örnek kelimeyle oluşturduk.

5.2. Ayrıntılı Tasarım

Doğal Dil İşleme mekanizmasının üç temel birimi kendine özgü işlemler yürütmektedirler ve bir arada kullanılmadıkları sürece kendine yeterli bir bütün oluşturamazlar. Aşağıdaki metinde her bir bölüm ayrıntılı olarak anlatılacaktır.

5.2.1. Sözlük

Sözlük Öbek Oluşturma Kuralları

Ayrıştırıcı

Öbek Oluşturma Kuralı Sözcük

Türkçe cümle Bulgarca cümle

(35)

Belirlediğimiz çerçeve içinde Sözlük sistemde kullanılan kelimelerin tanımlarının bulunduğu bir listedir. Bilinen sözlüklerden önemli bir farkı kelimelere ilişkin ayrıntılı teknik bilgi içermesidir. Bu bilgiler Özellik-Değer Matrisleri (Attribute-Value Matrices) formatında kodlanmıştır. Bir Özellik-Değer Matrisi her bir değerin bir başka Özellik-Değer Matrisi olabileceği özellik-değer ikilisi kümesidir. Örnek cümlemizden aldığımız bir kelimenin özellik-değer matrisi aşağıdaki gibi olacaktır:

(72) PHON : < dete> cat : noun SYN : gender : neut num : sg TUR : < çocuk >

Sözlükteki tüm kelimeler sessel ve sözdizimsel bilgilerin ve Türkçe karşılığın verildiği üç temel özelliğe sahiptir. PHON (PHONOLOGY) değeri, fonolojik ve fonetik yorum için temel öğe vazifesi görür ve kelimenin ses içeriğini ifade etmek için kullanılır. SYN (SYNTAX), cat (category - kategori), gender (cinsiyet) ve num (number - sayı) olmak üzere üç alt özellikten oluşur. TUR (TURKISH) bölümünde ise kelimenin Türkçe karşılığı yer almaktadır.

(72)’de örnek olarak dete kelimesinin basit bir özellik-değer matrisi gösterimi verilmiştir. Uygulamamızda büyük (>) ve küçük (<) işaretleri listenin kısa bir tanımını vermek için kullanılmakta ve <> ile de boş liste gösterilmektedir.

5.2.2. Öbek Oluşturma Kuralları

Kelime veya kelime öbeklerinin bir araya gelerek oluşturduğu kelime öbekleri, dilbilimsel nesnelerin ikinci alt grubunu teşkil etmektedirler. Öbek yapılarının nasıl oluşturulacağı Öbek Oluşturma Kuralları tarafından belirlenmektedir. Gramerimizdeki tüm Öbek Oluşturma Kurallarının temeli olan iki kural aşağıdaki gibidir:

(74) XP → Y(P), Xbar Xbar → Z(P), X

(36)

Bu gösterimde okun sol tarafındaki elemanın sağındaki elemanlardan meydana geldiği ifade edilmektedir. Daha önce de belirttiğimiz gibi X, Y ve Z sözlüksel sınıf sembolleri yerine kullanılan meta-değişkenlerdir. P (Phrase), kelime öbeği yerine kullanılırken parantez içinde ifade edilmesi ise bu elemanın sözlüksel bir kelime ya da öbek olması durumunun değişebileceğine işaret eder. Örnek olarak aldığımız (1)’deki cümle için sistemimizde iki kategoride kelime öbeği bulunmaktadır. Bunlar, Belirteç Öbeği (Determiner Phrase) (DP) ve Fiil Öbeği’dir (Verb Phrase) (VP). Aşağıda bu kelime öbeklerinin nasıl oluşturulduğunu tanımlayan kurallar gösterilmektedir.

(75) DP Æ det, noun (76) S Æ DP + V (77) DP

det noun edno dete

“edno dete” bir DP’dir ve (75)’deki kural uygulanarak elde edilir. Benzer kurallarla bütün yapılar elde edilir.

Örnek cümlemizin (‘edno dete spi’ (bir çocuk uyuyor)) ağaç analizi aşağıdaki gibi olacaktır:

(78)

İnceleme ağaç yapısının en alt yaprağından başlar. Cümledeki özne (isim-noun) alınır, dete, karşılığı olan türkçe kelime bulunur, çocuk. Bulgarca’da ismin solunda

DP V’ S det edno verb spi noun dete

(37)

bulunan edno belirteci (determiner) ile bir Belirteç Öbeği oluşturur. Edno’nun karşılığı alınır (bir) ve ilgili öbek Türkçe’ye çevirilir: bir çocuk.

Daha sonra ismin Bulgarca’da genellikle sağında yer alan fiil ile bir cümle oluşturur. Spi’nin karşılığı (uyuyor) alınarak cümle tamamlanır.

(79) Bir çocuk uyuyor.

Bu işlemler gerçekleşirken kelime tanımlarında SYN kategorilerinin alt kategorileri itibariyle birbirleriyle uyum içinde olduğuna dikkat edilmelidir.

Yaptığımız çalışma daha önce bahsedildiği üzere temel dilbilim kurallarına dayanarak oluşturulduğu için her tür sözcük ailesinden birkaç örnek alarak tümü için geçerli bir yapı oluşturulmaya çalışılmıştır. Aşağıda yazılı olan öbek türleri yapıda yer almıştır:

İsim Öbeği (Noun Phrase) Fiil Öbeği (Verb Phrase) Sıfat Öbeği (Adjective Phrase)

Öbek grupları gösteriminde de Bulgarca’da kullanılan öbek grubu türlerinden her birini tanımlayarak açıkladık. Bu grupları içeren basit cümleler de çevirilebilmektedir.

Bütün bu program parçaları kendine özgü işlemler yürütmektedirler ve daha önce söylediğimiz gibi bir arada kullanılmadıkları sürece bir bütün oluşturamazlar. Her bir bölüm ayrıntılarıyla anlatılacaktır.

Öncelikle belirtmeliyiz ki, yaptığımız çeviri tamamen sözdizimsel tabanlıdır. Bu nedenle performansı diğer faktörlerin yanında bu yönüyle de kısıtlıdır. Örneğin bağlam bağımlı bilgilerle çözülebilecek çok-anlamlılık durumları çözüme kavuşturulamamaktadır. Cümlenin anlamı ve dolayısıyla çevirisi Compositionality

Prensibi’ne dayanarak oluşturulmaktadır.

(38)

Belli kuralları göz önünde bulundurarak Bulgarca’da kelime bulunduktan sonra Türkçe karşılığı tespit edilerek, kelimenin türü, cümlede aldığı pozisyon belirlenerek kelimeyi ve dolayısıyla cümleyi çevirerek ekrana getirmektedir. Bu işlemleri adım adım aşağıdaki örnekte göstereceğiz. Öbek yapıları birleştirilerek daha üst yapı olan cünleye erişilmektedir. Sözdizimsel olarak paralellik olup olmadığı incelenir, çeviri yapılır. Henüz bu işlem kelimelerin klavyeden girişi ve çeviri metninin de tekrar ekrana yazılışıyla gerçekleşmektedir. Giriş olarak verilen cümle :

(80) Edno dete spi. Bir çocuk uyuyor.

5.2.3.Ayrıştırıcı

Sistemin “dış dünyayla” etkileşimini ayrıştırıcı sağlamaktadır. Temelde çıktı olarak Türkçe cümle ve anlam nesnesi oluşturma görevini üstlenmiştir. Bu görev ayrıştırıcıya girdi olarak ya bir cümlenin ya da bir anlam nesnesinin anlamının işlenmesi şeklinde verilebilir. Ayrıştırıcıya işlemesi için cümle verilirse, çıktı yine bir cümle, öbek verilirse çıktı yine öbek olacaktır. Ayrıştırıcının fonksiyonlarından biri girdi için verilen yapının anlamlı ve uygun bir yapı olduğunu teyit etmektir.

Yukarıda belirtildiği gibi ayrıştırma işleminin temelinde girdinin gramatikal olarak kontrol edilmesi işlemi vardır. Tahmin edileceği gibi böyle bir işlem hedef dilin gramerine bağlı olacaktır. Gramer bilgisinin iki önemli bileşeni sözlük ve öbek oluşturma bilgileridir. Öncelikle dilin temel birimleri ya da kelimeleri belirlenir ardından daha büyük parçaların (kelime gruplarının) oluşturulması için bu birimlerin ne şekilde bir araya getirileceği belirtilir. İsimlerinden de açıkça anlaşılacağı gibi bu iki sınıf sırasıyla Sözlük ve Öbek Oluşturma Kuralları denilen alt birimler içinde saklanmaktadır. Ayrıştırıcı girdi ifadesini gramatikal olarak kontrol ederken bu bileşenlere başvurur. Onların “onayı” sonrasında ise sözlükte yer alan Türkçe ifadeyi alır ve tekrar gramatikal doğruluğunu kontrol eder. Neticeye ulaşılınca ise çıktı olarak çevirilmiş cümle gönderilir.

egnar egnar

(39)

egnar egnar

6. SİSTEM GERÇEKLEMESİ

Bu bölümde program kod bazında açıklanacaktır. Sırasıyla, genel olarak programın parçaları, sözlükteki (Lexicon) kelimelerin çeşit bazında özellikleri, öbek oluşturma kurallarımız (Phrase Structure Rules), ayrıştırıcı (Parser), öperatör tanımlama kuralları (Operator) ve tümünü ortaklaşa derlediğimiz compiler bölümlerinden bahsedilecektir.

Operator bölümünde kodlamada kullanılacak öperatör tanımları verilmiştir.

Prolog, bazı istisnalar dışında, varsayılan durum olarak operatörleri ‘prefix’ notasyonunda kabul eder. Kod okunurluğunu artırmak için biz baz operatörleri (&, ::

ve ==> gibi) ‘infix’ notasyonunda kullanacağız. Bu nedenle aşağıdaki bildirimlere

ihtiyacımız olacak:

(81) :- op(750,xfy,::).

:- op(800,xfy,&). :- op(850,xfy,==>).

(40)

6.1. Sözlük Özellikleri

Sözlükteki kelimeler için tanıtılan özellikler aşağıdaki gibidir: (82) fon : < fonetik içerik >

syn : < sözdizimsel içerik> tur : < türkçe karşılık >

Burada phon ile gösterilen özellik aslında kelimenin kendisini, yazılışını ifade eder. Phonology teriminin kısaltılmasıdır.

SYN kelimenin sözdizimsel özelliklerini ifade eder. Syntax teriminin

kısaltılmasıdır. Bu kısım alt kategorilere sahiptir. Alt kategorilerin anlamları sırasıyla şöyledir:

cat (category) kelimenin cinsini (isim, fiil, sıfat v.s. olduğunu) belirler. num (number) - kelimenin nicel özelliğini belirtir

per (person) - kelimenin şahıs özelliğidir (tekil, çoğul)

gen (gender) - kelimenin cins özelliğidir (masc : eril, fem : dişil, neut : nötr)

Bulgarca’da eril ve dişil cinsleri (gender) dışında birde nötr cinsi mevcuttur.

trk (turkish) ile de türkçedeki anlam ve özelliklerini vermeye çalıştık. Bu alanda

da kelimenin türkçe anlamını verdik.

Kelimeleri tanımladığımız genel çerçeveyi sunduk. Fakat bazı kelime türleri içn bu tanımlamalar daha ayrıntılı olabilmektedir. Bu farklılıklar ayrı ayrı kategorileri incelediğimizde verilecektir.

6.2. Sözlükteki Kelime Türleri

(41)

İsimler, Sıfatlar, Fiiller / Yardımcı Fiiller ve Belirteç.

6.2.1. İsimler

Bir ismin Prolog’daki tanımı aşağıdaki gibidir:

(83) word(phon::dete &

syn :: (cat :: noun & gender :: neut & num :: sg) & turkish :: 'çocuk').

Buradaki gösterim dete’nin bir isim olduğunu, cinsiyetinin nötr ve tekil olduğunu ifade etmektedir.

6.2.2. Sıfatlar

Bulgarca’da sıfatların özellikleri Türkçe’dekilerine göre daha farklı olduğundan bu bölümde diğerlerine göre değişik bir çalışma yapılmıştır. Daha önce de belirttiğimiz gibi programda bir morfolojik analiz modülü olmadığından, kelimeler takılarıyla birlikte girilmişlerdir. Burada bir sıfatın bulgarca 4 farklı hali olabilir: Üç tekil ve bir çoğul. Örneğin ‘malık’ (küçük) kelimesindeki durumu inceleyelim.

Burada ‘malık’ kelimesini sözlükte dört kez (malık, malka, malko, malki) tanımlıyoruz.

(84) word(phon::malik &

syn :: (cat :: adj & gender :: masc & num :: sg) & turkish :: 'küçük').

(85) word(phon::malka &

syn :: (cat :: adj & gender :: fem & num :: sg) & turkish :: 'küçük').

(86) word(phon::malko &

syn :: (cat :: adj & gender :: neut & num :: sg) & turkish :: 'küçük').

(87) word(phon::malki &

syn :: (cat :: adj & gender :: _ & num :: pl) & turkish :: 'küçük').

İlk üç örnekte tekil (num :: sg) tanımı, fakat cinsiyet (gender) farklılığı

(42)

durumlardır. Dördüncü (95) örnekte ise çoğul (num :: pl) ve bütün cinsiyetler (gender :: _) için geçerli bir tanımdır.

6.2.3. Fiiller

Fiiller de daha önce belirttiğimiz standartlarla tanımlanacaktır, fakat burada ek olarak bir zaman belirleyicisi de bulunmaktadır. Bulgarca’da da fiiller cümlenin zamanını belirttiği için bir zaman göstergesi de eklenmiştir.

(88) word(phon::kupih &

syn :: ( cat :: verb & gender :: _ & num :: sg & tense :: past) & turkish :: 'aldım').

Zaman gösterimindeki isimlendirme ingilizce olarak tanımlanmıştır. Örnekte olduğu gibi geçmiş zaman için ‘past’ ifadesi kullanılmıştır.

6.2.4. Belirteçler

Bulgarca’da belirteçlerin özellikleri aynı sıfatlar gibi Türkçe’dekilerine göre daha farklıdır. Bir belirtecin Bulgarca’da 4 farklı hali olabilir: üç tekil ve bir çoğul. Örneğin ‘edin’ (bir) kelimesindeki durumu inceleyelim.

Burada ‘edin’ kelimesini sözlükte dört kez (edin, edna, edno, edni) tanımlıyoruz.

(89) word(phon::edin &

syn :: (cat :: det & gender :: masc & num :: sg) & turkish :: 'bir').

(90) word(phon::edna &

syn :: (cat :: det & gender :: fem & num :: sg) & turkish :: 'bir').

(91) word(phon::edno &

syn :: (cat :: det & gender :: neut & num :: sg) & turkish :: 'bir').

(43)

syn :: (cat :: det & gender :: _ & num :: pl) & turkish :: 'bir').

Burada ilk üç örnekte tekil (num :: sg) tanımı ve farklı cinsiyet (gender)

tanımları. Dördüncü örnekte ise çoğul (num :: pl) ve tüm cinsiyetler için geçerli bir

tanım gösterilmiştir.

6.2. Öbek Oluşturma Kuralları

Öbek oluşturma kurallarının nasıl oluşturulduğunu daha önce Bölüm 5.2.2’de açıklamıştık. Burada bu kuralların programımızda uygulanışına değineceğiz. Aşağıdaki kuralı örnek alacak olursak:

(93) NP Æ adj, noun

okun sol tarafında yer alan NP (Noun Phrase), anlaşıldığı üzere bir adj (sıfat) ve bir noun’dan (isim) oluşmaktadır. Bulgarca’nın özelliği doğrultusunda sıfat ve isim öbek oluşturabilmeleri için şahıs (number) ve cinsiyet (gender) özellikleri birbirine uymak durumundadır. Aşağıdaki Prolog kodunda bu kontrolü görebiliriz:

(94)

((syn::(cat::np & gender::GENDER & num::NUMBER)) & turkish::TURKISH) ==> [(syn::(cat::adj & gender::GENDER & num::NUMBER) & turkish:: TURKISH1), (syn::(cat::noun & gender::GENDER & num::NUMBER) & turkish:: TURKISH2)]

:- concat(TURKISH1, ' ', TURKISH11), concat(TURKISH11, TURKISH2, TURKISH).

GENDER, NUMBER ve TURKISH olarak tanımlanan değişkenler sözlükten alınan kelimenin kontrolünü gerçekleştirmektedir. Sıfat ve isim için alınan GENDER ve NUMBER değerleri aynı olduğunda öbek oluşturulur ve ‘concat’ komutuyla birleştirilerek çevirilmiş (Türkçe olarak) cümle ekrana yansır.

6.3. Ayrıştırıcı

Programda ayrıştırıcı (parser) olarak görev yapan kod parçası (101)’de görülebilir.

(44)

(95) parse([syn::_SYN & turkish::TUR],[], TUR). parse([X,Y|Rest], String, TUR)

Z ==> [Y, X],

parse([Z|Rest], String, TUR). parse(Stack, [Word|Words], TUR)

word(phon::Word & syn::SYN & turkish::TUR1),

parse([(syn::SYN & turkish::T1)|Stack], Words, TUR). parse([X|Rest],String,TUR)

Y ==> [X],

parse([Y|Rest], String,TUR).

Bu basit bir ayrıştırıcıdır. İlk dikkat çekilmesi gereken kısım Prolog programlamanın özyinelemeli yapısı sebebiyle durma şartı (base case) olarak belirleyebileceğimiz kuraldır. Eğer geçerli bir cümle elde edilebilmiş ise çeviri yapılır ve bu kural ile işleme son verilir. Ayrıştırıcımız cümlenin bileşenlerinden başlayarak yukarı doğru temel bileşenlerden öbekleri ve öbeklerden de cümleyi oluşturacak/geçerliliğini denetleyecek bir yapıdadır. Bu mekanizma tabandan yukarı (bottom-up) olarak çalışmaktadır. İkinci kural son giren ilk çıkar (LIFO - Last In First Out) algoritması ile çalışan yığında (stack) en az iki eleman varsa bunları birleştirerek bir öbek oluşturup oluşturamayacağına bakar. Bunu yaparken öbek oluşturma kurallarından faydalanır. Eğer bir öbek oluşursa bu yeni oluşturduğu yapıyı yığına ekler ve işlem devam eder. Belirtilmesi gerek ki ayrıştırıcı yığından her defasında iki eleman alarak işlem yapmaktadır. Bu durum da öbek oluşturma kurallarımızın ikililer biçiminde tanımlanmasından kaynaklanmıştır. Daha gelişmiş ayrıştırıcı modelleri mevcuttur (bkz. Gazdar ve Mellish 1989, Allen 1995). Son olarak da geçerli bir cümle elde edilememiş ise ve yığında ikiden az eleman varsa veya varolan elemanlardan bir öbek oluşturulamadıysa çalışmaktadır. Kullanıcı tarafından girilen kelimenin sözlükte olup olmadığına bakılır. Sözcüğü bulduktan sonra yazımı (programımızda phon özelliği olarak belirtilmiştir) hariç diğer bütün özelliklerini yığına atar. Sözcük varsa çevirilmiş halini döndürür, değilse olumsuz cevap döndürür

(45)

Yıllardan beri süren anadili Türkçe olanlarla Slavca olanlar arasındaki dil engelini otomatik çeviri teknolojisi ile aşmak mümkün olduğu görülmüştür. Her geçen gün bu işleme duyulan ihtiyaç gittikçe artmaktadır. Ülkeler arası izlenen yakınlık ve ortak çalışma alanları yeterince geniş bir çapta ilerlemektedir. Günümüzde Slav dillerin diğer dillerle ilişkili bir çeviri mekanizması henüz ihtiyaç duyulan boyuta ulaştırılmamıştır. Slav dillerine örnek olarak Bulgarca’yı inceledik.

Bu çalışmada Bulgraca’daki bir cümle veya öbeği Türkçe bir cümle veya öbeğe çevirebilecek bir yazılım modeli geliştirmeği amaçladık. Bu doğrultuda attığımız ilk adım sayılabilir. İlk aşamada bir çeviri modeli oluşturduk. Bu modeli küçük bir Prolog yazılımıyla hayata taşıdık. Program Sözlük, Öbek oluşturma kuralları ve Ayrıştırıcı olmak üzere üç temel birimden oluşmaktadır. Sözlük bölümünde kelimlerin çeşit bazında özellikleri ve Türkçe karşılıkları verilmiştir. Öbek oluşturma kuralları bölümünde kelime veya kelime öbeklerinin bir araya gelerek oluşturduğu öbek yapıları belirlenmiştir. Ayrıştırıcının fonksiyonlarından ilki girdi olarak verilen yapının anlamlı ve uygun bir yapı olduğunu teyit etmektir. Sonrasında ise sözlükte yer alan Türkçe kelime karşılıklarını alarak gramatikal doğruluğunu kontrol ettikten sonra çevirilmiş metin olarak ekrana göndermektedir.

Yaptığımız çalışmada tamamlanacak birçok eksik vardır. Öncelikle alfabe farklılığın aşılması. Bu çalışmada Bulgarca metinleri de Latin alfabesiyle kullandık. İleriki aşamalarda gerçekleştirilmesi planlanan bir hedef olarak programa “öğrenme mekanizma”sının eklenmesidir. “Öğrenme” sözlüğe kelime eklemesi olduğu gibi, çeşitli gramer kurallarının da eklenmesi mümkün olmalı. Bunun yanısıra unutulmaması gereken önemli bir nokta da “anlam modülü”nün eklenmesidir. Gramere ilişkin bazı çok anlamlılık durumların çözümünü sağlayacak olan bölüm. Gelecekte yaptığımız çalışmaları da bu yapının üzerine “inşa ederek” daha verimli ve insanlığa yararlı sonuçlar elde edeceğimize inanıyoruz.

KAYNAKLAR

ALLEN J., Natural Language Understanding, Benjamin/Cummings Pub. Co. , Redwood City, Calif., 1995.

Referanslar

Benzer Belgeler

İstanbul Kültür ve Turizm Müdürlüğü’nün verilerine göre 2016’da İstanbul’a gelen yabancı turist sayısı, bir önceki yıla göre yüzde 26 düştü.. Türkiye’ye gelen yabancı

Padişahlara bile hizmet etmiş Sultaniye Kaplıcaları da Dalyan’ın hemen dibinde… Dustin Hoffman, Sting gibi ünlüleri de konuk eden çamur banyoları da

Var olan paralel metinlerden en yüksek verimi almak ve diller arasındaki yapısal farklılıkları en aza indirmek için biçimbirimsel analiz yapılarak ekler kelime

Özellikle konu geleneksel folklorik doku ile doğrudan ilgili ise, dil-kültür ilişkisinin belirleyiciliği çeviride göz ardı edilemeyecek kadar önem taşımaktadır

Buna bağlı olarak ünlemlerin dilde ister konumu, ister işlevi, ister tanımı farklılıklar göstermektedir (Akalın,Ş.H.,1999/477) ve bu durum karşılaştırmalı

Yazışma metinlerinin çeviri açısından incelenmesi sonucunda, Türkçe ve Fransızca mektup ve e-posta türlerinin gerek dilsel gerekse kültürel açıdan içermiş olduğu

Önsözden sonra Açkı başlığı altında Bulgarca Alfabesi, matbaa yazısı ve el yazısı olarak gösterilmiştir. Üç harf hariç, her harfin karşısına Arapça

Socialist Literature Co. Kadın ve Sosyalizm. Sabiha Zekeriya Sertel). Dün ve Yarın Tercüme Külliyatı, Sayı 33. İstanbul: Takvim Gazete Matbaa Kütüphane. Kadın ve Sosyalizm.