• Sonuç bulunamadı

Türkçe için Bilgisayarl Artgönderim Çözümleme Çal³malar

Türkçe'ye yönelik dilbilimsel çal³malarn bollu§una kar³n bilgisayarl dilbilim- sel çal³malar çok fazla de§ildir. Artgönderim çözümlemesi için de bu durum geçerlidir. Türkçe için yaplan ilk bilgisayarl çal³malardan biri

[Tn ve Akman, 1994] tarafndan yaplm³tr. Durum Anlambilimini (Situ- ation Semantic) temel alan bir çerçeve sunulmu³tur. Bilgisayarl bir çerçeve içinde çözüm sunan bu yap BABY-SIT olarak adlandrlm³tr. Bu durum te- orisine göre bir söylem yapsn bireyler, onlarn özellikleri, birbirleri arasndaki ili³kileri ve durumlar belirler. Ancak bu teorik çerçevede sunulan bilgisayarl model deneysel bir sonuç sunmam³tr. Dolaysyla bir ba³ar oran belirtilme- mi³tir.

[Turhan-Yöndem ve “ehito§lu, 1997] tümce içi bo³ artgönderimler için öbek-yap dilbigisi çerçevesinde bir çal³ma sundular. Bu çal³mada bo³ art- gönderimlerin çözümünün tümce bile³enlerinin srasna ba§l oldu§unu belirtil- mi³tir. HPSG (Head-Driven Phrase Structure Grammar) dilbilgisi tabanl bir ayr³trc kullanlm³tr. Çal³mada vurgulanan bir ba³ka nokta ise çözümleme- nin anlambilimsel ba§lantlara ba§l oldu§udur. Konu³ucular ve dinleyicilerin

artgönderimlerin çözümü için anlambilimsel ba§lantlar kullandklar belirtil- mi³tir.

[Yüksel ve Boz³ahin, 2002] önerdikleri sistemde ba§lama teorisi ve mer- kezleme teorisi için baz kurallar kullanarak yerel ve yerel olmayan gönderimleri modellemi³lerdir. Yerel gönderimler ba§lama kuramnn temel kurallarna göre yaplandrlm³tr. Yerel olmayanlar tümce d³ bir gönderim çerçevesinde ele alnm³tr. Çal³mann içerdi§i bir di§er konu ise Türkçe'nin adl dü³ürme yaps ile ilgildir. Bu ba³lk altnda adllarn nasl dü³tü§ü ya da nasl bo³ artgönde- rime dönü³tü§ü tart³lm³tr. Bu bilgisayarl yakla³m deneyi makine çevirisi sisteminde test edilmi³tir ve ba³ar oran %70 olarak kaydedilmi³tir.

[Tüfekci ve Klçaslan, 2005] Hobbs Algoritmasn Türkçe metinler üze- rinde uygulam³tr. Bu uygulamada kendi olu³turudu§u derlem üzerinde deney- lerini gerçekle³tirmi³tir. Kullanlan model tümcelerin ayr³trma a§açlar üzerin- den bir analiz yapar. Dolaysyla her bir tümcenin ayr³trma a§ac da derleme girilmi³tir. Bu çal³mada elde edilen ba³ar oran % 84 olarak belirtilmi³tir.

[Küçük, 2005] ve [Küçük ve Turhan, 2007] az bilgili adl çözümleme modeli sunmu³tur. Sistem snrl dilbilimsel ve anlamsal bilgi kulland§ için az bilgili bir model olarak ifade edilmi³tir. Kural tabanlu bu çal³mada ise % 85.3 anma ve % 88 kesinlik sonuçlarna ula³lm³tr.

Bölüm 4

TÜRKÇE ÇN ARTGÖNDERM

ÇÖZÜM DENEMELER

Bu bölümde Türkçe için artgönderim çözümünün nasl uyguland§ anlatlacak- tr. Bir çok farkl algoritma snanarak, ortaya çkan sonuçlar üzerinden bir tar- t³ma olu³turulacaktr. Asl amacmz farkl yakla³mlar Türkçe metinler üze- rinde ne gibi tepkiler verdi§ini incelemektir. Bu deneyler daha sonraki deneylerin için yol gösterici oldu§una inanmaktayz.

Di§er diller için, özellikle ngilizce için son yirmi ylda birçok hesaplamal model ve yakla³m sunulmu³tur. Oldukça fazla sayda olan bu çal³malarn ön plana çkanlar önceki bölümlerde tart³ld. Bu a³amadaki amaç bu yakla³m- lardan bazlarn ele alarak Türkçe için uygulanabilirli§ini, nasl uygulanaca- §n ve sonuçlarn tart³maktr. Tart³madaki en önemli vurgu Bilgi Tabanl (Knowledge-Based) yakla³mlarla Ö§renme Tabanl yakla³mlarn kar³la³trl- masdr. ki ayr yakla³mn Türkçe derlem üzerindeki etkisi sonuçlar ekseninde de§erlendirilecektir.

4.1 Derlem

Bu çal³ma kapsamndaki en önemli unsurlardan biri, üzerinde deneylerimizi gerçekle³tirece§imiz Türkçe derlemdir. Türkçe için bir kaç derlem çal³mas ya- plm³tr. Ancak bu derlemlerden ara³trmaclara açk olanlar eksik bilgiler içer- mektedir. Özellikle söylem analizleri için çok uygun de§ildir. Çünkü derlemin içerdi§i söylemler sral ve tutarl tümcelerden olu³mamaktadr. Tümce düze- yindeki çal³malar için uygun olmasna kar³n, söylem düzeyi için çok uygun- de§illerdir. Bir ba³ka olumsuzluk ise artgönderimsel ili³kilerin bu derlemlerde belirtilmemi³ olmasdr. Bu çal³mada ihtiyaç duyulan ve üzerinde deneyler ya- placak olan derlemin artgönderimsel ili³kilerinin belli olmas gerekir. Bu neden- den dolay 20 farkl çocuk hikayesinden olu³an bir örnek derlem olu³turulmu³tur. Bu derlemin toplam 10165 kelimeden olu³ur ve içindeki adl says ise 1114'tür. Bu adllar tiplerine ve derlemdeki oranlarna göre ³u ³ekilde sralanr;

1. %82.3 ki³isel adl (personal pronoun) 2. %6.6 yerel adl (locative pronoun) 3. %10.7 dönü³lü adl (reexive pronoun ) 4. %0.4 kar³lkl adl (reciprocal pronoun).

Derlem özellik-de§er ³eklinde bir veritaban tablosu olarak kaydedilmi³tir. Bu derlemin özelliklerini ³u ³ekilde sralayalm.

• Durum Eki: Adln ya da aday öncülün dilbilgisel durum eki; Yaln hali, Belirtme Hali, Yönelme Hali, Ayrlma Hali, lgi Hali, Bulunma Hali

• Açklk : Bir adln açk ya da bo³ olup olmad§

• Adl Tipi : Olas adl tipleri ki³isel, yerel, dönü³lü ve kar³lkl.

• Anlamsal Tip : Bir ö§enin olas anlamsal tipleri insan, hayvan, bitki, yer, cansz varlk ve soyut varlk olabilir.

• Ki³i Say: Ki³i say bilgisi bir ö§enin tekil-ço§ul olma durumu ile 1., 2. ve 3. ki³i olma durumu.

• Pozisyon: Ö§enin hangi söylemde, hangi tümcede ve hangi srada ol- du§u

• Öncül Pozisyonu Bir adln i³aret etti§i öncülün pozisyonu

• Gönderimsel fade: Bir söylem varl§nn gönderimsel ifade olup ol- mad§

Yaplan tüm artgönderim çal³malarnda kullanlan özellik says

([McCarthy ve Lehnert, 1995.]) 8'den ([Aone ve Bennet, 1995.] )66'a kadar de- §i³ebilmektedir. Sistemimiz yar otomatik oldu§u için bu özelliklerin bir ksm elle bir ksm yardmc kütüphaneler ile otomatik olarak gerçekle³tirilmi³tir. Özelliklerin elle girilmesi için java ile yazlm³ bir arayüz tasarladk. “ekil 4.1'de de görülen arayüz ile derleme yeni söylemler girebiliyoruz ve onlar güncelle- yebiliyoruz. Kullanlan bu arayüz ayn zamanda web tabanl bir versiyona da sahiptir. Bu web arayüzü ile birçok ki³i ayn anda sisteme ba§lanp söylem dahil edebiliyor.

Derlemdeki bu özelliklerin bazlar yardmc kütüphaneler kullanlarak oto- matik girilmi³tir. Bu açdan olu³turulan sisteme yar-otomatik artgönderim çö-

“ekil 4.1: Derlem Girme ve Güncelleme Arayüzü

zümleme sistemi denebilir. Bu yardmc kütüphanelerden biri biçimbilimsel ana- liz yapan Zemberek Kütüphanesidir 1

Girilen söylemlerin geni³li§i içerdi§i adllarn gönderimde bulundu§u öncül- leri kapsayacak ³ekilde belirlenmi³tir. Yani gereksiz tümceler söylemden çkar- lm³tr. Bu nedenden adllarn oran çokmu³ gibi durmaktadr. Her bir adln öncülü mutlaka söylem içerisinde bulunmaktadr. Derlemdeki en büyük söylem 26 tümceden olu³ur.