• Sonuç bulunamadı

4.3 Bilgi Tabanl Çözüm Önerileri

4.3.2 Belirginlik Tabanl Çözüm Önerisi

Artgönderim çal³malarnn en önemli yakla³mlarndan biri [Lappin ve Leass, 1994] tarafndan önerilmi³ RAP algoritmasdr. Bu yakla³ma benzer bir sistem ise [Mitkov, 2002]'un sundu§u MARS sistemidir. Bu yöntemler sadece ngilizce için de§il Lehçe, Arapça, ve Norveççe için de ba³arl bir ³ekilde uygulanm³tr. n-

gilizce d³ndaki di§er diller için, bu yöntemler basit bir de§i³iklik ile uygula- nabilmi³tir. Türkçe için de basit bir de§i³iklikle bu yöntem bu tez kapsamnda uygulanm³tr. Bu yöntem belirginlik temmellidir ve sözdizimsel bilgi kullanmas açsndan az bilgili sistemdir. Yöntem aday öncüllere, özelliklerine bakarak belli puanlar verir. En çok puan alan öncül asl öncül olarak seçilir.

Dolaysyla bu noktadaki en temel soru puanlamann nasl belirlenece§idir. Örne§in ngilizce için dü³ünüldü§ünde dilbilgisel i³lev özelli§i, en önemli özel- liktir ve bu yüzden en çok puan bu özellik alr. Ancak her dilde bu böyle olmayabilir. Örnek olarak [Holen, 2007] Norveççe için yapt§ çal³mada özne pozisyonunun belirginlik için önemli olmad§n vurgulam³tr. Türkçe için ba- kld§nda bu özelli§in önemli oldu§u söylenebilir. Dolaysyla bu tez için olu³- turulan sistemde Özne dilbilgisel görevine sahip ö§eler nesne konumunda olan ö§elere göre daha çok puan alacaklardr. Say, ki³i ve cinsiyet ise di§er sözdizim- sel özelliklerdir. Söz konusu adl ile o adlla say ve ki³i uyumu gösteren öncüller di§er öncüllere göre daha çok puan alr. Öte yandan ngilizce için kullanlan cinsiyet kodlamas Türkçe'de olmad§ndan bu bilgi kullanlmayacaktr. Tüm bu belirginlik etkenleri a³a§daki ³ekilde sralanabilir:

• Özne Etkeni: Bu etken daha önce de bahsedildi§i gibi en önemli un- surlardan biridir ve Türkçe için bu durum geçerlidir. Merkezleme Teorisi tabanl yakla³mda da görüldü§ü gibi, özne pozisyonunda bulunan mer- kezin de§i³meme e§ilimi vardr. Özne pozisyonundaki ö§eler ço§u zaman bo³artgönderim halinde sürekli kendilerini var ederler.

Ali sabah okula gitmek için evden ayrld. lk olarak kalabalk bir yoldan kar³ya geçti.

Yukardaki söylemde görüldü§ü gibi özne pozisyonundaki söylem varl§ Ali, özne pozisyonundaki bo³artgönderimlerle sürekli tekrarlanr. Bazen uzun hikayelerde bu durum çok daha uzun olur ve artgönderim çözümü de o derece basit olabilir. Bu anlamda özne pozisyonundaki ö§elerin bo³art- gönderimlerle sürekli tekrarlanmas ya da gönderimsel ili³ki içinde olmalar Türkçe için oldukça sk görülen bir durumdur.

Türkçe metinlerde özne de§i³ikli§i ba³ka bir söylem olu³turmak için kul- lanlr. Her zaman bu kural geçerli olmasa da ço§unlukla yeni bir söylemin snrlarnn i³areti oldu§u söylenebilir.

• Nesne Etkeni: E§er öncül dolaysz nesne pozisyonunda ise belli bir puan alabilir. Ancak Özne Etkenine oranla daha az puanlanr.

• Ki³i/Say Uyumu: Bu özellik en önemli özelliklerden biridir. Çünkü bu uyum içinde olmayanlar genellikle gönderimsel bir ili³ki içinde bulun- mazlar. Genellikle demek zorundayz çünkü bunun kurald³ durumlar da vardr. Örnek olarak aile, takm, gurup gibi ço§ul eki almayan sözcükler biz, siz, onlar ço§ul artgönderimlerle ifade edilebilirler. Ya da iki söylem varl§ sisteme dahil olmu³³a bunlar daha sonra ço§ul bir artgönderimle ifade edilebilirler.

Ali ve Ay³e sabah erken kalkarlar.

Çünkü onlar günlerini daha iyi geçirmek isterler. (4.16)

Bu örnek görüldü§ü gibi Ali ve Ay³e söylem varlklar iki ayr ve tekil ifadelerdir. Ardndan ikisine ortak bir ço§ul artgönderim olan onlar gön- derimde bulunur.

• Adls Vurgusu: E§er öncülün kelime tipi adl ise bu öncül adl olmayan- lara göre daha çok vurgu alr. Bu durum birçok çal³mada vurgulanm³tr.

Ali gazete okumay sever.

1 Sabah erkenden g azete almak için kalkar.

2 Kahvaltda gazete okumak onun için zevktir. (4.17)

Üçüncü tümcedeki 2 bo³artgönderimi için bir önceki tümcede yine bir

( 1) bo³artgönderim ile gazete aday öncüldür. ( 1) bo³artgönderimi hem

özne hem de adls oldu§undan gazeteye göre daha belirgindir.

• lk Ad Öbe§i Vurgusu: E§er bir ö§e söyleme ilk ad öbe§i olarak girmi³ ise sonraki her tekrarlan³nda ilk ad öbe§i vurgusu alr ve puanlanr. Örnek olarak 4.17 nolu söylemde Ali söylem varl§ sonra tekrarlanrsa ya da bir artgönderimle gönderimsel ili³ki içinde olursa o artgönderim ilk ad öbe§i vurgusu alr. Bu etken [Mitkov, 2002], [Lappin ve Leass, 1994] ve [Holen, 2007] tarafndan kullanlm³ ve önerilmi³tir. Söylemin davran³na ili³kin bir ipucundan haraket ile bu lk Ad Öbe§i etkisi vurgulanm³tr. Söylemler ilk ad öbe§ini sürekli vurgulamak isterler. Bu özellikten dolay bu ad öbekleri sürekli adlsalla³trlrlar.

• Bahsedilme Says: Bir ö§e söylem içinde ne kadar tekrarlanrsa o ö§e- nin belirginli§i o kadar artar. Bu özellik birçok çal³ma tarafndan da kullanlm³tr. Bir önceki lk Ad Öbe§i etkeni gibi bu etken de benzer bir söylem özelli§inden gelmektedir. Sürekli tekrarlanan ö§eler daha fazla vurgu alrlar.

• Uzaklk: Bu etken sözkonusu adl ile söz konusu aday öncül arasndaki uzakl§n tümce bazndaki kar³l§dr. Uzaklk arttkça ö§eler arasnda

gönderimsel ili³ki olma olasl§ azalr. Bu çal³madaki derlem analiz edil- di§inde bu özelli§in çok önemli oldu§u tesbit edildi. Çünkü adllarn ön- cülleri daha çok bir önceki ve iki önceki tümce içerisinde yer alm³tr. Dolays ile uzakl§n bu çal³ma için önemli oldu§u açktr.

Tüm bu etkenler belli bir a§rlk ile a§rlklandrld. Bu a³amada deneme yanlma yöntemiyle birçok de§er tahmini olarak atand.

Tablo 4.3: Etkenler ve A§rlklar

Etken A§rl§

Özne Vurgusu 100

Ki³i Say Uyumu 150

Adl Olma Vurgusu 50

Dolaysz Nesne Vurgusu 30

lk Ad Öbe§i Olma Vurgusu 20

Bahsedilme Says Vurgusu 2 kere için 10 daha fazlas için 20

Yaplan bu denemelerde en iyi a§rlklandrma de§erleri tablo 4.3.2'deki gibi olmu³tur. Söylemdeki herbir adl ondan önce gelen herbir öncül ile e³le³ir ve yukardaki a§rlklar tüm bu öncüllere uygulanr. Uygulama sonunda a§rlklar toplanr ve adla aday her bir öncül için bir puan olu³ur. En iyi a§rl§a sahip öncül ba³arl aday olarak belirlenir ve söz konusu adln gönderimde bulundu§u öncül olur.

Basit Bir Örnek

Bu algoritmay basit bir örnekle açklayalm. Kabul edelimki a³a§daki gibi iki tümcelik basit bir söylem ile çal³yoruz.

Ama kalemleri bir türlü bulamyordu. (4.18)

kinci tümcedeki bo³ artgönderimi için olas öncüller kümesi { Ali, çanta- sdaki , kalemleri} gibidir. Tüm bu aday öncüller yukardaki tablo kullanlarak a§rlklandrlr. A§rlklandrma sonuçlar 4.3.2 nolu tablodaki gibidir.

Tablo 4.4: Aday Öncüllerin A§rlklandrlmalar

Etken A§rl§ Ali Çantasndaki Kalemleri

Özne Vurgusu 100 100 0 0

Ki³i Say Uyumu 150 150 150 0

Adl Olma Vurgusu 50 0 0 0

Dolaysz Nesne Vurgusu 30 0 30 30

lk Ad Öbe§i Olma Vurgusu 20 20 0 0

Bahsedilme Says Vurgusu 10 / 20 0 0 0

Toplam 270 180 30

Ali öncülü 270 puanla en çok oy alarak ikinci tümcedeki bo³ artgönde- rimin öncülü olarak kabül edilir. Bu örnek iki tümceden olu³tu§u için birçok farkl durumu içinde barndramyor. Örnek olarak bashedilme says özelli§ini örnekleyemedik.

Bu algoritmay derlem üzerinde uygulad§mzda, 1114 adln 598'i do§ru bir ³ekilde çözümlendi. [Mitkov, 2002] artgönderim sisteminin ba³ar orann 4.12 nolu formüldeki gibi tanmlam³tr.

Bu formüle göre bizim modelin ba³ar oran 598

1114= 0.53'e e³ittir. Bu orana ba-

kld§nda ve de di§er artgönderim çal³malaryla kar³la³trld§nda normal bir çözüm yönteminden daha dü³ük performansa sahip oldu§u söylenebilir. Bu yak- la³m Merkezleme Teorisine göre daha fazla bilgiye ihtiyaç duyar ve bu bakmdan yöntem bilgiye fazla ba§mldr. Yöntemde kullanlan özelliklerin sisteme ne ka- dar katks oldu§u her zaman tart³ma konusudur. Seçilen özelliklerin bir ço§u gereksiz ve yararsz olabilir. Bu bakmdan sistemin bu gereksiz özellikleri çözüm-

leme öncesi (pre-processing) süreçlerde bo³u bo³una aramamas için bir eleme i³lemine tabi tutulabilir. Bu noktadaki sorulacak soru ³u: Çal³ma alan içinde bu özelliklerin yarar nasl saysalla³trlabilir ? Ya da saysalla³trlabilir mi ? Bunun için [Mitkov, 2002] (Relative Importance) Ba§l Önem isimli bir formül önermi³tir. Ba§l Önem K etkeni için 4.19 nolu formüldeki gibi hesaplanr.

RIK =

SR − SRK

SR (4.19)

Bu formüldeki SR ksaltmas tüm sistemin ba³ar orandr. Öte yandan SRK

ksaltmas ise K etkeni olmad§nda sistemin göstermi³ oldu§u ba³ar orann ifade eder. Görüldü§ü gibi RIK formülü K etkeni olmad§ durumda sistemin

bundan nasl etkilenece§ini ba§l bir ³ekilde hesap eder. Bu formül buradaki etkenler için uyguland§nda 4.5 nolu tablodaki sonuçlar elde edilir.

Tablo 4.5: Ba§l Önem Tablosu

Etken RI Say / Ki³i 0.07 Adls Vurgusu 0.01 Özne Vurgusu 0.28 Nesne Vurgusu 0.01 lk Ad Öbe§i Vurgusu 0.01 Tekrar Vurgusu 0.01

Görüldü§ü gibi say/ki³i uyumu etkeni ile özne vurgusu Türkçe'de önemli bir yere sahip. Bu etkenleri sistemden çkard§mzda neredeyse artgönderim çözümlemesi imkansz hale gelecektir. Bu Ba§l Önem ölçütüne benzer ba³ka ölçüm yöntemleri de mevcuttur. Çal³mann sonuç ksmnda tüm bu ölçüm so- nuçlarn kar³la³traca§z.

Bir ba³ka ölçüm tekni§i yine [Mitkov, 2002] tarafndan önerilen Karar Gü- cüdür (Decision Power). Bir etkenin karar gücü hesab (K), onu sa§layan öncül adaylarn asl öncül olarak seçilip seçilmemesine baklarak yaplr. O etkenin asl öncül olmasndaki rolüne baklmakszn yaplan bu de§erlendirmede sadece o aday öncüllerin asl aday olup olmadklarna baklr. K etkeninin Karar gücü, bu etkenin destekledi§i ve do§ru ³ekilde asl öncül olmu³ durumlarn saysnn (SK) K etkeni tarafndan desteklenmi³ tüm öncüllerin saysna (AK) oranna

e³ittir.

DPK =

SK

AK

(4.20)

Sistemdeki etkenlerin Karar Gücüne bakld§nda 4.6 nolu tablodaki gibi bir sonuç elde edilir.

Tablo 4.6: Karar Gücü Tablosu

Etken DP Say / Ki³i 0.107 Adls Vurgusu 0.09 Özne Vurgusu 0.16 Nesne Vurgusu 0.03 lk Ad Öbe§i Vurgusu 0.17 Tekrar Vurgusu 0.06

Yukardaki tabloda en önemli üç etken; say/ki³i uyumu, özne vurgusu ve ilk ad öbe§i vurgusu. Bu özellikler di§er algoritmalar içinde önemli oldu- §unu izleyen bölümlerde görece§iz.