• Sonuç bulunamadı

Türkçe derlemlerdeki artgönderimlerin tümdengelimli ve tümevarımlı yöntemlerle çözümlenmesi

N/A
N/A
Protected

Academic year: 2021

Share "Türkçe derlemlerdeki artgönderimlerin tümdengelimli ve tümevarımlı yöntemlerle çözümlenmesi"

Copied!
122
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

T.C.

TRAKYA ÜNVERSTES FEN BLMLER ENSTTÜSÜ

Türkçe Derlemlerdeki Artgönderimlerin Tümdengelimli ve Tümevarml

Yöntemlerle Çözümlenmesi Sava³ YILDIRIM

Doktora Tezi

Bilgisayar Mühendisli§i Anabilim Dal Dan³man: Yrd. Doç. Dr. Ylmaz KILIÇASLAN

(2)

T.C.

TRAKYA ÜNVERSTES FEN BLMLER ENSTTÜSÜ

Türkçe Derlemlerdeki Artgönderimlerin Tümdengelimli ve Tümevarml Yöntemlerle Çözümlenmesi

Sava³ YILDIRIM

Doktora Tezi

Bilgisayar Mühendisli§i Anabilim Dal

Bu tez ... / ... / 2008 tarihinde a³a§daki jüri tarafndan kabül edilmi³tir. Jüri

Dan³man: Yrd. Doç. Dr. Ylmaz KILIÇASLAN

Yrd. Doç. Dr. Erdem UÇAR Yrd. Doç. Dr. Rafet AKDENZ

(3)

Özet

Bu tez çal³masnda Türkçe Artgönderim Problemi çe³itli yakla³mlar ³§nda ele alnm³tr. Bilgi tabanl tümdengelimli yöntemlerle, ö§renme tabanl tüme-varml yöntemler birbirleriyle çe³itli açlardan kar³la³trlm³tr. Belirginlik Ta-banl yakla³m ile Merkezleme Algoritmas, bilgi taTa-banl yöntemleri de§erlendir-mek için ele alnm³tr. Makine Ö§renme algoritmalarndan karar a§açlar, naïve Bayes algoritmas, k-en yakn kom³u algoritmas, Destek Vektör makineleri ve alglayclar artgönderim problemine uygulanm³tr. Baz Türkçe metinlerdeki artgönderimsel ili³kiler bilgisayarl bu modellerle az bilgi kullanlarak çözüm-lenmi³ ve deney sonuçlarna dayanarak birçok bulgu sunulmu³tur. Bu alanda Türkçe için yaplan çal³malarn azl§ sebebiyle ara³trmaclar tarafndan kul-lanlan ortak bir derlem bulunamam³tr. Bu nedenle 10000 kelime kapasiteli 1114 adl içeren bir derlem yaratlm³tr. Çe³itli deneylerle bu derlem üzerin-deki gönderimsel ili³kilerin davran³ analiz edilmi³tir. Deney sonuçlarn de§er-lendirebilmek için derlemdeki gönderimsel ili³kiler elle i³aretlenmi³tir. Kapsam olarak adlsal artgönderim, dönü³lü artgönderim, bo³ artgönderim ve kar³llkl artgönderim tipleri ele alnm³tr. Bu tezin temel amac Türkçe Artgönderim Çözümlemesi için az bilgili ve bilgisayarl yakla³mlar sunmak, bu yakla³m-lar birbirleriyle kyaslamak ve bu problemin bilgisayarl çözümlenmesi için bir tart³ma ba³latmaktr.

Anahtar Kelimeler: Artgönderim Çözümlemesi, Bilgisayarl Dilbilim, Ma-kine Ö§renmesi

(4)

Abstract

In this study, the problem of anaphora resolution in Turkish is addressed in the light of various approaches. Knowledge-based deductive methods and learning-based inductive methods are compared from various points of view. The salience-based approach and the centering algorithm are chosen as examples of knowledge-based methods to evaluate. Of machines learning algorithms, decision trees, the naïve Bayes algorithm, the k-nearest neighbor classier, support vector machines, and the voted perceptron are chosen and applied to the problem of anaphora resolution. Anaphoric relations in some Turkish texts are resolved by means of these computational techniques in a knowledge-poor framework and numerous ndings are presented as results of the experiments.Since there is no publicly released corpus on which we can conduct our experiment, we needed to create a Turkish corpus- with the capacity of 10000 tokens and of 1114 pronouns- in which anaphoric relations are mannually annotated. Pronominal anaphora, reexive anaphora, null pronoun, and reciprocals are in the scope of this study. So, main goal of the study is to provide a computational resolution for the turkish language, to compare deductive and inductive approaches, and to start a discussion about the problem.

Keywords: Anaphora Resolution, Computational Lingusitics, Machine Learning

(5)

TE“EKKÜR

Bu tez çal³mas süresince her türlü katky sa§layan ve sonsuz enerjisiyle beni destekleyen dan³manm Yrd. Doç. Dr. Ylmaz Klçaslan'a, tez çal³masnda

beraber çal³t§m Edip Serdar Güner'e, Bilgi Üniversitesinde beraber çal³t§m Tu§ba Yldz'a, Trakya Üniversitesi Bilgisayar Mühendisli§i Bölümüne ve bu tezi tamamlamam için bana gereken frsat ve motivasyonu veren Bilgi Üniversitesi ve Bilgi Üniversitesi Bilgisayar Bilimleri Bölümüne

(6)

çindekiler

1 GR“ 1 1.1 Problem . . . 1 1.2 Artgönderim ve Önemi . . . 2 1.3 Artgönderim Çal³malar . . . 4 1.4 Kapsam . . . 6 2 DLBLMSEL ARKAPLAN 8 2.1 Artgönderim Biçimleri . . . 10 2.1.1 Adlsal Artgönderim . . . 10 2.1.2 Dönü³lü Artgönderim . . . 11 2.1.3 Bo³ Artgönderim . . . 11

2.1.4 Sözlüksel Ad Öbe§i Artgönderimleri . . . 12

2.1.5 Kar³lkl Artgönderim (Reciprocal) . . . 13

2.1.6 Bo³ Adsal Artgönderim . . . 13

2.2 Yan Tümcelerde Artgönderim . . . 14

2.3 Di§er Dilbilimsel Artgönderim Çal³malar . . . 15

2.3.1 Ba§lama Kuram (Binding Theory) . . . 15

2.3.2 Givon . . . 18

2.3.3 Fox . . . 18

(7)

2.4 Türkçe için Dilbilimsel Artgönderim Çal³malar . . . 19

3 BLGSAYARLI ARTGÖNDERM ÇALI“MALARI 26 3.1 Artgönderim Çözümleme Süreçleri . . . 26

3.2 Bilgi Tabanl (Knowledge-Based) Artgönderim Çözümleme Ça-l³malar . . . 29

3.2.1 Hobbs'un Algoritmas(Hobbs's Naive Algorithm) . . . 30

3.2.2 Merkezleme Teorisi ve Algoritmas (Centering Teory) . . 34

3.2.3 BFP . . . 35

3.2.4 Lappin ve Leass'in Sözdizim Tabanl Yakla³m . . . 37

3.2.5 Kennedy ve Boguraev'in Yöntemi . . . 38

3.2.6 Baldwin's Cogniac . . . 39

3.2.7 MARS . . . 40

3.3 Ö§renme Tabanl Artgönderim Çözümleme Çal³malar . . . 42

3.3.1 Artgönderim çin Ö§renme Süreçleri . . . 42

3.3.2 Di§er Dillerdeki Ö§renme Tabanl Çal³malar . . . 44

3.4 Türkçe için Bilgisayarl Artgönderim Çözümleme Çal³malar . . 46

4 TÜRKÇE ÇN ARTGÖNDERM ÇÖZÜM DENEMELER 48 4.1 Derlem . . . 49

4.2 Gönderimsel fadelerin Tespiti . . . 51

4.3 Bilgi Tabanl Çözüm Önerileri . . . 53

4.3.1 Merkezleme Tabanl Çözüm Önerisi . . . 54

4.3.2 Belirginlik Tabanl Çözüm Önerisi . . . 62

4.4 Ö§renme Tabanl Çözümler . . . 70

4.4.1 E³le³me . . . 70

4.4.2 Kullanlan Veri Madencili§i Teknikleri . . . 71

(8)

5 DENEY SONUÇLARININ DE‡ERLENDRLMES 92

6 SONUÇ 104

6.1 Amaç . . . 104 6.2 Yöntem . . . 105 6.3 Sonuçlar ve Bulgular . . . 105

(9)

“ekil Listesi

3.1 Birinci tümcenin sözdizim a§ac . . . 31

3.2 kinci tümcenin sözdizim a§ac . . . 32

3.3 Ayr³trma A§ac . . . 34

4.1 Derlem Girme ve Güncelleme Arayüzü . . . 51

4.2 Merkezleme Yakla³mnn Ak³ Diagram . . . 55

4.3 K-en yakn kom³u algoritmas . . . 72

4.4 Karar A§ac . . . 74

4.5 Destek Vektör Makineleri - KDM . . . 75

4.6 Yapay Sinir A§lar . . . 76

4.7 A³r Uyma . . . 85

(10)

Tablo Listesi

2.1 AÖ Snflandrma Tablosu . . . 16

3.1 Merkezdeki De§i³iklikler . . . 36

3.2 Belirgenlik Türleri ve A§rlklar . . . 38

3.3 Ö§renme Veritaban . . . 43

4.1 Öncüllerdeki sim Hallerinin Olu³ma Skl§ . . . 57

4.2 Senaryolar . . . 60

4.3 Etkenler ve A§rlklar . . . 66

4.4 Aday Öncüllerin A§rlklandrlmalar . . . 67

4.5 Ba§l Önem Tablosu . . . 68

4.6 Karar Gücü Tablosu . . . 69

4.7 Algoritma ve Parametreleri . . . 77

4.8 Snandrclarn Sonuçlar . . . 77

4.9 Kar³klk Matrisi . . . 78

4.10 Özelliklerin Katk De§eri Ortalamalar / 10'lu Çapraz Sa§lama . 87 4.11 Özelliklerin Bilgi Kazanc . . . 87

4.12 Artgönderim Ba³ar Oran . . . 89

5.1 Artgönderim Ba³ar Oran . . . 95

5.2 Tüm Yakla³mlarn Genel Görünümü . . . 99

(11)

Bölüm 1

GR“

1.1 Problem

Do§al dildeki gönderimlerin yada dildeki ba§lantlarn çözümlenmesi Bilgisayarl Dilbilim çal³malarnn temel admlarndan biridir. Örne§in Türkçe'de

Arda Alin'den onun kitabn istedi.

gibi bir tümcede onun ifadesi hangi varl§a, Alin'e mi yoksa Arda'ya m gönderimde bulunur? En azndan Türkçe bilen birçok ki³i sezgisel olarak onun ifadesinin Alin'e gönderimde bulundu§unu çkarabilir. Yapsal olarak yukardaki tümceye benzeyen fakat farkl bir çözümü olan bir ba³ka örnek tümce verilebilir. Örne§in

Arda Alin'den kendi kitabn istedi.

gibi bir tümcedeki kendi -ki bu kendi ifadesi "onun" adlsal artgönderimi ye-rine konmu³ dönü³lü bir artgönderimdir- ifadesi Alin yeye-rine Arda'ya gönderimde

(12)

bulunur. Bu çkarm yine Türkçe'yi bilen biri rahatlkla yapabilir. Ancak ilk ör-nekte oldu§u gibi, ki³i bu çkarm nasl yapt§n bize sistematik olarak ifade edemez. Belki o ki³i "nasl yaptn?" sorusu soruldu§u anda dü³ünüp çka-rmda bulunabilir. Bu tam olarak insandaki sezgisel ve farknda olmad§ bir yetenektir diyebiliriz. Peki yukardaki iki örnek yapsal olarak birbirlerine ben-zemelerine kar³n neden farkl bir çözüm olu³mu³tur. Bunun için akla gelen ilk cevap birinci örnekte adls bir artgönderim, ikinci örnekte dönü³lü bir artgön-derim kullanld§ olacaktr. ki farkl artgönartgön-derim kullanld§ için çözümleme sistemati§i de farkl kurallar içermi³tir diyebiliriz. Bu örneklemeden hareketle ³öyle bir noktaya varabiliriz: Artgönderim problemi için birçok kuraldan olu-³an bir sisteminin olu³turulmas gerekmektedir. Daha basit bir ifadeyle dilde kurallar gizlenmi³ bu ili³kilere bir çözüm modeli olu³turulmas gerekmektedir. Belki bu çok saydaki kurallar daha basit bir genellemeden olu³maktadr. ³te bu problem ekseninde bu tip sorularn cevab aranmaktadr.

Bu tez kapsamnda olu³turulacak ve de tart³lacak model bilgisayarl bir alan içerisinde olacaktr. Bilgisayarl birçok yakla³m çözüm için denenecektir ve çok deneylerle ortaya atlan yakla³mlar kyaslanacak ve detayl bir ³ekilde tart³lacaktr.

1.2 Artgönderim ve Önemi

Yapay Zeka alannn alt ba³lklarndan olan Do§al Dil ³leme (Natural Langu-age Processing) ve Bilgisayarl Dilbilim (Computational Linguistics) alanlar, do§al dili istatistiksel ve kural tabanl modellerle ele alarak bilgisayarl çözüm-ler üreten, ara³trmaclarn son zamanlarda yo§unla³t§ ve önemi giderek artan disiplinler aras bilimsel çal³ma alanlardr. Do§al dil i³leme alan dilbilim teori

(13)

ve yakla³mlarndan yapay zeka çal³malar yapmak için yararlanr. Bilgisayarl Dilbilim ise bilgisayar bilimlerinden dilbilim alanndaki teori ve yakla³mlarn modellenmesi ve do§rulanmas için yararlanr. Bu tezde sunulan çal³ma her iki alana da katk sa§lama potansiyeli içermektedir.

Her iki alann da teorik olarak beslendi§i dilbilim alan ise sözdizim (syn-tax), biçimbilim (morphology), sesbilim (phonology), anlambilim (semantics), edimbilim (pragmatics), söylem analizi (discourse analysis) gibi birçok önemli alt ba³l§ içerir.

Yukarda bahsedilen alt alanlardan biri ve bu tezin kapsad§ alt alanlardan birisi olan söylem analizi (discourse analysis) birçok uygulama için önemini korumaktadr. Söylem analizi çerçevesinde metin özetleme, makine çevirisi, bilgi çkarm, diyalog sistemi gibi teorik ve pratik çal³malar yaplmaktadr. Söylem düzeyindeki analiz dilbilim çal³malarndaki en zor problemlerden biridir. Bu düzeyde yaplacak çal³ma alt düzeylerdeki birçok bilgiye ihtiyaç duydu§undan bu alt düzeylere sk skya ba§ldr. Sözdizimsel ya da biçimbilimsel analizlerde ortaya çkan problemler söylem düzeyinde yaplacak ba³ka bir analizi dolaysz bir ³ekilde etkiler.

Söylem analizi için çözülmesi gereken problemden biri ve ayn zamanda bu tez çal³masnn da konusu artgönderim (anaphora) problemidir. Artgönderim söylem içindeki ö§elerin birbirlerine gönderimde bulunmasdr. Bir ba³ka de-yi³le bir dünya varl§na çe³itli ³ekillerde e³gönderimde bulunma durumudur. Örne§in, John isimli birine söylem içinden John, adam, o, çocuk, Mr. John, John Green, Bay John ³eklinde gönderimler olu³turulabilir. Bu gönderimsel ili³kilerin söylem içindeki rolü çok güçlüdür. Her söylem kendi içinde çok sa-yda gönderimsel ili³ki barndrr. Bu gönderimsel ili³kilerin varl§ bilgisayarl dilbilim çal³malar için bilgisayarla çözümlenmeleri gereklili§i gibi zor

(14)

problem-ler olu³turur. Söylem içinde yaplan herhangi bir gönderimin çözülmesi söylem analizleri için çok gereklidir. Örnek olarak bir söylemde, o adlnn Ahmet'e mi yoksa Ay³e'ye mi gönderimde bulundu§u söylem analizi için önemlidir. Bu bilgi olmadan söylem üzerinde herhangi bir çkarm yaplamayacaktr. Bu gön-derimsel olguya ngilizce'de Anaphora denirken Türkçe için sklkla kullanlan kar³l§ Artgönderimdir. Bu gönderimsel ili³ki için a³a§daki iki tümcelik ba-sit söylemi ele alalm:

Alin çantasndaki kitaplar masaya koydu. Sonra masaya otu-rup onlar okumaya ba³lad.

Örne§in yukardaki söylemde ikinci tümce iki artgönderim barndrr: , on-lar. Bu artgönderimlerin hangi öncüle gönderimde bulundu§u Türkçe bilen biri tarafndan kolaylkla çözülebilir. bo³ artgönderimi birinci tümcedeki Alin ki³isine gönderimde bulunurken, onlar adl kitaplar söylem varl§na gönde-rimde bulunur. Bu çözümlemenin insan tarafndan yaplmas normal ve ola§an-dr. Ancak, bu çözümlemenin bilgisayar tarafndan yaplmaya çal³lmas birçok güçlü§ü beraberinde getirecektir. Yani hangi adln hangi öncüle gönderimde bulundu§unu tespit etmek için bilgisayarl bir model yaratmak gerekmektedir. ³te bu problemin çözümü için uygulanacak çözümleme sistemine Bilgisayarl Artgönderim Çözümlemesi (Computational Anaphora Resolution) denir.

1.3 Artgönderim Çal³malar

Artgönderim probleminin çözümü için çe³itli yöntemler önerilmi³tir. [Hobbs, 1978] bu problemi çözmek için tümcelerin ayr³trma a§acndan faydalanm³tr. Ayr³-trma a§açlarn belli bir sisteme göre tarayarak adllarn öncüllerine ula³maya

(15)

çal³m³ ve bir sistem önermi³tir. [Grosz ve Sidner, 1986] ve [Brennan vd., 1987] merkezleme teorisini geli³tirmi³lerdir. Bu teoriye göre söylemin merkezindeki de-§i³iklikler belli bir davran³ ilkesine göre olu³maktadr. Söylemin, merkezindeki ö§eyi mümkün oldukça koruma e§ilimi içinde oldu§u vurgulanm³tr. Bilgi ta-banl bu teori ba³arl ve önemli oldu§undan birçok çal³maya ilham vermi³tir. [Lappin ve Leass, 1994] ise belirginlik tabanl bir yöntem geli³tirmi³tir. Bu yak-la³ma göre aday öncüller puanlanarak bir yar³ içine sokulur. En yüksek puan alan öncül hesaptaki adln öncülü olur. Basit bir toplama i³lemi çerçevesinde geli³tirilmi³ bir yakla³m olmasna kar³n çok ba³arl sonuçlar vermi³tir. Ay-rca günümüzdeki birçok artgönderim çözümleme sisteminde kullanlmaktadr. [Chomsky, 1981] tarafndan sunulan ba§lama teorisi birçok yöntem tarafndan kullanlm³tr. Ba§lama kuramnda birçok kural ve kst vardr. Bu kurallar ve kstlar artgönderimin davran³n tanmlar. Bu konudaki detaylar ileriki bö-lümlerde yer alacaktr. Gerçek uygulama açsndan ise en önemli çal³malardan biri [Mitkov, 2002] tarafndan yaplm³tr. Bu çal³ma [Lappin ve Leass, 1994] tarafndan uygulanan RAP algoritmasnn geli³tirilmi³ bir türüdür. Gerçek uy-gulamalarda çal³mas çal³mann önemini artrmaktadr.

Yukardaki teorik yakla³mlarn d³nda artgönderim problemi için makine ö§renmesi ve istatistiksel yöntemler de kullanlm³ ve bu yöntemler problemin çözümü açsndan ba³arl olmu³tur. Makine Ö§renmesi tekniklerinin bilim ala-nndaki öneminin artmas ve birçok alanda ba³arl bir ³ekilde uygulanmas, artgönderim probleminin çözümünde de ba³aryla kullanlmalar do§rultusunda umut do§urmu³tur. Makine ö§renme algoritmasn artgönderim çözümü için uygulayan ilk çal³ma [Aone ve Bennet, 1995.] tarafndan yaplm³tr. Bu çal³-mada söylemler ö§renme algoritmas için düzenlenmi³ ve karar a§ac yöntemi kullanlarak bir karar verme sistemi olu³turulmu³tur. Japonca için uygulanan bu yöntem birçok çal³maya ön ayak olmu³tur. Örnek olarak daha sonra ngilsizce

(16)

için yaplan en önemli ö§renme temelli yakla³m [Soon vd., 2001.] tarafndan sunulmu³tur. Bir di§er önemli çal³ma ise [McCarthy ve Lehnert, 1995.] tara-fndan yaplm³tr. Bu çal³malarn ayrntlar izleyen bölümlerde verilecektir.

Tüm bu çal³malar artgönderim problemi için zengin bir literatür olu³turmu³ ve bu problem çerçevesinde birçok ara³trma ve bilimsel tart³ma yaplm³tr. Türkçe için yaplan çal³malar ise di§er dillerle kyasland§nda oldukça azdr. ngilizce, Almanca, Japonca en çok çal³lan diller olurken Türkçe bu anlamda az çal³lan diller kategorisine girmi³tir. Türkçe için bilgisayarl artgönderim çözümlemesi ilk olarak

[Tn ve Akman, 1994] tarafndan sunulmu³tur. Bunun d³nda Türkçe için baz çal³malardan bahsetmek mümkün. Bu çal³malar ilerleyen bölümlerde detayl olarak incelenecektir.

1.4 Kapsam

Bu çal³mann amac Türkçe söylemlerdeki artgönderim çözümü için bilgisa-yarl sistemler tasarlamak, çe³itli yakla³mlar denemek ve bunlar tümdengelim ve tümevarm ikilili§i üzerinden tart³maktr. Bu vesileyle öncelikle çal³mann kapsamndan bahsedilmesi gerekiyor. Türkçe'de öne çkan gönderim tipleri adl-sal artgönderim, dönü³lü artgönderim, bo³ artgönderim, sözlüksel artgönderim, kar³lkl artönderim, bo³ adsal artgönderim ³eklinde sralanabilir. Bu gönderim biçimlerinden adlsal artgönderim (ben,sen, o vb.), dönü³lü artgönderim (ken-dim, kendi vb.), bo³ artgönderim (yüzeyde görünmeyen), kar³lkl artgönderim (birbirleri) bu çal³mann kapsamndadr. Bu artgönderimlerin olu³turdu§u ili³-kilerin çözümü için çe³itli çözümleme yöntemleri tart³lacaktr.

(17)

ayrabiliriz:

1. Bilgi Tabanl Yakla³mlar 2. Ö§renme Tabanl Yakla³mlar

Bu iki yakla³mn Türkçe'deki artgönderim problemi için nasl bir sonuç ve-rece§i bu çal³mann konusudur. Ancak Bilgi tabanl tüm sistemleri denemek olanaksz oldu§undan en önemli iki yöntem olan, belirginlik tabanl yöntem1 ile

Merkezleme Algoritmas yöntemi bu çal³ma kapsamnda tart³lacak yöntem-lerdir.

Öte yandan ö§renme tabanl yakla³mlar yine ayn derlem üzerinde snana-caktr. Makine ö§renme algoritmalarndan Karar A§ac, Destek Vektör Makine-leri gibi önemli teknikler artgönderim çözümü için kullanlacaktr. Ortaya çkan ba³ar sonuçlar çerçevesinde tüm yöntemler birbirleriyle kyaslanacak ve belirli sonuçlar çerçevesinde tart³malar açlacaktr. Bilgi tabanl yöntemlerle, ö§renme tabanl yöntemler birbirleriyle çe³itli kyaslamalar göz önünde bulundurularak tart³lacaktr. Bu yöntemlerin Türkçe söylem analizi için ne kadar ba³arl ve uygulanabilir oldu§u ara³trlacaktr.

(18)

Bölüm 2

DLBLMSEL ARKAPLAN

Son otuz yldr giderek artan söylem yaps ile ilgili çal³malarn merkezinde hep artgönderim konusu yeralm³tr. Söylem gerçek dünyadaki nesnelere gönderimde bulunurken bir ba§la³klk düzene§i olarak artgönderimlere ba³vurur. Söylemde odakta bulunan anlatmsal ifadeler artgönderimsel olarak adlla³abilir. Söylem içinde gerçek dünyadaki bir nesneye çe³itli ³ekillerde gönderimlerde bulunabili-riz: Ali, bardak, adam, o, bu, onlardan biri, ora, masa vb. Söylem içinde önce öncüller sisteme dahil olurlar. Örnek olarak tümce 2.1'de Ali, Hasan ve Kitap sisteme dahil olurlar.

Ali Hasan'a kitab uzatt. (2.1)

Bu ö§eler herhangi bir anda söylem içinde bir adl ile e³gönderim olu³tura-bilirler. Bu tümcenin hemen ardndan geldi§ini varsayarsak, tümce 2.2 buna bir örnek olu³turur.

(19)

Ama o almak istemedi. (2.2)

Bu tümcedeki o açk adl Hasan'a gönderimde bulunur. 2.1 nolu tümceden hemen sonra 2.3'deki gibi bir tümce gelseydi bu durumda onu açk adl kitaba gönderimde bulunacakt.

Ancak Hasan onu almak istemedi. (2.3)

E§er tümce 2.4'teki gibi bir tümce gelseydi, öncelikle gözle görünür açk bir adln olmad§ farkedilirdi. Ancak üzgün görünen birinin oldu§u da kesindir.

Çok üzgün görünüyordu. (2.4)

Bu durumda bu tümcede göremedi§imiz ancak dilbilgisel olarak gizli bir öznenin varl§nda bahsedebiliriz. Bu tümcede Ali'ye gizli bir artgönderim söz konusu oldu§undan buna bo³ artgönderim diyece§iz ve i³areti ile ifade edece§iz.

Bu örneklerden anla³ld§ gibi amaç geriye i³aret etmek ve bunun yapsn ara³trmaktr. Geriye i³aret eden veya gönderimde bulunan yaplar için ngi-lizce'de Anaphora kelimesi kullanlmaktadr. Türkçe için kullanlan ve kabul gören kar³l§ ise artgönderimdir. Bu artgönderimin (Anaphora) i³aret etti§i, gönderimde bulundu§u ö§eye ise ngilizce'de antecedent ya da referent de-nir. Türkçe dilbilimsel çal³malarda ço§unlukla öncül kelimesi kullanlr. Tümce 2.1'de Ali, Hasan ve kitap aday öncüllerdir. Tümce 2.2'deki o ö§esi ise Ali

(20)

ön-cülünü i³aret eden bir açk adldr ve bir artgönderim örne§idir.

2.1 Artgönderim Biçimleri

2.1.1 Adlsal Artgönderim

Ana ve yan tümcelerde özne pozisyonunda açk adl ve bo³ artgönderimleri tümcenin yüklemi ile say/ki³i uyumu içindedir. Üçüncü tekil ³ahs uyum taks bo³tur. Üçüncü ço§ul ki³ide e§er açk özne kullanlm³sa ildeki biçimsel tak ba§lama ba§l olarak kullanlabilir ya da kullanlmayabilir. Aksi halde uyum gösterir ve açktr. Artgönderim, söylem içinde çe³itli biçimlerde var olabilir. Bu biçimin zorunluluk mu yoksa konu³ucunun ya da yazann seçimine mi ba§l oldu§u de§i³kenlik gösterir. En yaygn kullanlan artgönderim tipi adlsal art-gönderimdir (pronominal anaphora). Ben, Sen, O, Biz, Siz ve Onlar adlsal artgönderim örneklerinin yaln halleridir (Ben yarn okulda olaca§m). Bununla birlikte ismin hallerini de alrlar:

1. Yaln Hali (Nominative): Ben, Sen, O ... 2. Belirtme Hali (Accusative): Beni, Seni, Onu ... 3. Yönelme Hali (Dative): Bana, Sana, Ona ...

4. Ayrlma / Çkma Durumu (Dative): Benden, Senden, Ondan ... 5. lgi / Tamlayan Hali (Genitive): Benim, Senin, Onun ...

(21)

2.1.2 Dönü³lü Artgönderim

Bir ba³ka artgönderim tipi ise dönü³lü (reexive) adllardr. "Jonh admires him-self" tümcesindeki himself ayn tümcedeki John varl§na gönderimde bulunur. Tükçede bu tümceyi "John kendini be§enir" ³eklinde söyleriz. Bu tümcedeki kendi terimi Türkçe dönü³lü adllar için bir örnektir. Dönü³lü artgönderim de adlsal artgönderim gibi durum hallerinden etkilenebilir: Kendi, kendini, kendi-sine, kendinde...

2.1.3 Bo³ Artgönderim

Söylemde yüzeyde görünmeyen fakat dilbilgisi kurallarnca aç§a çkarlan art-gönderim tipidir. A³a§daki söylemi ele alalm.

Alini baleye gitmek için hazrlk yapyordu.

[ i [ i Çantasna gerekli e³yalar koyarak] evden çkt.] (2.5)

Bu tümcedeki özne pozisyonundaki ilk ö§e bo³ bir artgönderimdir ve Alin ile e³gönderime sahiptir. Benzer bir ³ekilde bo³ artgönderim pozisyonunda bulunan ikinci gönderimi de bo³ artgönderim'e örnektir. Bu bo³ artgönderimler adl mdr yoksa de§i³ken midir sorusu halen tart³lmaktadr. Bu tart³ma çal³ma-mzn d³nda kald§ndan biz yüzeyde görünmeyen bu ö§elere bo³ artgönderim diyece§iz.

(22)

2.1.4 Sözlüksel Ad Öbe§i Artgönderimleri

Di§er bir artgönderim tipi ise Sözlüksel Ad Öbe§i Artgönderimleridir. Bu yap sözdizimsel olarak tümcelerde belirtili isim öbekleri ³eklinde bulunurlar: Özel isimler, belirtili tanmlar vb. Noam Chomsky, bir sepet elma, masadaki vazo, adam örnek olarak verilebilir.

Artgönderim örneklerimize a³a§daki alnty inceleyerek devam edelim.

(1) Evvel zaman içinde bir kentte küçük ve fakir bir kz ya³arm³.(2) Bu kz kibrit satarak geçinmeye çal³rm³. (3) Kzn hiçkimsesi yok-mu³.(4) Ykk dökük bir evde ya³arm³. (5) Bir sabah yine kibrit satmak için yollara dü³mü³.(6) Kar ya§d§ için her taraf bembe-yazm³.(7) Kibritçi Kzn aya§na giyecek ayakkabs bile yokmu³.(8) Yaln ayak karlara basa basa kibrit satmaya çal³yormu³. (9) Üze-rindeki elbiseler o kadar eskimi³ ki so§uktan korumuyormu³ bile. (10) Kibritçi kz so§uktan donmamak için bir kö³eye büzülmü³. (11) Artk ak³am olmak üzereymi³. (12) Kzca§z artk kibrit satamaya-ca§n anlam³.

Bu metinde ilk tümceyle birlikte kent ile küçük ve fakir bir kz ad öbekleri söylem varlklar olarak sisteme girerler. Bir sonraki tümcede (Bu kz kibrit sa-tarak geçinmeye çal³rm³), küçük ve fakir bir kz söylem varl§na bu kz ad öbe§iyle gönderimde bulunulur. Aslnda bu iki ad öbe§i gerçek dünyadaki bir varl§a e³gönderimde bulunurlar. Bu yapdaki iki ad öbe§i de gönderimde bulun-duklarndan bunlar Sözcüksel Ad Öbe§i Artgönderimi'nin birer örne§idir. Benzer bir ³ekilde ikinci tümceyle birlikte kibrit varl§ da sisteme dahil edil-mi³tir. Bu ad öbe§ine de izleyen bir tümceden göderim yaplabilir. Bu tip ad

(23)

öbekleri genel anlamda göderimsel ifadeler olarak de§erlendirilir. “imdi yuka-rdaki alntda küçük kz için nasl bir gönderim yaps kuruldu§una bakalm. Kullanlan gönderimleri tümce srasyla listeleyelim: Küçük ve fakir bir kz (1), Bu kz (2), Kzn (3), (4), (5), Kibritçi Kzn (7), (8), + GEN ve + ACC(9), Kibritçi kz (10), Kzca§z(12). Ortaya çkan e³gönderimsel bu zincirde açk adl, bo³ artgönderim, ve ad öbe§i artgönderimleri kullanlm³tr.

2.1.5 Kar³lkl Artgönderim (Reciprocal)

Bir di§er artgönderim tipi ise kar³lkl artgönderimdir. Söylemde kar³lkl bu-lanan ö§eler arasndaki kar³lkl§ ifade etmek amacyla kullanlr.

They hit each other (2.6)

Yukardaki tümcede geçen each other ifadesi ngilizce'deki kar³lkl artgönde-rim için bir örnektir. Türkçe için kullanlan kelime ise birbirleridir.

Birbirlerine vurdular. (2.7)

Yukardaki tümcedeki birbirlerine ifadesi kar³lkl artgönderime bir örnektir.

2.1.6 Bo³ Adsal Artgönderim

Bir ad öbe§inin olmas gereken yeri bo³ brakt§ durumlarda ortaya çkar. Buna a³a§daki gibi bir örnek verelim.

(24)

- Ben [senin gibi bir ayya³a] yol vermem - Ben veririm

Yukardaki söylemde birinci konu³ucu senin gibi bir ayya³ ifadesi ile ikinci konu³ucuyu tanmlyor. kinci konu³ucu ayn ifadeyi bo³ kullanarak birinci konu-³ucuyu tanmlyor. kinci konu³ucunun tümcesinde adlsal bo³ bir artgönderim oldu§unu söyleyemeyiz; bu durumda bu ifade ikinci konu³ucuyu yani kendi-sini tanmlyor olacakt. Oysa ikinci konu³ucunun birinci konu³ucuyu belirtti§i açktr.

2.2 Yan Tümcelerde Artgönderim

Türkçede yan tümce üretmek için eyleme eklenen çekim ekleri ³u ³ekildedir:

1. -mek: Ö§renciler derse girmek istemiyorlar.

2. -me: Ö§rencilerin derse geç gelmesi en ciddi problemimiz. 3. -i³: Hocann dersi anlat³ bence iyi.

4. -ecek: Dersi geçecek ö§renciler belli. 5. -dk: Ö§renci ald§ notu be§enmedi.

Yan tümcenin öznesi tamlayan eki alrken, eylemi iyelik eki alr. Ve bu iki birim ki³i say uyumu gösterir. Ana tümcede oldu§u gibi yan tümcede de üçüncü ki³i ço§ul uyumu eyleme seçime ba§l olarak eklenir. Artgönderim ana cümledeki i³levi yan tümcelerde de aynen devam eder.

(25)

Bu cümledeki Onun artgönderimi açk adl olarak gerçekle³mi³tir. Bununla beraber bo³ artgönderim içeren durumlar da olur. Bo³ artgönderimler benzer bir ³ekilde yan tümcelerde de görülür. A³a§daki tümce buna örnektir.

Adami [ i okula gitmek] için otobüse bindi. (2.9)

2.3 Di§er Dilbilimsel Artgönderim Çal³malar

2.3.1 Ba§lama Kuram (Binding Theory)

Artgönderim konusundaki en önemli çal³malardan biri de [Chomsky, 1981] ta-rafndan sunulan ilkeler ve de§i³tirgenler (principles and parameters) kuram-dr. Bu çal³mann içerdi§i Ba§lama Kuram artgönderimlerin nasl gönderimde bulunaca§na ili³kin önemli sözdizimsel kstlar vurgular. Bu kuram dönü³lü adllar, ki³i adllarn ve sözlüksel ad öbeklerini kapsar. Ba§lama ba§l ö§e-nin/öncülün gönderimi ile göndergenin gönderimi ayndr. Ba§lama kuralnda gönderimi tümce içinde olan adllar gönderge olarak adlandrlr. Gönderimi tümce d³nda olan adllar adlsl (pronominal) ve sradan adlar ise gönderimsel ifade (referential expression) olarak tanmlanr.

1. He likes himself 2. John likes herself

He adlnn gönderimi tümce d³nda oldu§undan adlsl, herself kurucusu gönderimi tümce içinde oldu§u için gönderge ve John ise gönderimsel ifadedir.

(26)

Tablo 2.1: AÖ Snflandrma Tablosu

Açk Bo³ (Örtük)

[+ gönderge, - adlsl] Sözlüksel Gönderge (kendine, birbirleri) Ad Öbe§i zi [- gönderge, + adlsl] Adl (ben, onlar,...) adl (pro) ( )

[+ gönderge, + adlsl] - ADIL (PRO)

[- gönderge, - adlsl] Ad (Ali, Veli) de§i³kenler

Sözlüksel göndergeler [+ gönderge, - adlsl], gönderimleri sadece tümce içinde olmak durumundadr. Buna en iyi örnek dönü³lü artgönderimdir. Adl [- gönderge, + adlsl], tümce içine gönderimde bulunamaz. Tümce d³na gön-derimde bulunurlar. Adllar buna örnektir. Adlar ise [- gönderge, - adlsl] hiç bir gönderimsel ksta u§ramazlar. Üçüncü kategorideki ö§e ise denetim ADIL (kontrol PRO) olarak bilinir. Bu yap ya ki³i-d³ bir yorum ile yaplr ya da özne ile nesne tarafndan kontrol edilebilen bir yorum yaplabilir. Örnek olarak

[ADIL(PRO) Okumak] gereklidir. (2.10)

cümlesinde okumak eyleminden önce gizli bir ki³i-d³ de§i³ken vardr. PRO özne tarafndan kontrol edilebilir.

Arda [ADIL(PRO) Okumak] istiyor. (2.11)

Yukardaki cümlede, okumak eyleminin önünde PRO vardr. A³a§daki tümcede ise nesne tarafndan kontrol edilen bir PRO söz konusudur.

Herkes[P RO(onun)gitmesini]istiyor. (2.12)

(27)

1. Bir gönderge yerel bir alana ba§ldr. (An anaphor is bound in its Gover-ning Category)

2. Bir adlsl yerel alana ba§l de§ildir (A pronominal is free in it GC) 3. Gönderimsel ifadeler özgürdür (R-expression is free)

Bu ilkeler için a³a§daki örnekleri inceleyelim.

J ohni likes himselfi (2.13)

John sevmek kendi(gönderge) John kendini sever

Bu tümcedeki kendi göndergesi ile John ad Ba§lama Kuram'n birinci ilkesine uygun bir ³ekilde e³göndergelidir.

Hei likes him∗i/j (2.14)

O(adls) sevmek o(adls) O onu sever

Kurammzn ikinci ilkesine göre adlslar yerel alanda özgürdürler. Dolay-syla bu cümledeki he ve him adlslar yerel alanda özgürdürler ve e³göndergeli de§ildirler. Bu nedenle he i ile dizinlenmi³ken him j dizinine ba§ldr.

Ba§lama Kuramnn üçüncü ilkesi gere§i John gönderimsel ifadesi tamamen özgürdür ve O(he) adl ile e³dizinlenemez.

(28)

Hei likes John∗i/j (2.15)

O(adls) sevmek John(Gönderimsel ifade) O onu sever

2.3.2 Givon

[Givon, 1983] konusallk ile artgönderim biçimi arasnda kar³lkl bir ili³kinin oldu§una de§inir. Konusallk de§eri yüksek olan göndergeler ya adlla ya da bo³ artgönderimle kodlanr. Konusallk de§eri dü³ük olanlar ise tam ad öbekleriyle (Full NP) ile kodlanr.

2.3.3 Fox

[Fox, 1987] ise ayn söylem alan içinde sisteme dahil edilmi³ öncüllerin adlla ya da bo³ artgönderimlerle kodland§n vurgular. Öte yandan ba³ka bir söylem ala-nndaki öncüller ise Tam Ad Öbe§i ile kodlanrlar. [Fox, 1987] söylemin a³amal olarak sralanm³ önermeler dizisi oldu§unu belirtir. Bu a³amal yapnn artgön-derim seçimlerinde önemli bir rol oynad§n vurgular. A³amal modeldeki temel yakla³m ³u ³ekildedir: Söylem sral bir ³ekilde okunuyor olsa da anlamland-rlmalar a³amal olarak gerçekle³ir. Ku³ku yok ki bunun artgönderim davran³ üzerinde çok büyük bir etkisi vardr.

Metinler a³amal olarak düzenlenmi³ önerme kümeleridir. Önermelerden olu-³an kümeler retorik yaplarla gösterilmektedir. Bu Retorik yaplar çekirdek ve niteleyici uydu olmak üzere iki bölümden olu³ur. Konu³ucunun ana kri ya da amac çekirdekte yeralr. Çekirdekteki bilgileri nitelemek için kullanlan di§er

(29)

ek bilgiler ise uydu dedi§imiz niteliyici yapda yer alrlar.

2.3.4 Merkezleme Teorisi

[Grosz ve Sidner, 1986] ve [Grosz, 1995] söylem yaps teorisini geli³tirdiler ve odak tabanl artgönderim çözümlemesi ile ilgili birçok çal³ma sundular. Mer-kezleme Teorisi olarak bilinen bu çal³ma yerel ba§da³kl§ ele alr ve merkezin hareketine ili³kin baz kurallar içerir. ³te bu kurallar içeren ve bu kurallar üze-rinden olu³turulan artgönderim algoritmalarna merkezleme algoritmalar (Cen-tering Algorithms) denir. Merkezleme Kuram yerel ba§da³klk ve belirginlik modeli olarak geli³tirilmi³tir. Asl amac ba§da³klk örüntülerini olu³turan gön-derimsel ifadeleri tanmlamaktr. Bu kurama göre her söylem bir dizi bölütten olu³ur ve her bölüt bir tümceden(sözce) olu³ur. [Brennan vd., 1987] bu kuram bilgisayarl bir model olarak sunmu³tur.

2.4 Türkçe için Dilbilimsel Artgönderim

Çal³-malar

[Oktar ve Ya§co§lu, 1997] yapt§ çal³mada [Fox, 1987]'un çal³masn ör-nek alarak üçüncü-tekil-ki³i insan göndergelerinde olu³an artgönderim örün-tülerini saptamaya çal³m³lardr. Veri tabanndaki metinleri inceleyerek elde ettikleri bulgularda, artgönderim örüntülerinin tümüyle retorik düzenlemeyle yönetilmedi§ini, artgönderim seçimlerinde yapsal olmayan etkenlerin de rol oy-nad§n gözlemlerler. Ortaya çkan bulgular ³u ³ekilde özetlenebilir:

1. E§er aktif göndermede söz konusu ki³i ya da varlk hakknda daha önce bir açklama varsa, bu öncüle yaplacak bir gönderme adl ile gerçekle³ir.

(30)

Aksi halde ad öbe§i kullanlr.

2. Bu çal³mada verilen bir örnekte öncül ile adl arasnda dört önermeli bir bo³luk vardr. Böylelikle tam ad öbe§i kullanma zorunlulu§unun olmad§ tespit edilmi³tir.

3. Adl kullanmnn uygun olabilece§i retorik birimlerde genellikle tam AÖ'lerinin kullanld§na ili³kin bulgular bu tür metinlerde tam AÖ'lere geleneksel gönderge ba§lantsnn d³nda çok daha ba³ka i³levler yüklendi§ini gös-termektedir.

[Çeltek ve Oktar, 2004] ise yine [Fox, 1987]'un çal³masndaki Retorik Yap Çözümlemesi yöntemini temel alarak metinlerin sadece bir tümceler dizisi olmad§, a³amal biçimde düzenlenmi³ önermeler dizisi oldu§uyla ilgilenmi³tir. Bu çal³mada 5000 önermenin adl ve bo³ artgönderim örüntüleri çözümlenmi³-tir. Bu analizde sadece 3. ki³i göndergeleri için 317 adet bo³ artgönderim ve 144 adet açk adl oldu§u tespit edilmi³tir. 3. ki³i göndergelerde bo³ art gönderim-lerin daha a§rlkl oldu§u kesindir. Öte yandan çal³madaki ilginç bir bulgu ise 1. ve 2. ki³i ile cansz göndergelerine yöneliktir. Bu göndergeler için tercih edi-len artgönderimsel biçimin açk adl oldu§u belirtilmektedir. Öte yandan araya giren önermelerde söz konusu ki³iye ili³kin bir açklama yaplm³ ise gönderge geriye-atlama yapsnda adl ya da bo³ artgönderim ile kodlanmaktadr.

Peki adl ya da bo³ artgönderim seçime ba§l olarak m yaplmaktadr ? [Enç, 1986] açk adlarn söylem içinde konu³anlar ve dinleyenler tarafndan ö§-renilmesi gereken edimbilimsel i³levleri oldu§undan, bo³ ulamn ve açk adln seçime ba§l olmad§n söyler.

[Erguvanl-Taylan, 1986] söylemde öznenin konu de§i³tirme i³levi gör-dü§ü durumlarda, açk adllarn kullanlmasnn zorunlu oldu§unu ve bo³

(31)

ula-mn dilbilgisi d³ yaplara neden oldu§u görü³ünü savunur. Ve bo³ adln söylem özellikleri açsndan açk adllarla örtü³medi§ini gösterir. Çal³mada gönderimin olu³tu§u üç durumun alt çizilir:

1. Bo³ artgönderimlerin zorunlu kullanm 2. Açk adllarn zorunlu kullanm

3. Bo³ artgönderimin ya da Açk adln seçimli kullanm

Yan tümcelerdeki tamlayan pozisyonundaki ifadelerin dü³mesi tamlayan du-rumlu bo³ bir artgönderim olarak yorumlanr.

Eroli i kars için her³eyi yapar. (2.16)

2.16 nolu tümcede kars ifadesinden hemen önce bo³ bir artgönderim vardr. Bu art gönderimin bo³ kullanlmas zorunludur ki Erol ile e³gönderime sahip olsun. Benzer bir durum a³a§daki 2.17 nolu tümce için de geçerlidir.

i kars için Eroli her³eyi yapar. (2.17)

Bo³ art gönderim öncülden önce olsa da farketmez. Bu durumda yine iki ö§e ayn e³gönderime sahiptir. Öte yandan 2.18 ve 2.19 nolu tümcelerdeki kars ö§esi açk adl ile kullanlm³tr. Bu durumda söz konusu açk adl (Onun) Erol ile ayn e³gönderime sahip olmaz.

(32)

2.19 nolu tümcede açk adl öncülünden önce yer almasna ra§men 2.18 nolu tümceyle ayn davran³a sahiptir.

Onun∗i/j kars için Eroli her³eyi yapar. (2.19)

Ancak öncüller birden fazla olduklarnda, tümce içindeki pozisyonlar önemli olur. Örnek olarak a³a§daki 2.20 nolu tümcede bo³ artgönderimin öncülü be-lirsizdir.

Ahmeti Erolj'a i/j karsn sordu. (2.20)

Ancak karsn ö§esi de§i³ik pozisyonlarnda yer ald§nda bu belirsizlik ortadan kalkar. Karsn ifadesi 2.21 nolu tümcedeki gibi yerle³ti§inde, bo³ artgönderim Ahmet öncülüne gönderimde bulunur.

Ahmeti i/∗j karsn Erolj'a sordu. (2.21)

2.22 nolu tümcedeki gibi bir dizili³ söz konusu oldu§unda bo³ artgönderim Erol'a gönderimde bulunur.

(33)

Çal³madaki bir ba³ka bulgu ise ³udur: Ana tümce öznesi ile ayn e³ gönde-rime sahip yan tümce öznesi bo³ adl olmak zorundadr.

Eroli bana [ i/onun∗i/j toplantya gelmeyece§ini] söyledi (2.23)

2.23 nolu tümcede görüldü§ü gibi e§er yan tümcenin öznesi açk adl olursa gönderimi Erol, yani ana tümcenin öznesi, olmaz. E§er bu özne bo³ artgönderim olursa Erol'a gönderimde bulunabilir. Dolays ile bu tip örneklerde adllarn açk ve bo³ kullanlmas seçime ba§l de§ildir.

Çal³mada alt çizilen bir di§er önemli ba³lk ise söylemin gönderim çözü-müne etkisidir.

Eroli yeme§e gelecek miydi ?

Nazan bana [onuni/ i yedide gelece§ini] söyledi (2.24)

2.24 nolu söylemde onuni/ i gönderimleri Erol'a gönderimde bulunur. Oysa

birinci tümce dikkate alnmaz ise bu durumda söz konusu gönderimler tümce içindeki özne pozisyonunda yeralan Nazan'a gönderimde bulunurlar.

[Turan, 1996] Türkçe söylemdeki artgönderimsel ili³kilerin karakteristi§ini çkarmaya çal³m³tr. Bu çal³masn Merkezleme Teorisi üzerinden yapm³tr. Buna yönelik olarak üç temel olguyu tart³m³tr.

• Hangi ifadeler gönderimler için öncül olma potansiyeline sahiptir. Baz ifadeler gönderimseldir, bazlar de§ildir.

(34)

• Ayrca potansiyel öncüller belli bir belirginlik de§erine sahiptir. Bu belir-ginlik de§eri nasl hesapland§ çal³mann ikinci olgusudur.

• Üçüncü amaç, bo³artgönderim, açk adl ve özne pozisyonundaki tam ad öbe§inin i³levini ortaya çkarmaktr.

Bu çal³madaki bulgular çal³mamzn ileriki a³amalarnda kullanlaca§ndan detaylarn daha sonra tart³aca§z.

[Enç, 1986] Türkçe'deki bo³ artgönderim ve açk adllarn serbest olmad-§n söyler.

Ben çar³ya gidiyorum

çar³ya gidiyorum (2.25)

2.25 nolu örnekteki ilk tümcede özne açk adlla ifade edilmi³.kinci örnekte ise bo³ artgönderim kullanlm³tr. [Enç, 1986] ilk cümledeki açk adln söyle-min konusunu belirledi§ini söyler. kinci tümce "Neden ceketini giydin" gibi bir soruya cevap olarak verilmi³tir. Bu durumda ceketin neden giyildi§i söylemin konusudur. Bu konuya yorum yapmak için ikinci tümce kullanlr. Bu tümcede bo³artgönderim kullanlmasnn sebebi, söylemin konusunun özne olarak belir-lenmesinden kaçnmaktr. Ayrca [Enç, 1986] özne pozisyonundaki açk adln konu de§i³tirmek için kullanld§n söyler. Ayrca iki ad öbe§i arasnda bir ay-krlk (contrast) yaratmak için açk adl kullanlanilir.

Arabay Ahmet ykamad. Ben ykadm

(35)

Açk adl kullanmann bu iki i³levi - konu de§i³tirme ve aykrlk yaratma- bir-birlerine ba§l kavramlardr.

(36)

Bölüm 3

BLGSAYARLI ARTGÖNDERM

ÇALI“MALARI

Bu bölümde artgönderim çözümlemesi için ne tip bilgisayarl tekniklerin kul-lanld§na bakaca§z. Bu nedenle öncelikle bilgisayarl artgönderim çözümleme süreçlerinin nelerden olu³tu§unu inceleyip Türkçe ve di§er Dünya dilleri için hangi tekniklerin ve çözümlerin önerildi§ine bakaca§z. Basitle³tirilmi³ çözüm-leme süreçleriyle ba³layalm.

3.1 Artgönderim Çözümleme Süreçleri

Bu ksmda artgönderim çözümlemesi için yaplmas gereken temel admlardan bahsedece§iz. Bu admlar bugüne kadar artgönderimle ilgili yaplan çal³malarda uygulanan temel admlardr. Bir çok çal³ma a³a§ yukar benzer a³amalardan geçerek artgönderim için bir çözüm olu³turmaya çal³m³tr. Bu a³amalar ³u ³ekilde sralayalm:

(37)

ö§e-lerden hangilerinin söylem için bir varlk oldu§u saptanr. Bu varlklar çö-züm sistemine söylem varl§ olarak dahil edilirler. Varlklar, gönderimde bulunabilenler ve bulunamayanlar olarak ikiye ayrlr. Ve yine gönderimde bulunamayanlar ise öncül potansiyeli§ine sahip ve sahip olmayanlar ola-rak ikiye ayrlr. Ya da bir ba³ka ifade ile gönderimsel ifade (referring expression) snfnda olanlar ya da olmayanlar ³eklinde ikiye ayrlabilirler. Dolaysyla söylemdeki ö§eler üç ³ekilde snandrlr.

(a) Gönderimsel Varlklar: Açk Adllar(Adlsal, Dönü³lü, Kar³lkl), Bo³ Artgönderimler, Sözlüksel Ad Öbekleri.

(b) Öncül Potansiyeline Sahip Varlklar (Referring Expressions): Gönde-rimsel varlklar da yine bu snfa dahil olurlar. Yani bir adl bir di§er adla gönderimde bulunabilir. Hatta bu Türkçe metinlerde çok sk olan bir durumdur. Bunun d³ndaki ad öbekleri ya da tümceler bu snfa dahil olabilir.

(c) Öncül Potansiyeline Sahip Olmayan Ö§eler: Eylemler (ço§u zaman), Saylar, Sfatlar vb. Bu ö§eler baz ko³ullarda gönderimsel ili³ki içinde olabilirler. Ama ço§unlukla bu ili³kilerin d³ndadrlar.

Bu snandrma, olu³turulacak bir modelin hzn ve performansn ar-tracaktr. Çünkü bu snandrma ve de eleme sayesinde Artgönderim Çözümleme Algoritmas gereksiz ö§eler ile u§ra³mayaca§ndan mode-lin ba³arsn olumlu yönde etkileyecektir. Bir artgönderimin olas öncül adaylarnn azalmas, gönderim potansiyeli ta³mayan söylem varlklar için aday öncül aranmamas gibi durumlar sistemin ve de algoritmasn ba³arsn ve hzn artracaktr.

2. Olas Aday Öncüllerin Olu³turulmas:

(38)

or-tak özelli§i herbir gönderge için tekrarlanmasdr. Yani tüm göndergeler çözümlenene ya da i³lenene kadar bu a³amalar sürekli tekrarlanr. Sözko-nusu gönderge/adl için olas öncül adaylarnn olu³turulmas için dikkate alnan temel noktalar ³unlardr:

(a) Aday öncüllerin, ele alnan gönderge ya da adl ile ayn söylem snr-lar içinde olmas

(b) Aday öncüllerin ele alnan adldan önce gelmesi 1

3. Öncüllerin Süzülmesi:

Süzme a³amas söz konusu adl için mantksz öncüllerin elenmesidir. Bir adl bir önceki a³amadan geçmi³ olas öncüllerden sadece belli kurallara uyanlar ile gönderimsel bir ili³ki içinde olabilir. Örnek olarak say, ki³i, cinsiyet uyumu bu kurallar arasndadr. Ama sözkonusu dilin bu bilgileri kodlamas gerekmektedir. Türkçe bunlardan sadece say ve ki³i bilgisini kodlamaktadr. Dolaysyla bu a³amada bizim çal³mamzda kullanaca-§mz süzme tekni§i sadece say ve ki³i bilgilerini içerecektir. Bunun d-³nda ba³ka süzme yöntemleri de vardr. Anlambilimsel süzme bunlardan en önemlisidir. Bir varl§n ve eylemin anlamndan yola çkarak belli ku-rallar sisteme dahil edilebilir. Örne§in sistem ³u tip anlamsal kuku-rallar içe-rebilir; A§açlar yürüyemez, Kediler konu³amaz, nsan nefessiz ya³ayamaz. Ama bunlar gerçek dünyada, belli bir ba§lamda kabul görecek anlamsal olgulardr. Ba³ka bir evrende bu kurallar de§i³ebilir.

4. Kalan Öncüllerin Sralanmas Bu a³amada herbir gönderge için bir aday öncül listesi vardr. Böylelikle aday öncüller arasndan en uygunu

seçi-1Adl her zaman gönderimde bulundu§u söylem varl§ndan önce gelir. Ama bu kurala

istisna olu³turan durumlar da vardr. Mesele ngilizce'de "He's the biggest slob I know. He's really stupid. He's so cruel. He's my boyfriend, Steve." cümlesi dilbilgisel olarak do§rudur ve kullanlan bir yapdr. Burada He adl gönderimde bulundu§u Steve söylem varl§ndan önce gelir. Bu yaplara ngilizce'de Cataphora denir. Türkçe için sk kullanlan kar³l§ ise Öngönderimdir.

(39)

lebilecektir. E§er bu liste bo³ gelirse, ya di§er a³amalardan bazlar iptal edilir ya da bu gönderge çözümsüz braklr. Baz sistemlerde bu çözümsüz durum için özgün yöntemler kullanrlar. Örne§in adla en yakn öncül bu adln öncülü olur. Bu yöntemi deneyimizin bir ksmnda kullanaca§z. Bu tamamen sistemin gereksinimlerine ba§ldr. E§er liste bo³ de§ilse aday ön-cüllerin sralanmas ya da belli puanlarla a§rlklandrlmas gerekir. Buna yönelik kullanlan iki önemli bilgi tabanl kuramdan bahsedebiliriz: Mer-kezleme Teorisi ve Belirginlik Tabanl(Salient-based: RAP, MARS, etc...) algoritmalar. Bilgi tabanl yöntemlerin d³nda makine ö§renmesi algorit-malar da kullanlmaktadr. Bu iki yakla³m - yani bilgi tabanl yakla³m-lar ve makine ö§renmesi yakla³myakla³m-lar- sonraki bölümlerde ayrntl oyakla³m-larak incelenecektir.

3.2 Bilgi Tabanl (Knowledge-Based)

Artgönde-rim Çözümleme Çal³malar

Bir önceki bölümde de bahsetti§imiz gibi artgönderim çözümlemesinin baz a³a-malar vardr. Bu a³amalardan sonuncusu hariç di§erleri hemen hemen tüm yak-la³mlar için ayndr ve çok büyük bir de§i³iklik göstermezler. Son a³ama hangi öncülün hangi sralamadan geçeçe§ine ili³kin bir yöntemini içerir. Son a³ama için birçok yakla³mdan bahsedilebilir. Bu bölümde bilgi tabanl (knowledge-based) yakla³mla ilgili ne tür çal³malar yapld§ incelenecektir. Bu yakla³mlar daha çok dilbilimsel teorilerden elde edilir ve öne sürülen model bu teorik arkaplan üzerine oturur. Bu yakla³mlardan öne çkanlar tek tek inceleyelim.

(40)

3.2.1 Hobbs'un Algoritmas(Hobbs's Naive Algorithm)

En eski bilgi tabanl artgönderim çal³mas [Hobbs, 1978] tarafndan sunulan sözdizim tabanl bir çözümdür. Her bir gönderge için aday öncüllerin bulun-mas ve tespiti sözdizim a§acnn taranbulun-mas ile yaplr. Öncül arama i³i metnin yönünün tersinedir. Öncül arama sözkonusu göndergenin ya da adln içinde bu-lundu§u tümceden ba³lar ve geriye do§ru gider. Bu aramada a§aç soldan-sa§a ve yaylma öncelikli arama (breadth-rst) yöntemiyle taranr. Tarama sonucunda uyum ve ba§lama ko³ullarna uyan ilk aday gönderge ya da adl için önerilir. Bu kadar basit olmasna kar³n tam ayr³trlm³ bir sözdizim a§acna ba§ml olmas bir dezavantaj olarak görülür.

Bu algoritma sözkonusu adln bulundu§u tümce ile önceki tümcelerin söz-dizim a§açlarn girdi olarak alp bu a§açlar üzerinde uygun bir öncül arar. A§aç tarama algoritmasnda belirlenmi³ bir Söylem Modeli vardr. Bundan do-lay a§ac tarayacak olan algoritma bir dilbilgisi belirlemek zorundadr. Çünkü sözdizimsel olarak a§acn yapsna ili³kin kabuller sonuçlar etkileyecektir. Bu yakla³mda Ad Öbe§inin (NP) her zaman için bir A-Bar (N-Bar) içerdi§i kabul edilir. A³a§daki iki tümceyi inceleyelim:

1. Mr. Smith saw a driver in his truck.

2. Mr. Smith saw a driver of his truck. (3.1)

lk tümcede his adl a driver aday öncüle gönderimde bulunabilir. Ama ikinci tümcede bu gönderim mümkün de§ildir. Bu iki tümcenin sözdizim a§aç-larna bir gözatalm.

(41)

“ekil 3.1: Birinci tümcenin sözdizim a§ac ikinci tümcenin sözdizim agac “ekil 3.2'deki gibi olur.

Hobbs algoritmas bu sözdizim a§açlarn belli bir yöntem ile tarayarak he-saptaki adl ile say-ki³i uyumu gösteren öncülleri arar. Bu arama i³lemi belli kurallarlardan olu³ur. Bu kurallar ³u ³ekilde sralayalm:

1. Sözkonusu gönderimi içeren Ad Öbe§i ile ba³la.

2. Üst seviyede ilk kar³la³lan AÖ veya S 2 dü§ümüne çk. Bu dü§ümü X,

bu dü§üme ula³mak için izledi§in yolu ise p (PATH) olarak kaydet. 3. Bu X dü§ümünün altnda ve bu p yolunun solunda kalan a§ac soldan

sa§a (left-to-rigth) ve yaylma öncelikli arama (breadth-rst) biçimiyle tara. Kar³la³lan herhangi bir NP'yi öncül olarak öner.

4. Bu X dü§ümü tümcedeki en üst S dü§ümü ise, bir önceki tümceye geç ve bu a§ac sa§dan sola (letf-to-right) biçimiyle ile tara. Kar³la³lan Ad

2Buradaki S dü§ümü ana tümceyi ifade eder. Örne§in S->NP VP gibi bir tekrar yazma

kurallar içeren bir sistem dü³ünülebilir. Burada NP(Noun Phrase) Ad Öbe§ini, VP (Verb Phrase) Eylem Öbe§ini ifade eder. Burada S dü§ümünü tümce ayr³trma a§acnn en tepe-sindeki dü§üm olarak kabül ediyoruz. Çünkü ba³ka sistemlerde bu tepe dü§üm daha farkl olabilir.

(42)

“ekil 3.2: kinci tümcenin sözdizim a§ac

Öbeklerini öncül olarak öner. E§er bu X dü§ümü en yüksek S dü§ümü de§il ise 5. admdan devam et.

5. X dü§ümünden üst seviyede ilk kar³la³lan Ad Öbe§i veya S dü§ümüne çk. Bu dü§ümü X de ve bu dü§üme giden yolu p olarak kaydet.

6. E§er X dü§ümü AÖ ise ve p yolu X'in yönetti§i3 herhangi bir N-bar'dan

geçmiyor ise, bu dü§ümü öncül olarak öner.

7. Bu X dü§ümünün altnda ve bu p yolunun solunda kalan a§ac sa§dan sola, yaylma öncelikli biçimle tara. Kar³la³lan herhangi bir AÖ'yü öncül olarak öner.

8. E§er X bir S dü§ümü ise, p yolunun sa§nda, X'in altnda kalan tüm dallar tara. Ancak Kar³la³lan bir AÖ (NP) veya S dü§ümünün altna inme. Kar³la³lan AÖ'leri öner.

3Bu yönetme olgusu (c-command) sözdizim a§acndaki dü§ümlerin birbriletiyle olan

ili³ki-sidir. Örne§in A dü§ümü B dü§ümünden yüksekte ise, ayn zamanda A dü§ümü B'den köke giden yol üzerinde de§ilse ve A dü§ümü B dü§ümünün solunda ise A dü§ümü B dü§ümünü yönetir (c-command) eder

(43)

9. 4. Adma geri dön.

Bu algoritmadaki 2. ve 3. admlar dönü³lü adllarn seviyeleriyle ilgilenirler. Bununla birlikte 5 ile 9 arasndaki döngü S ve NP dü§ümleri ile ilgilenir. 4 adm ise daha önceki tümcelere geçi³i sa§lar.

Görüldü§ü üzere Bu algoritma bir dilgilgisine ihtiyaç duyar. Bu algoritma için ilk kullanlan dilbilgisi a³a§daki gibidir.

S → NP VP (3.2) NP → (Det) N-bar (PP)* NP → pronoun Det → article Det → NP's N-bar → noun (PP)* PP → preposition NP VP → verb NP (PP)*

Buradaki * karakterleri sfr (0) ve sonsuz tekrar anlamna gelir.

[Tüfekci ve Klçaslan, 2007] Türkçe bir tümce üzerinde bu algoritmaya açklk getirmi³. A³a§daki tümceyi bu algoritma üzerinden açklam³.

Mr. Smith kendi kamyonunda bir adam gördü (3.3)

(44)

“ekil 3.3: Ayr³trma A§ac

Bu örnekte görüldü§ü gibi kendi dönü³lü adlndan, onu yöneten NP 1_loc dü§ümüne geçiliyor. Ardindan VP1 ve S1 dü§ümleri takip edilerek Mr. Smith öncülüne ula³lyor. Bu a³amada program do§ru çal³yor. Ancak bu tümcedeki kendi dönü³lü adl yerine, onun açk adl olsayd bu algoritmann çözümü yanl³ olacakt. Bunu için ba³ka bir kural olu³turmak gerekiyor. Bu konu bah-setti§imiz çal³malarda ayrntl bir ³ekilde tart³lm³tr.

3.2.2 Merkezleme Teorisi ve Algoritmas (Centering

Te-ory)

Bu kuramn arkaplan bölüm 2.3.4'de verilmi³tir. Bu bölümde de belirtildi§i gibi her söylem bir dizi tümceden olu³ur. Her tümce daha sonraki adllar için öncül olabilecek bir dizi söylem varl§na sahiptir. Bu söylem varlklar belli bir sralama yöntemine göre sralanr ve ileriye dönük merkez (Mi) listesini

olu³turur. Bu ileriye dönük merkez listesi söylem boyunca sürekli güncellenir ve sralama de§i³ir. Bu liste yeni bir listeyle de§i³ecektir. Dolaysyla Mi ba³ka

(45)

olacaktr. Mi listesindeki en belirgin ö§e ya da ilk adln olas öncülü olabilecek

söylem varl§ o listenin oda§ olacak ve Mo olarak ifade edilecektir.

3.2.3 BFP

Merkezleme Algoritmalarndan en önemlisi [Brennan vd., 1987] tarafndan ta-sarlanan BFP algoritmasdr. Algoritma, verili bir adln çözümlenmesi için, süzme a³amasnda aday öncülleri biçimbilgisel kstlarla (cinsiyet, say, ki³i uyumu gibi) sözdizimsel kstlar(ba§lama kstlar gibi) kullanarak eler. Ardndan aday öncüllerin sralanmas merkezleme teorisi ilkeleriyle yaplr.

Ancak daha sonra yaplan çal³malar Merkezleme Algoritmasnn açklarn ya da eksiklerini tamamlamaya çal³m³tr. Merkezleme Teorisi sadece yerel söy-lem alannda bir çözüm arar ve verilen bir gönderge ya da adl için yerel söysöy-lemin d³na çkmaz. Ama gerçek uygulamalarda yerel söylem d³na gönderimde bulu-nan göndergeler mevcut oldu§undan bu aç§ kapamaya yönelik ba³ka çal³malar da olmu³tur. Bir di§er problem ise her bir göndergenin gönderimi için bir önceki tümce analiz edilir. Bu da teorik olarak sorun olmasa da pratik uygulamalarda bir sorun olarak görülmektedir. Çünkü bir adl iki tümce öncesine gönderimde bulunabilir. Ayn zamanda sralama yöntemi de yeterince belirgin olmad§ndan baz varlklar ayn sraya sahip olabilmektedir.

Merkezleme Kuram dikkat oda§ndaki de§i³imleri ve dönü³ümleri de ince-lemektedir. Söylemdeki merkezde meydana gelen de§i³iklikler devam, içerme, yumu³ak-dönü³ ve sert-dönü³ olmak üzere dört ³ekilde ifade edilmektedir.

[Brennan vd., 1987] bu geçi³leri 3.1 nolu tablodaki gibi açklam³tr.

Bu merkezleme geçi³leri söylem varlklarnn belirginlik derecelerine göre s-ralanr. Merkezdeki her türlü de§i³iklik bu geçi³lerle ifade edilmi³tir. Merkezleme

(46)

Tablo 3.1: Merkezdeki De§i³iklikler

Mg(Tn)=Mg(Tn-1) Mg(Tn)!=Mg(Tn-1)

Mg(Tn)=Mo(Tn) Devam Yumu³ak Dönü³

Mg(Tn)!=Mo(Tn) çerme Sert Dönü³

Teorisine göre söylem bu geçi³lerden bazlarn daha çok tercih eder. Mesele De-vam geçi³i ilk tercihtir. DeDe-vam geçi³i iki önceki ve bir önceki tümcede merkezde yer alan ö§renin yine merkezde olmas durumudur. Yani merkezin de§i³memesi söylem yapsnn ilk tercihidir. Bu anlamda teoriye göre söylemler merkezleri-nin fazla de§i³memesini tercih eder. Dolaysyla bu geçi³leri belli bir öncelikle sralamak gerekiyor.

Devam >çerme > Yumu³ak-dönü³ > Sert-Dönü³ (3.4)

Söylemdeki adllarn gönderimsel ili³kileri çözümlenirken bu sralamadan ya-rarlanlr. Tümcedeki adllar aday öncüllerle birçok biçimde e³le³ebilir. Bu e³le³-meler farkl senaryolar olu³turur. Bu farkl senaryolar ise farkl geçi³ durumla-rna denk gelir. Bu a³amada hangi geçi³in seçilece§i i³te yukardaki sralamaya göre seçilir. Yani Devam geçi³i çerme geçi³ine tercih edilir. Benzer bir ³ekilde çerme Yumu³ak Dönü³e, Yumu³ak Dönü³ Sert-dönü³e tercih edilir. Bu tercih yapldktan sonra hangi adln hangi öncüle gönderimde bulundu§u ortaya çkar. Bu da Merkezleme Algoritmasnn çözümü olmu³ olur. Bu algoritmann adm adm bir örne§i izleyen bölümlerde verilecektir.

(47)

3.2.4 Lappin ve Leass'in Sözdizim Tabanl Yakla³m

[Lappin ve Leass, 1994] belirginlik temelli ve sözdizimsel kstlar ve kurallar içe-ren bir yöntem sunar. Bu yöntemde herhangi anlambilimsel ve edimsel kst bu-lunmaz. Sunulan yakla³m sadece biçimbilimsel ve sözdizimsel kstlar uygular. Yöntemin temel yakla³m aday öncüllere biçimbilimsel ve sözdizimsel özellik-lerine bakarak belli puanlar(scoring) vermesidir. Her bir öncül toplad§ puana göre sralanr ve en çok puan toplayan öncül verilen adln ya da göndergenin öncülü olarak sisteme önerilir. Toplanan bu puan o öncülünün söylem içindeki belirginli§ini (salient) ifade eder. Dolaysyla bu teorinin sadece do§rusal bir yakla³m vardr.

Tüm söylem varlklarna ya da gönderimsel ifadelere bu belirginlik a§rlk-landrlmas uygulanr. Ve her söylem varl§nn puan hesaplanr. Ancak bu puan ele alnan adla göre belirlenir. Her söylem varl§nn adldan ba§msz pu-an olmaz. Ele alnan adl ile olan uyumu en büyük etkendir. Örnek olarak adl ile öncülün tümce yaknl§ önemli bir etkendir. Ayn zamanda adl ile say/ki³i ve cinsiyet uyumu da bir di§er önemli etkendir. Ancak yine de her ö§enin ele alnan adldan ba§msz özellikleri bulunur. Örne§in ele alnan öncülün dilbigisel görevi (özne, nesne vb.) a§rlklandrmay etkileyen güçlü bir bilgidir ve bu bilgi adldan ba§mszdr.

“imdi hangi etken için ne gibi bir a§rlklandrma yaplaca§na baklacak. [Lappin ve Leass, 1994] Tablo 3.2 içindeki a§rlk de§erlerini kendi modelle-rinde uygulam³tr.

Gönderimi çözümlenecek adl ile aday öncül arasndaki uzaklk en çok bir tümce kadarsa, öncülün belirginlik de§erine 100 puan eklenir. E§er öncül özne pozisyonundaysa 80 puan eklenir. Öncül varolu³sal pozisyonunda 4 ise 70,

(48)

Tablo 3.2: Belirgenlik Türleri ve A§rlklar

Etkenin Türü A§rl§

Tümce Yaknl§ 100

Özne Olma Durumu 80

Varolu³sal Vurgusu

(Exis-tential Nominal) 70

Belirtme Durumu

(Accusa-tive Case) 50

Dolayl Nesneler (Indirect

Object) 40

Ba³ Ad Öbe§i Vurgusu

(Head Noun Emphasis) 80 Belirteç Öbe§inde olmama

vurgusu (Non-adverbial Emphasis)

50

lirtme durumuna sahipse 50, dolayl nesne ise 40, ba³ ad öbe§i5 ise 80 ve Belirteç

öbe§inde ise 50 puan eklenir. Bu a§rlklandrma tablosu kullanlarak rastgele seçilen yakla³k 360 adl üzerinde algoritma snand. Bu snama sonucunda % 86 orannda bir ba³ar kaydedildi.

3.2.5 Kennedy ve Boguraev'in Yöntemi

[Kennedy ve Boguraev, 1996] RAP alogritmasnn de§i³tirilmi³ bir versiyonunu sundular. Bu çal³mada kullandklar sistem, ayr³trma a§acna (parse tree) ih-tiyaç duymuyor. Bu yöntemde dilbilgisel görevler (Grammatical Role) yerine sadece sözdizimsel bilgiye göre, verilen bir adln aday öncülleri puanlanr ve s-ralanr. Bu özelli§i ile RAP algoritmasndan daha avantajl bir noktada duruyor. Çünkü gerçek sistemlerde mümkün oldu§u kadar az bilgi kullanarak tasarlanan

öbekleri için ayrca bir a§rlk de§eri eklenir. Çünkü bu yapda bulunan ad öbekleri söylemde vurgulanrlar. Örnek olarak "There are some books on the table" ifadesindeki some books ad öbe§i varolu³sal vurgusu içerir.

5Öncül söyleme ilk ad öbe§i olarak dahil olmu³sa o öncülü ödüllendiriyoruz. Örne§in

"Ah-met birden uyand..." ile ba³layan bir söylemde daha sonra her Ah"Ah-met öncülü için ba³ ad öbe§i vurgusu yaplacaktr.

(49)

modeller her zaman çok daha etkili ve pratik oluyorlar. Bilgiye ba§mll§n en aza indirilmesi son zamanlardaki çal³malar için önem verilen bir noktadr. Bi-çimbirimsel analiz yapan LINGSOFT isimli modelden gelen bilgileri kullanan bu yakla³m, RAP alogritmasnda oldu§u gibi belirginlik a§rlklandrmas içerir. Magazin dergilerinden, ürün tantmlarndan ve gazete haberlerinden olu³turu-lan derlem üzerinde test edilen algoritma 306 adl için uyguolu³turu-land ve % 75 gibi bir ba³ar elde etti.

3.2.6 Baldwin's Cogniac

[Baldwin, 1997] az bilgili ve bir takm kurallardan olu³an bir model sundu. Bu kurallar srayla adllar üzerinde uygulanr. Bu kurallar önemleri ve artgönderim çözümüyle olan ili³kilerine baklarak sralanr. Adla ili³kin uygun bir kural sa§-land§nda süreç tamamlanr ve sonuca varlr. Dolaysyla kurallarn sras çok önemlidir.

Bu yöntemde uygulanan kurallar ve bu kurallarn ne gibi bir ba³ar sa§la-d§n a³a§daki ³ekilde sralayalm:

1. Söylemde Teklik (Unique in Discourse): E§er sadece bir aday öncül varsa onu adln öncülü olarak seç. Bu kural 8 kere do§ru sonuç verdi.

2. Dönü³lü (Reexive): E§er adl dönü³lü ise tümcedeki en yakn aday öncül olarak kabul et. Bu kural 16 kere do§ru, bir kere yanl³ çal³t.

3. Önceki ve mevcut tümcedeki tekillik (Unique in current and prior): E§er bir önceki tümce ya da mevcut tümcede tek bir adl varsa onu öncül olarak seç. Bu kural 114 kere do§ru, 2 kere yanl³ cevap verdi.

(50)

4. yelik durumundaki adllar (Possessive Pronoun): E§er adl iyelik halinde ise (my, your, his, her vb.) ve bir önceki cümlede iyelik halinde olan bir öncül var ise onu adln öncülü olarak kaydet. Bu kural 4 kere do§ru, 1 kere yanl³ çal³m³tr.

5. Mevcut Tümcede Teklik (Unique current sentence): E§er mevcut tümcede sadece bir aday öncül varsa, onu adln öncülü olarak kaydet. Bu kural 21 kere do§ru ve 1 kere yanl³ sonuç vermi³tir.

6. Tekil Özne / Adls Özne (Unique Subject / Subject Pronoun): E§er bir önceki tümcenin özne Ad Öbe§i sadece bir aday öncül içeriyorsa ve mevcut tümcenin öznesi adl ise, bir önceki tümcenin ad öbe§ini öncül olarak kaydet. Bu kurallar 11 kere do§ru çal³m³ ve hiç yanl³ sonuç vermemi³tir.

Srasyla uygulanan bu kurallar d³na çkan durumlar için daha sonra iki ek kural daha eklenmi³tir. Bu çal³ma The Wall Street Dergisi'nden elde edilen derlem üzerinde 200 adl için uyguland ve % 92 kesinlik (precision), % 64 anma (recall) orannda bir ba³ar elde etti.

3.2.7 MARS

[Mitkov, 2002] tarafndan geli³tirilen MARS (Mitkov's Anaphora Resolution System) isimli sistem tam otomatik çal³abilme 6 yetene§ine sahiptir. Yani

hiç-bir i³aret koyulmam³ serbest metinler sistem tarafndan analiz edilir. Ve içerdi§i artgönderimsel ili³kiler otomatik olarak belirlenir ve belli bir ba³ar oranyla çö-zülür. MARS02 kodlu ilk versiyonda toplam be³ a³amada i³lemler tamamlanr.

6Bu sistemin ilk versiyonu yar-otomatik olarak çal³yordu. Daha sonraki denemelerde tam

otomatik bir sistem kuruldu. Ancak do§al olarak tam otomatik sistem yar-otomatik sisteme göre daha az ba³arl olmu³tur.

(51)

Birinci a³amada de§erlendirilecek i³lenmemi³ metin sözdizimsel olarak ayr³t-rlr. Bu a³amada ayr³trlm³ her bir parçann biçimbilimsel, sözdizimsel, dil-bilgisel analizi yaplr. Ad Öbekleri bu süreçte belirlenmi³ olur. kinci a³amada artgönderimsel adllar, gönderimsel olmayan ö§eler makine ö§renmesi algorit-malar aracl§ ile ayklanr. Üçüncü a³amada her bir adl için, adln bulundu§u tümce ile iki tümce öncesine kadar olan metin parçasndaki olas adaylar belir-lenir. Bu a³amada mevcut adaylar belli kstlar çerçevesinde yar³rlar. Yar³ta sözdizimsel kstlar uygulanr. Öncelikle her bir aday öncül adl ile say, ki³i ve cinsiyet uyumu içinde olmaldr. Dördüncü a³amada RAP algoritmasnda oldu§u gibi her bir aday öncülün puan hesaplanr. Bunun için etkenlere ba§l olarak adaylar de§erlendirilir ve puanlanr. Be³inci a³amada ise en yüksek puana sahip aday adln öncülü olur. MARS'n en son versiyonunda baz güncellemeler yaplm³tr. MARS06 olarak nitelendirilen yeni versiyonda daha kat ve kesin uyum yöntemleri uygulanr. MARS sistemin en önemli özelli§i dünyadaki en iyi sistem olmas ve bu sistemin metin özetleme (text summarization), bilgi çka-rm (information extraction) ve metin snandrlmasnda (text categorisation) kullanlmasdr.

MARS bilgisayar kullanm klavuzlarndan olu³an 8 farkl döküman üzerinde çal³trlm³tr. Bu derlem 247.000 kelimeden ve 2263 adldan olu³ur. MARS'n tam otomatik versiyonundaki deneyler sonunda ortaya çkan ba³ar oran %61.55 olarak ölçülmü³tür. Bu oran do§ru çözümlenmi³ adl saysnn sistemde bulunan adl saysna orandr. Öte yandan yar otomatik versiyonundaki sonuçlar %85-90 arasnda çkm³tr. Bu yöntemin Bulgarca dili adaptasyonu % 72.6, Japonca dili adaptasyonu % 75.8 ba³ar elde etmi³tir.

(52)

3.3 Ö§renme Tabanl Artgönderim Çözümleme

Çal³malar

Makine ö§renmesi yapaz zeka alannn en önemli alt alanlarndan biridir. Bu disiplin içinde üretilen teoriler di§er disiplinlerdeki hemen hemen tüm alanlara, özellikle de yapay zeka alt alanlarna uygulanabilmektedir. Bu anlamda bilgi tabanl yöntemlere bir alternatif olu³turur. Ö§renme tabanl algoritmalar daha önceki deneyim durumlarndan bir model olu³turur. Olu³turulan modeller, da-yand§ veriyi iyi bir ³ekilde ifade etmeye çal³r ve bu verinin içindeki özellikle gizli olan kurallar çkarmaya çal³r. Ksacas, veri madencili§inin bir parças olan makine ö§renme algoritmalar insann bulamayaca§ kurallar çkarmak için kullanlr. En önemlisi ele ald§ veriyi analiz ederek gelecekte olu³acak durumlara tahminde bulunmasdr. Bu gücü sebebiyle ö§renme algoritmalar bilgisayarl dilbilim çal³malarnn hemen hemen tüm alt ba³lklar için uygu-lanmaktadr. Bu alt görevlerden biri olan Artgönderim Çözümlemesi için de uygulanmaktadr. Bu uygulamalarn ne tür süreçlerden geçti§ine bakalm.

3.3.1 Artgönderim çin Ö§renme Süreçleri

Ö§renme algoritmalar bir veritabanndaki veriye dayanarak bir model ortaya çkarr. Bu veritaban birçok özellik ve tek bir hedef özellik (ya da sonuç) içeriyor ise bu ö§renme yöntemine kontrollü (supervised), e§er sonuç alan içermiyorsa kontrolsüz (unsupervised) ö§renme denir. Kontrollü ö§renmede amaç, ba§msz özelliklerin hedef özellik ile olan ili³kisini bulmak. Buradaki Hedef ya da sonuç di§er özellik ö§elerinden hangilerine daha çok ba§lysa o özellik ön plana çkar. Bu özellikler birbirinden ne kadar ba§msz olurlarsa ve hedef snfa ne kadar ba§ml olurlarsa model o kadar ba³arl olur.

(53)

Peki Artgönderim çal³malar bu sürece nasl ba§lanacak ? Söylemdeki her-bir artgönderimsel adl ya da ö§e kendisinden önce gelen tüm söylem varlkla-ryla e³le³ir. Bu e³le³melerin her biri bir kayda denk dü³er. Bu kaytlarn hedef snf, sözkonusu artgönderim ile e³le³di§i varl§n ya da gönderimsel ifadenin gönderimsel bir ili³ki içinde olup olmad§na baklarak belirlenir. E§er iki ö§e arasnda gönderimsel bir ili³ki var ise hedef snf (sonuç) EVET olarak imlenir, aksi durumda ise HAYIR olarak imlenir. Bu duruma basit bir örnekle açklk getirelim. Diyelim ki

e1...e2...a1(> e1 )...e3...e4...e5...a2(>e4) (3.5)

söylem 3.5' deki gibi bir söylem üzerinde çal³yoruz. Bu söylemde e1,e2,e3,e4 ve e5 ö§elerinin gönderimsel ifade ve p1 ve p2 ö§elerinin ise adl oldu§unu kabul edelim. Adl a1'in e1'e ve adl a2'nin e4'e gönderimde bulundu§unu varsayalm. Bu durumda olu³turulacak veri kayt listesi Tablo 3.3'deki gibi olacaktr.

Tablo 3.3: Ö§renme Veritaban Adl Gönderimsel fade Sonuç

a1 e1 EVET a1 e2 HAYIR a2 e1 HAYIR a2 e2 HAYIR a2 e3 HAYIR a2 e4 EVET a2 e5 HAYIR

Bu tablodan da görüldü§ü gibi herbir adl ile ondan önce gelen her bir gönde-rimsel ifade e³le³iyor. Bu e³le³meler iki ³ekilde yaplmaktadr. Birincisi olumsuz e³le³me, ikincisi ise olumlu e³le³me. Bu tablo makine ö§renme algoritmas için bir e§itim kümesini temsil eder. Ancak bu a³amada belirtilmesi gereken bir

(54)

nokta ³udur: a ve e ile ifade etti§imiz adl ve gönderimsel ifadeler yerine bu ö§elerin ya da varlklarn özellikleri koyulmaldr. Yani adla ait özellikleri ve aday öncüle ait özellikler bu satrlarda bulunmaldr. Ayrca adl ile aday öncül arasndaki yaknlk, uyum gibi ili³kisel bilgiler de bu özelliklere eklenmelidir. Böylelikle ortaya çkan model, çözümü belli olmayan bir söylem üzerine uygula-nr ve bir çözüm sunar. Makine ö§renmesi tekni§ini Türkçe artgönderim çözüm-lemesi için uygulayan henüz yoktur. Bu nedenle bir sonraki bölümde ö§renme yakla³m içeren bu tekni§i di§er diller için kullanan çal³malara bakaca§z.

3.3.2 Di§er Dillerdeki Ö§renme Tabanl Çal³malar

[Aone ve Bennet, 1995.] Japonca metinlerde geçen farkl türdeki artgönderim-ler için makine ö§renme tabanl bir sistem geli³tirdiartgönderim-ler. Bu çal³ma artgönderim problemine makine ö§renmesi yakla³mn sunan ilk çal³madr. Bu çal³madan sonra birçok makale bu çal³maya atfta bulunmu³tur. Ö§renme algoritmas için gereken özellik vektörü için toplam 66 özellik kullanm³lardr. Bu özellikler söz-lüksel bilgiler, sözdizim bilgileri, anlamsal bilgiler ve adl ile öncül arasndaki mesafe bilgisinden olu³ur. Çal³mada iki olumlu örnek yaratma metodu kullanl-m³tr: Geçi³li ve geçi³siz. Geçi³li olumlu örnekler, herbir artgönderim ile dahil oldu§u artgönderimsel zincir üzerindeki onlardan önce gelen tüm ad öbekleriyle olu³turulan örneklerden olu³ur. Geçi³siz örnekler ise, herbir artgönderim ile da-hil olduklar artgönderimsel zincir üzerindeki onlardan önce gelen ilk (en yakn) ad öbekleriyle olu³turulan örneklerden olu³ur. Olumsuz örnekler ise benzer bir ³ekilde her bir artgönderimsel ifade ile ondan önce gelen ve artgönderimsel zin-cir üzerinde olmayan gönderimsel ifade e³le³melerinden yaratlr. Bu ³ekildeki e³le³meler e§itim ve sa§lama kümesini olu³turur. Bu deney [Quinlan, 1993.] -C4.5 karar a§ac algoritmasn kullanm³ ve çal³mann sonunda ö§renme

Referanslar

Benzer Belgeler

• Sunulan ikinci akıllı ba˘glantı y¨onlendirme y¨ontemi ic¸in veriye gerc¸ek zamanlı uyarlanabilen ve c¸evrimic¸i bir makine ¨o˘grenmesi y¨ontemi olarak c¸ekirdek

Yanşma Oturumu sonrası yapılan oylama sonucu dereceye giren ilk 3 çalışmaya diizenlenecel olan Ödül Töreninde Ödül takdim edilecektir.. Başrırrular 0l Haziran

Söz konusu yanşmanın Türkiye Cumhuriyeti Anayasası, Milli Eğitim Temel Kanunu ile TiiIk Milli Eğitiminin genel amaçlarına uyguıl olarak ilgili yasal

Amino asit yapım ve yıkım hızının yüksek olmasr, merkezi sinir sisteminin etkin ve verimli fonksiyon göstermesi için önemli bir parametredir; dolayısıyla yeterli

Kı K ısaca, ki saca, ki şinin kendini ş inin kendini bilmesi olarak. bilmesi olarak tan

OrtasÕ delikli freze çakÕlarÕ uzun ve kÕsa malafa milleriyle, saplÕ freze çakÕlarÕnÕn büyükleri özel sÕkma düzenleriyle, küçükleri de pens-mandren tertibatÕ ile

AynÕ úekilde sütun gizlemek istedi ÷inizde de gizlemek istedi÷iniz yerde bulunan sütun sayÕsÕnÕn üzerinde sa÷ tÕklayÕp Resim 2.6’da görebilece ÷iniz gibi açÕlan

Resim 8.5’te gösterilen özet tablo alan listesinden raporunu almak istedi ÷iniz alanlarÕ seçerek tabloyu daraltabilir veya geni úletebilirsiniz.. AyrÕca özet tablo