• Sonuç bulunamadı

Diğer birçok öğrenme tabanlı yaklaşım gibi, bu çalışmadaki öğrenme deneyleri için de, veri özellik-değer (feature-value) çiftlerinin vektörleri şeklinde ifade edilmelidir. Bu sebeple, kullanacağımız derlemin ilgili özelliklerle işaretlenmesi gerekir. Artgönderim çözümlemesi için makine öğrenmesi teknikleri kullanan tüm sistemler, sözlüksel (lexical), sözdizimsel, anlambilimsel ve konum belirten (positional) özelliklerin bir birleşimini kullanmaktadır. Aşağıda, ham metnin işaretlenmesi için kullanılan özellikler kısaca açıklanmaktadır.

Durum eki: Bir adılın veya aday öncülün sahip olduğu dilbilgisel (grammatical)

durum (yalın, belirtme, yönelme, bulunma, sahiplik (genitive), ayrılma veya araç durumlarından biri)

Dilbilgisel görev: Bir adıl veya aday öncülün özne veya nesne durumlarından

hangisinde olduğu.

Açıklık (overtness): Bir adılın sesbilgisel (phonetic) olarak açık veya gizli

Adıl Tipi: Bir adılın tipinin kişi, konum belirten, dönüşlü veya işteş tiplerinden

hangisi olduğu.

Anlamsal Tip: Bir aday öncülün referansının hayvan, insan, yer, soyut nesne

veya fiziksel nesne tiplerinden hangisi olduğu.

Kişi ve Sayı: Bir adılın veya aday öncülün kişi ve sayı bilgisi.

Konum: Uzaklık bilgisini hesaplamaya yardımcı olan, bir kelimenin söylem

parçası içindeki konumu.

Öncül konumu: Bir adılın gerçek öncülünün konumu.

Gönderimsel (Referential) Durum: Bir ad kökenlinin (nominal), öncül olarak

kullanılabilmesi için adılsıl-olmayan (non-pronominal) bir ifade olup olmadığı. Öğrenme tabanlı artgönderim çözümleme sistemlerinde kullanılan özellik sayıları, 8’den (McCarthy ve Lehnert 1995), 66’ya (Aone ve Bennett 1995) kadar değişkenlik göstermektedir. Bu çalışmadaki deneylerde kullanılarak öğrenim modellerine bilgi sağlayan bütün özellikler, daha önce yapılmış bir veya daha fazla artgönderim çözümleme çalışmasında kullanılmıştır.

Durum ve dilbilgisel rol, artgönderim üzerine yapılan çalışmalarda çok geniş kullanım alanı bulmuş iki sözdizimsel özelliktir (Fisher vd. 1995, McCarthy 1996, Cardie ve Wagstaff 1999, Ng ve Cardie 2002, Trouilleux 2002). Bu sözdizimsel özellikler, Türkçe ile ilgili çalışmalarda da kullanılmıştır. Tüfekçi ve Kılıçaslan’ın (2007) sözdizim tabanlı adıl çözümleme sisteminde, adıla paralel dilbilgisel role sahip isim öbeklerine, diğerlerine oranla öncelik tanınmıştır. Küçük ve Turhan-Yöndem (2007), sistemlerinin bilgi-yoksun doğasını koruyabilmek amacıyla özneye verilen önceliği tam anlamıyla kullanmayıp, bunun yerine daha özel bir durum olan yalın durum önceliğini kullanmıştır. Diğer yandan, Yıldırım ve Kılıçaslan (2007) durum ve dilbilgisel rol bilgisini tam olarak kullanmıştır.

Bağlama Kuramı açık ve gizli adıllar arasında belirgin bir ayrım yapar. Türkçe de adıl düşüren bir dil olarak bu açıdan özel bir ilgiyi hakeder. Önceki bölümde bahsedildiği gibi, adılların açık olması, bu dilde artgönderimsel gönderge üzerine yapılan ilk çalışmalardan (Erguvanlı-Taylan 1986, Enç 1986, Kerslake 1987, Turan 1996) beri dikkate alınan bir özellik olmuştur. Ayrıca bazı artgönderim çözümleme sistemlerinin de ilgi alanına girmiştir. Yüksel ve Bozşahin’in (2002) gönderge planlama

sisteminin görevlerinden biri de söylemin doğal yorumunu koruyarak gizli artgönderimleri oluşturmaktır. Küçük ve Turhan-Yöndem’in (2007) sistemi, gizli bir adılı dikkate alması gerektiğinde, önceliği önceki cümlelerde gizli adılların öncülü olan adaylara vermektedir. Adılın açık olması, Yıldırım ve Kılıçaslan’ın (2007) karar ağacı öğrenme modelinde de sınıflandırma için kullanılan özelliklerden biridir.

Đfadelerin sözlüksel tipi, Bağlama Kuramında önemli rol oynayan diğer bir özelliktir. Bu kuramda, artgönderimsel ilişkiler üzerindeki sözdizimsel kısıtlar formüle edilirken, gerçek adıllar ve gerçek artgönderimler (dönüşlü ve işteşler) arasında bir ayrım yapılır. Beklenebileceği gibi, bu ayrım yukarıda bahsedilen sistemlerdeki çözümleme işleminde bir şekilde yer almıştır.

Anlamsal özellikler, göndergelere ilişkin canlılık, cinsiyet veya konum gibi birçok açıdan bilgi sağlar. Birçok araştırmacı öğrenme modellerini tasarlarken bu gibi özellikleri dikkate almıştır (Fisher vd. 1995, McCarthy 1996, Cardie ve Wagstaff 1999, Soon vd. 2001, Strube et al 2002, Ng ve Cardie 2002). Tın ve Akman’ın (1994) BABY- SIT çalışması, Türkçe söylem parçalarında artgönderimsel belirsizliği çözebilmek için bağlamdan elde edilen bireylerin cinsiyetleri, durumların zaman sıralaması gibi çeşitli anlamsal bilgileri kullanmaktadır. Tüfekçi ve Kılıçaslan’ın (2007) sistemi uygun bir öncül belirlemek için, bir ifadenin yer mi yoksa zaman mı belirttiğini de dikkate almaktadır. Yıldırım ve Kılıçaslan’ın (2007) öğrenme modeli, anlamsal bilgi olarak bir varlığın insan, hayvan veya cansız nesne olma durumlarını kullanmaktadır. Küçük ve Turhan-Yöndem (2007), bilgi-yoksun doğasına uygun olması için, benzer anlamsal bilgilerden sistemlerini uzak tutmaktadırlar.

Artgönderim çözümleme sistemleri oluşturulurken kullanılan bir başka sözlüksel bilgi ise kişi, cinsiyet ve sayı gibi uyum bilgileridir (Cardie ve Wagstaff 1999, Soon vd. 2001, Ng ve Cardie 2002, Strube vd. 2002, Yang vd. 2003). Türkçe’de artgönderim çözümlemesi için tasarlanan ve yukarıda bahsedilen sistemlerin tamamı sayıyı dikkate alan uyum bilgisinden yararlanmaktadır.

Konum bilgisi kullanılarak hesaplanan uzaklık özelliği, aday öncülün artgönderimden ne kadar uzakta olduğu bilgisini taşır. Bu özellik bilimsel yazında geniş bir kullanım alanı bulmuştur (McCarthy ve Lehnert 1995, Fisher vd. 1995, McCarthy

1996, Cardie ve Wagstaff 1999, Soon vd. 2001, Ng ve Cardie 2002, Strube vd. 2002, Yang vd. 2003). Hem Küçük ve Turhan-Yöndem’in (2007) hem de Tüfekçi ve Kılıçaslan’ın (2007) sistemlerinde, öncelik adıllara daha yakın olan adaylara tanınmıştır. Yıldırım ve Kılıçaslan’ın (2007) modelinde uzaklık, öğrenme boyutlarından biri olarak kullanılmıştır.

Öncülün konumu ve göndergesel durum özellikleri, deneylerin veri hazırlama aşamasında adıl-aday öncül çiftlerini otomatik olarak üretmek amacıyla kullanılmıştır.

Deneyler için seçilen özelliklerin, bilimsel yazında geniş bir kullanım alanı bulduğunu görmekteyiz. Değerlilik ölçümü yapıldığında bunların birçoğunun, deneylerde artgönderimsel ilişkilerin sınıflandırılmasına büyük katkı sağladığı da görülebilmektedir (bkz. Bölüm 5.5).

Benzer Belgeler