• Sonuç bulunamadı

Makine Çevirisinin Türleri

BÖLÜM 2: MAKİNE ÇEVİRİSİ

2.3. Makine Çevirisinin Türleri

Makine çevirisi sistemleri 1940’lardan itibaren ilk önce askeri alanda daha sonra da çoğunlukla uluslararası örgütler tarafından üye devletler ve diğer ülkerlele olan iletişimi kolaylaştırmak için kullanılmış, günümüzde ise bilgisayar teknolojisinin her ortama girmesiyle birlikte çok daha farklı ve çeşitli ortamlarda denenmeye başlanmıştır. Neticede, bu teknolojiler üzerine yapılan yatırımların ve araştırmaların sayısı yükselmiş ve makine çevirisi sistemlerinin türlerinde de paralel bir artış meydana gelmiştir. Makine çevirisi sistemleri günümüzde devlet dairelerinin yanı sıra, çeviri büroları ve ihracat oranını artırmak isteyen şirketler tarafından da kullanılmaya başlanmıştır. Ayrıca, sıradan bilgisayar kullanıcılarının, yabancı dilde hazırlanmış web sitelerini (özellikle ebay.com, aliexpress.com, gittigidiyor.com gibi e-ticaret siteleri ve bir sosyal ağ olan facebook.com gibi) kendi dillerinde alımlamak istemeleri neticesinde, web sitelerinin çevirisini yapan sistemler de geliştirilmiştir (krş. Dillinger ve Lommel, 2004).

2.3.1. Aktarım (Kural) Temelli Makine Çevirisi Sistemleri

Aktarım temelli makine çevirisi sistemleri (Bir diğer adı da Kural Temelli Sistemler; İng: Rule Based Machine Translation Systems, kısaltması: RMBT), gerek girişimciler gerekse de tüketicilerin büyük çoğunluğu tarafından kullanılan sistemlerdir. Bu sistemlerle ilgili çalışmalar, 1950’lerden beri yapılmaktadır. Bu sistemler, bünyesinde birtakım sözlükler bulundurur ve kaynak dildeki cümleleri dilsel bir analize tabi tutar. Metni gramer açısından inceleyen sistem, cümleleri bileşenlerine ayırır ve cümle içindeki her kelimeye (özne, nesne veya yüklem gibi) dilsel bir rol atar. Bu yöntem, sadece sözcük aktarımına

33

dayalı çeviri anlayışına göre daha iyi sonuç vermektedir. Çünkü cümlenin bağlam içindeki kullanımından da faydalanmaktadır ve ayrıca hedef metindeki dilbilgisine uygun çeviriler yapabilir. Kural temelli makine çevirisi sistemlerinde, cümleler analiz edildikten sonra, kelimeler yeniden sıraya konulmak üzere bir dizi aktarım (transfer) kuralına başvurulur. Ayrıca arka arkaya gelen cümlelerin yapıları, erek dildeki dilbilgisi kurallarına uygun olarak değiştirilir. Son aşamada çeviri üretilmeye başlar. Bu aşamada çekimler (ing: inflection) ve gerekli kısaltmalar uygulanır. Aktarım temelli sistemler, daha çok benzer dil aileleri arasında iyi sonuç vermektedir (krş. Dillinger ve Lommel, 2004: 42- 43). Kural temelli makine çevirisi sitemlerinde o hâlde dilbilgisi, söz dizim kuralları ve diğer kurallara dayalı, dijital ürünün içine kodlanmış yapay algoritmalar söz konusudur (https://www.gala-global.org/language-industry/language-technology). Systran, ProMT ve iki büyük yerelleştirme servis sağlayıcısı olan SDL ile Lionbridge geliştirdikleri teknolojilerde kural temelli makine çevirisinden faydalanmaktadır (bkz. Singh; Vaskee: 2012: 290).

1990’ların sonunda makine çevirisindeki araştırmalar, kural temelli makine çevirisi yaklaşımından örnek temelli makine çevirisi ve özellikle istatistik temelli makine çevirisine doğru bir paradigma değişimi yaşamıştır (O’Hagan, 2013: 510).

2.3.2. İstatistik ve Örnek Temelli Makine Çevirisi Sistemleri

İstatistiksel makine çevirisinde (İng: Statistical Based Machine Translation, kısaltma: SMT) (ya da daha özel anlamda Öbek Temelli İstatistiksel Makine Çevirisi), otomatik çeviriye veri güdümlü (İng: data driven) (veriye dayanan) bir yaklaşım vardır. İstatistiksel Makine Çevirisinin temel veri kaynakları iki ayrı bütünceden oluşur: Bunlar iki dilli paralel bütünce ve tek dilde oluşturulmuş bir bütüncedir (Austermühl, 2011: 12). İstatistik temelli makine çevirisinde, istatistiksel olarak en uygun olan çevirilerin saptanması için bir dizi referans metnine karşı örüntü eşleme teknolojisi kullanılır80. Google, Microsoft Live ücretsiz çeviri portalları ve Lionbridge RTTS (İng: Real Time Translation Solutions; Tr: Gerçek Zamanlı Çeviri Çözümleri) portalı, istatistik temelli makine çevirisinden faydalanmaktadır (bkz. Singh; Vaskee: 2012: 290).

34

Örnek temelli makine çevirisi81 (İng: Example Based Machine Translation, kısaltma: EBMT), “yeni kaynak metin parçalarının otomatik olarak, önceki çevrilmiş metinlerle karşılaştırıldığı bir makine çevirisi yaklaşımıdır82” (Bowker, 2002: 146). Ayrıca örnek temelli makine çevirisinde, dilbilgisi kurallarını ampirik olarak elde etmek amacıyla metin bütüncesini derinlemesine araştıran otomatik programlar bulunur (Budiansky, 1998:6’dan akt. Archer, 2010: 104).

İstatistiksel makine çevirisi ve örnek temelli makine çevirisi83, veri güdümlü (veriye dayanan) makine çevirisinde iki farklı yaklaşımdır. Her ikisi de, mevcut örnek çevirilere dayalı olarak yeni çeviriler yapmak üzere karışık istatistiksel yöntemlerden faydalanır. Bu sistemler, bir dildeki kelime ve ifadelerin öteki dildeki kelime ve ifadelerle eşleştirilme oranının yüksek olup olmadığını tespit etmek amacıyla kaynak metin/erek metin cümle çiftlerini analize tabi tutar. Daha basit bir ifade ile, sistem iki dilli bir sözlük ve aktarım (transfer) kurallarını otomatik olarak oluşturmaktadır. Bir cümlenin çevirisi yapılacağında, sistem örneklerde bulunan eşleşmeleri veya korelasyonları kullanarak, yapabileceği en doğru çeviriyi üretir. Genellikle, örnek çeviri sayısı fazla ise sonuç o kadar iyidir. Bu yaklaşımı kullanan ticari sistemler, son zamanlarda popüler hâle gelmiştir. Bu sistemler, uzun geliştirme dönemleriyle uğraşmak ve aktarım kuralları ile sözcükleri test etmek zorunda kalmadan hızlı bir şekilde çeviri metin üretebilir. Ayrıca çeviri belleğindeki verilerin yeniden kullanımı için farklı şekillerde birçok yeni potansiyeller sunarak, sahip oldukları teknolojinin değerini artırır (Dillinger ve Lommel, 2004: 44).

2.3.3. Hibrit (Melez) Makine Çevirisi Sistemleri

Şahin’e göre, hibrit makine çevirisi sistemleri (Kısaltma: HMT, İng: Hybrid Machine Translation Systems) kural temelli ve istatistiksel yaklaşımların ikisini de kullanan sistemlerdir. Ancak, iş akışında çeviri bellekleri ile diğer veri kaynaklarından faydalanan bilgisayar çevirisi sistemlerini tanımlamak üzere de kullanılır (Şahin, 2013: 83). Hibrit makine çevirisinde, makine çevirisi programıyla entegreli olarak kullanılan birden fazla makine çevirisi yaklaşımı vardır. Bu sistemlere geçilmesinin nedeni, makine çevirisinin

81 Penn Tree bütüncesi (bkz. Archer, 2010: 104).

82 Bowker’a göre, örnek temelli makine çevirisinde, makine tam bir taslak veya ham çeviri üretir. Bu taslak/ham çeviri daha sonra çeviri bitiminde bir insan çevirmen tarafından düzeltilir (Bowker, 2002: 105).

35

tek bir teknik kullanarak, tatmin edici doğruluk seviyesine ulaşamamasıdır. Multi-Engine hibrit makine çevirisi sistemlerine örnek verilebilir (http://www.asiaonline.net/EN/MachineTranslation/default.aspx?QID=18).