• Sonuç bulunamadı

noktada başarının azımsanmayacak bir seviyede olduğu, ancak hedeflediğimiz başarının da henüz yakalanmadığı tespit edilmiştir.

İlk sürüm duygu sözlüğünün kapsamının genişletilmesi ve terimlerin ton değerlerinin kararlı hale getirilmesi, ikinci faz kapsamında çalışılmıştır. Bu doğrultuda, sözlükteki terimlerin eş ve zıt anlam karşılıkları açık erişimli kaynaklardan derlenerek, ilişkiler dünyasını en iyi temsil eden veri yapısı olan çizge dünyasında yapılandırılmış ve problemlere çizge teorisi içinde çözüm aranmıştır. İlk olarak, açık kaynaklardan gelen kirli eş-zıt bağlantılarının elimine edilmesi gündeme gelmiş ve bu doğrultuda kelimeler arasındaki bağın gücünü sayısallaştıran Bağ Gücü matematiksel modeli geliştirilmiştir.

Ağ üzerindeki zayıf bağlar bağ gücü değerleri doğrultusunda koparılarak ağdan filtrelenmiştir. Bir sonraki adımda, sözlüğe yeni kazandırılan terimlerin ton ve polarite değerlerinin tespitine yönelik olarak, Ton Yayılımı matematiksel modeli geliştirilmiştir.

Böylece ağa yeni dahil olan terimlere ton değeri atanabildiği gibi, mevcut terimlerin de ton değerleri daha kararlı hale getirilmiştir. Sözlükteki negatif ve pozitif terimlerin ton değerlerinin dengelenmesi amacıyla Ton Kaydırma yaklaşımları sergilenmiş ve sonuçta 49 K kapasiteli Genel Amaçlı Türkçe Duygu Sözlüğü, SWNetTR++ geliştirilmiştir.

Sözlüğün performansı, test derlemi üzerinde ölçülmüş ve performans başarımı önceki sürümün ve hedeflediğimiz noktanın üzerinde gerçekleşmiştir. Bu aşamada tez çalışması başlangıcında belirlediğimiz iki problemden ilkine çözüm önerisi sunulmuştur.

SWNeTR++ duygu sözlüğü ile ana akım haber medyası üzerinde yapılan performans testleri, ham duygu analizi yaklaşımlarıyla doküman seviyesinde gerçekleştirilmiş sonuçları yansıtmaktadır. Bir başka ifadeyle, duygu analizinde iyileştirici çalışmalar ve alt problemler olarak kabul edilen; kuvvetlendirici ve zayıflatıcılar, kelime türü etkileri, olumsuzluk durumları, soru cümleleri ve kinayeli ifadeler gibi etkenler göz önünde bulundurulmamıştır. İlaveten, duygu analizinin güncel yönelimi olan hedef tabanlı duygu analizi de çalışmada ele alınmamıştır. Dolayısıyla SWNetTR++ duygu sözlüğü, anılan alt problemlere getirilecek çözümlerle beraber kullanıldığında, duygu analizi performansının çok daha da iyi olacağı değerlendirilmekte olup, gelecek çalışmalar kapsamında bu alt problemlerin ele alınması planlanmaktadır.

Birinci probleme yönelik geliştirilen çizge temelli matematiksel modellerin farklı problem alanlarında da uygulanabileceği ve bu sayede literatüre katkı sunulabildiği de değerlendirilmektedir. Bağ Gücü hesaplama modeli, eş ve zıt olarak ilişkilerle modellenebilen bütün problem alanlarına uygulanabilecek bir yaklaşımdır. Örneğin, tıp disiplininde proteinler arasındaki bağlantıların modellenmesi, ilaç sektöründe etken maddeler arası etkileşimin modellenmesi gibi, kenarların ağırlıklandırılmasına ihtiyaç duyulan bütün çizge veri yapılarında kullanılabileceği değerlendirilmektedir. Önerilen bir diğer çizge temelli matematiksel model olan Ton Yayılımı, ağdaki düğüm değerlerinin paylaşılmasına/kararlı hale getirilmesine ihtiyaç duyulan tüm problem sahalarında uygulama alanına sahiptir.

Tez çalışması kapsamında çözüm aradığımız ikinci problem ise, literatürde duygu analizi çalışmalarının ağırlıklı olarak metin sınıflandırma problemi olarak, kısmen de bir regresyon problemi olarak görülmesine yönelik eleştirimizdir. Halihazırdaki birçok duygu analizi çalışmasında, içeriğin duygusu pozitif veya negatif gibi mutlak bir yargıyla ifade edilmektedir. Bazı çalışmalarda ikili sınıflandırmanın yanında, üçlü veya daha çok duygu boyutlu sınıflandırma da yapılmaktadır. Ancak doküman içerisinde duygu, bir salınım göstermektedir ve bu değişimin göz ardı edilmemesi gerekmektedir.

Bu motivasyon doğrultusunda, tez kapsamında Duygu Haritası Modeli (DHM) önerilmiştir. Model, cümle ve paragraf seviyesinde ele alınabileceği gibi, zaman skalası boyutunda da kullanılabilme esnekliğine sahiptir ve keşifsel veri analizi yaklaşımı sergilemektedir. İçeriklerdeki duygu salınımının ortak bir şablona yerleştirilmesi ile duygu haritası oluşturulur. Bu ortak şablonun özelliği, duygu skorlarını bölgelere ayırarak görselleştirmesidir. Kontrol limitleri olarak adlandırılan bu sınırların tespiti için 2.12 milyon cümleden oluşan duygu skoru havuzu oluşturulmuştur.

Duygu haritaları üzerindeki analiz için Shewhart Kontrol Diyagramı kuralları kullanılmıştır. 4 temel kural, duygu haritasındaki duygu salınımını; “istikrar”, “tesadüfi olmayan belirginlik”, “tesadüfi olmayan baskınlık” ve “şiddetli duygu sapması”

şeklinde özetlenebilecek tespitlere imkan vermektedir. Önerilen bu metodoloji ile,

içeriklerdeki duyguyu farklı perspektiflerden değerlendirebilmek mümkün olabilmiş ve tezimizdeki ikinci probleme de çözüm olarak önerilmiştir.

DHM’nin uygulama alanının oldukça geniş olduğu değerlendirilmektedir. Bölüm 4.3.5’de verilen uygulama örneğinde olduğu gibi, çocuk kitaplarındaki duygu salınımının, okuyucu kitlesinin seviyesi göz önüne alınarak belirli limitler arasında olması pedagojik perspektifinden oldukça önemlidir. Okullar, kütüphaneler ve hatta Türkiye ölçeğinde Milli Eğitim Bakanlığı tarafından kitapların seviye uygunluğunun tespitinde önerilen modelin kullanılabileceği değerlendirilmektedir.

DHM ile duygu analizi, sosyal medya içeriklerinin farklı bakış açısı ile analizini de mümkün kılabilecek yeteneğe sahiptir. Belirli bir konu başlığı ve zaman periyodu içerisindeki paylaşımların duygu haritası, konuya yönelik toplumsal algının yönü, istikrarı ve şiddeti gibi çok değerli bilgiler sunacaktır.

Benzer bir yaklaşım ana akım haber medyasında yer alan sosyal bir olayın zaman içerisindeki duygusal seyrinin duygu haritaları ile yorumlanmasını, haberlerin içeriği yanında haberlere yapılan kullanıcı yorumlarının duygu haritası ile analiz edilebilmesini de mümkün kılmaktadır. Dünyanın bir bölgesindeki sosyal, politik, ekonomik iklimi, duygu haritası ile modellemek ve yorumlamak mümkündür. Bu sayede, karar vericilerden politika belirleyicilere kadar geniş bir yelpazenin karar destek süreçlerine katkı sunulabileceği de değerlendirilmektedir.

5.2. Öneriler

DDİ’nin dile özgü bir disiplin olması ve inovasyonun dillere özgü kalmasının da getirdiği zorluklarla beraber, çözülmesi gereken çok sayıda alt problem söz konusudur ve yapay zeka yaklaşımlarına muhtaç bir alandır. Araştırmacılar için ise, dil kaynaklarının varlığı ile zenginliği dil çalışmalarının temel başlangıç noktasıdır.

İngilizce dilindeki kaynakların kapsam ve zenginliği göz önüne alındığında, Türkçe çalışan ve Türkçe konuşan araştırmacılara büyük sorumluluklar düşmektedir. Özellikle Türkçe WordNet dil kütüphanesinin gelişiminin tekrar canlandırılmasının ve

araştırmacıların da artırımlı yaklaşımla katkı sunmasının oldukça önemli olduğu değerlendirilmektedir. Türk Dil Kurumunun da dahil olduğu geniş katılımlı ve uzun soluklu çalışmalar ile etkin ve verimli dil kaynaklarının geliştirilebileceği öngörülmektedir.

Benzer Belgeler