• Sonuç bulunamadı

6. DERİN ÖĞRENME MODELLERİ İLE METİN SINIFLANDIRMASI

6.2. Motivasyon

Doküman sınıflandırma akademik alanda önemli olmakla beraber olağan üstü ekonomik değeri olan bir alandır. Kullanıcı davranışları web tarama geçmişindeki metinlerin analizi ile çıkarılabilir ve bu davranışa göre reklam tavsiyeleri gerçekleştirilebilir. Bir ürün hakkında yapılan yorumlar otomatik analiz edilebilir ve bu analiz sonucu ürün sağlayıcılar doğru iş planları ve kararları alabilir. Akademik dünyadaki makaleler konu içeriğine göre sınıflandırılabilir ve en doğru kategoride olması sağlanabilir. Özet olarak bir doküman içeriği anlaşılarak sınıflandırılabilmesi önem arz etmektedir. Bu problemin çözümü için en temel yaklaşım dokümanların ya da kelimelerin sayısal vektörlere çevrilmesi ve vektör uzayında her bir metnin karşılaştırılması ve sınıflandırılmasıdır.

Görüş madenciliği olarak da adlandırılan duygu analizi, NLP ve metin madenciliği problemlerinden birisidir [212]. Hem akademik araştırmalarda hem de endüstrideki uygulamalarda hızla gelişen önemli çalışma alanlarındandır. Sınıflandırma problemlerinden olan duygu analizi, bir kullanıcının yorumlarından oluşan metnin genel duygusunu tahmin etmeyi hedeflemektedir. Örneğin, gösterimde olan bir film hakkında izleyicinin görüşünün pozitif veya negatif olduğunun tespit edilmesi vb. Duygu sınıflandırması, metinde ifade edilen görüşün pozitif ya da negatif olduğunu etiket veya puan ile doğru bir şekilde bulmayı amaçlamaktadır.

Çevrimiçi erişilebilir çok sayıda etiketli veri ve derin öğrenme yöntemlerinin artması ile birlikte metin verilerinden duygu çıkarımı, NLP çalışmalarında yeniden popülerlik kazanmıştır. Kişilerin belirli bir olaya ya da ürüne yönelik duygularının tespit edilmesi, daha doğru planlamalar ve iş kararları alınmasında etkili olmaktadır. Bilgi ya da veri toplamak için e- postalar, çevrimiçi anketler, sosyal medya gönderileri, blog yayınları ve benzeri kişilerin görüşlerini içeren çok farklı kaynaklar vardır. Bu kaynaklardan toplanan veri miktarı, insanlar

142

tarafından yapılan manuel analizler için genellikle çok büyüktür. Öte yandan, göz ardı edilemeyecek kadar çok değerlidir. Duygu analizi bu problemin çözümü için, önceden tanımlanmış ya da etiketlenmiş veriler üzerinde model eğitir ve etiketsiz ya da tanımsız duyguları içeren veriler üzerinde bu modeli kullanır.

Cui ve arkadaşları [213] çevrimiçi (online) marka yorumları üzerinde duygu analizi gerçekleştirmiştir. Pasif-Agresif Algoritma Tabanlı Sınıflandırıcı, Dil Modelleme (DM) Tabanlı Sınıflandırıcı ve Winnow Sınıflandırıcısı [214] olmak üzere üç teknik üzerinde duygu analizini tartışmışlardır. Socher ve arkaşları [215], cümleleri tam etiketli ayrıştırma ağaçlarını kullanarak pozitif veya negatif olarak tanımlamak için Özyinelemeli Sinir Tensor Ağı (Recursive Neural Tensor Network) adlı yeni bir model önermektedir.

Destek Vektör Makineleri, Naive Bayes, K En Yakın Komşu ve Maksimum Entropi gibi geleneksel gözetimli ve gözetimsiz ML algoritmaları, duygu analizinde yaygın olarak kullanılmaktadır. Ancak, yakın zamanda CNN, LSTM ve RNN ağları gibi derin öğrenme mimarileri yüksek başarı sonuçlarından dolayı daha çok tercih edilmektedir. Fakat her türlü problem için evrensel derin öğrenme modeli bulunmadığından, problem alanlarına göre uygun model seçilmelidir. Farklı ağ modelleri, bilgisayar görmesi ve NLP gibi farklı uygulama alanlarında farklı performans sonuçları vermektedir [17].

Sarkar ve arkadaşları [216], duygu analizi için son zamanlardaki yaklaşımların GloVe [217] ve word2vec [16] modeller gibi kelime temsillerine dayalı metin özelliklerini kullandıklarını belirtmektedir. Önceki çalışmalar, kelime torbaları veya TF-IDF gibi diğer önemli metin gösterimi modellerini yaygın olarak kullanmıştır. Bu tez çalışmasında da word2vec ile yaklaşık 80 bin benzersiz kelime içeren BEYAZPERDE Türkçe film yorumları veri seti kullanılarak kelime temsilleri oluşturulmuştur. Benzer şekilde aynı algoritma ile yaklaşık 1,3 milyon benzersiz kelime içeren HABERLER Türkçe haber veri seti kullanılarak kelime temsilleri oluşturulmuştur.

Metin sınıflandırması alanındaki çalışmalar genellikle İngilizce için yoğunlaşmaktadır. Son yıllarda, web üzerinde erişilebilir, önemli büyüklüklerde Türkçe içeriğin oluşmasıyla birlikte Türk dilinde metin madenciliği geliştirme ihtiyacı doğmuştur. Metin madenciliği yardımıyla,

143

kullanıcı yorumları ve farklı ana başlıklardaki dokümanlar kolay bir şekilde sınıflandırılarak ve daha etkin iş kararları alınabilmektedir.

Bu çalışmanın temel bölümünde, popüler derin öğrenme ağları ile Türkçe kelime temsilleri kullanılarak film yorumları üzerinde duygu sınıflandırması gerçekleştirilmiştir. Türkçe dilinde yapılacak duygu sınıflandırması çalışmalarında standart bir veri seti olmadığı için www.beyazperde.com sitesinden Türkçe film yorumları toplanmıştır. Oluşturulan veri seti ve kelime temsilleri kullanılarak popüler derin öğrenme modelleri test edilip duygu sınıflandırması doğruluğuna etkisi detaylı olarak sunulmuştur.

Çalışmanın ikinci bölümünde, duygu sınıflandırması performans sonuçlarına göre seçilen en iyi model ve parametre seçimleri ile 5 kategorili haber sınıflandırması gerçekleştirilmiştir. Türkçe haber sınıflandırması çalışmalarında standart bir veri seti olmadığı için çeşitli haber sitelerinden yaklaşık 10 milyon haber toplanarak kelime temsilleri eğitilmiştir. Bu veri setinden ekonomi, politika, kültür, dünya ve spor konusu içeren 500 bin haber seçilerek, oluşturulan eğitim verisi üzerinde derin öğrenme modelleri eğitilip test edilmiştir. Performans sonuçları değerlendirilip tartışılmıştır.

6.3. İlgili Çalışmalar

Kullanıcı yorumları gibi çevrim içi ortamda artan sosyal içeriklerle birlikte, otomatik duygu sınıflandırması talebi büyük bir artış göstermiştir. Bu amaç doğrultusunda, yakın zamana kadar yapılan çalışmalar [218][219][220]’de özetlenmiştir. Film eleştirileri üzerine yapılan duygu analizi çalışmalarında geleneksel makine öğrenmesi yöntemlerinden Destek Vektör Makineleri, Naive Bayes, K En Yakın Komşu ve Maksimum Entropi algoritmaları yaygın olarak kullanılmıştır. Kalaivani ve Lillian [218], 1000 pozitif ve 1000 negatif yorum içeren veri seti üzerinde gözetimsiz makine öğrenmesi algoritmalarını uygulayarak duygu sınıflandırması gerçekleştirmiştir. Bu çalışmada Destek Vektör Makinelerinin, Naive Bayes ve K En Yakın Komşu algoritmalarına göre %80 doğruluk oranı ile daha iyi sınıflandırma işlemi yaptığı gözlemlenmiştir. Bir diğer çalışma [219], IMDB (imdb.com) film eleştirileri veri tabanından alınan 1400 adet pozitif ve negatif yorum üzerinde, Naive Bayes Algoritmasının %65 doğruluk

144

oranı (accuracy) ile Destek Vektör Makineleri’ ne göre daha iyi bir sınıflandırma sonucu elde ettiği belirtilmiştir. Bhadane [220], verilen bir metni pozitif ya da negatif olarak sınıflandırmak için belirli statik özellikler ekleyerek Destek Vektör Makineleri’ni kullanmıştır. Kelime köklerinin bulunması, metin içerisinde 30 defadan fazla ve 4 defadan az geçen kelimelerin çıkarılması, kelimeler arasındaki eş anlamlılık ve zıt anlamlılık gibi ilişkileri içeren WordNet kullanımı, sık kullanılan kelimelerin (stopwords) kaldırılması gibi pek çok ön işlemeden geçirilen yorumlar üzerinde %78 doğruluk oranına ulaşılmıştır. Geleneksel makine öğrenmesi yöntemleri ile yapılan duygu analizi çalışmalarında boyutsallık sorunu [221] ve özellik seçimlerine bağlı olarak doğruluk oranlarının değişmesi önemli bir sınıflandırma problemidir. Yüksek boyutlu veri setleri kullanıldığında, belirli öğrenme algoritmaları kötü davranış sergilemekte ve doğru olmayan sonuçlar elde etmektedir.

Makine öğrenmesi tekniklerinin gelişmesi ile büyük verilerin işlenmesi ve analizinde daha karmaşık modellerin oluşturulması mümkün hale gelmiştir. Metin analizinde geliştirilen bu modeller n-gram, kelime torbası (bag of words) ve kelime frekansları (TF-IDF) gibi yaygın yöntemlerde kullanılan basit modellere göre üstünlük sağlamıştır. Son günlerde geliştirilen en başarılı model ise kelimelerin dağıtık gösterimleridir. Kelimelerin dağıtık gösterimleri [13], çeşitli yapay sinir ağları tabanlı dil modellerinden elde edilmektedir ve n-gram modellere göre üstünlük sağlamaktadır [14]. Mikolov ve arkadaşları farklı sinir ağ tabanlı dil modelleri sunmuştur [15]. En son geliştirdikleri skip-gram modellerini içeren word2vec yazılımı ile de basit bir logaritmik doğrusal sınıflandırma ağı oluşturmuştur [16]. Skip-gram modeli, çok büyük miktarda yapılandırılmamış metin verisinden yüksek doğrulukta kelime vektörünün gösterimlerini öğrenmek için etkili bir yöntemdir. NLP çalışmalarında kullanılan derin öğrenme yöntemlerinin çoğu, sinir dil modellerinden elde edilen kelime vektörlerinin gösterimlerini öğrenmektedir.

Derin öğrenme yeni bir kavram olmasa da, geçtiğimiz son on yıl içerisinde, gittikçe artan veri miktarı ile birlikte daha etkin eğitim modellerinin geliştirilmesi ve hesaplama kapasitesindeki ilerlemeler nedeniyle popülerlik kazanmıştır. Görüntü ve ses tanıma çalışmalarında başarılı sonuçlar elde eden derin öğrenmenin son durağı NLP’dir. Ouyang [222], 11855 yorum ve beş farklı sınıf içeren (pozitif, negatif, biraz pozitif, biraz negatif, nötr) bir film

145

eleştirileri veri seti üzerinde word2vec ve CNN ile oluşturduğu derin sinir ağı mimarisini uygulamıştır. Oluşturduğu modelin, Öz yinelemeli Sinir Ağları (RNN) ve Matris-Vektör Öz yinelemeli Sinir Ağları (MV-RNN) ile karşılaştırdığında %45.4 doğruluk oranı ile daha iyi sınıflandırdığını gözlemlemiştir. Bir diğer çalışmada [223], LSTM ve CNN sinir ağı modellerini kullanarak IMDB ve Yelp (yelp.com/dataset_challenge) veri setlerinden alınan kullanıcı yorumları üzerinde duygu analizi çalışmaları gerçekleştirmiştir. Deneysel sonuçlara göre LSTM, çoklu filtre kullanan CNN modele göre daha iyi performans göstermiştir.

Zhou [224], Stanford Sentiment Treebank (SST) [215] veri setini kullanarak film eleştirileri üzerinde duygu sınıflandırması gerçekleştirmiştir. CNN ve LSTM modellerinin birleşiminden oluşan mimarileri, çok katmanlı CNN ve RNN modellere göre daha iyi sonuçlar elde etmiştir. 2-sınıf için (pozitif ve negatif) %87.7 doğruluk oranına ulaşırken, 5-sınıf için ( çok pozitif, pozitif, nötr, çok negatif, negatif) %49.2 doğruluk oranı elde etmiştir. Yoon Kim [225], word2vec üzerinde eğitilen basit bir CNN modelini kullanarak çeşitli veri setlerinde duygu sınıflandırması gerçekleştirmiştir. Bir cümlenin nesnel mi öznel mi olduğunu sınıflandırmak için kullanılan Subjectivity veri seti [226] üzerinde %93.2, pozitif ve negatif müşteri yorumlarının bulunduğu CR veri setinde [227] %85, pozitif ve negatif film yorumlarını içeren SST veri setinde ise %88.1 doğruluk oranı elde etmiştir. Collobert ve arkadaşları [162] tarafından yapılan çalışmada, İngilizce Wikipedia üzerinde eğitilen word2vec kelime temsillerinin kullanılmasının, performansı önemli ölçüde arttırdığı görülmüştür. Bu durumun Mikolov ve arkadaşlarının [228] önerdiği mimariden mi yoksa Google haberlerden alınan 100 milyon kelime üzerinde eğitilmiş vektörlerden mi kaynaklandığının açık olmadığı belirtilmiştir. Kato ve Goto [229], word2vec algoritmasını kullanarak Japon dilinde yayınlanmış web haberleri üzerinde kelime temsilleri eğitmiştir. Bu kelime temsillerini kullanarak ekonomi, eğlence, bilim içeren 6 kategoride haber verisini üzerinde sınıflandırma gerçekleştirmiştir. 800 etiketli veri setinin, 600 örneğini eğitim için ayırmıştır. Word2vec kullanımının metin sınıflandırmada pratik olduğunu söyleyen çalışmanın sınıflandırma başarısı %78 olarak kaydedilmiştir. Zhang ve arkadaşları [10], spor, finans, eğlence, teknoloji ve otomobil içeren 5 kategori ve her bir kategoride seçilen 90,000 eğitim örneği ile Sogou haber veri seti üzerinde metin sınıflandırma gerçekleştirmiştir. Word2vec kelime temsilleri ile CNN model kullanarak

146

gerçekleştirilen sınıflandırmanın test seti üzerindeki hata %4,54 olarak verilmiştir. Word2vec kelime temsilleri kullanmadan ise daha yüksek hata alınmıştır. Aynı çalışmada 496,835 etiketli haber makalesi içeren AG’s haber veri seti üzerinde %9,92 sınıflandırma hatası alınmıştır. Veri setinin boyutuna ve içeriğine göre aynı modellerin farklı sonuçlar verdiğini gösteren çalışmada, tüm veri setleri için çalışan tek bir makine öğrenmesi modelinin olmadığını belirtmiştir. Geliştirdiği derin öğrenme yöntemi ile ikili duygu sınıflandırması üzerine de odaklan çalışmada Yelp film yorumları veri setinden 130 bin eğitim örneği alarak 10 bin test verisi üzerinde %4,63 hata oranı ile yüksek başarı elde etmiştir. Karakter Seviyeli Konvolüsyon Ağları olarak geçen bu model başka bir çalışmada [230] Çin veri setleri üzerinde test edilmiştir ve en düşük %4,66 hata oranı ile metin sınıflandırılması gerçekleştirilmiştir. Ayrıca yapılan çalışmada veri seti ne kadar büyükse CNN mimarisinin metin sınıflandırmada o kadar iyi çalıştığı belirtilmiştir.

Benzer Belgeler