Temmuz 2019 Bilgisayar Mühendisliği Anabilim Dalı YÜKSEK LİSANS TEZİ Osman Nuri Atak Derin Öğrenme Yöntemleri ile Sinema Filmi Başarım Tahmini

(1)

Derin Öğrenme Yöntemleri ile Sinema Filmi Başarım Tahmini Osman Nuri Atak

YÜKSEK LİSANS TEZİ Bilgisayar Mühendisliği Anabilim Dalı

Temmuz 2019

(2)

Estimating Film Achievement Using Deep Learning Methods Osman Nuri Atak

MASTER OF SCIENCE THESIS Department of Computer Engineering

July 2019

(3)

Derin Öğrenme Yöntemleri ile Sinema Filmi Başarım Tahmini

Osman Nuri Atak

Eskişehir Osmangazi Üniversitesi Fen Bilimleri Enstitüsü Lisansüstü Yönetmeliği Uyarınca Bilgisayar Mühendisliği Anabilim Dalı

Bilgisayar Bilimleri Bilim Dalında YÜKSEK LİSANS TEZİ

Olarak Hazırlanmıştır

Danışman: Doç.Dr. Kemal Özkan

Bu çalışma, 116E284 nolu ve “İmge Tabanlı Öneri Sistemi” başlıklı TÜBİTAK 3001 projemiz kapsamında yürütülmüştür.

Temmuz 2019

(4)

ONAY

Bilgisayar Mühendisliği Anabilim Dalı Yüksek Lisans öğrencisi Osman Nuri Atak‟ın YÜKSEK LİSANS tezi olarak hazırladığı “Derin Öğrenme Yöntemleri ile Sinema Filmi Başarım Tahmini” başlıklı bu çalışma, jürimizce lisansüstü yönetmeliğin ilgili maddeleri uyarınca değerlendirilerek oybirliği ile kabul edilmiştir.

Danışman : Doç. Dr. Kemal Özkan

İkinci Danışman : -

Yüksek Lisans Tez Savunma Jürisi:

Üye : Doç. Dr. Kemal Özkan

Üye : Dr. Öğr. Üyesi Uğur Gürel

Üye : Dr. Öğr. Üyesi Muammer Akçay

Fen Bilimleri Enstitüsü Yönetim Kurulu‟nun ... tarih ve ... sayılı kararıyla onaylanmıştır.

Prof. Dr. Hürriyet ERŞAHAN Enstitü Müdürü

(5)

ETİK BEYAN

Eskişehir Osmangazi Üniversitesi Fen Bilimleri Enstitüsü tez yazım kılavuzuna göre, Doç. Dr. Kemal Özkan danışmanlığında hazırlamış olduğum “Derin Öğrenme Yöntemleri ile Sinema Filmi Başarım Tahmini” başlıklı YÜKSEK LİSANS tezimin özgün bir çalışma olduğunu; tez çalışmamın tüm aşamalarında bilimsel etik ilke ve kurallara uygun davrandığımı; tezimde verdiğim bilgileri, verileri akademik ve bilimsel etik ilke ve kurallara uygun olarak elde ettiğimi; tez çalışmamda yararlandığım eserlerin tümüne atıf yaptığımı ve kaynak gösterdiğimi ve bilgi, belge ve sonuçları bilimsel etik ilke ve kurallara göre sunduğumu beyan ederim. 30/07/2019

Osman Nuri Atak

(6)

ÖZET

Sinema filmlerinin gişe hasılatının tahmin edilebilmesi amacıyla çeşitli teknikler geliştirilmiştir. Kullanılan yöntemlerde tahminlemeler, film vizyona girdikten sonra alınan veriler üzerinden yapılmaktadır. Hazırlanan tez çalışmasında, film daha vizyona girmeden ve belki de sadece afiş ve fragmanı hazırlanarak gişe hasılat tahmini yapılabilmesine imkân sağlayan derin öğrenmeye dayalı sınıflandırma tabanlı bir makine öğrenme sistemi tasarlanmıştır. Çalışmada 2017 yılında vizyona giren sinemalar hasılatlarına göre 5 gruba ayrılarak kullanılmıştır. Derin öğrenme modeli olan Inception V3 modeli ile sinema afişleri ve fragmanlar üzerinde çalışılmıştır. Sinema afişi, fragman, oyuncular, yönetmen, senarist gibi film özellikleri üzerinden, film vizyona girmeden hasılat tahmini yapılmasının mümkün olup olmayacağı incelenmiştir. 482 adet yerli ve yabancı film üzerinde yapılan çalışmada, ağaç sınıflandırıcılarından ince ağaç (Fine Tree Classifier FTC) ve orta ağaç (Medium Tree Classifier MTC) sınıflandırıcısı ile %97,7‟lik ortalama doğruluk oranı elde edilmiştir. Elde edilen bu sonuç, çalışmada kullanılan yöntemin diğer gişe gelir tahminleri için kullanılan yöntemlerden daha iyi bir performans sergilenebileceğini göstermektedir.

Çalışmanın ikinci kısmında ise Movilens veri kümelerinden 20 milyon kullanıcı film puanlaması olan veri kümesi ile film öneri sistemi tasarımı gerçekleştirilmiştir. En az 100 filme puan veren kullanıcılardan 10 bin kullanıcı seçilerek 11.726 film verisi ile film öneri çalışması yapılmıştır. Filmlerin detay verileri, fragmanlardan elde edilen 4096‟lık özellik matrisi ve film puanlamaları ile yapılan çalışmaların sonucunda yenilik değeri 1,5497 olarak bulunmuştur.

Anahtar kelimeler: Makine Öğrenmesi, Sinema Afiş, Fragman, Hasılat Tahmini, Sınıflandırma, Film Öneri

(7)

SUMMARY

Various techniques have been developed in order to estimate the box office revenue of cinema films. Estimations in the methods used are based on the data obtained after the film is released. In the thesis study, a deep learning leaning against classification based machine learning system was designed that produce results before the film came into the picture and perhaps only the poster and the trailer was prepared. In this study, cinemas which were released in 2017 were divided into 5 groups according to their revenue.

Cinema posters and fragments were studied with Inception V3 model based on deep learning structure. It has been examined whether it is possible to estimate the revenue before the film comes into play through the movie features such as cinema posters, trailers, actors, directors and screenwriters. In the study, conducted on 482 domestic and foreign films, an average accuracy rate of 97.7% was obtained from Tree classifiers by Fine Tree and Medium Tree classifier. This result shows that the method used in the study can perform better than the methods used for other box office revenue estimates. In the second part of the study, a movie suggestion system was designed with a data set of 20 million users from the Movilens data sets. 10,000 users were selected from users who rated at least 100 films, and a film proposal study was conducted with 11,726 movie data. Novelty value was found to be 1.5497 as a result of the studies made with the detailed data of the films, 4096 feature matrix obtained from the fragments and film scoring.

Keywords: Machine Learning, Poster, Trailer, Revenue Estimation, Classification, Film Recommendation

(8)

TEŞEKKÜR

Tez konumun belirlenmesinde, tez sürecinde ve tezimin tamamlanmasında, yapılan araştırmalarda, karşılaştığım sorunlarda ve yönlendirmesinde, tezimin tamamlanmasında destek olan tez danışmanım Sayın Doç. Dr. Kemal ÖZKAN‟ a teşekkür ederim.

Çalışmalarım boyunca maddi manevi destekleriyle beni hiçbir zaman yalnız bırakmayan aileme ve hususen kıymetli eşime çok teşekkür ediyorum.

116E284 numaralı proje kapsamında 3001 – Başlangıç Ar-Ge Projeleri Destekleme Programı ile maddi destek sağlayan TÜBİTAK‟a teşekkür ederim.

(9)

ix İÇİNDEKİLER

Sayfa

ÖZET ... vi

SUMMARY ... vii

TEŞEKKÜR ... viii

İÇİNDEKİLER ... ix

ŞEKİLLER DİZİNİ ... xi

ÇİZELGELER DİZİNİ ... xii

SİMGELER VE KISALTMALAR DİZİNİ ... xiii

1. GİRİŞ VE AMAÇ ...1

2. LİTERATÜR ARAŞTIRMASI...6

3. YÖNTEM VE ARAÇLAR ...10

3.1. Yöntem ...10

3.1.1. AlexNet ...11

3.1.2. Inception V3 ...12

3.1.3. Tekil Değer Ayrışımı (Singular Value Decomposition, SVDS) ...13

3.1.4. Sınıflandırma ...14

3.1.4.1. Karar Ağaçları (Decision Tree) ...14

3.1.4.2. K En Yakın Komşular (KNN) ...15

3.1.4.3. Destek Vektör Makinesi (Support Vector Machine SVM) ...16

3.1.4.4. İkinci Dereceden Ayrım Analizi (Quadratic Discriminant Analysis) ...18

3.1.4.5. Doğrusal Ayrım Analizi (Linear Discriminant Analysis - LDA) ...18

3.2. Araçlar ...19

3.2.1. Derin Öğrenme ...19

3.2.2. Sinir Ağları ...19

3.2.3. Öneri Sistemleri ...20

3.2.3.1. İçerik Tabanlı Filtreleme ...21

3.2.3.2. İşbirlikçi Filtreleme ...21

3.2.3.3. Hibrid Yaklaşım ...22

3.3. Veri Toplama ve Hazırlama ...23

3.3.1. Hasılat Tahmini ...23

3.3.2. Film Önerisi ...25

(10)

İÇİNDEKİLER (devam)

Sayfa

3.3.2.1 Gizli Etken Modeli (Latent Factor Model) ...26

4. DENEYSEL ÇALIŞMALAR ...31

4.1. Film Sınıflandırma ...31

4.2. Sınıflandırma Grafiksel Sonuçlar ...31

4.2.1. Karar Ağaçları (Decision Tree) ...31

4.2.2. K En Yakın Komşular (KNN) ...32

4.2.3. Destek Vektör Makinesi (Support Vector Machine, SVM) ...33

4.2.4. Ayrım Analizi (Discriminant Analysis) ...34

4.2.5. Karşılaştırmalı Sonuçlar ...34

4.3. Film Önerileri ...37

5. BULGULAR VE TARTIŞMA ...39

6. SONUÇ VE ÖNERİLER ...40

KAYNAKLAR DİZİNİ ...41

(11)

ŞEKİLLER DİZİNİ

Şekil Sayfa

3.1. Gelir tahmin çalışması akış grafiği ... 10

3.2. AlexNet çalışma yapısı ... 12

3.3. Inception V3 modeli ... 13

3.4. Doğrusal olarak bölünebilen veri kümesi (a) ve Doğrusal olarak bölünemeyen veri kümesi (b) ... 17

3.5. LDA örnek veri kümesi ... 18

3.6. Yapay sinir ağları ... 20

3.7. İçerik tabanlı filtreleme ... 21

3.8. İşbirlikçi filtreleme ... 22

3.9. Hibrid yaklaşım ... 22

3.10. Film afişlerinden örnekler ... 25

4.1. Karar ağacı sınıflandırma doğruluk oranları ... 32

4.2. K en yakın komşular sınıflandırma doğruluk oranları ... 33

4.3. Destek vektör makineleri sınıflandırma doğruluk oranları ... 33

4.4. Ayırıcı sınıflandırma metotları doğruluk oranları ... 34

4.5. Fine Tree sınıflandırması– Scatter Plot ... 35

4.6. Fine Tree sınıflandırması Hata matrisi - Confusion matrix ... 35

4.7. Tüm ölçümlerin karşılaştırmalı doğruluk oranları ... 36 4.8. Sınıfların dengeli dağıtılmış hali tüm ölçümlerin karşılaştırmalı doğruluk oranları 37

(12)

xii ÇİZELGELER DİZİNİ

Çizelge Sayfa

3.1. Film grupları ... 23

3.2. Öneri yöntemleri karşılaştırması ... 28

4.1. Film puan ortalaması ... 38

4.2. Öneri sistemi test sonuçları ... 38

(13)

SİMGELER VE KISALTMALAR DİZİNİ

Kısaltmalar Açıklama

SVDS Singular Value Decomposition (Tekil Değer Ayrışımı)

KNN K-Nearest-Neighbors (En Yakın K Komşu)

IMDb Internet Movie Database (İnternet Fim Veritabanı) KRW South Korean won (Güney Kore Para Birimi) SVM Support Vector Machine (Karar Destek Makinesi) MLP Multi-Layer Perceptron (Çok Katmanlı Algılayıcı) LDA Linear Discriminant Analysis ( Doğrusal Ayrım Analizi) GPU Graphic Processing Unit (Grafik İşlem Birimi)

DAN2 Dynamic Artificial Neural Network (Dinamik Yapay Sinir Ağı) FTC Fine Tree Classifier (İnce Ağaç Sınıflandırıcısı)

MTC Medium Tree Classifier (Orta Ağaç Sınıflandırıcısı) CTC Coarce Tree Classifier (Kaba Ağaç Sınıflandırıcısı)

MDS-NN Multi-Dimensional Scaling based RS design ( Çok Boyutlu Ölçeklendirme tabanlı Öneri Sistemi tasarımı)

Net-CF Network based Collaborative filtering scheme ( Ağ tabanlı İşbirlikçi filtreleme şeması)

(14)

1. GİRİŞVEAMAÇ

Sinema, ışıklı bir perdeye görüntülerin veya çizimlerin belirli düzenli aralıklarla film makinesi vasıtasıyla yansıtılarak tekrar oluşturulması üzerine kurulan bir sanat dalıdır.

İnsan gözünün hareketleri kesintisiz algılaması için gereken en düşük ardışık resimlerin sayısı 24 olarak belirlenmiştir. Bu oran günümüz çekimlerinde daha da yükseltilerek kaliteli görüntüler hareketler perdeye daha başarılı bir şekilde yansıtılmaktadır. I. Dünya savaşına kadar teknolojik kısıtlar nedeniyle sessiz olarak çekilen sinemalar, teknolojik gelişmelere paralel olarak gelişerek ses ve görüntünün birleştirilmesiyle bir boyut daha atmıştır. Başlangıç zamanlarında, küçük topluluklara eğlence amaçlı hitap eden sinema, zamanla kendine yer edinerek bir endüstrisi oluşturmuş ve bunun sonucunda daha geniş kitlelere daha farklı türlerde hitap etmeye başlamıştır. Sabit olarak tiyatro tarzı yapılan çekimlerin yerini, 1903‟te çekilen Büyük Tren Soygunu filmi ile hareketli, farklı açılardan yapılan gerçekçi sinema filmi almıştır. 1927 yılında gösterime giren The Jazz Singer filmi ile de sesli filme ilk geçiş yapılmıştır. Bunu, 1939 yılında Gone with the Wind filmi ile renkli filme geçiş takip etmiştir. 1952 yılında 3-D sinema tekniğinin bulunması ile yeni aşamalar kat eden sinema artık daha gerçekçi, tiyatrodan ayırt edilemez bir hale gelmiştir.

Sinemaya olan ilgi de arttıkça, birçok sinema yapımcısı ortaya çıkmıştı ve sinema artık bir sanayi ve ticaret sektörü olarak piyasada yer edinmeye başlamıştır. Sinema piyasasından pay alma çabasına girişen yapımcılar, insanların dikkatini çekecek yeni filmler çekme yarışına girişmiştir. Takvimler 1980‟leri gösterdiğinde, videonun yaygınlaşması ile elektronik sinema önem kazanmaya başlamıştır. Videoların evlere girmesiyle sinemaya talep daha da artmıştır ve bunun sonucunda büyüklerin yanında küçük film yapımcıları da bu pazarda kendilerine yer bulmuşlardır (Ana Britannica, 2019).

1980 ile 1990 yılları arasında ise artan ithalatın sonucu teknolojik gelişmeler ülkeye giriş yaparak sinema gelişimini de etkilemiş ve sinema seyircileri aileden birey düzeyine düşmüştür. Yine 1980‟lerde, eskiden başroldeki oyuncu ile vizyona çıkan filmlerden yönetmenine göre belirtilen sinema sistemine geçiş yapılmıştır. 1990‟larda ise ülkemizde sinemaya ilgi daha da azalmış ve sinema salonları yavaş yavaş kapanmaya başlamıştır.

Sinemaların yerini sırasıyla vhs video, cd ve dvd ler almıştır. Sinemaya ilginin düşüşünün

(15)

diğer bir sebebi de 80‟lerde yapılan kalitesiz filmler olduğu da söylenebilir (Gırlangıç, 2014). Seneler ilerledikçe sinemaya hakim olan yönetmen kitlesi ve anlatımları da değişmiş, kendine özgü izleyici kitlesi de oluşmuştur. 2000‟lere geldiğimizde ise sinemada daha çok sinema okullarından mezun olmuş eğitimli genç bir nesil hakim olmaya başlamıştır. Teknolojik düzeyde ve bütçe olarak dünya sinemasını yakalamış bir sinema ile milyon dolarlık, milyon seyircili yapımlar yapılmaya başlamıştır.

2005 yılında 30 milyon civarında olan sinema seyircisi sayısı, 2017 yılında 71 milyonu aşmıştır. Yine 2017 yılında ülkemizde sadece gişe gelirleri 863 milyon TL‟lik bir büyüklüğe kavuşmuş ve film sektörünün büyüklüğü 3 milyar TL‟yi geçmiştir. 2018 yılında ise 180‟i yerli olmak üzere toplamda 437 film vizyona girmiştir (Kültür ve Turizm Bakanlığı, 2018).

Amerika Sinema Filmi Derneği (MPAA) 2018 yılında hazırladığı sinema raporuna (MPAA, 2018) göre; küresel bazda ev eğlencesi ve tiyatro pazarının büyüklüğü 2018 yılında toplamda 96,8 milyar dolar olarak gerçekleşmiştir. Sinema hasılatında ise dünya çapında 41 milyar dolar olarak hesaplanan hasılatın 11,9 milyar doları Kanada ve ABD tarafından ulaşılan rakamlardır. Dünya çapında gösterilen film sayısı da %7‟lik artışla 190 binlere yaklaşmıştır. Çok büyük hasılatlarla çekilen filmlerin yatırım maliyetlerinin geri dönüşleri de yatırımcılar tarafından önemli bir sorun olarak değerlendirilmektedir.

1920‟lerden beri Amerika film endüstrisi her yıl binlerce film yayınlamaktadır.

Çekilen filmlerden elde edilen hasılat, diğer tüm ülkelerden daha yüksektir (Im vd., 2011).

Filmlerin beğenilmesi ile yüksek karlılık oranları yakalanabilmektedir. Bunun için de film bütçesinden en büyük oran reklama ayrılmaktadır. Kimi zaman yapılan yatırımlar, yapımcı şirketlere büyük zararlar olarak dönmektedir. Amerika‟nın en büyük yapım şirketlerinden olan Warner Brothers bile 2013 yılında gelir kayıpları yaşamıştır. Filmlerin başarısı olasılığını önceden bilmek bir şekilde mümkün olduğunda, yapım evleri filmlerinin yayınlanmasını maksimum kar elde edecek şekilde ayarlayabilecektir (Nithin vd., 2014).

Apte vd. (2011) çalışmasında, film hasılatı tahmininin yapımcı firmaları bütçe oluştururken karlılık yönünde yönlendirici olacağından bahsedilmektedir. Yatırımcılar,

(16)

hasılat tahminine göre oyuncuların seçimi, reklam ve promosyon gibi film giderleri için daha sağlıklı karar verebilecektir.

Tüketiciler için satın alacakları ürünlerin görüntülenebilmesi ve benzer ürünlerin önerilmesi oldukça önemli bir konudur ( Rendle vd., 2009). Bu noktada, film afişleri ve fragmanlar, izleyicileri etkileyen önemli bir konumda durmaktadır. İzleyiciler açısından henüz vizyona girmemiş filmler ile aralarındaki en önemli irtibat noktası afiş ve fragmandır. Tek afiş karesine sığdırılacak filmin özeti ve etkileyici sahnelerden oluşan fragmanlar, izleyici çekecek vitrin görevi görmektedir.

Filmin bütçesi, süresi, yıldız oyuncunun popülerliği, filmin aldığı puan gibi verilerin de hasılat tahmini için kullanıldığı Jeffrey vd. (1999) çalışmasında görülmektedir.

Aynı şekilde, Quader vd. (2017) sınıflandırma modeli için, film verilerinden oyuncular, yönetmen, bütçe, vizyona giriş tarihi, çeşitli kaynaklardan toplanan film puanları ve filmin incelemeleri gibi veriler, makine öğrenmesi ve doğal dil işleme süreçleri uygulanarak hasılat tahmininde kullanılmaktadır.

Derin öğrenme, görüntü analizi ve görüntüden nesne belirleme gibi konular, son zamanlarda makinelerin işlem kabiliyetleri artmasından da kaynaklı olarak popüler hale gelmiştir. Çalışmamızda derin öğrenme yöntemleri ile görüntü işlemenin yanı sıra, metin ve sayısal değerleri de birlikte kullanarak, vizyondaki sinema filmlerinin gişe hasılatlarının tahmin edilmesine ve film önerisi verilmesi üzerinde çalışılmıştır.

Bu tezin amacı, önceki araştırmaların aksine, film daha vizyona çıkmadan sadece afiş ve fragman görselleri ile diğer oyuncu, senarist, konu gibi verileri ile tahminleme yapabilmesidir. Bununla birlikte bahsedilen öğelerin film önerisi üzerine etkisi de araştırılmıştır.

Hasılat tahmini için önerilen modelde 2017 yılında vizyona çıkan filmlerden bir veri kümesi oluşturulmuştur. Filmlerin gişe hasılatları, yönetmen, senarist, oyuncuları, konusu gibi çeşitli veriler üzerinde çalışma yapılmıştır. Film önerisi için kullanılan modelde ise, Movilens‟in sağladığı 20 milyon kullanıcı film puan verisine sahip veri kümesi ve bu filmlerin IMDb sitesindeki oyuncu, bütçe, yayın yılı gibi verileri kullanılarak

(17)

oluşturulan yeni veri kümesi kullanılmıştır. Bu veri kümesine ayrıca filmlerin fragmanlarından elde edilen özellik matrisleri eklenmiştir. Çalışmada derin öğrenme modellerinden Alexnet modeli kullanılmıştır.

Teknolojik gelişmeler, kendini sinema sektöründe de hissettirmektedir. Bunların başında yüksek maliyetli görüntü, ses efektleri ve diğer sahne ekipmanları sayılabilir.

Ayrıca filmlerde büyük gider kalemlerinden oyuncu ücretlerini de dahil edebiliriz. Bunun doğal bir sonucu olarak film yapımcılarının da en büyük beklentisi filmin hasılatıdır. Bu sebepten, yapımcı ve dağıtımcılar için en büyük risk kalemlerinin başında bilet satışları gelmektedir.

Bilet satış tahminleri sadece film yatırımcısının maliyetinin karşılanmasını değil, aynı zamanda filmin yayın risklerinin tespiti ve yatırımın karlılığı hususunda önemli bilgiler vermektedir. Bilet satışlarını etkileyen çok fazla etken ve bunların ölçülmelerindeki zorluklardan dolayı filmlerinin karlılığının doğru bir şekilde ölçülmesi gerçekten çok zordur. Bunun yanında, bilet satışlarındaki unsurları ve bunlar arasındaki ilişkileri tespit etmek, olası piyasa risklerini azaltmak, film endüstrisinin işleyişini ve yönetimini geliştirmek için oldukça önemlidir.

Yapılan diğer çalışmalarda en erken hasılat tahminleri, film vizyona girdikten sonraki ilk haftalık hasılatlarına göre tahminleme modeli oluşturularak yapılmaktadır.

Ancak bu durumda filmin gelirini artırıcı herhangi bir işlem yapılması mümkün olmamaktadır. Bu çalışma, filmin oyuncuları, senaristi, yönetmeni, film müziği, konu, süre, gösterime girdiği salon sayısı gibi verilerin yanı sıra film için oluşturulmuş afiş ve fragman bilgilerini de içeren bir model ile filmin hasılatının tahmini üzerinedir.

Tezin kalan kısmının formatı şu şekildedir: Bölüm 2, sinema gelir tahminleri ve tavsiye sistemlerine dayalı literatür araştırmasının yapıldığı kısımdır. Bölüm 3‟de hasılat tahmini ve film önerisi için kullanılan veri kümelerinin detayları, nasıl elde edildiği ve modelin oluşturulmasında kullanılan yöntemlerden bahsedilmektedir. Önerilen modelde kullanılan teknikler ile sınıflandırma araçları ve modelin detaylarına yer verilmektedir. 4.

bölümde ise film hasılatları ve film önerisi veri kümeleri üzerinde yapılan deneysel uygulamalardan ve elde edilen sonuçlardan bahsedilmektedir. 5. bölümde bulgular ve

(18)

tartışma başlıkları altında ise elde edilen veriler yorumlanmaktadır. Sonuç ve öneriler adlı son bölümde ise, önerilen model gerçekleştirilirken karşılaşılan zorluklar ve çözüm önerilerinin yanı sıra, sonraki çalışmalar için tavsiyeler yer almaktadır.

(19)

2. LİTERATÜR ARAŞTIRMASI

Veri madenciliği ve makine öğrenmesi üzerinde yapılan Kumar vd. (2019) çalışmasında, filmin başarısının doğrudan ilişkili olduğu film verileri araştırması gerçekleştirilmiştir. Karşılaştırmalar filmin bütçesi, oyuncular, yönetmen, yapımcı, senarist, vizyona giriş tarihi, film müziği, aynı anda vizyona giren rekabet edilen diğer filmler, yayınlandığı yer ve hedef kitle gibi veriler üzerinden yapılmıştır. Çalışmanın sonunda, eleştirmenlerin puanıyla izleyici puanları arasında güçlü bir pozitif ilişki olduğu bulunmuştur. Böylece, filmlerin başarısını eleştirmenlerin puanına dayanarak tahmin edilebileceği sonucu çıkartılmıştır.

Dey (2018) çalışmasında ise, IMDb¹ verilerinden 2010 - 2015 yılları arasındaki filmler üzerinde filmin brüt gelirini halka açık verilerden tahmin etmek amacıyla, bir bağımlı yöntem (Çoklu Doğrusal Regresyon) ve bir bağımsız yöntem (Faktör Analizi) kullanılmıştır. Bu iki regresyon modelinin sonuçlarına bakılarak yapım aşamasındaki filmin hasılat tahmininin çok doğru olmadığı belirtilmiştir. Bunun yanında, filmin ilk hafta yayınlanmasının ardından nihai hasılatın tahminlemesi daha kolay hale geldiği yapılan çalışmada ortaya konmuştur.

IMDb, Rotten Tomato², Box Office Mojo³ ve Meta Critic⁴ verileri üzerinde yapılan Quader vd. (2017) çalışmasında ise doğal dil işleme ve farklı makine öğrenme teknikleri kullanılmıştır. Film hasılatı tahmininde oyuncular, yönetmen, bütçe, filmin vizyon tarihi, filmin aldığı puanlar ve film hakkındaki kullanıcı görüşleri alınarak işlenmiş ve sınıflandırma yapılmıştır. Bu çalışmada devam filmleri ve film türleri, hesaplama adımlarına özellik olarak katılmamıştır. Çalışmanın sonuçlarına baktığımızda ise, Destek Vektör Makineleri (Support Vector Machine, SVM) tahmin doğruluğu %83,44 gibi yüksek bir oran yakalamıştır. Yine tüm özelliklerin ölçüldüğü SVM tahmininde doğruluk oranları tahmininde %88,87 olarak ölçülmüştür. Yapay sinir ağlarında tahminde %84,1, tüm

1 Internet Movie Database https://www.imdb.com/

2 https://www.rottentomatoes.com/

3 https://www.boxofficemojo.com/

4 https://www.metacritic.com/

(20)

özelliklerin kullanıldığı durumda %89,27 tahmin oranı elde edilmiştir. Bunun yanında, SVM ile Yapay Sinir Ağları karşılaştırıldığında, yapay sinir ağlarının SVM‟den daha yüksek sonuçlar verdiği görülmektedir. Çalışmadan elde edilen bir diğer önemli bulgu da, bütçe, ekran sayısı ve IMDB oylarının filmin hasılat tahmini yapılırken kullanılacak en önemli özellikler olduğudur.

11 senelik bir periyottaki filmler üzerinde yapılan bir çalışmanın sonucunda ortaya çıkan Lash vd. (2016) çalışmasında ise film yapımcılarına daha filmin başında iken yardımcı olması amacıyla karar destek sistemleri kullanılmıştır. Sistem, IMDb ve BoxOfficeMojo„dan alınmış sinema verilerini kullanarak bir filmin karlılığını tahmin etme üzerine çalışmaktadır. 2000 ile 2010 yılları arasında toplamda 14.097 film ve 4420 aktör üzerinde çalışma yapılmıştır. Metin madenciliği, sosyal ağ analizi tekniklerinin kullanıldığı sistemde kimlerin oynadığı, filmin konusu, vizyona çıkış tarihi yanında, (kim – ne) ve (ne zaman – ne) ile eşleşen özellik grupları otomatik olarak çıkarılmaktadır. Oyuncuların tecrübe süreleri, oyuncuların önceki çalışmalarında elde edilen kazanç, yönetmenlerin önceki çalışmalarında elde edilen kazanç, oyuncunun kazancı ve yönetmenin kazancı

“Kim” kısmında bakılan özellikler olarak karşımıza çıkmaktadır. Tahmine dayalı oluşturulan modelde, başrolde ortak rol alan oyuncuların arasında dinamik bir işbirliği ağı oluşturulmaktadır. Bunun yanında aktör yönetmen arasındaki ilişki ve kar oranları bulunmuştur. Filmin yatırım karlılığı üzerine oluşturulan modelde, lojistik regresyon, karar destek sistemleri, Naive Bayes, karar ağaçları gibi birçok algoritma kullanılmıştır.

Daha önce kullanılmamış bir metod olan ham verilerin işlenmesi ve SVM sınıflandırma mekanizmaları üzerine kurulu Liu ve Zhao (2016) çalışmasında da gişe gelir tahmini yapılmıştır. Ön işlemden geçen veriler üzerinde, sınıflandırıcının performansını arttırmak amacıyla nitelik azaltma metodu kullanılarak en iyileme yapılmıştır. Girdi olarak alınan değişkenlerin seçiminde ve ilk değerlerinin atanmasında daha bilimsel ve kabul edilebilir olması amacıyla istatistiksel yöntemler kullanılmıştır. Yapılan deneysel çalışmaların sonucunda, kullanılan yöntemin doğruluğunun, Sharda ve Delen‟in (2006) çalışmasında MLP (Multi-Layer Perceptron / Çok Katmanlı Algılayıcı) kullanılarak bulunan %75,2 lik sonucuna göre %10 daha yüksek olduğu ortaya çıkartılmıştır.

(21)

Ghiassi vd. (2014) çalışmasında, filmin yapım öncesi dönemde film gelirlerini tahmin etmek için Dynamic Artificial Neural Network (DAN2)'ye dayanan bir modelin gelişimi sunulmaktadır. Deneysel çalışmalarda DAN2 kullanılmıştır ve karşılaştırma modeli performansına göre %32,8 oranında iyileştirme sağlanmıştır. Çalışmada, veriler üzerinde K en yakın komşular (KNN) algoritması çalıştırılmış, sonrasında ise DAN2 sınıflandırması uygulanmıştır. Bu çalışmanın sonucunda %94,1'lik tahmin doğruluğu sunması için alternatif bir modelleme stratejisi olarak yeni bir değişken seti kullanılmıştır.

Alternatif modelde; rekabet, yıldız oyuncu değeri, film türü ve özel efektler değişken olarak kaldırılırken, üretim bütçesi, yayın öncesi reklam harcamaları, çalışma süresi ve mevsimsellik eklenmiştir. Bu çalışmada yüksek bir tahmin oranı olmasına karşın, film yapımcılarının her zaman herkesin erişebileceği bir veri olmayan finansal harcamaları üzerinden işlem yapılmıştır. Filmlerin görsel boyutları tahmin sonuçlarının elde edilmesi amacıyla incelenmemiştir.

Bir filmin IMDb‟de yayınlanan çevrimiçi yorumları ile filmin gişe geliri performansı arasındaki ilişkiyi incelemek için duygu analizi ve makine öğrenimi yöntemlerinin uygulandığı Yao vd. (2013) çalışmasında ise 14 etkili anahtar kelime içeren, üzerinde çalışılması daha kolay, çok basit bir özellik kümesi kullanılmıştır. Film yorumlarından gişe hasılatını tahmin etmek için Naive Bayes Sınıflandırıcısı kullanarak bir sınıflandırma modeli oluşturulmuştur. Toplamda 3 filmin (The Amazing Spiderman, Life of Pi ve Madagascar 3) 911 adet izleyici yorum verisi ile çalışılmış ve %78,75 oranında başarı elde edilmiştir.

Kore filmleri üzerinde yapılan Song vd. (2013) çalışmasında ise, hasılatı en az 500 milyon KRW (Güney Kore Para Birimi) olan 2008 ile 2011 yılları arasında vizyona girmiş 206 Kore filmi üzerinde Regresyon (Regression), Rastgele Orman (Random Forest) ve Değişim Arttırma (Gradient Boosting) çalışmaları yapılmıştır. Yönetmen, oyuncu popülerliği, devam filmi, film türü, sezon, yayın tarihi gibi 19 farklı veri tipi üzerinde çalışılmıştır. Çalışmanın sonunda, yönetmenin ve yıldız oyuncuların toplam geliri arttırdığı sonucu elde edilmiştir.

Tezin birinci kısmında film hasılatını tahmin etmek üzerinde durulmuş iken ikinci kısmında ise film önerisi üzerine odaklanılmıştır. Öneri sistemleri, müşterilere

(22)

ilgilendikleri ürünlerin benzer ve alternatiflerini sunarak aranılan ürünlere daha hızlı erişim sağlamakta ve satıcılar açısından da bir rekabet ortamı meydana getirmektedir. Kaliteli öneri sistemleri, satıcıların rakiplerine oranla daha fazla satış yaparak önlerine geçmesine imkan verecektir. Elektronik ortamdaki alışverişlerde önerilerin başarını ve satış oranlarını yükseltmek adına çeşitli yöntemler geliştirilmiştir Kapusuzoğlu H. (2011). Bunlardan İçerik Tabanlı Filtreleme (Content Based Filtering), Ortak Filtreleme (Collaborative Filtering) ve Melez-Karma Filtreleme (Hybrid Filtering) ürün önerilerinde en sık kullanılan yöntemlerdendir.

Ürünlerin değerlendirilmesi sırasında insanların göz önüne aldığı görsel özellikleri inceleyen He vd. (2016) çalışmasında ise daha iyi öneri verebilmek amacıyla kullanıcıların geçmişteki geri bildirimleri kullanılmıştır. Tek Sınıf İşbirlikçi Filtreleme (One-Class Collaborative Filtering) için yeni modeller oluşturulan çalışmada, kullanıcıların moda davranışlarının kişiselleştirilmiş sıralama işlevleri tahmin edilmeye çalışılmıştır. Çalışmada önerilen yöntemde üst düzey görsel özellikler, derin erişimsel sinir ağlarından elde edilmiş ve kullanıcıların daha önce yapmış oldukları geri bildirimler ile toplulukta gelişen eğilimler bir araya getirilmiştir.

Pliakos ve Kotropoulos (2015) çalışmasında ise turizm ile ilgili görüntülerin görsel ve metinsel bilgilerinin yardımıyla anlam bilimsel, görsel ve coğrafik olarak betimleme yapmışlardır. Çalışmanın temeli, organize edilerek kümelenmiş ve sınıflandırılmış büyük görüntü koleksiyonlarına dayanmaktadır. GIST betimleyici ve GPS konum verileri yardımıyla sınıflandırılmış imgelerin benzerliklerinin ölçülmesi ve betimleme yapılabilmesi için bir öneri sistemi kurulmuştur.

Cao vd. (2010) çalışmasında ise geotagged fotoğrafların fotoğraf paylaşım sitelerinden toplanarak bir veritabanı oluşturulmuştur. Bu veritabanındaki imgelerden insanların (cinsiyet, yaş vb.) özellikleri betimlenmiş ve seyahat kayıtları ile bu özellikler birleştirilerek kişiye özel seyahat önerileri vermektedir. Seyahat yerleri arasındaki en kısa mesafelerin belirlendiği bu öneri sisteminde GPS verileri ile o andaki konumuna göre kişiye özel önerilerde bulunmaktadır.

(23)

3. YÖNTEM ve ARAÇLAR

3.1. Yöntem

Videolar üzerinde yapılan özellik birleştirme işleminde, düşük seviyeli ses ve görsel özelliklerin birleştirilerek daha güçlü performans sergilediği Natarajan vd., (2012) çalışmasında görülmektedir. Bu sonuçlardan yola çıkarak, çalışmada filmin afişleri, fragmanları ve oyuncu, senarist, yapımcı gibi bilgiler toplanarak detay boyutunda birbirinden farklı 3 veri kümesi elde edilmiştir. Her bir veri kümesi, sınıflandırıcı verilerine göre birleştirilerek üzerinde işlem yapacağımız son veri kümesi elde edilmiştir. İşlem akışı Şekil 3.1‟de detaylı olarak gösterilmiştir.

Şekil 3.1. Gelir tahmin çalışması akış grafiği (K: Film sayısı, N: Fragman saniye uzunluğu x 5)

(24)

Song vd. (2013) çalışmasında da bahsedildiği gibi, bir filmin hasılatını etkileyen faktörler arasında yönetmen, oyuncular, devam filmi, film türü, sezon, yayın tarihi, film müziği, yapımcı gibi film ile ilgili detay bilgileri sayılmaktadır. Rendle vd., (2009) çalışmasında ise, ürün resimlerinin müşterilerin tercihleri üzerindeki etkisi ele alınmıştır.

Film için de afiş ve fragmanlar bu tanıma uymaktadır. En iyi sınıflandırma verisine ulaşmak için metin, resim ve video özelliklerini içeren bu 3 veri kümesinin birleştirilerek üzerinde çalışılması mantıklıdır.

Yapılan çalışmada, bu üç farklı kaynaktan elde edilen metin, resim ve video özellikleri bir araya getirilip sınıflandırma işlemlerinde kullanılmıştır. Afiş ve fragmanlardan ayrı ayrı çıkartılan öznitelik vektörleri ile üzerinde işlem yapacağımız matrisler oluşturulmuştur. Metin verilerinden de elde edilen öznitelik vektörü ile matrisimiz oluşturulmuş, diğer matrislerle uyum sağlaması açısından tekil değer ayrışımı (SVDS) ile K x 5 (K: Film sayısı) boyutlu bir matrise indirgenmiştir. Elde edilen 3 matris, film bazında hasılatlarına göre gruplandırılarak birleştirilerek yeni matrisimiz elde edilmiştir. Çalışmada anlatılan tüm sınıflandırma modelleriyle bu son birleştirilmiş matris (Film Matrisi) üzerinde işlem yapılmıştır.

3.1.1. AlexNet

Geliştiricileri Alex Krizhevsky, Ilya Sutskever and Geoffrey Hinton‟dır. 2012 yılında geliştirilen bu çalışma sayesinde, konvolüsyonlu yapay sinir ağ modelleri (CNN) ve derin öğrenmenin tekrar popüler olmasını sağlamışlardır. İçerdiği benzer katmanlar nedeniyle LeNet modeliyle benzerlik göstermektedir. Sadece büyük imgelere göre uyarlanmış LeNet modeli olduğu da söylenebilir (Krizhevsky vd., 2012).

Paralel çalışan çift GPU (Graphic Processing Unit) üzerinde iki parçalı modelde yaklaşık olarak 60 milyon parametre hesaplanabilmektedir. Sınıflandırma doğruluk oranını

%74,3‟ten %83,6‟ya yükselterek, ImageNet ILSVRC yarışmasında görüntü sınıflandırmada büyük kırılma noktası olmuştur. Ayrıca 5 hata ortalamasını da %26 dan

%15,3„e çekerek yüksek bir performans sergilemiştir (Krizhevsky vd., 2012).

(25)

Tam bağlı katmanlar denilen AlexNet modelinin Şekil 3.2‟de gösterilen en son basamaktaki tam bağımlı FC6 ve FC7 katmanları, 4096x1 boyutlu öznitelik vektörü çıkartmak için kullanılmaktadır. Bu çalışmada, FC7 katmanından elde edilen 4096x1 boyutlu vektör, sinema hasılatı sınıfının tahmin edilmesinde kullanılmıştır.

Şekil 3.2. AlexNet çalışma yapısı, Kızrak (2018)

3.1.2. Inception V3

ImageNet yarışması “AlexNet” ağı tarafından kazanılmasından bu yana, nesne tespiti, bölümlendirme, insan pozu tahmini, video sınıflandırması, nesne takibi ve süper çözünürlük gibi çok çeşitli bilgisayarlı görü görevlerine başarıyla uygulanmıştır Krizhevsky vd., (2012). Szegedy vd., (2016) çalışmasıyla ortaya çıkarılan bir modüldür.

Evrişimli sinir ağları (CNN – Convolutional Neural Networks) 2014 den beri popüler bir araştırma konusu olmasıyla birlikte, çeşitli konularda yapılan çalışmalarla kazanımlar sağlamıştır. Çoğu modelde verim artışı sağlamasına karşın, veri modelinin büyüdükçe artan hesaplama ve etiketleme maliyetleri ile düşük parametre sayısı, mobil görme ve büyük veri işlemlerinde çeşitli kısıtlamalara neden olmaktadır. Yapılan çalışmada, bu sorunlara çözüm bulunması için, hesaplamayı mümkün olduğunca verimli hale getirecek en uygun şekilde düzenlenen evrişimler ile sinir ağlarını büyütme yolları araştırılmıştır.

Inception V2‟nin üzerine yardımcı sınıflayıcı küme normalizasyonu (batch normalized) ve tam bağlı (Fully Connected - FC) katmanı eklenmesi ile Inception V3 mimarisi (Şekil 3.3) ortaya çıkmıştır.

(26)

Şekil 3.3. Inception V3 modeli, Kızrak (2018)

3.1.3. Tekil Değer Ayrışımı (Singular Value Decomposition, SVDS)

Bir matrisin tekil değer ayrışımı (SVDS) işlemi, matrisin çarpanlarına ayırma yöntemlerinden biridir ve iki aşamalı bir işlem grubu ile hesaplanmaktadır. İlk adımda matris, bidiagonal⁵ matrise indirgenmiştir. Bu işlem m ≥ n olduğu varsayılarak O( )‟lik bir işlem karmaşıklığına sahiptir. İkinci adımda ise bidiagonal matrisin SVD‟sinin hesaplanması yinelemeli bir yöntemle yapılmaktadır. Bu yineleme işlemi n defa tekrarlandığı varsayıldığında, O(n) karmaşıklığında olacaktır. İşlemlerin maliyetlerine bakıldığında, ilk adım daha pahalıdır ve toplam işlem maliyeti O( )‟dir (Trefethen ve Bau, 1997). Tekil değer ayrışımı formülünde (3.1) (Matlab Function Reference, 2019), matrisin indirgenmesi işlemindeki değişkenler gösterilmiştir.

A = USV^T (3.1)

A: m x n matris U: m x n ortogonal matris

S: n x n diyagonal matris V: n x n ortogonal matris

5 Ana köşegen ile alt ve üst köşegenlerinde sıfır girdisi olmayan matris

(27)

3.1.4. Sınıflandırma

Veri sınıflandırma, veriyi içeriğine bağlı olarak belirli hassasiyet dereceleri ve sınırlar dahilinde istenilen gruplara ayırma işlemidir. Sınıflandırmada kullanılan algoritmalar, baştan verilen eğitim kümesi ile gruplama işlemini öğrenir ve daha sonra grupları belli olmayan bir veri kümesi verildiğinde doğru şekilde gruplandırmaya çalışır.

Çalışmada, filme ait afiş, fragman ve detay verilerinin işlenerek hangi hasılat grubuna dahil olduğu sınıflandırma yöntemleri kullanılarak belirlenmeye çalışılmıştır. Veriler üzerinde farklı sınıflandırma yöntemleri uygulanarak veri kümemize en uygun ve en iyi sınıflandırma oranını veren yöntemin bulunması hedeflenmiştir.

3.1.4.1. Karar Ağaçları (Decision Tree)

Makine öğrenmesi tekniklerinden biri olan karar ağacı, tümevarım tekniği ile sınıflandıran verilerden öğrenen bir karar verme yapısıdır. Büyük miktardaki veriyi basit karar verme adımları ile küçük parçalara ayıran bir öğrenme algoritmasıdır. Her bir başarılı bölümün sonucundaki elemanları birbirleriyle olan benzerlikleri artmaktadır. Karar ağaçları, öngörücü ve tanımlayıcı özelliklere sahiptir. Kolay yorumlanması, veritabanlarına entegre edilebilmesi ve güvenirliliği ile sınıflandırma algoritmaları arasında popülerliği korumaktadır (Çelik ve Altunaydın, 2018).

Bu algoritmadaki amaç; bilinmeyen bir verinin modelinin tahmini için, eldeki verilerin özelliklerinden basit kurallar çıkartıp bu kuralları öğrenen bir yapı kurulmasıdır.

Bu algoritma kullanılmadan önce eksik değerlerin belirlenip çözülmesi gerekmektedir.

Akpınar‟a (2000) göre karar ağaçlarının en çok kullanıldığı alanları şu şekilde sıralayabiliriz:

- Belirli bir sınıfın üyeleri belirlenirken

- Çok sayıdaki değişkenlerden seçim yaparak parametrik model oluşturulurken - Olaylardan kurallar oluşturarak gelecekteki olayların tahmin edilmesi

- Olayların düşük, orta ve yüksek gibi risk grupları gibi kategorizasyon yapılması - Kategorilerin birleştirilmesi işlemlerinde

(28)

- Belirli gruplara ait ilişkiler tanımlanırken

KA (Karar Ağaçları), ağacın derinliğine (yaprak sayısı) bağlı olarak alt gruplara ayrılır.

Bunlar; İnce Ağaç Sınıflandırıcısı (Fine Tree Classifier, FTC), Orta Ağaç Sınıflandırıcısı (Medium Tree Classifier, MTC) ve Kaba Ağaç Sınıflandırıcısıdır (Coarse Tree Classifier, CTC). İnce ağaç sınıflandırıcısı, büyük veri sınıfları için uygundur. Yaprak sayısı daha fazla ve sonuçların sınıflandırma doğruluğu daha yüksektir. Kaba ağaç sınıflandırıcısı ise en az yaprak sayısına sahiptir ve karar ağaçları arasında en az doğruluk oranına sahiptir.

Küçük veri kümeleri için yorumlanması kolay ve daha tutarlıdır. Orta ağaç sınıflandırıcısı ise orta sayıda yaprağa sahiptir. Böylece kaba ağaçtan daha yüksek doğruluk sağlamaktadır (Subbarao ve Samundiswary, 2018).

3.1.4.2. K En Yakın Komşular (KNN)

Bu algoritma, örnek veri noktaları ile denetimli öğrenme adı verilen, ilk defa Cover ve Hart‟ın (1967) önerdiği bir metottur. Bu yöntemde, belirlenen bir k değerine göre en yakın komşu noktaların bulunduğu bir karar aşaması kullanılmaktadır. Tıp, yapay zeka, veri madenciliği gibi çeşitli dallarda kullanılan bu yöntem, çok kullanılan, uygulaması basit, eski ve verimli bir sınıflandırma algoritmasıdır. Analitik olarak takip edilebilen bu yöntemin uygulaması da kolaydır. Paralel olarak da çalıştırılabilen bu yöntem, verilerdeki gürültülerden de çok fazla etkilenmez. Bu özellikleri sayesinde sınıflandırma verileri için tercih edilen metotların başında gelmektedir. Bunun yanında, veri seti boyutundaki büyüme, öznitelik boyutu artışının da yüksek bellek kullanımı, artan işlem maliyeti gibi dezavantajları vardır. k değerinin belirlenmesinde bir kriter bulunmamaktadır. Seçim sezgisel olarak da yapılabilmektedir (Laribi, 2018).

Yeni veri geldiğinde, ilk önce k değerine bakılmaktadır. k değeri, eşitlik oluşmaması amacıyla tek sayı olarak seçilmelidir. Veriler arasındaki mesafe hesaplamalarında Öklid (Euclidean) (3.2), Manhattan (3.3) ve Minkowski (3.4) mesafeleri kullanılmaktadır.

(29)

 

²

1 k

i i

i

Mesafe x y



  

^(3.2)

1 k

i i

i

Mesafe x y



  

^(3.3)

 

¹

1

k q q

i i

i

Mesafe x y



  

^(3.4)

Test verisine en yakın k tane değerin farkları ile istenilen formül kullanılarak uzaklıklar hesaplanır. Bulunan en küçük değerler çözüm kümesini oluşturur. Bu kümedeki k tane eleman hangi sınıfta ise, yeni eleman da bu sınıfa dahil edilir.

3.1.4.3. Destek Vektör Makinesi (Support Vector Machine SVM)

İstatistiksel bir öğrenme metodu olan destek vektör makinesi, farklı sınıflandırma işlemlerinde yüksek başarı oranlarına sahiptir. Destek vektör makinesi, doğrusal bir sınıflandırıcıdır. Doğrusal olmayan yüksek boyutlu veri kümesi üzerinde çalışmaktadır (Hazım, 2018). Sınıflandırma için iki grup arasına, grup üyelerine en uzak mesafeye bir çizgi çekilerek ayrılırlar. En uzak sınır çizgisinin bulunmasında, öncelikle iki gruba da en yakın yerlere birbirlerine paralel olacak şekilde iki sınır çizgisi çizilir. Bu iki sınır çizgisinin birbirlerine yaklaştırılması sonucunda ortak sınır çizgisi oluşturulur. Bu sınır çizgisi bulunurken, çoklu düzlemler arasındaki mesafenin en büyük değeri aranmaktadır (Cortes ve Vapnik, 1995).

Destek vektör makineleri, veri kümesini iki gruba ayırabilmek için doğrusal olarak ayrılabilen bir hiper düzlem oluşturmaya çalışır. Bu hiper düzlem, bir çizgi (2 boyutlu), düzlem (3 boyutlu) veya hiper düzlem (4+ boyutlu) boyutları için doğrusal bir ayırıcıdır (James vd., 2013). Güneren‟in (2015) çalışmasında da bahsedildiği gibi, SVM‟lerin temel hedefi, iki sınıfın verilerinin en uygun şekilde ayıran hiper düzlemin bulunmasıdır. Destek vektör makineleri, sınıflandırma tabanlı veri kümesinin doğrusal olan ve doğrusal olmayan şeklinde 2 kategoriye ayrılmaktadır.

(30)

i. Doğrusal olarak ayrılabilen

Genellikle (+1, -1) şeklinde etiketlenen iki farklı sınıfın örneklerini, eğitim verilerinin işlenmesi sonucu oluşturulan karar fonksiyonu ile iki hiper düzlem ile ayırmak amaçlanmıştır. Bu hiper düzlemler, en yakın noktalar arasındaki mesafeyi SVM‟ye en büyük olanlar bulunarak elde edilir. Sınırları en büyük yapan hiper düzleme en verimli hiper düzlem, sınırları limitleyen noktalara da destek vektörleri denir.

ii. Doğrusal olarak ayrılamayan

Verilerin doğrusal olarak ayrılamayacağı durumlarla da karşılaşılmaktadır. Bu durumda çözüm için pozitif yapay bir değişken tanımlanmaktadır. Sınırın en büyük hale getirilmesi işleminden sonra, C karakteri ile gösterilen bir düzenleme parametresi ile sınıflandırma hatalarının en aza indirgenmesi arasındaki denge sağlanır (Çelik ve Altunaydın, 2018).

Şekil 3.4‟de doğrusal olarak bölünebilen ve bölünemeyen veri kümesi örnekleri verilmiştir.

(a) (b)

Şekil 3.4. Doğrusal olarak bölünebilen veri kümesi (a) ve Doğrusal olarak bölünemeyen veri kümesi (b)

(31)

3.1.4.4. İkinci Dereceden Ayrım Analizi (Quadratic Discriminant Analysis)

İstatistiksel sınıflandırma, bir nesne veya olayın her biri bilinen bir y tipine sahip x gözlem vektör kümesini göz önüne almaktadır. Bu veri kümesi eğitim kümesi olarak adlandırılır. Burada çözüm bulunması beklenen durum, yeni gelen bir gözlem vektörünün sınıfının en doğru şekilde belirlenmesidir. İkinci dereceden bir sınıflandırıcının çözümünün ikinci dereceli olduğu varsayılmaktadır (Anonim, 2019).

3.1.4.5. Doğrusal Ayrım Analizi (Linear Discriminant Analysis - LDA)

Bu ayrım modelinde, sayısallaştırma yapılmamış veri modellerinde boyutun azaltılması, hesap verimliliğinin yükseltilmesi ve verinin birden fazla model ile uyumlu olma durumunun azaltılması amacıyla kullanılmaktadır. Yapı itibariyle PCA‟ya (Principal Component Analysis - Temel Bileşen Analizi) çok benzemektedir. LDA, sınıf ayrımını en iyi seviyede yapabilecek alt özellik uzayını bulmayı hedeflemektedir. Hem PCA hem de LDA doğrusal dönüşüm metotlarıdır ve veri kümesindeki boyut sayısını azaltmak için ikisi de kullanılabilir.

Şekil 3.5‟de doğrusal ayrım analizi, 2 sınıflı bir problem için gösterilmiştir. Sınıf 1 den gelen veriler kesitsel, diğer sınıftan gelen veriler ise dairesel olarak gösterilmiştir (Raschka, 2015).

Şekil 3.5. LDA örnek veri kümesi

(32)

3.2. Araçlar

Çalışmada, evrişimli sinir ağları ve derin öğrenmenin popülerliğini arttıran Alexnet modeli kullanılmaktadır. Altyapısının detaylarına kısaca değinilmiştir.

3.2.1. Derin Öğrenme

Derin öğrenme, yüksek nitelikte çoklu katmanları olan yapay sinir ağları kullanılan bir yöntemdir. Bu yapıda her katman, kendisinden önceki katmandan gelen veriler ile eğitilir. Bu yönü, diğer yapay sinir ağlarından kendisini ayıran en önemli özelliğidir.

Derin Öğrenme terimi, 2006 yılında Hinton tarafından çok katmanlı yapay sinir ağlarının verimli bir şekilde eğitilebileceği ortaya koyulduktan sonra literatürde sıkça kullanılmaya başlanmıştır Hinton (2012).

Derin Öğrenme, özelleştirilmiş bir Makine Öğrenmesi tekniğidir. Derin öğrenme, bilgisayarla görü, konuşma ve ses işleme, doğal dil işleme, robotik, biyoinformatik ve kimya, video oyunları, arama motorları, çevrimiçi reklam ve finans da dahil olmak üzere pek çok uygulama alanında faydası ispatlanmıştır.

Derin öğrenme ile yapılan uygulamalar, makine öğrenmesi ile de yapılabilmektedir.

Fakat derin öğrenme, yapısı gereği daha hızlı ve daha güvenilir sonuç verdiği için tercih edilmektedir.

3.2.2. Sinir Ağları

Çalışma mantığı, insan beyninde bulunan nöronlar ve insan beyninin taklit edilmeye çalışılması üzerine kurulmuştur. Bu taklitten dolayı adına “Yapay Sinir Ağları”

da denmektedir. Ortaya çıkış sebebi, bilgisayarların işlem güçlerinin verimli şekilde kullanılarak, insanların daha hızlı yaptıkları işlemleri bilgisayarlara en azından aynı hızda yaptırabilmektir. Yapının genel işleyişi Şekil 3.6‟dan görülmektedir.

(33)

Şekil 3.6. Yapay sinir ağları

Sinir ağına sistemdeki bütün veriler girdi olarak verilmemektedir. Aksine sistemin üzerinden devam edeceği özelliklerden bazılarının bütün veriden seçilerek çıkarılmış halidir. Özellik çıkartma işlemi ile bütün veri üzerinden boyut azaltma yapılmış olmaktadır. Karmaşık veri, önemli verilerin korunması garanti edilerek, değişken sayısının azaltılmasıyla problem daha basit bir hale indirgenir.

3.2.3. Öneri Sistemleri

Öneri Sistemleri (Recommender Systems), kullanıcıların geçmiş alışkanlıkları ve geri bildirimlerine göre tercihlerini modelleyerek karar alma süreçlerini yönlendirebilen ve aynı zamanda kolaylaştıran sistemler olarak tanımlanmaktadır (Kapusuzoğlu, 2011). Öneri sistemlerini arama motorlarından ayıran önemli bir fark da, kullanıcıya aradığını bulmak yerine istediği nesneleri bulmak üzere özelleşmiş olmalarıdır. Bunun yanında kullanıcıya daha önce görmediği nesneleri de tavsiye ederek yeni şeyleri de bulmasını sağlamaktadır.

Öneri sistemleri genellikle perakende alışveriş, müzik ve film önerileri başta olmak üzere pek çok alanda uygulamaları mevcuttur. Bu sistemlerde öneriler genellikle kullanıcıya özel olmakta ve hoşlanacağı nesnelere erişim kolaylığı sağlamaktadır (Özgöbek ve Erdur, 2015).

(34)

3.2.3.1. İçerik Tabanlı Filtreleme

İçerik tabanlı sistemlerde öneride bulunabilmek için nesnelerin ortak özelliklerinden faydalanılmaktadır. Kullanıcının geçmişte yaptığı nesne tercihleri göz önüne alınarak, benzer özellikleri taşıyan nesneler kullanıcıya tavsiye edilmektedir.

Anahtar kelime benzerlikleri, metin analizi gibi yöntemler nesneler arasındaki benzerliklerin hesaplanmasında kullanılmaktadır (Özgöbek ve Erdur, 2015). Şekil 3.7‟de gösterildiği gibi, benzer özelliklere sahip nesneler kullanıcılara tavsiye edilmektedir.

Hamburger ve pasta A ve B kullanıcıları tarafından da alınmış, C kullanıcısı sadece pasta almış. Bu kullanıcıya da diğerlerinin seçtiği hamburger tavsiye edilmektedir.

Şekil 3.7. İçerik tabanlı filtreleme

3.2.3.2. İşbirlikçi Filtreleme

Bu yöntemde ise öneriler, nesneler yerine kullanıcıların yaptıkları tercihlerin benzerlikleri üzerinden gidilmektedir. Benzer nesne tercihleri yapan kullanıcılar bulunmakta ve yaptıkları tercihler birbirlerine önerilmektedir. Şekil 3.8‟deki örnekte A ve C kullanıcıları ortak 2 tane nesne tercih etmişlerdir. C kullanıcısının tercih etmediği dondurmayı da A kullanıcısı tercih ettiği için C kullanıcısına öneri olarak verilmektedir.

(35)

Şekil 3.8. İşbirlikçi filtreleme

3.2.3.3. Hibrid Yaklaşım

Hibrid sistemlerde ise, daha verimli bir sonuç almak amacıyla içerik tabanlı ve işbirlikçi filtreleme birleştirilerek kullanılmaktadır. Bu sistemin uygulanması için içerik tabanlı ve işbirlikçi filtrelemeler ayrı ayrı uygulanıp birleştirilebilmektedir (Madasamy 2019). Bu sistemin genel amacı, sistemlerin sahip olduğu dezavantajları en aza indirerek avantajlarını birleştirmek suretiyle verimli bir yapı oluşturmaktır (Özgöbek ve Erdur, 2015). Şekil 3.9‟da A ve B kullanıcılarının alışkanlıkları benzerlik göstermektedir. B kullanıcısına işbirlikçi yaklaşım üzerinden pasta ve dondurma önerilirken, C kullanıcısına da nesne benzerlikleri göz önüne alınarak hamburger önerilmektedir.

Şekil 3.9. Hibrid yaklaşım

(36)

3.3. Veri Toplama ve Hazırlama

Çalışma sırasında kullanılan veriler çeşitli kaynaklardan elde edilmiştir. Görüntü işleme, internet sitesinden verilerin alınarak işlenmesi, videoların görüntülere ayrılması gibi aşamalardan geçilerek sınıflandırma ve öneri çalışmalarına veriler hazırlanmıştır.

3.3.1. Hasılat Tahmini

Hasılat tahmini çalışmalarında kullanılan veri kümesi boxoffice ⁶ sitesinden elde edilmiştir. Çalışmada kullanılan veri kümesi, 2017 yılında vizyona giren toplamda 482 yerli ve yabancı filmden oluşmaktadır. Grupların hasılat aralıkları, sezgisel bir gruplama ile Çizelge 3.1‟deki gibi yapılmıştır. 100.000 TL altında hasılat yapan filmler, diğer tüm gruplara oranla daha fazla olduğu görülmektedir. Çok yüksek gişe hasılatı yapan filmler de diğer gruplara oranla en düşük sayılı grubu oluşturmaktadır.

Çizelge 3.1. Film grupları

Hasılat Aralığı (TL) Toplam

Grup1 0 < 100.000 167

Grup2 100.000 250.000 77

Grup3 250.000 1.000.000 96

Grup4 1.000.000 5.000.000 81

Grup5 > 5.000.000 61

Genel Toplam 482

Hasılat hesaplamalarında filmlerin kullanılan verileri ise şöyle sıralanabilir:

 Yönetmen

 Oyuncular

 Senarist

 Stüdyo

 Dağıtıcı firma

 Müzik

6 https://boxofficeturkiye.com/

(37)

 Film türü

 Hasılatı

 Seyirci sayısı

 Süresi

 Oynatıldığı salon sayısı

 Afiş

 Fragman

Hasılatlarına göre gruplandırılmış 482 sinema filminin yukarıda listelenen tüm bu özellikleri ile 4132 x 482 (film özellikleri x film sayısı) boyutlarında büyük bir matris elde edilmiştir. Oluşturulan matrisin sütunlarında oyuncu, senarist, yönetmen, dağıtımcı, film türü gibi veriler girilmiş, satırlara ise filmler girilmiştir. Matrisin hücrelerinde ise filmlere karşılık gelen tüm içerikler 1, karşılığı olmayan sütun bilgileri için ise 0 değeri verilmiştir.

Matrisin en son sütununda ise filmin hasılatına göre hangi sınıfa girdiği bilgisi eklenmiştir.

Bu matris SVDS kullanılarak K x 5 (K: film sayısı) boyutlu bir matrise indirgenmiştir.

Afişlerden de 4096‟lık özellik kümesi çıkarılmıştır. Aynı şekilde fragmanlar saniyede 5 tane film karesine ayrılarak afişlere uygulanan K x 4096 (K: film sayısı) boyutlarında özellik kümesi çıkarılmıştır. Bu işlemler için Alexnet mimarisi kullanılmıştır.

Daha sonra tüm bu veriler hasılat gruplarına göre tek bir matris altında birleştirilerek (Film Matrisi) sınıflandırma yöntemleri ile testler yapılmış ve en yüksek değeri veren algoritma ve sonuca ulaşılmaya çalışılmıştır. Şekil 3.6‟da çalışmada kullanılan film afişlerinden örnekler verilmiştir.

(38)

Şekil 3.10. Film afişlerinden örnekler

3.3.2. Film Önerisi

Çalışmanın öneri sistemi tarafında kullanılan veriler, Movilens⁷ sitesindeki 20 milyon puanlama, 138.000 kullanıcı, 27.000 film ve 465.000 etiketleme içeren veri kümesi kullanılarak elde edilmiştir.

Çalışmada 27 bin filmin 11.726 tanesinin fragmanları, youtube video kanalından bulunmuştur. Videosu elde edilen filmlerin detay bilgileri IMDB sitesinden elde edilmiştir.

Seçilen filmlere verilen puanlar ve puanları veren kullanıcılar, 20 milyon puanlama verisi içinden çekilerek 12 milyon veri elde edilmiştir. Kullanıcılar ve filmlere ait verilerden en az 100 film için puan veren kullanıcılar çıkartılmıştır. Bulunan 34 bin veriden 10 bin tanesi seçilerek kullanıcıların filmlere verdikleri puanların matrisi oluşturulmuştur.

Filmlere ait elde edilen detaylar şu şekilde listelenebilir:

o Yayınlanma yılı

7 https://grouplens.org/datasets/movielens/20m/

(39)

o Anahtar kelimeler o Film türü

o Dağıtımcı firma o Yayınlandığı yerler o Yayınlandığı diller o Bütçe

o Film süresi o Oyuncular

11.726 sinema filmine ait yukarıda listelenen 33.730 adet özellik ile 33.730 x 11.726 (film özellikleri x film sayısı) boyutlarında bir matris elde edilmiştir. Oluşturulan matrisin satırlarında oyuncu, anahtar kelimeler, dağıtımcı firma, film türü gibi veriler girilmiş, sütunlarında ise filmler girilmiştir. Matrisin hücrelerinde ise filmlere karşılık gelen tüm içerikler 1, karşılığı olmayan sütun bilgileri için ise 0 değeri verilmiştir. Bu matris SVDS kullanılarak K x 5, K x 10, K x 20 ve K x 25 (K: film sayısı) boyutlu matrislere indirgenmiştir.

Fragmanlar saniyede 5 tane film karesine ayrılarak K x 4096 (K: film sayısı) boyutlarında özellik kümesi çıkarılmıştır. Bu işlemler için Alexnet mimarisi kullanılmıştır.

3.3.2.1 Gizli Etken Modeli (Latent Factor Model)

Gizli etken modelleri, kullanıcının bir öğe seçmesinin gizli etken olarak bilinen az sayıda etkenin bir işlevi olduğu varsayımı üzerine kuruludur. Örneğin, film önerileri durumunda, bunlar oyuncular, yönetmen ya da tür olabilir. Bu varsayım altında, kullanıcılar gizli etkenlerin her biri için tercihlerini açıklayan vektörler olarak modellenebilir. Benzer şekilde, öğeler bu özelliklerin her birini gösterme dereceleriyle karakterize edilebilir. Gizli etken modeli, öncelikle kullanıcının ve öğenin gizli etken vektörlerini kurtarmak için kullanıcılar tarafından birkaç nesneye verilen açık derecelendirmelerden yararlanır. Diğerlerinden daha kritik olarak derecelendiren bir kullanıcı negatif kullanıcı önyargısına sahipken, oldukça popüler bir nesnenin olumlu nesne önyargısı vardır. Bir kullanıcı tarafından açık derecelendirme böylece formül 3.5'deki gibi modellenebilir (Gogna ve Majumdar, 2017).

(40)

,

( , )

u i u i u i

R  U V    b b g

^(3.5)

Ru,i: u kullanıcısının i nesnesine verdiği puan

Uu, Vi: u kullanıcısı ve i nesnesinin gizli etken vektörü

bu, bi: u kullanıcısı ve i nesnesinin kullanıcı ve nesne yanlılıkları (bias) g: genel ortalama

Zeng vd. (2014) çalışmasında kullanılan MDS-NN (Multi-Dimensional Scaling based RS design) yönteminde, çift taraflı kullanıcı-nesne ağlarındaki düğümlerin benzerliklerini ölçmek için çok boyutlu ölçeklendirme kullanılmaktadır. Çok boyutlu ölçeklendirme tabanlı benzerlik ölçüsü, verideki gürültüyü gidermede yardımcı olmaktadır.

Bu şekilde elde edilen benzerlik ölçüsü, en yakın komşu yaklaşımına benzer bir ürün – ürün puan değerlendirmesi için kullanılmaktadır.

Gan ve Jiang (2013) çalışmasında kullanılan Net-CF (Network based Collaborative filtering scheme) çalışması ise, popüler nesnelerin olumsuz etkisinin üstesinden gelebilmek amacıyla doğruluk ve çeşitlilik arasında anlamlı bir denge kurabilmek için ağ tabanlı bir işbirlikçi filtreleme yaklaşımı önermektedir. İlk olarak, ileride de kullanılacak çeşitliliği ortaya koymada yardımcı olan, madde ayırt edici puanı hesaplamada kullanılan bir kullanıcı benzerlik ağı oluşturulmaktadır.

Gogna ve Majumdar (2017) çalışmalarında DiABlO adını verdikleri yöntemleri, mevcut Net-CF ve MDS-NN yöntemlerinden yaklaşık %10 daha fazla başarı yakalamıştır.

Böylece kullanıcıları daha doğru şekilde yönlendiren bir öneri sistemi tasarlamışlardır.

Formül 3.6‟da DiABlO‟da kullanılan formül görülmektedir. Çizelge 3.2‟de ise diğer yöntemler ile karşılaştırmalı bir başarı ölçümü görülmektedir.

(41)

Çizelge 3.2. Öneri yöntemleri karşılaştırması

Algorithm Precision Recall Aggregate Diversity

Individual

Diversity Novelty

DiABlO 0.8630 0.1907 1448 0.3870 19.359

Net-CF 0.8358 0.1831 473 0.2712 10.709

MDS-NN 0.7639 0.1535 1539 0.4062 20.119

2 2

( ) ( )

,

_F _F

1

_{u Users}

minU V Y  M UV   u U   v V   d 

_

var Uu

(3.6)

3.6 numaralı denklemindeki U, verilen modelde ilgilenilen ürünle alakalı görsel öznitelikleri içermemektedir. He ve McAuley (2016)‟de ise kullanıcının ürün tercih skorlamasında görsel özniteliklerinin de kullanılabilmesi için imge özniteliklerini kullanabilecek şekilde uygulamakta ve gerçel dünya veri seti üzerinde test etmektedir.

(3.6) numaralı eşitlikte verilen modele, Dx1 boyutlu ürün (açık) görsel faktörleri ve Kx1 boyutlu ürüne ait gizli (görsel olmayan) faktörleri ile birleştirerek kullanıcı öngörü değerlendirmesi yardımıyla kestirimde bulunulmak istenmiş ve geri bildirimi olmayan yeni ürünlerin sisteme eklenmesi benzeri sorunlarının hafifletilmesi amacıyla 3.7‟ deki denklem elde edilmiştir.

2 2 2

( ) (

,

_F _F

1

_{u Users}

)

_u _{i F}

minU V Y  M UV   u U   v V   d 

_

var Uu 

  (3.7)

Burada _i ürünle alakalı görsel öznelikleri temsil eden D boyutlu vektördür.

Görsel özniteliklerini elde etmek için He ve McAuley (2016) Evrişimsel Sinir Ağları (Conventional Neural Network) ile ürünün imgesinden elde edilen 4096 boyutlu öznitelik vektörüdür. Evrişimsel Sinir Ağları ile elde edilen vektör yüksek boyutlu olduğu için (4096x1 lik vektör) Temel Bileşen Analizi gibi yöntemlerle Kx1 boyutlarına indirgenerek kullanılmıştır. Modelde 4096 boyutlu gizli görsel faktörlerin Kx1 boyuta düşürülmesini sağlayan 3.7‟ deki denkleme lineer dönüşüm matrisi eklenmesi yardımıyla elde edilmiştir.

Bu tez çalışmasında ürün görsel öznitelikleri için Şekil 3.1 de verilen akış diyagramına

(42)

göre elde edilmiş film matrisi kullanılmıştır. Tez çalışmasında kullanılan en son model 3.8 de görülmektedir.

2 2

( )

, ( ) 1

( )

_u _i _F _v _i _F

F F

u Users E f f

minU V Y M UV u U v V

d var Uu

 

 



_ 

   

 

(3.8)

Net-CF ve MDS-NN modellerine kıyasla DiABlO tasarımı, doğruluk (accuracy) ve çeşitlilik (diversity) arasında daha iyi bir denge oluşturmaktadır öyle ki, hassasiyetteki (precision) küçük bir düşüş bile çeşitlilikte çok daha büyük bir artışa neden olmaktadır.

Buna ilave olarak, mevcut 2 model de istenen çeşitlilik değerini seçme esnekliğini sağlamamaktadır. Fakat çalışmamızda da kullandığımız DiABlO modeli, düzenlileştirme parametrelerinin değerini değiştirerek farklı seviyelerde çeşitlilik sağlayabilmektedir.

Çizelge 3.2‟deki sütunlar işe şu şekilde açıklanabilir:

(3.9)

Formül 3.9‟da, kullanıcı tarafından 4 ve üzerinde puan verilen nesneler ilişkili olarak sınıflandırılmaktadır. tp değeri true-positive yani kullanıcı ile ilişkili nesneler ve tavsiye sistemi tarafından kullanıcıya tavsiye edilmiş, fp değeri ise false-positive yani kullanıcı ile ilişkisi olmayan nesneler fakat öneri sisteminin kullanıcıya tavsiye ettiği nesnelerdir.

(3.10)

Formül 3.10‟da ise bölümdeki false-negative değerinden dolayı kullanıcıya önerilmeyen ilişkili nesneleri temsil etmektedir. Hassasiyet genellikle tavsiye listesindeki eleman sayısı arttıkça düşerken, duyarlılık yükselir. Yüksek hassasiyet ve duyarlılık değeri daha doğru bir modele işaret etmektedir. Bireysel çeşitlilik (Individual diversity - ID), çeşitliliği kullanıcının bakış açısından ölçmektedir. Formül 3.11‟de belirtildiği gibi, tüm

Temmuz 2019 Bilgisayar Mühendisliği Anabilim Dalı YÜKSEK LİSANS TEZİ Osman Nuri Atak Derin Öğrenme Yöntemleri ile Sinema Filmi Başarım Tahmini

 

Mesafe x y

  

Mesafe x y

  

 

Mesafe x y

  

( , )

R  U V    b b g

( ) ( )

,

1

minU V Y  M UV   u U   v V   d 

var Uu

( ) (

,

1

)

minU V Y  M UV   u U   v V   d 

var Uu 

, ( ) 1

( )

minU V Y M UV u U v V

d var Uu

 



   

 

( ) #

# #

Hassasiyet Precision t

t f

 

(Re ) #

# #

Duyarlılık call t

t f

 