• Sonuç bulunamadı

9. SONUÇLAR VE ÖNERİLER

9.1. Sonuçlar

Bu tez çalışması kapsamında futbol müsabakalarının sonuçlarının kestirilmesine yönelik uygulamalar gerçekleştirilmiştir. Bu bağlamda yapay zeka temelli altı sınıflandırma ve iki kümeleme yöntemi kullanılmıştır. Sınıflandırma için çok terimli lojistik regresyon, destek vektör makinesi, k en yakın komşu, rasgele orman, sade bayes ve yapay sinir ağları yöntemleri kullanılırken kümeleme için ise k-ortalamalar ve bulanık c-ortalamalar yöntemlerinden yararlanılmıştır. Sınıflandırma yöntemlerinin performansları karşılaştırılmış sonrasında ise kümeleme yöntemleri de sürece dahil edilerek kestirim başarısını artıran hibrit modeller geliştirilmiştir.

Çalışmanın verilerini, Türkiye, İngiltere, İspanya, İtalya, Almanya ve Fransa’nın en üst düzey liglerinde oynanan toplam 6396 maça dair bilgiler oluşturmaktadır. Bu bilgiler, çalışma kapsamında geliştirilen veri toplama araçları ile dağınık olarak yer aldıkları web tabanlı kaynaklardan toplanarak, oluşturulan veri tabanı tablolarına kaydedilmişlerdir.

Veri toplama ve kayıt sürecinin ardından yöntem performanslarını ölçmek ve veri seti içeriğine göre kestirim performansındaki değişimi izlemek amacıyla alternatif veri setleri oluşturulmuştur. Oluşturulan veri setleri ile öncelikli olarak kullanılan altı farklı sınıflandırma yönteminin başarıları karşılaştırılmış ardından da geliştirilen hibrit yöntemlerin kestirim başarısına olan etkileri araştırılmıştır.

Çalışma boyunca elde edilen sonuçlar, sınıflandırma yöntemlerine, hibrit yöntemlere ve veri seti içeriğine göre farklı başlıklar altında ela alınmış son başlık olarak da çalışmanın genel sonuçları paylaşılmıştır.

Sınıflandırma Yöntemlerine İlişkin Sonuçlar

Yapay zeka tabanlı sınıflandırma yöntemleri futbol müsabakalarının sonuçlarının kestirilmesinde son derece başarılı olmuşlardır. Elde edilen kestirim başarıları, futbol ve bahis istatistikleri alanında çalışmalar gerçekleştiren uzmanlarca oldukça yüksek olarak değerlendirilmiştir.

Sınıflandırma yöntemleri ile elde edilen bulgular bağımlı değişkenin farklı şekillerde ele alındığı MS1, MS2 ve MS3 durumları için aşağıda özetlenmiştir. Paylaşılan performans değerleri veri setinin çapraz geçerlilikle 10 parçaya ayrılması sonucu elde edilen eğitim ve test kümeleri ile gerçekleştirilen uygulamalarda elde edilen değerlerdir.

• MS-1 (G,B,M) için,

o Ortalama olarak en başarılı yöntem RO’dur. (ACC: %64.05) o Galibiyet en iyi kestiren yöntem DVM’dir. (ACC: %89.60) o Beraberliği en iyi kestiren yöntem SB’dir. (ACC: %39.90) o Mağlubiyeti en iyi kestiren yöntem RO’dur. (ACC: %69.00) • MS-2 (GB,M) için,

o Ortalama olarak en başarılı yöntem RO’dir. (ACC: %79.25) o GB’yi iyi kestiren yöntem KEYK’dir. (ACC: %90.13) o M’yi en iyi kestiren yöntem SB’dir. (ACC: %70.81) • MS-3 (G,BM) için,

o Ortalama olarak en başarılı yöntem RO’dur. (ACC: %75.05) o G’yi iyi kestiren yöntem RO’dur. (ACC: %77.58)

o BM’yi en iyi kestiren yöntem DVM’dir. (ACC: %86.80)

• DVM ve RO yöntemleri, boyut indirgeme çalışmaları yapılmamış veri seti ile daha yüksek performans göstermişlerdir.

• ÇLR, KEYK, SB, YSA yöntemleri, boyutu indirgenmiş veri setinde daha iyi performans göstermişlerdir.

Geliştirilen Hibrit Yöntemlere İlişkin Sonuçlar

• MS-1 (G,B,M) için,

o KO hibrit yöntemleri içerisinde en iyi kestirim oranını yakalayan yöntem KO-RO’dur. (ACC: %65.46)

o KO hibrit yöntemleri içerisinde hibrit olmayan yöntemlere oranla en yüksek artış KO-SB yönteminde yaşanmıştır. Değişim: %3.80 (%59.63 – %63.43)

o BCO hibrit yöntemleri içerisinde en iyi kestirim oranını yakalayan yöntem BCO-RO’dur. (ACC: %65.46)

o BCO hibrit yöntemleri içerisinde hibrit olmayan yöntemlere oranla en yüksek artış BCO-ÇLR yönteminde yaşanmıştır. Değişim: %2.27 (%60.49 – %62.76)

• MS-2 (GB,M) için,

o KO hibrit yöntemleri içerisinde en iyi kestirim oranını yakalayan yöntem KO-RO’dur. ACC: %81.04

o KO hibrit yöntemleri içerisinde hibrit olmayan yöntemlere oranla en yüksek artış KO-DVM yönteminde yaşanmıştır. Değişim: %3.55 (%77.94 – %81.49)

o BCO hibrit yöntemleri içerisinde en iyi kestirim oranını yakalayan yöntem BCO-DVM’dir. (ACC: %81.76)

o BCO Hibrit yöntemleri içerisinde hibrit olmayan yöntemlere oranla en yüksek artış BCO-DVM yönteminde yaşanmıştır. Değişim: %3.82 (%77.94 – %81.76)

• MS-3 (G,BM) için,

o KO hibrit yöntemleri içerisinde en iyi kestirim oranını yakalayan yöntemler KO-KEYK ve KO-RO’dur. (ACC: %76.52)

o KO hibrit yöntemleri içerisinde hibrit olmayan yöntemlere oranla en yüksek artış KO-KEYK yönteminde yaşanmıştır. Değişim: %2.59 (%73.93 – %76.52)

o BCO hibrit yöntemleri içerisinde en iyi kestirim oranını yakalayan yöntem BCO-RO’dur. (ACC: %77.88)

o BCO hibrit yöntemleri içerisinde hibrit olmayan yöntemlere oranla en yüksek artış BCO-RO yönteminde yaşanmıştır. Değişim: %2.38 (%75.50 – %77.88)

Veri Seti İçeriğine ve Veri Setinin Oluşturulma Sürecine İlişkin Sonuçlar

• Veri seti parçaları içerisinde kestirim başarısına en önemli katkıyı sunan veriler takımların geçmiş maçlarından elde ettikleri ortalama saha içi performans değerleridir.

• Takımların geçmiş maçlardan elde ettikleri ortalama saha içi performans değerleri hesaplanırken belli sayıda maç dikkate alınmaktadır. Dikkate alınan maç sayısının kestirim başarısına etkisini araştırmak adına çeşitli denemeler yapılmış ve bu denemeler sonucunda en yüksek kestirim başarısına son 6 maçın dikkate alınması sonucu oluşturulan verilerle ulaşıldığı gözlemlenmiştir.

• Her bir takım için ayrı ayrı hesaplanan ortalama saha içi performans değerlerinin içeren [1x65] boyutlu iki vektörün kıyaslanarak [1x65] boyutlu yeni bir vektöre dönüştürülmesi sürecinde “oranlar”, “farklar” ve “1-2 kodlama” seçenekleri kullanılmıştır. Gerçekleştirilen denemelerde,

kestirim başarısının en yüksek düzeye “oranlar” seçeneği ile yapılan kıyaslamalar sonucunda çıktığı gözlemlenmiştir.

• Veri seti içerisinde kestirim başarısına en düşük katkıyı sağlayan parçalar taraftar görüşleri ve iddaa oranlarıdır.

Genel Sonuçlar

• En yüksek kestirim başarısına galibiyetle biten maçlarda ulaşılmaktadır. • En düşük kestirim başarısı beraberlikle biten maçlarda ortaya çıkmaktadır. • Tüm durumlar için sınıflandırma algoritmaları arasında en başarılı olanı

RO’dur. (ACC: 73.39%)

• Tüm durumlar için KO kümeleme yöntemi ile hibritlenmiş sınıflandırıcılar içerisinde en başarılı olanı KO-RO’dur. (ACC: 74.34%)

• Tüm durumlar için BCO kümeleme yöntemi ile hibritlenmiş sınıflandırıcılar içerisinde en başarılı olanı BCO-RO’dur. (ACC: 74.87%) • MS-1 için en başarılı yöntem KO-RO ve BCO-RO’dur. (ACC: %65.46) • MS-2 için en başarılı yöntem BCO-DVM’dir. (ACC: %81.76)

• MS-3 için en başarılı yöntem BCO-RO’dur. (ACC: %77.88) • Geliştirilen hibrit yöntemler kestirim başarısını artırmışlardır.

• BCO kümeleme yöntemi ile oluşturulan hibrit modeller KO kümeleme yöntemi ile oluşturulan modellere oranla daha yüksek kestirim başarısına erişmişlerdir.

• Geliştirilen hibrit modellerde kestirim başarısında meydana gelen artış farklı hibrit çözümler aranabileceğini göstermiştir.

• Kullanılan sınıflandırma yöntemlerinin modeli eğitmek için harcadıkları sürelere bakıldığından en hızlı yöntem KEYK, en yavaş yöntem YSA’dır. • Futbol müsabakalarına ilişkin istatistiksel verilere çok sayıda internet

sitesinden erişilebilmekte fakat bu kaynakların akredite olmaları gereken bir üst organizasyon olmadığı için özellikle küçük çaplı sitelerde sağlıksız veriler yer almaktadır.

• Futbol maçlarından çıkarılan istatistiklerin belli bir kısmı maçı gözlemleyen kişilerce raporlaştırıldığı için farklı platformlarda paylaşılan istatistiksel bulgularda tutarsızlık olabilmektedir.

• Futbol istatistiklerini paylaşan sitelerden elektronik tablolar halinde veri elde edilememektedir ve bu sitelerin bazıları çeşitli güvenlik uygulamaları ile web scrapig araçlarını engellemektedirler. Bu nedenle bazı verileri elde etme süreci çok fazla zaman alabilmektedir.

• Futbola dair en çok sayıda istatistiksel paylaşımının yapıldığı platformlar online iddaa siteleridir.

• Futbolda saha içi istatistiklerle ilgilenen akademik çalışmaların büyük çoğunluğu iddaa temelli çalışmalardır. Literatürde iddaa oranlarının belirlenmesi, karlılığın artırılması vb. amaçlarla gerçekleştirilmiş çok sayıda çalışma mevcuttur.

• FIFA, UEFA ve TFF gibi organizasyonların bilgi bankalarında futbol maçlarına dair detaylı istatistikler yer almamaktadır.

• Futbol istatistikleri alanında çalışmalar gerçekleştiren ve internet üzerindeki açık erişimli verilerden çok daha fazlasını ticari olarak pazarlayan organizasyonlar mevcuttur.

• Futbol istatistikleri ile ilgili en fazla sayıdaki akademik çalışma İngiltere Premier Ligi baz alınarak gerçekleştirilmiştir.