Y APAY Z EKÂ - BÖLÜM: YAPAY ZEKÂ VE DESTEK VEKTÖR MAKİNELERİ

5. BÖLÜM: YAPAY ZEKÂ VE DESTEK VEKTÖR MAKİNELERİ

5.1. Y APAY Z EKÂ

finansçılar tarafından geleneksel olarak kullanılan otoregresif hareketli ortalama modelleri gibi modeller söz konusu bu karmaşık yapının hareketlerini modelleme konusunda yeteri kadar başarılı olamamaktadırlar ve özellikle piyasalardaki lineer olmayan hareketleri gerektiği düzeyde yakalayamamaktadırlar. Diğer taraftan, son zamanlarda popülaritesi de oldukça artan ve birçok değişken arasındaki lineer olmayan ilişkileri de modelleme kapasitesine sahip ve söz konusu hesaplamaları zaman ve maliyet açısından daha uygun düzeyde yapabilen yapay zekâ yöntemlerinin kullanımı artmıştır. Yapay zekâ kullanılarak geliştirilen metotlar sayesinde büyük ölçekli ve karmaşık ilişkilere sahip veri setlerini doğru analiz etme ve hızlı karar verme gibi insana özgü olan yetileri kullanarak bir sonuç elde edebilen ve kullanıcılarına tavsiyeler geliştiren yapay zekâ sistemlerinin geliştirilmesi ile daha hızlı ve gerçekçi çözümler elde edilebilmektedir. Nitekim şu anda gelişmiş borsalarda yapılan işlem ve emirlerin çoğunun yapay zekâ algoritmalarının ürettiği ve otomatik olarak emir olarak sisteme gönderdiği mesajlar üzerinden yapılması bu konuya örnek olarak gösterilebilir.

Turing (1950), makinelerin düşünüp düşünemeyeceği sorusu üzerine yaptığı tartışmada; bir yetişkin aklını bilgisayar programlarıyla programlamak yerine problemi ikiye bölerek, bir çocuk aklını simüle edecek bir bilgisayar programı yaparak bunu gerekli eğitimler ile yetişkin aklı seviyesine getirmeyi önermiştir.

Çocuğun aklı temiz bir defter gibidir ve az sayıda mekanizma olabileceği varsayılmıştır ve bu sayede kolay programlanabileceği umulmaktadır. Yapılacak programın eğitimi hususu ise çocuklara verilen eğitime benzer şekilde ödül ve ceza sistemi üzerine düşünülebileceği önerilmektedir (Turing, 1950). Diğer taraftan, bu şekilde makinelerin belli algoritmalarla insan zekâsına benzer şekilde öğrenmelerinin sağlanmaları ve bunların daha sonra karmaşık problemlerin çözümünde kullanılmaları sonucunda elde edilecek sonuçların insanın beyninin yanılsamasından da arındırılmış olacağından daha doğru ve yansız bir sonuç elde edilebilecektir (Turing, 1950). Son olarak, aynı çalışmasında Turing, tartışmanın cevabının tam olarak ne olduğunu bilmediğini fakat bunun cevabının bulunması için ortaya konulan yaklaşımların denenmesi gerektiğini ifade etmiştir.

Turing, “Bizler sadece yakın mesafeleri görebiliriz ama orada yapılması gereken çok fazla şeyin olduğunu görebiliriz” derken bu alanda aslında o zamandan dahi

ne kadar çok yapılması gereken şeylerin olduğuna işaret etmiştir. Nitekim, bugün yapay zeka yöntemleri finans ve ekonomi dahil birçok disiplinde kendisine uygulama alanı bulmuş ve her geçen gün yeni algoritma ve metotlarla önemli gelişmeler sağlanmaktadır. Bugün, Google yapay zekâ sayesinde “waymo”

projesiyle birlikte trafiğe insansız araçlarını çıkarabilmiş; Amazon, insansız uçan makinelerle müşterilerin taleplerini karşılayabilmiştir. 2016 yılı itibarıyla, Google kendi kendini süren sürücüsüz araçlarıyla 2009 yılından bu yana çoğunluğu şehir merkezlerinde olmak üzere toplam 2 milyon mil yol kat etmişlerdir. Söz konusu büyüklük insanın 300 yıllık sürüş deneyimine eş değer olduğu ifade edilmektedir (google.com). Hal böyleyken, yapay zekanın yakın gelecekte büyük veri teknolojisi ile birlikte çok daha önemli hale geleceği ve daha yaygın olarak hemen her platform ve alanda kendisine uygulama alanı oluşturacağını tahmin etmek hiç de güç değildir.

5.2. Destek Vektör Makineleri

Bu bölümde destek vektör makineleri ile ilgili genel bilgiler ile birlikte, söz konusu metodun uygulama alanları, metodolojisi ve yapay zeka yöntemleri ile finansal veri tahminlemesi konusundaki yeri hakkında bilgi verilecektir.

Son zamanlarda destek vektör makineleri (DVM) finansal ve ekonomik veriler üzerinde de sıklıkla uygulanmaya başlanmıştır (Kara vd., 2011; Huang vd., 2005;

Aytuğ ve Sayın, 2009; Lee, 2009; Patel vd., 2015). DVM’lerin bu alanda sıklıkla kullanılan bir başka yapay zeka yöntemi olan yapay sinir ağları yöntemine göre genellikle daha başarılı sonuçlar ürettiği gösterilmektedir (Kim, 2003; Thissen vd., 2003; Liu ve Wang, 2008). DVM metodu Vapnik ve iş arkadaşları tarafından 1992 yılında ortaya atılmış, sınıflandırma konusunda ve lineer olmayan regresyon tahmin problemlerinde iyi sonuçlar elde etmeyi başarmıştır. Fakat diğer taraftan, söz konusu yöntemde kullanılan parametrelerin bu metodun başarısını önemli ölçüde etkilediği ifade edilmektedir (Kim, 2002). DVM’ler belli özellikleri içeren bir veri setinde bu özellikleri kullanarak farklı sınıflara ayırma işlemi yapmaktadırlar.

DVM’lerin aşırı uydurma problemlerine karşı dayanıklı olduğu gösterilmiş ve genel olarak yüksek düzeyde genelleme kapasitesine sahip olduğu bilinmektedir (Huang vd., 2005). Bu metodun diğer önemli özelliği de, DVM’leri eğitmek

doğrusal kısıtlandırılmış kuadratik bir programlama problemi olduğundan dolayı yapay sinir ağlarından farklı olarak bu problemin çözümü her zaman için global olarak en iyi sonucu verecektir. Fakat finansal analistler açısından yapacakları işleme baz teşkil edecek tahminlerde tahmin hatasını en aza indirgemeye çalışan yöntemlerin kullanımı amaçlarına ulaşmaları bakımından yeterli olmayabilecektir.

Diğer bir ifadeyle finansal analistler yatırımlarını bahsi geçen şekildeki tahminleri kullanarak yönlendirdiğinde bir piyasanın yönünü kesin olarak tahmin edebilecek bir yatırım stratejisine göre daha kötü sonuçlara maruz kalabilecektir (Huang vd., 2005). Fakat bununla beraber, bu çalışma ve şimdiye kadar yapılan hiçbir akademik çalışma, piyasanın yönünü kesin olarak tahmin edebileceğini ifade etmemiş veya gösterememiştir.

DVM’ler büyük veri yığınlarını otomatik bir şekilde sınıflandırmak için sistematik bir sıra izlemektedirler. Başlangıçta söz konusu veri seti temel olarak eğitim ve test verisi olarak başlangıçta ikiye ayrılmaktadır. Eğitim alt küme veri seti ortalama olarak toplam verinin genelde ortalama en az %80’i kadar olmaktadır.

Eğitim verisinin tüm veri seti içerisinde test veri setine göre daha yüksek miktarda olması söz konusu modelin daha doğru tahmin yapabilmesine olanak sağlayabileceği değerlendirilmekle birlikte, eğitilen modelin ne kadar doğru ve isabetli sonuçlar üretebildiğinin test edilmesi gerekmekte ve bu da ancak eğitim verisinin dışında bir veri seti olarak test veri kümesinin de olması şarttır. Eğitim verisindeki her bir gözlem hedef veri olarak etiketlenmektedir ve bu etiket ilgili gözlem verisinin hangi sınıfa ait olduğunu göstermektedir. Örneğin, söz konusu sınıflandırma problem, bir veri setinde yer alan gözlemlerin her birini A ve B kümesi olarak iki sınıfa ayırmak ise eğitim verisindeki gözlemlerin özelliklerine göre A veya B kümesi olmak üzere hedef veri olarak sınıflandırılmasının yapılmış olması gerekmektedir. Bu eğitim verileri ve hedef verileri kullanılarak DVM algoritmaları test veri setindeki gözlemleri A ve B kümesi olarak sınıflandırma yapabilecektir. Bu sınıflandırma yapılırken eğitim veri seti içerisinde yer alan her bir gözlemin birçok özelliği dikkate alınmaktadır.

Bu çerçevede bir örnek vermek gerekirse; k adet desen içeren eğitim veri seti düşündüğümüzde bir desen x vektörü ile 𝑥_𝑖 ∈ 𝑅^𝑛, 1 ≤ 𝐼 ≤ 𝑘, ve [𝑥₁, 𝑥₂, 𝑥₃… 𝑥_𝑛] olarak birçok deseni gösterecek şekilde tanımlanmaktadır. Buna karşılık gelen

hedef küme etiketleri ise 𝑦 ∈ (1, −1) kümeleri olarak tanımlanabilmektedir.

Dolayısıyla bir bütün olarak eğitim veri seti aşağıdaki gibi tanımlanabilmektedir:

𝑋 = {(𝑥_𝑖, 𝑦_𝑖)}_𝑖=1^𝑙 (58)

𝑋 ∈ 𝑅^𝑛, 𝑦 ∈ {1, −1}

𝑥_𝑖 = [𝑥₁, 𝑥₂, 𝑥₃, … , 𝑥_𝑛], ise X kümesindeki i' inci vektörü göstermektedir.

Burada amaç söz konusu veri desenini belli bir karar sınırı bularak bölgeyi iki kümeye ayırarak sınıflandırmaktır. Bu karar sınırına ara yüzey denilmekte ve n boyutlu bir yüzey olarak bir yüzeyi n+1 boyutlu iki yüzeye bölmektedir. Söz konusu ara yüzey belli bir sınıflandırıcıya bağlı olarak aşağıdaki formda yer alan ayırtaç fonksiyonu ile ifade edilebilmektedir.

𝑓(𝑥) =< 𝑤. 𝑥 > +𝑏 (59)

Bu fonksiyonda b sözde eğilimi ve < 𝑤. 𝑥 > ise ağırlık vektörü w ve desen vektörü x arasında iç çarpım olarak tanımlanmaktadır. Bu iç çarpım aşağıdaki şekilde formüle edilebilmektedir:

< 𝑤. 𝑥 >= ∑ 𝑤_𝑗𝑥_𝑗

𝑛

𝑗=1

(60)

Aşağıdaki grafikte bir çok arayüz iç çarpım vektörü ile birlikte gösterilmektedir:

Aşağıdaki sınıflayıcıların lineer olduğu söylenebilir çünkü bunlar lineer karar sınırı üzerine tanımlanmışlardır. Fakat, birçok problemde olduğu gibi finans problemlerinde de lineer olmayan sınıflayıcılar daha iyi sonuçlar verebilmektedir.

Bunun kötü yanı lineer olmayan ayrıştırıcıların girdi özellikleri ile doğru bir şekilde ölçülemeyen karmaşık eğitim algoritmaları bulunmaktadır (Bishop, 2007). Bu sorunun çözümü olarak ise, DVM’lerde lineer olmayan karar sınırları geliştirebilen

genişletilmiş lineer ayrıştırıcılar oluşturan haritalama fonksiyonları (kernels) kullanarak çözüm üretilebilmektedir. Söz konusu çözümü bir örnek yardımıyla açıklamak gerekirse; doğrusal bir sınıflayıcıyı doğrusal olmayan bir fonksiyon üzerinden yapmak amacıyla eğitim veri seti olan veya girdi düzlemi olarak bilinen X’i daha yüksek boyutlu özellik düzelimi olan F’e eşleştirmek için kullanılan doğrusal olmayan fonksiyon 𝜑: 𝑋 → 𝐹 kullanıldığında söz konusu eşleştirme neticesinde ayrıştırma fonksiyonu olarak; 𝑓(𝑥) =< 𝑤. 𝜑(𝑥) > +𝑏elde edilecektir.

Burada doğrusal olmayan ayrıştırıcıların girdi özellikleri ile doğru ölçeklendirilemediği için f ayrıştırma fonksiyonunun hesaplanabilmesini temin etmek amacıyla eşleştirme fonksiyonu olan 𝜑(𝑥) hesaplanmaktadır. Netice itibarıyla doğrusal olmayan bir özellik uzayı gözlem vektörünü daha yüksek dereceden başka bir vektöre dönüştürerek bu yeni uzayda doğrusal sınıflandırıcılar elde edilebilmektedir.

Şekil 6: Destek Vektör Makinelerinde Çeşitli Hiperdüzlemler

Kaynak: Alamili (2011).

Destek vektör makineleri sınıflandırma yaparken aynı zamanda regresyon özelliği de bulunmakta ve zaman serisi tahmini de yapabilmektedir. Nitekim bu çalışmada, hisse senetlerinin getirilerinin değer olarak tahminleri yapılmıştır.

DVM’lerin klasik regresyon yöntemlerinden temel farkı ortalama hata karesinin

en aza indirmek yerine, istatistiksel öğrenme teorisini baz alarak yapısal riskleri en aza indirme prensibiyle çalışmasıdır.

Yukarıda da bahsedildiği gibi bazı durumlarda veriler iki sınıfa doğrusal bir düzlem ile ayrılamamaktadır. Bu durumlarda çekirdek fonksiyonları kullanılarak bütün değerlerin tekrar çarpım değerlerinin bulunması yerine doğrudan çekirdek fonksiyonununda değerin yerine konularak özellik uzayındaki değerinin bulunması mümkündür. Diğer taraftan, çekirdek fonksiyonu eğitme aşamasında bir eğitim örneği için fonksiyon kurulup değerler bulunduktan sonra diğer örnekler için bulunan değerler hazır olarak kullanıldığından çok daha kolay hesaplanabilmektedir (Kecman, 2001). Bu metotla yaygın olarak kullanılan temel olarak 4 farklı çekirdek fonksiyon bulunmaktadır. Bunlar:

1- Doğrusal fonksiyon 2- Polinomiyal fonksiyon 3- Sigmoid fonksiyon 4- Radyal tabanlı fonksiyon

Destek vektör makinelerinin finansal araştırmalar üzerindeki uygulamarında finansal verilerin özelliklerinden dolayı en çok radyal tabanlı fonksiyon kullanıldığı gözlemlenmektedir (Huang vd., 2005).

5.3. Yapay Zekâ ile Finansal Portföy Optimizasyonu Akademik Çalışmaları

(Huang vd., 2005) çalışmalarında haftalık olarak NIKKEI 225 borsa endeksinin geçmiş dönem verilerini destek vektör makineleri yöntemiyle kullanarak söz konusu borsa endeksinin gelecek dönem fiyat hareketlerinin yönünü tahmin etmişlerdir. Modelleme ve tahmin çalışmalarında, faiz verim eğrisini, kısa ve uzun vadeli faiz bilgilerini, tüketici fiyat endeksini, endüstriyel üretimi, kamu harcamalarını, özel harcamaları ve gayri safi yurtiçi hasıla verilerini kullanmışlardır. Ayrıca yurtdışı ekonomik gösterge olarak S&P 500 indeksi ile Amerikan Doları-Japon Yeni kuru kullanılmıştır. Destek vektör makinesi yöntemi ile elde ettikleri sonuçları rassal yürüyüş modeli, doğrusal ayrıştırma analizi ve Elman geri yayılım sinir ağları modellerinin sonuçları ile kıyaslamışlardır. Ayrıca araştırmacılar birden fazla modelin birleştirilerek yeni bir karma model ile tahmin

yapılmasının tahmin sonuçlarını biraz daha iyileştirebileceğinden hareketle karma bir model de ortaya koymuşlardır. Söz konusu karma modelin tahmin gücü destek vektör makineleri ile yapılan modelin tahmin gücüne oldukça yakın bir performans göstermiş olsa da destek vektör makinesine göre 2 puan yukarıda ve yüzde 75 olarak gerçekleşmiştir. Bu sonuç ise destek vektör makinelerinin ne kadar isabetli tahmin sonuçları üretebildiğinin bir başka kanıtıdır. Araştırmacılar bunun en önemli nedeninin diğer tahmin metotlarının deneysel riski en aza indirmeye çalışırken; destek vektör makinelerinin yapısal riskleri en aza indirmeye çalışmasından olduğunu vurgulamışlardır.

(Trafalis ve İnce, 2009) yaptıkları çalışmada sermaye varlıklarının fiyatlarını tahmin etmek için oluşturulan bağlanımlarda destek vektör makinesi yöntemini kullanmışlardır. Bu çalışmada, destek vektör makineleri tekniğinin son zamanlarda araştırmacılar arasında oldukça yüksek düzeyde ilgi topladığı ve uygulama alanı olarak optimizasyon ve makine öğrenimi alanlarında kullanıldığı belirtilmiştir. Bu çalışmalarında, geri yayılımlı destek vektör makineleri ve radyal taban fonksiyonu ağları ile elde ettikleri sonuçları kıyaslamışlar ve benzer sonuçlar elde ettiklerini ifade etmişlerdir.

(Thim vd., 2011) Markovitz’in Etkin Sınır Hipotezi’ni genelleştirerek yapay zeka mekanizmaları ile sinir ağı modeli geliştirmişler ve böylece oluşturdukları portföyler ile her düzey yatırımcıya kararlarında avantaj sağlayabildiklerini ifade etmişlerdir.

(Yıldız vd., 2008) çalışmalarında yapay sinir ağları yöntemiyle Borsa Istanbul BIST-100 endeksini modellemişlerdir. Bu çalışmalarında endeksin yönünü tayin etmeye çalışmışlar ve sonuç olarak yaklaşık yüzde 75 düzeyinde başarılı bir şekilde endeksin yönünü doğru tahmin etmişlerdir.

(Kara vd., 2011) çalışmalarında yine Borsa İstanbul verileri ile çalışmış ve bu çalışmada hem yapay sinir ağları hem de destek vektör makineleri kullanılarak elde edilen sonuçlar karşılaştırılmıştır. Buna göre, yapılan çalışmada, Borsa Istanbul 100 endeksinin yönü tahmin edilmeye çalışılmış ve yapay sinir ağları ile yaklaşık yüzde 76 başarı sağlanırken bu oran destek vektör makineleri için

yaklaşık yüzde 72 olarak gerçekleşmiştir. Bu çalışma sonucundan da anlaşılabileceği üzere, en azından Borsa İstanbul sermaye piyasası için, yapay sinir ağları ile destek vektör makineleri birbirine yakın sonuçlar üretmektedir.

(Guresen vd., 2011) çalışmalarında hisse senedi piyasalarında uygulanan yapay zeka yöntemlerinin performanslarını kıyaslamışlardır. Bu çalışmada, NASDAQ piyasası verileri baz alınmış ve hisse senedi piyasalarının tahmininin çok zor bir iş olduğu vurgulanmıştır. Diğer taraftan sonuç olarak, çok katmanlı algılayıcı model (Multi-Layer Perceptron Model) ile yapay sinir ağları modellerinin GARCH, GARCH ve yapay sinir ağları hibrit modeli gibi diğer modellere göre daha iyi sonuçlar verdiği ifade edilmiştir.

(Bildirici ve Ersin, 2011) ARCH/GARCH modelleri ile yapay sinir ağlarını kullanarak hibrit modeller geliştirmişlerdir ve Borsa Istanbul 100 endeksi verileri üzerinde test ederek bu hibrit modellerin tahmin gücünü artırdığını göstermişlerdir.

(Shen vd., 2011) çalışmalarında radyal temel fonksiyonlu sinir ağları modeliyle Şangay Borsasındaki hisse senedi endekslerini tahmin etmişlerdir. Bununla birlikte modelin sonuçlarının etkinliğini kıyaslayabilmek amacıyla destek vektör makinelerinin de içinde bulunduğu bir küme yapay zeka modeliyle de tahminlemeler yapılmış ve elde edilen sonuçlar kıyaslanmıştır. Sonuç olarak, yapay balık sürüleri algoritmaları ile radyal temel fonksiyonu optimize edilerek hibrit bir modelin en iyi sonuç verdiği tespit edilmiştir.

(Zhang ve Wu, 2009) çalışmalarında Geliştilrilmiş Kimyevi Bakteriyel Optimizasyonu modeli önermişlerdir ve bunu çeşitli hisse senedi endekslerinin tahminini etkin bir şekilde yapmak için geri yayılımlı yapay sinir ağları modeli ile birleştirmişlerdir. Yaptıkları deneysel araştırmalara göre de bu metodun diğer tahmin metotlarına göre oldukça iyi düzeyde sonuç verdiğini göstermişlerdir.

Netice olarak, yapay zeka algoritmaları son yıllarda her alanda olduğu gibi finans alanında da oldukça önemli düzeyde kullanılmaya başlanmış ve bundan sonraki süreçte de kullanımının daha etkin ve yaygın olacağı beklenmektedir. Bu çerçevede, bu tez çalışmasında da, yapay zeka yöntemlerinden birisi olan ve

kullanımı günden güne yaygınlaşan destek vektör makineleri ekonometrik model ve Black-Litterman modelle entegre edilerek hibrit bir model geliştirilmektedir.

Belgede YAPAY ZEKA MODELİYLE GENİŞLETİLMİŞ HİBRİT BLACK-LİTTERMAN MODEL ÖNERİSİ, BORSA İSTANBUL BIST-30 ENDEKS VERİLERİ İLE TEST EDİLMESİ (sayfa 82-92)