MAKĠNE ÖĞRENMESĠ TÜRLERĠ - MAKĠNE ÖĞRENMESĠ

2. MAKĠNE ÖĞRENMESĠ

2.4. MAKĠNE ÖĞRENMESĠ TÜRLERĠ

Belirli bir probleme birçok makine öğrenmesi algoritmalarının uygulandığı bir sürü örtüĢme var. Sonuç olarak, aynı problem için birçok farklı makine öğrenmesi modeli olabilir. En iyi makine öğrenme modelinin ortaya çıkması sabır ve deneme yanılma gerektiren bir sanattır (Marshland, 2011: 5). Ramasubramanian ve Singh (2017: 222) makine öğrenme türlerini ġekil 3‟teki gibi incelemiĢtir.

ġekil 3. Makine Öğrenme Türleri (Ramasubramanian ve Singh, 2017: 222).

Makine Öğrenmesi Türleri

Danışmanlı Öğrenme Danışmansız Öğrenme Yarı-danışmanlı Öğrenme Pekiştirmeli Öğrenme

Camastra ve Vinciarelli (20015: 101), öğrenme stratejilerini;  DanıĢmanlı öğrenme

 DanıĢmansız öğrenme  Yarı-danıĢmanlı öğrenme  PekiĢtirmeli öğrenme  Çevrimiçi öğrenme

 Aktif öğrenme olarak incelemiĢtir.

Brownlee (2013-internet), öğrenme türlerini;  DanıĢmanlı öğrenme,

 DanıĢmansız öğrenme,  Yarı-danıĢmanlı öğrenme,

 PekiĢtirmeli öğrenme olarak ifade etmiĢtir.

Öğrenme stratejilerinin literatürdeki farklı sınıflandırılmalarına karĢın genel olarak, makine öğrenmesinin ana iki alt alanı, danıĢmanlı öğrenme ve danıĢmansız öğrenme olduğu görülmüĢtür. Bizim çalıĢmamızda makine öğrenmesi türleri sınıflandırmasında Camastra ve Vinciarelli (2008: 101) tarafından önerilen öğrenme stratejileri kullanılmıĢtır.

2.4.1. DanıĢmanlı Öğrenme (Supervised Learning)

DanıĢmanlı öğrenme, öğrenme algoritmasının etiketlenmiĢ eğitim verisini aldığı ve iterasyonla öğrenme iĢlemini gerçekleĢtirdiği test verisindeki noktaları tahmin etmeye çalıĢtığı bir öğrenme stratejisidir (Mohri vd., 2012: 2).

DanıĢmanlı öğrenmede öğrenme olayı isminden de anlaĢılacağı gibi bir danıĢman (veya öğretmen) aracılığıyla gerçekleĢtirilir. DanıĢman (veya öğretmen), makine öğrenmesinde eğitim verisini veya kazanılmıĢ deneyimi ifade etmektedir (Kotsiantis, 2007: 249). DanıĢmanlı öğrenmede (veya öğretmenle öğrenirken) veriler, girdi-çıktı modellerinin bir örneğidir. Bu durumda, verinin kısa bir açıklaması, girdi verildiğinde çıktı üretebilen iĢlevdir (Camastra ve Vinciarelli, 2015: 102). DanıĢmanlı öğrenme probleminde, eğitim seti olarak adlandırılan bir girdi-çıktı setine verilen görev, herhangi bir girdiyi gelecekteki girdi-çıktı gözlemlerini tahmin

edebilecek bir çıktıya eĢleyen deterministik bir fonksiyon bulmaktır (Camastra ve Vinciarelli, 2015: 102).

Algoritma, verilen tahmin edici değiĢkenler kümesine karĢı çıktı değiĢkenini öğrenmeye dayanır. Örneğin, veri seti bir hasta grubuna aitse, her bir örneğin bir hastanın kanser olup olmadığını belirten bir çıktı değiĢkeni olacaktır (kategorik). Ayrıca, çıktı değiĢken kategorik ise bir sınıflandırma görevi, sürekli ise bir regresyon görevi olacaktır (Ramasubramanian ve Singh, 2017: 222).

DanıĢmanlı öğrenmenin bazı uygulamaları konuĢma tanıma, kredi puanlama, tıbbi görüntüleme ve arama motorları (Ramasubramanian ve Singh, 2017: 222) olarak ifade edilirken ayrıca el yazısı harflerin ve rakamların tanınması, borsa endekslerinin tahmini (Camastra ve Vinciarelli, 2015: 102) olarak da ifade edilmiĢtir.

2.4.2. DanıĢmansız Öğrenme (Unsupervised Learning)

Veriler, iliĢkili hedef değerleri olmayan nesnelerin sadece bir örneğiyse yani etiketler mevcut değilse problem danıĢmansız öğrenme olarak bilinir. DanıĢmansız öğrenmede öğretmen yoktur. Bu nedenle, verilerin kısa bir açıklaması, gelecekte belli bir nesneyi gözlemleme olasılığınızı belirten bir grup küme veya olasılık yoğunluğu olabilir (Camastra ve Vinciarelli, 2015: 103).

DanıĢmansız öğrenmede sistem giriĢ kalıplarının kümelerini oluĢturmaktadır. Kümeleme sisteminde belirli bir desen seti veya maliyet fonksiyonu göz önüne alındığında, farklı kümeleme algoritmaları farklı kümeler oluĢturur (Duda, 2001: 29). Buna göre, kümelemeyi yapan algoritma gelen verileri birbirine benzemelerine göre aynı kümeye atama iĢlemini yapar (Alpaydın, 2011: 9).

Öğrenme, veri kümesindeki her satır arasındaki benzerlik veya uzaklık ölçüsüne dayanır (Ramasubramanian ve Singh, 2017: 223). Öğrenen, eğitim verisine göre tahminlerde bulunur (Mohri vd., 2012: 3).

Literatürde danıĢmansız öğrenme örnekleri olarak kümeleme ve boyut azaltma gösterilebilir (Mohri vd., 2012: 33). DanıĢmansız öğrenmenin bazı uygulamaları pazarlama, sosyal ağ analizi, imge bölümleme, iklimbilim ve müĢteri segmentasyonudur (Ramasubramanian ve Singh, 2017: 223) ve ayrıca görüntü

kontrolü ve metin parçalanması ve süreç denetiminde yenilik algılaması görevini içerir (Camastra ve Vinciarelli, 2015: 103).

2.4.3. Yarı-DanıĢmanlı Öğrenme (Semi-Supervised Learning)

Yarı-danıĢmanlı öğrenme, danıĢmanlı ve danıĢmansız öğrenmeyi birleĢtirir (Chapelle, 2010: 2). Yarı-danıĢmanlı öğrenmede makine öğrenme algoritması hem etiketli hem etiketsiz verilerden oluĢan eğitim kümesini alır ve bu kümede yer almayan yeni veriler için tahminlerde bulunur (Witten vd., 2016: 468). Etiketsiz gözlemlerin de kullanılmasının sadece danıĢmanlı öğrenmenin kullanılmasına göre daha iyi neticeler vereceği düĢünülür (Mohri vd., 2012: 7).

Yarı-DanıĢmanlı öğrenmede öğrenme problemi, daha iyi bir öğrenme sistemi oluĢturmak için küçük miktarda etiketli veriyle etiketlenmemiĢ büyük miktarda veri kullanılarak ele alınmaktadır (Camastra ve Vinciarelli, 2015: 104). Yarı-danıĢmanlı öğrenmede, etiketli verilere dayalı olarak yapılanlardan daha iyi bir sınıflandırıcı oluĢturmak için etiketsiz verileri kullanmaya çalıĢır. Birçok örnekte bu yaygın bir sorundur çünkü etiketlenmemiĢ verilerin toplanması ucuzdur (Barber, 2012: 308).

Yarı-danıĢmanlı öğrenme yöntemi etiketsiz verilerin kolayca ulaĢılabildiği fakat veriyi etiketlemenin oldukça güç olduğu durumlar için kullanılmaktadır. Birçok durumda, etiketleme maliyeti oldukça yüksektir çünkü bunu yapmak için nitelikli uzmanlar gerekir (Ramasubramanian ve Singh, 2017: 223).

Yarı-danıĢmanlı öğrenme, üçe ayrılır: yarı denetimli sınıflandırma, yarı denetimli regresyon ve yarı denetimli kümeleme (Camastra ve Vinciarelli, 2015: 104). Sınıflandırma, regresyon türündeki bazı problemler de yarı-danıĢmanlı öğrenme algoritmaları ile çözülmektedir (Mohri vd., 2012: 7).

2.4.4. PekiĢtirmeli Öğrenme (Reinforcement Learning)

PekiĢtirmeli öğrenme, baĢarmak için hedeflerin verildiği ve bu hedeflerin denenerek nasıl baĢarılacağının görüldüğü bir öğrenme stratejisidir. Bu öğrenme, dinamik programlama ve danıĢmanlı öğrenme alanlarını birleĢtirir (Harmon ve Harmon, 1997: 3). PekiĢtirmeli öğrenmede, veriler kategorilere ayrılmaz. Geçici kategori oluĢturulur ve bunlar doğru veya yanlıĢ olarak ayrılır. Ancak kategorinin yanlıĢ olduğu özellikle söylenmez (Duda, 2001: 29). Eğitim ve test aĢamaları iç içe

girmiĢ durumdadır. PekiĢtirmeli öğrenme algoritması sürekli çevreyle yinelemeli bir Ģekilde öğrenir. Öğrenen, mümkün olan tüm durumları keĢfedinceye kadar çevre deneyimlerini öğrenir (Ramasubramanian ve Singh, 2017: 224). Her bir deneyimden sonra hemen bir ödül alır. Öğrenme makinesinin hedefi bir deneyimler dizisinden sonra aldığı ödülü maksimize etmektir (Engelbrecht, 2007: 83).

PekiĢtirmeli öğrenmenin kökleri kontrol teorisindedir. Durum-eylem-ödül üçlüsünü veri olarak veren dinamik bir ortamın senaryosunu dikkate alır. PekiĢtirmeli ve danıĢmanlı öğrenme arasındaki fark, pekiĢtirmeli öğrenmede belirli bir süreçte optimal bir eylem bulunmadığı, ancak öğrenme algoritmasının beklenen ödülü zaman içinde en üst düzeye çıkarmak için bir eylem belirlemesi gerektiğidir (Camastra ve Vinciarelli, 2015: 103).

PekiĢtirmeli öğrenme problemi, verilen bir ödülü en üst düzeye çıkarmak için ne yapılacağını, diğer bir deyiĢle durumların hareketlerle nasıl eĢleĢtirileceğini öğrenmektir. DanıĢmanlı öğrenme görevinden farklı olarak, belirli bir durumda hangi eylemlerin gerçekleĢtirileceği öğrenme algoritmasına bildirilmemektedir. Bunun yerine öğrenen, bazı ödüllerin aldığı eylemler hakkında, eylemin gerçekleĢmesinden hemen sonra gelmeyerek bilgi edinmeyi kabul eder. Böyle bir probleme örnek satranç oynamayı öğrenmektir. Her tahta konfigürasyonu, yani satranç taĢlarının satranç tahtasındaki konumu verilen bir durumdur; Eylemler belirli bir yapılandırmada olası hamlelerdir. Belli bir eylemin ödülü oyunu kazanmaktır (Camastra ve Vinciarelli, 2015: 103).

Görünmeyen örnekler üzerinde çalıĢabilmek için verilerin kapsamlı olması gerekir. Örneğin, hastaların tıbbi geçmiĢi temelinde kanser öngörme problemi belirli bir kanser türü için veri bulunmuyorsa, algoritma gerçek zamanlı konuĢlandırıldığında birçok yanlıĢ alarm üretir. Bu nedenle, Ģu anda öğrenme verilerinin mevcut olmadığı veya zamanla hızla güncellendiği durumlarda, pekiĢtirmeli öğrenme ideal bir seçimdir (Ramasubramanian ve Singh, 2017: 224).

PekiĢtirmeli öğrenme, kontrol teorisi, markov karar süreçleri ve oyun kuramı ile bağlantılıdır. (Barber, 2012: 308). PekiĢtirmeli öğrenme algoritmasının bazı uygulamaları bilgisayarla oynanan tahta oyunları (Satranç, Go), robotik eller ve kendi kendine sürülen otomobillerdir (Ramasubramanian ve Singh, 2017: 224). Yeni

doğmuĢ bir ceylan yavrusunun kısa sürede ayağa kalkması ve hızla koĢabilmesi, temizlik yapmak için bir robotun odalar arasında dolaĢması pekiĢtirmeli öğrenmeyi kavramamızı sağlayan örneklerdir (Sutton ve Barto, 1998: 1).

2.4.5. Aktif Öğrenme (Active Learning)

Aktif öğrenmede öğrenme makinesi yeni verilerin etiketini bir uzmanı sorgulayarak öğrenmeye çalıĢır. Amaç, öğrenme için gerekli etiketlenmiĢ verilerin sayısını azaltabilmektir (Zhang, 2011). Genellikle maliyetlerin yüksek olduğu etiketlerin elde etme durumlarında kullanılır (Mohri vd., 2012: 8). Aktif öğrenme etiketleme problemi yaĢanan resim, ses, video, doküman sınıflandırma ve konuĢma tanıma problemlerinde etiketlenmemiĢ örneklerin sorgulama sistemi ile uzman kiĢinin etiketleyebilmesini sağlamaktadır. Bu sayede aktif öğrenmede en az etiketlenmiĢ veri ile en yüksek doğruluk elde edilmiĢ olur (Settles, 2010: 3). Aktif öğrenme, öğrenenin Ģu anda bilgi sahibi olmadığı bölgelerdeki bilgileri talep edebileceği danıĢmansız öğrenme bağlamında da düĢünülebilir (Barber, 2012: 308).

2.4.6. Çevrimiçi Öğrenme (Online Learning)

Çevrimiçi öğrenmede veriler sıralı olarak gelir ve yeni veriler elde edildiğinde tur tamamlanmıĢ olur ve model sürekli güncellenir (Barber, 2012: 307). Öğrenene her turda soru sorulur ve öğrenenin verdiği cevap ile doğru cevap karĢılaĢtırılır. Öğrenme baĢarısı, doğru cevap ile verilen cevap arasındaki fark ölçülerek ortaya çıkartılmaktadır (Shalev-Shwartz, 2007: 1). Çevrimiçi öğrenme, danıĢmanlı veya danıĢmansız öğrenme türleriyle iliĢkilidir (Barber, 2012: 308).

Belgede Borsa Endeksi Hareket Yönünün Tahmininde Sınıflandırma Yöntemlerinin Performanslarının Karşılaştırılması: Bist 100 Örneği (sayfa 43-48)