• Sonuç bulunamadı

Bulguların Değerlendirilmesi için Bir Örnek ve Açıklamaları

4.4. Bulgular ve Değerlendirme

4.4.1. Bulguların Değerlendirilmesi için Bir Örnek ve Açıklamaları

Karar ağacı ile elde edilen çıktılar, veri madenciliği uygulamalarının doğası gereği oldukça fazla ve karmaşıktır. Bu amaçla tezin, okurları açısından daha anlaşılabilir olabilmesi amacıyla 69 firmaya ilişkin bulgulardan sadece birine ait bulgular ayrıntılarıyla açıklanarak bir klavuz hazırlanmıştır. Çalışmanın izleyen bölümlerinde bulgular özetler halinde verileceğinden, bu kısımdaki açıklamalar yardımıyla özet bulguların genişletilmesi mümkün hale getirilmiştir.

C4.5 algoritmasının ürettiği çıktılar, “karar ağacı” ve “sonuç” dosyası olarak tanımlanabilir. Şekil 4.2, C4.5 algoritmasının EREGL pay senedi için ürettiği karar ağacı örneğini, Şekil 4.3 ise EREGL pay senedi için ürettiği sonuç dosyası örneğini göstermektedir.

Şekil 4.2’de verilen karar ağacı örneği; bağımlı değişken olan EREGL pay senedinin fiyat değişkeni ile 26 adet makro ve mikro bağımsız değişken arasındaki ilişkinin C4.5 (J48) algoritması tarafından analiz edilmesi sonucunda WEKA programı tarafından üretilmiştir. Bu sonuçlara göre EREGL pay senedi ile “USD”, “GSYH” makro değişkenleri ve “F/DD” mikro değişkeni arasında ilişki olduğunu, diğer 23 adet bağımsız değişkenin, karar ağacında yer almadığı için EREGL pay senedinin fiyat hareketlerinin açıklanmasında anlamlı sayılabilecek bir etkisinin olmadığı anlaşılmaktadır.

Şekil 4.2 değerlendirildiğinde, C4.5 algoritması tarafından EREGL pay senedinin gelecek fiyat hareketlerinin tahmin edilebilmesi için dört kural ürettiği görülmektedir:

Birinci Kural: “Eğer F/DD oranı 1,05’ten büyükse; EREGL pay senedinin fiyatı yükselecektir.” Ayrıca yaprak düğümün yanında parantez içerisinde yer alan ifadeden bu örüntünün 35 defa veri seti içerisinde tespit edildiği ve ilgili kuralın test edilmesi sonucunda 30 defa doğru sınıflandırma (tahmin) başarısı gösterdiği, 5 defa ise başarısız olduğu anlaşılmaktadır.

İkinci Kural: “Eğer F/DD oranı 1,05’e eşit ya da küçükse ve USD

değişkeni yükselirse; EREGL pay senedinin fiyatı düşecektir.” Ayrıca yaprak düğümün yanında parantez içerisinde yer alan ifadeden bu örüntünün 12 defa veri seti içerisinde tespit edildiği ve ilgili kuralın test edilmesi sonucunda 11 defa doğru sınıflandırma başarısı gösterdiği, 1 defa ise başarısız olduğu anlaşılmaktadır.

Üçüncü Kural: “Eğer F/DD oranı 1,05’e eşit ya da küçükse ve USD

değişkeni düşerse ve GSYH değişkeni yükselirse; EREGL pay senedinin fiyatı yükselecektir.” Ayrıca yaprak düğümün yanında parantez içerisinde yer alan ifadeden bu örüntünün 5 defa veri seti içerisinde tespit edildiği ve ilgili kuralın test edilmesi sonucunda 4 defa doğru sınıflandırma başarısı gösterdiği, 1 defa ise başarısız olduğu anlaşılmaktadır.

Dördüncü Kural: “Eğer F/DD oranı 1,05’e eşit ya da küçükse ve USD

değişkeni düşerse ve GSYH değişkeni düşerse; EREGL pay senedinin fiyatı düşecektir.” Ayrıca yaprak düğümün yanında parantez içerisinde yer alan ifadeden bu örüntünün 2 defa veri seti içerisinde tespit edildiği ve ilgili kuralın test edilmesi sonucunda 2 defa doğru sınıflandırma başarısı gösterdiği anlaşılmaktadır.

Şekil 4.3, C4.5 algoritmasının EREGL pay senedi için ürettiği (J48 Pruned Tree) sonuç dosyasını göstermekte olup, bu dosyanın üst kısmında EREGL pay senedinin gelecek fiyat hareketlerinin tahmin edilebilmesi için üretilmiş olan dört kural yer almaktadır. Ayrıca üst kısımda karar ağacının büyüklüğünü gösteren sayısal veriler bulunmaktadır.

Sonuç dosyasının orta bölümünde ise yapılan sınıflandırmaya ilişkin performans bilgileri çeşitli istatistiksel performans ölçütleri ile temsil edilerek “summary” başlığı altında gösterilmektedir. Bu bilgilere göre; EREGL pay senedinin gelecek dönem “yükseliş” mi yoksa “düşüş” mü göstereceğine ilişkin sınıflandırmanın üretilen 4 adet kural kullanılarak %85,11 oranında doğrulukla sınıflandırıldığı görülmektedir. Diğer bir ifade ile hatalı sınıflandırma oranı %14,89 düzeyindedir.

Ayrıca Kappa İstatistiği, sınıflandırmanın 0,6673 oranıyla “iyi düzeyde uyum” seviyesinde gerçekleştirildiğini ifade etmektedir. MAE performans ölçütü ise sınıflandırmanın ortalama 0,2479 hata ile gerçekleştiğini göstermektedir. Burada, ayrıca “Hata Karelerinin Ortalamasının Karekökü”, “İlişkisel Mutlak Hata”, “İlişkisel Hataların Karelerinin Karekökü” gibi istatistiksel performans ölçütleri ile sınıflandırma başarısı açıklanmaktadır.

Sonuç dosyasının son bölümünde, sınıflandırma başarısını toplam gözlem sayısını baz alarak sınıf bazında açıklayan Karıştırma Matrisi (Confusion Matrix) yer almaktadır. Karıştırma Matrisi’ne göre toplam 47 gözlem içerisinde; “Yükselecek” sınıfına girmesi gereken 29 gözlemden 28 adedinin doğru sınıflandırılabildiği, “Düşecek” sınıfına girmesi gereken 18 gözlemden ise 12 adedinin doğru sınıflandırılabildiği görülmektedir. Karıştırma Matrisinin üst kısmında ise, “sınıflara göre doğruluk (Detailed Accuracy By Class)” başlığı altında; sınıf bazında sınıflandırma başarısının istatistiksel olarak ölçümleri yer almaktadır.

Şekil 4.3: WEKA Programı İstatistiki Çıktı Örneği

Tablo 4.5’te, pay senetlerinin karar ağacı ile yapılan sınıflandırma sonuçlarına ilişkin Şekil 4.3’ten seçilen (veya türetilen) bilgiler yer almaktadır.

Tablo 4.5: Örnek Bulgular Tablosu

Firma

Karıştırma Matrisi Doğru Sınıflandırma Genel Sınıflandırma Başarısı OMH (MAE) Kappa İstatistiği (κ) Durum Yük. Düş. EREGL Yük. 12 6 66,67% 12/18 40/47 85,11% 24,79% 66,73% Düş. 1 28 96,55% 28/29

Bu bilgilere göre; yükseliş sınıflandırma başarısının %66,7 (12/18), düşüş sınıflandırma başarısının %96,6 (28/29), genel sınıflandırma başarısının %85,1 (40/47), Ortalama Mutlak Hata’nın 0,2479 ve Kappa İstatistiği’nin 0,6673 (iyi

düzeyde uyum) düzeyinde oldukları görülmektedir. Ayrıca Tablo 4.5’te kalın yazı ile gösterilen değerler doğru sınıflandırma durumunu göstermektedir.

Bu tez çalışmasının uygulama kapsamına alınan 69 şirketin karar ağacı çıktıları Ek 5’te gösterilmiştir. Tablo 4.6’da ve Tablo 4.7’de ise Ek 5’teki bulgulardan özetlenmiş “özet bulgular” yer almaktadır.

4.4.2. Karar Ağacı Çıktılarının ve Uygulama Bulgulama Bulgularının