4. BULGULAR
4.1 Baskın Kümeler Algoritması Bulguları
Çizelge 4.1‟de “ocean” arama sonuçlarına uygulanan baskın kümeler algoritmasının farklı uzaklık ölçütleri ve test kümeleriyle yapılan performans analiz sonuçları verilmiĢtir. Çizelgede de görülebileceği gibi bazı kesinlik ve geri çağırma değerleri 0 çıktığı için F1 değerleri de sayı değeri olarak elde edilememektedir. Performans ölçütleri gözönüne alındığında bu durumun görülebileceği çıkarılabilir. Bu durumun gerçekleĢmesinin nedeni tespit edilen grup üyeleriyle olması beklenen grup üyelerinin hiçbirinin %50‟den daha fazla oranda üst üste çakıĢmamasıdır. Bu durumda doğru tespit edilen bir grup elde olmadığından kesinlik ve geri çağırma değerleri 0 olarak bulunur.
Çizelgeye dikkat edildiğinde görülebileceği gibi Soergel uzaklık ölçütünün kesinlik, geri çağırma ve F1 değerleri için genelde en iyi sonuç veren ilk üç uzaklık ölçütü içerisinde kalmaktadır. F ölçütü içinse bu uzaklık ölçütü ilk üç içerisinde bulunmasa bile yine de büyük değerler aldığı bir baĢka gözlem olarak ortaya çıkmaktadır.
Çizelge 4.1 “Ocean” arama sonuçlarına uygulanan baskın kümeler algoritmasının farklı uzaklık ölçütleri ve test kümeleriyle yapılan performans analiz sonuçları
T1 T2 T3 T4 T5 T6 T7 T8 T9 T10 T11 T12
Euclidian
Prec 0.0741 0.4074 0.2593 0.1111 0.2222 0.0741 0.1852 0.2963 0.4074 0.4074 0.1111 0.3333 Recall 0.0952 0.3793 0.2800 0.1500 0.2500 0.1000 0.1923 0.3077 0.3929 0.3667 0.1304 0.2813 F 0.3344 0.4550 0.3523 0.3428 0.3592 0.3943 0.3967 0.3876 0.3981 0.4251 0.4305 0.3195 F1 0.0833 0.3929 0.2692 0.1277 0.2353 0.0851 0.1887 0.3019 0.4000 0.3860 0.1200 0.3051
53
Çizelge 4.1 “Ocean” arama sonuçlarına uygulanan baskın kümeler algoritmasının farklı uzaklık ölçütleri ve test kümeleriyle yapılan performans analiz sonuçları (devam)
T1 T2 T3 T4 T5 T6 T7 T8 T9 T10 T11 T12
City Block Prec 0.0400 0.4800 0.3200 0.1600 0.3600 0.0800 0.3200 0.3200 0.4400 0.4800 0.2400 0.4000 Recall 0.0476 0.4138 0.3200 0.2000 0.3750 0.1000 0.3077 0.3077 0.3929 0.4000 0.2609 0.3125 F 0.3256 0.4372 0.3555 0.3520 0.3615 0.3650 0.4036 0.3864 0.4107 0.4049 0.4150 0.3407 F1 0.0435 0.4444 0.3200 0.1778 0.3673 0.0889 0.3137 0.3137 0.4151 0.4364 0.2500 0.3509
Minkowski Prec 0.1739 0.3043 0.2174 0.1304 0.2174 0.1304 0.2174 0.3043 0.4348 0.2609 0.0870 0.2609 Recall 0.1905 0.2414 0.2000 0.1500 0.2083 0.1500 0.1923 0.2692 0.3571 0.2000 0.0870 0.1875 F 0.3224 0.3530 0.3009 0.2710 0.3164 0.3637 0.2910 0.3241 0.3209 0.3269 0.3044 0.2940 F1 0.1818 0.2692 0.2083 0.1395 0.2128 0.1395 0.2041 0.2857 0.3922 0.2264 0.0870 0.2182
Chebyshev Prec 0.1000 0.2333 0.0667 0.0000 0.0333 0.0333 0.0667 0.0333 0.1000 0.1333 0.0333 0.0667 Recall 0.1429 0.2414 0.0800 0.0000 0.0417 0.0500 0.0769 0.0385 0.1071 0.1333 0.0435 0.0625 F 0.2915 0.3376 0.3258 0.2762 0.3174 0.2861 0.3309 0.3195 0.3534 0.3236 0.3499 0.3130 F1 0.1176 0.2373 0.0727 NaN 0.0370 0.0400 0.0714 0.0357 0.1034 0.1333 0.0377 0.0645
Sorensen
Prec 0.0417 0.4583 0.2917 0.0833 0.3333 0.1250 0.3333 0.3333 0.5000 0.4167 0.1667 0.4167 Recall 0.0476 0.3793 0.2800 0.1000 0.3333 0.1500 0.3077 0.3077 0.4286 0.3333 0.1739 0.3125 F 0.3163 0.4191 0.3543 0.3167 0.3652 0.3527 0.3861 0.3671 0.4077 0.3830 0.3987 0.3339 F1 0.0444 0.4151 0.2857 0.0909 0.3333 0.1364 0.3200 0.3200 0.4615 0.3704 0.1702 0.3571
Gower
Prec 0.0952 0.7619 0.3333 0.2857 0.3810 0.2381 0.4762 0.4762 0.7143 0.6667 0.1905 0.3810 Recall 0.0952 0.5517 0.2800 0.3000 0.3333 0.2500 0.3846 0.3846 0.5357 0.4667 0.1739 0.2500 F 0.3077 0.3820 0.3291 0.3156 0.3052 0.3453 0.3559 0.3210 0.3860 0.3536 0.3642 0.2886 F1 0.0952 0.6400 0.3043 0.2927 0.3556 0.2439 0.4255 0.4255 0.6122 0.5490 0.1818 0.3019
Soergel
Prec 0.0952 0.7143 0.4762 0.1905 0.4286 0.2381 0.4762 0.4762 0.7143 0.6667 0.1905 0.6190 Recall 0.0952 0.5172 0.4000 0.2000 0.3750 0.2500 0.3846 0.3846 0.5357 0.4667 0.1739 0.4063 F 0.3031 0.4017 0.3413 0.3198 0.3245 0.3250 0.3515 0.3422 0.3829 0.3491 0.3597 0.2918 F1 0.0952 0.6000 0.4348 0.1951 0.4000 0.2439 0.4255 0.4255 0.6122 0.5490 0.1818 0.4906
Kulczynski d Prec 0.0000 0.2703 0.1351 0.1081 0.1892 0.0270 0.0541 0.1351 0.2973 0.1622 0.0811 0.1892 Recall 0.0000 0.3448 0.2000 0.2000 0.2917 0.0500 0.0769 0.1923 0.3929 0.2000 0.1304 0.2188 F 0.3211 0.4494 0.3543 0.3793 0.3644 0.3315 0.3847 0.3868 0.4496 0.3823 0.3939 0.3690 F1 NaN 0.3030 0.1613 0.1404 0.2295 0.0351 0.0635 0.1587 0.3385 0.1791 0.1000 0.2029
Lorentzian
Prec 0.0417 0.5000 0.3333 0.1667 0.3333 0.0417 0.3333 0.3750 0.4583 0.5417 0.2500 0.4167 Recall 0.0476 0.4138 0.3200 0.2000 0.3333 0.0500 0.3077 0.3462 0.3929 0.4333 0.2609 0.3125 F 0.3178 0.4245 0.3571 0.3471 0.3563 0.3487 0.4009 0.3935 0.4056 0.3942 0.4136 0.3394 F1 0.0444 0.4528 0.3265 0.1818 0.3333 0.0455 0.3200 0.3600 0.4231 0.4815 0.2553 0.3571
Czekanowski Prec 0.0417 0.4583 0.2917 0.0833 0.3333 0.1250 0.3333 0.3333 0.5000 0.4167 0.1667 0.4167 Recall 0.0476 0.3793 0.2800 0.1000 0.3333 0.1500 0.3077 0.3077 0.4286 0.3333 0.1739 0.3125 F 0.3163 0.4191 0.3543 0.3167 0.3652 0.3527 0.3861 0.3671 0.4077 0.3830 0.3987 0.3339 F1 0.0444 0.4151 0.2857 0.0909 0.3333 0.1364 0.3200 0.3200 0.4615 0.3704 0.1702 0.3571
54
Çizelge 4.1 “Ocean” arama sonuçlarına uygulanan baskın kümeler algoritmasının farklı uzaklık ölçütleri ve test kümeleriyle yapılan performans analiz sonuçları (devam)
T1 T2 T3 T4 T5 T6 T7 T8 T9 T10 T11 T12
Kulczynski s Prec 0.0526 0.2105 0.0000 0.0000 0.1579 0.0000 0.2105 0.1579 0.1579 0.1579 0.0000 0.0526 Recall 0.0476 0.1379 0.0000 0.0000 0.1250 0.0000 0.1538 0.1154 0.1071 0.1000 0.0000 0.0313 F 0.2444 0.2709 0.2537 0.2228 0.2488 0.2651 0.2817 0.2530 0.2524 0.2496 0.2679 0.2421 F1 0.0500 0.1667 NaN NaN 0.1395 NaN 0.1778 0.1333 0.1277 0.1224 NaN 0.0392
Inner Product Prec 0.3077 0.3846 0.4615 0.3846 0.3077 0.3077 0.5385 0.5385 0.7692 0.6154 0.3846 0.9231 Recall 0.1905 0.1724 0.2400 0.2500 0.1667 0.2000 0.2692 0.2692 0.3571 0.2667 0.2174 0.3750 F 0.2281 0.2227 0.2116 0.1968 0.2276 0.2425 0.2445 0.2367 0.2109 0.2155 0.2239 0.2019 F1 0.2353 0.2381 0.3158 0.3030 0.2162 0.2424 0.3590 0.3590 0.4878 0.3721 0.2778 0.5333
Squared Euclidian
Prec 0.0256 0.3333 0.1026 0.0769 0.0769 0.0256 0.0769 0.1538 0.1795 0.1538 0.0769 0.1538
Recall 0.0476 0.4483 0.1600 0.1500 0.1250 0.0500 0.1154 0.2308 0.2500 0.2000 0.1304 0.1875 F 0.3455 0.4690 0.3557 0.3537 0.3631 0.3315 0.3784 0.3770 0.4095 0.3822 0.4133 0.3344 F1 0.0333 0.3824 0.1250 0.1017 0.0952 0.0339 0.0923 0.1846 0.2090 0.1739 0.0968 0.1690
Correlation Prec 0.0270 0.2432 0.1081 0.0811 0.1351 0.0541 0.0811 0.1081 0.2162 0.1622 0.0541 0.1622
Recall 0.0476 0.3103 0.1600 0.1500 0.2083 0.1000 0.1154 0.1538 0.2857 0.2000 0.0870 0.1875 F 0.3281 0.4241 0.3598 0.3315 0.3458 0.3204 0.3788 0.3557 0.4420 0.3750 0.3788 0.3392 F1 0.0345 0.2727 0.1290 0.1053 0.1639 0.0702 0.0952 0.1270 0.2462 0.1791 0.0667 0.1739
Çizelge 4.1‟de de görüldüğü üzere kullanılan uzaklık ölçütlerinden Soergel uzaklık ölçütü, diğer ölçütlere göre daha baĢarılı sonuçlar sunmaktadır. Elde edilen gruplandırma sonuçlarına görsel bir örnek oluĢturması açısından “ocean” imge kümesinin gruplandırılmasıyla elde edilen gruplara örnekler ġekil 4.1 ve 4.2‟de verilmiĢtir. Elde edilen sonuçlarda grup numaraları, en benzer imge gruplarından en az benzer olanlara doğru bir gidiĢi ifade etmektedir. Burada unutulmamalıdır ki, adı geçen benzerlik imge histogramlarının benzerliği olup, insan gözüne göre bir anlam ifade etmediği durumlar olabilmektedir. Burada görüleceği üzere Grup 3‟de yer alan imgelerin üç tanesi tamamen aynı görsel içeriğe sahipken, dördüncü imgede ufak görsel farklılıklar bulunmaktadır. Buna benzer bir durum Grup 7‟de de görülmektedir. Grup 10 ve 12‟de yer alan imgelerde aynı Ģekilde bir görsel yakınlık bulunmamakla beraber, bu imgelerdeki arka planlara bakıldığında “ocean” imge kümesinde yer alan diğer imgelere göre kendi aralarında yüksek benzerlik gösterdiği söylenebilmektedir. Deneklerden elde edilen gruplandırma sonuçlarında da benzer bir dokunun yer aldığı gözlemlenmiĢtir.
ġekil 4.2‟de örnek olarak sunulan Grup 15 ve 16‟da ise önceki gruplara göre daha
55
değiĢik bir durum gözlemlenmektedir. Deneklerle yapılan çalıĢma sonuçlarıyla da karĢılaĢtırıldığında bu iki grubun daha baĢarısız bir sonuç oluĢturduğu söylenebilir. Bu noktada verilen örnekte içinde çok imge bulunan kümeler daha baĢarısız gibi gözükse de bu durum elde edilen sonuçların genelinde görülmemektedir.
Grup 3:
Grup 7:
Grup 10:
Grup 12:
ġekil 4.1 “Ocean” imge kümesi baskın kümeler sonuçları örnek imgeler I
56 Grup 13:
Grup 15:
Grup 16:
ġekil 4.2 “Ocean” imge kümesi baskın kümeler sonuçları örnek imgeler II
57
Çizelge 4.2‟de ise “football” arama sonuçlarına uygulanan baskın kümeler algoritmasının farklı uzaklık ölçütleri ve test kümeleriyle yapılan performans analiz sonuçları verilmiĢtir. Çizelge 4.2‟de, Çizelge 4.1‟dekine paralel olarak görülebileceği gibi bazı kesinlik ve geri çağırma değerleri 0 çıktığı için F1 değerleri de sayı değeri olarak elde edilememektedir. Bu durumun nedeni daha önce de açıklanmıĢtır.
Çizelge 4.2‟ye dikkat edildiğinde, Çizelge 4.1‟e benzer bir Ģekilde Soergel uzaklık ölçütünün kesinlik, geri çağırma ve F1 değerleri için genelde en iyi sonuç veren ilk üç uzaklık ölçütü içerisinde kaldığı gözlemlenebilir. F ölçütü içinse bu uzaklık ölçütü ilk üç içerisinde bulunmasa bile yine de büyük değerler aldığı bir baĢka gözlem olarak ortaya çıkmaktadır.
Çizelge 4.2 “Football” arama sonuçlarına uygulanan baskın kümeler algoritmasının farklı uzaklık ölçütleri ve test kümeleriyle yapılan performans analiz sonuçları
T1 T2 T3 T4 T5 T6 T7 T8 T9 T10 T11 T12
Euclidian
Prec 0.2308 0.6538 0.3077 0.2308 0.3077 0.1923 0.3846 0.4231 0.4615 0.3077 0.3462 0.3077 Recall 0.3158 0.4722 0.3333 0.2727 0.3333 0.2941 0.3704 0.3667 0.4615 0.3333 0.3462 0.2857 F 0.3414 0.4609 0.4128 0.4164 0.3941 0.3271 0.3780 0.4027 0.4946 0.4045 0.4145 0.4208 F1 0.2667 0.5484 0.3200 0.2500 0.3200 0.2326 0.3774 0.3929 0.4615 0.3200 0.3462 0.2963
City Block Prec 0.1600 0.6000 0.2800 0.2800 0.2800 0.2000 0.3200 0.5200 0.4000 0.3200 0.4000 0.4400 Recall 0.2105 0.4167 0.2917 0.3182 0.2917 0.2941 0.2963 0.4333 0.3846 0.3333 0.3846 0.3929 F 0.3534 0.4515 0.4178 0.4053 0.4045 0.3345 0.3735 0.4135 0.4473 0.4006 0.4196 0.4351 F1 0.1818 0.4918 0.2857 0.2979 0.2857 0.2381 0.3077 0.4727 0.3922 0.3265 0.3922 0.4151
Minkowski Prec 0.3333 0.8667 0.5333 0.4667 0.3333 0.2667 0.6667 0.8000 0.6667 0.6667 0.6000 0.6000 Recall 0.2632 0.3611 0.3333 0.3182 0.2083 0.2353 0.3704 0.4000 0.3846 0.4167 0.3462 0.3214 F 0.2375 0.2949 0.2568 0.2553 0.2982 0.2466 0.2802 0.2669 0.2954 0.3196 0.2669 0.2679 F1 0.2941 0.5098 0.4103 0.3784 0.2564 0.2500 0.4762 0.5333 0.4878 0.5128 0.4390 0.4186
Chebyshev Prec 0.0000 0.2258 0.0968 0.0645 0.0968 0.0323 0.0968 0.1613 0.2258 0.0645 0.1613 0.0645 Recall 0.0000 0.1944 0.1250 0.0909 0.1250 0.0588 0.1111 0.1667 0.2692 0.0833 0.1923 0.0714 F 0.2996 0.4062 0.3555 0.3644 0.3332 0.2924 0.3308 0.3578 0.3914 0.3156 0.3581 0.3677 F1 NaN 0.2090 0.1091 0.0755 0.1091 0.0417 0.1034 0.1639 0.2456 0.0727 0.1754 0.0678
Sorensen
Prec 0.2857 0.9048 0.3333 0.2857 0.3333 0.1905 0.4286 0.5238 0.5238 0.4286 0.5714 0.4286 Recall 0.3158 0.5278 0.2917 0.2727 0.2917 0.2353 0.3333 0.3667 0.4231 0.3750 0.4615 0.3214 F 0.3310 0.4037 0.3714 0.3364 0.3674 0.3007 0.3323 0.3632 0.4375 0.4032 0.3596 0.3947 F1 0.3000 0.6667 0.3111 0.2791 0.3111 0.2105 0.3750 0.4314 0.4681 0.4000 0.5106 0.3673
58
Çizelge 4.2 “Football” arama sonuçlarına uygulanan baskın kümeler algoritmasının farklı uzaklık ölçütleri ve test kümeleriyle yapılan performans analiz sonuçları (devam)
T1 T2 T3 T4 T5 T6 T7 T8 T9 T10 T11 T12
Gower
Prec 0.2857 0.9048 0.3810 0.3810 0.3810 0.2857 0.4286 0.4762 0.5238 0.4762 0.5714 0.5238 Recall 0.3158 0.5278 0.3333 0.3636 0.3333 0.3529 0.3333 0.3333 0.4231 0.4167 0.4615 0.3929 F 0.2951 0.4087 0.3568 0.3432 0.3361 0.2964 0.3175 0.3658 0.4025 0.3770 0.3609 0.3687 F1 0.3000 0.6667 0.3556 0.3721 0.3556 0.3158 0.3750 0.3922 0.4681 0.4444 0.5106 0.4490
Soergel
Prec 0.2632 1.0000 0.4211 0.4737 0.5263 0.2632 0.6316 0.5263 0.7368 0.6842 0.6316 0.7895 Recall 0.2632 0.6389 0.3333 0.4091 0.4167 0.2941 0.4444 0.3333 0.5385 0.5417 0.4615 0.5357 F 0.3242 0.3977 0.3804 0.3834 0.3675 0.3124 0.3299 0.3613 0.4412 0.3938 0.3772 0.3907 F1 0.2632 0.7797 0.3721 0.4390 0.4651 0.2778 0.5217 0.4082 0.6222 0.6047 0.5333 0.6383
Kulczynski d Prec 0.0857 0.3429 0.1714 0.1143 0.1714 0.1143 0.2000 0.2571 0.2286 0.1714 0.2286 0.2000 Recall 0.1579 0.3333 0.2500 0.1818 0.2500 0.2353 0.2593 0.3000 0.3077 0.2500 0.3077 0.2500 F 0.3416 0.5115 0.4235 0.4086 0.4224 0.3722 0.4124 0.4421 0.4853 0.4190 0.4271 0.4617 F1 0.1111 0.3380 0.2034 0.1404 0.2034 0.1538 0.2258 0.2769 0.2623 0.2034 0.2623 0.2222
Lorentzian
Prec 0.1600 0.6400 0.3200 0.2400 0.2400 0.1600 0.2800 0.5200 0.4400 0.3200 0.4400 0.4400 Recall 0.2105 0.4444 0.3333 0.2727 0.2500 0.2353 0.2593 0.4333 0.4231 0.3333 0.4231 0.3929 F 0.3658 0.4478 0.4306 0.4121 0.4043 0.3460 0.3923 0.4100 0.4382 0.3971 0.4143 0.4370 F1 0.1818 0.5246 0.3265 0.2553 0.2449 0.1905 0.2692 0.4727 0.4314 0.3265 0.4314 0.4151
Czekanowski Prec 0.2857 0.9048 0.3333 0.2857 0.3333 0.1905 0.4286 0.5238 0.5238 0.4286 0.5714 0.4286 Recall 0.3158 0.5278 0.2917 0.2727 0.2917 0.2353 0.3333 0.3667 0.4231 0.3750 0.4615 0.3214 F 0.3310 0.4037 0.3714 0.3364 0.3674 0.3007 0.3323 0.3632 0.4375 0.4032 0.3596 0.3947 F1 0.3000 0.6667 0.3111 0.2791 0.3111 0.2105 0.3750 0.4314 0.4681 0.4000 0.5106 0.3673
Kulczynski s Prec 0.1176 0.2941 0.1176 0.1176 0.0588 0.0588 0.1765 0.1765 0.2353 0.2353 0.2941 0.1176 Recall 0.1053 0.1389 0.0833 0.0909 0.0417 0.0588 0.1111 0.1000 0.1538 0.1667 0.1923 0.0714 F 0.2496 0.2658 0.2624 0.2510 0.2453 0.2544 0.2507 0.2527 0.2646 0.2657 0.2771 0.2610 F1 0.1111 0.1887 0.0976 0.1026 0.0488 0.0588 0.1364 0.1277 0.1860 0.1951 0.2326 0.0889
Inner Product Prec 0.0952 0.2857 0.0952 0.2381 0.0952 0.0476 0.1429 0.2857 0.0952 0.0952 0.1429 0.0952 Recall 0.1053 0.1667 0.0833 0.2273 0.0833 0.0588 0.1111 0.2000 0.0769 0.0833 0.1154 0.0714 F 0.2427 0.2733 0.2728 0.2482 0.2662 0.2390 0.2367 0.2677 0.2592 0.2613 0.2912 0.2673 F1 0.1000 0.2105 0.0889 0.2326 0.0889 0.0526 0.1250 0.2353 0.0851 0.0889 0.1277 0.0816
Squared Euclidian
Prec 0.1081 0.3243 0.1081 0.0541 0.1351 0.1081 0.1622 0.2162 0.2703 0.1351 0.1351 0.1622 Recall 0.2105 0.3333 0.1667 0.0909 0.2083 0.2353 0.2222 0.2667 0.3846 0.2083 0.1923 0.2143 F 0.3291 0.4796 0.3880 0.3904 0.3815 0.3009 0.3698 0.4486 0.4727 0.3859 0.4116 0.4318 F1 0.1429 0.3288 0.1311 0.0678 0.1639 0.1481 0.1875 0.2388 0.3175 0.1639 0.1587 0.1846
Correlation Prec 0.0270 0.2973 0.1622 0.0811 0.1081 0.0541 0.1892 0.1892 0.2703 0.1351 0.1622 0.1892
Recall 0.0526 0.3056 0.2500 0.1364 0.1667 0.1176 0.2593 0.2333 0.3846 0.2083 0.2308 0.2500 F 0.3044 0.4853 0.3949 0.3917 0.3930 0.3249 0.3694 0.4273 0.4850 0.4095 0.4176 0.4215 F1 0.0357 0.3014 0.1967 0.1017 0.1311 0.0741 0.2188 0.2090 0.3175 0.1639 0.1905 0.2154
59
Çizelge 4.2‟de görüldüğü üzere kullanılan uzaklık ölçütlerinden Soergel uzaklık ölçütü,
“football” imge kümesinin gruplandırılması sırasında da diğer ölçütlere göre daha baĢarılı sonuçlar sunmaktadır. “Football” imge kümesinin gruplandırılmasıyla elde edilen gruplara örnekler ġekil 4.3‟de verilmiĢtir. Burada görüleceği üzere Grup 6 ve Grup 11‟de yer alan imgelerin benzer görsel içeriğe sahip oldukları rahatlıkla söylenebilmektedir. ġekil 4.3‟de örnek olarak sunulan Grup 12‟de ise önceki gruplara göre daha değiĢik bir durum gözlemlenmektedir. Deneklerle yapılan çalıĢma sonuçlarıyla da karĢılaĢtırıldığında bu grubun içinde yer alan imgelerin görsel olarak bir çeĢitlilik içerdiği ve daha baĢarısız bir sonuç oluĢturduğu söylenebilir. Grup 14‟de ise ilk bakıĢta görsel bir farklılık varmıĢ gibi gözükse de imgelerin arka planlarının içerdiği benzerlik, bu gruba dahil olmalarının sebebidir.
Çizelge 4.3‟de ise “sky” arama sonuçlarına uygulanan baskın kümeler algoritmasının farklı uzaklık ölçütleri ve test kümeleriyle yapılan performans analiz sonuçları verilmiĢtir. Çizelge 4.3‟de, Çizelge 4.1 ve 4.2‟dekine paralel olarak görülebileceği gibi bazı kesinlik ve geri çağırma değerleri 0 çıktığı için F1 değerleri de sayı değeri olarak elde edilememektedir. Bu durumun nedeni daha önce de açıklanmıĢtır.
Çizelge 4.3‟e dikkat edildiğinde, Çizelge 4.1 ve 4.2‟ye benzer bir Ģekilde Soergel uzaklık ölçütünün kesinlik, geri çağırma ve F1 değerleri için genelde en iyi sonuç veren ilk üç uzaklık ölçütü içerisinde kaldığı gözlemlenebilir. F ölçütü içinse bu uzaklık ölçütü ilk üç içerisinde bulunmasa bile yine de büyük değerler aldığı bir baĢka gözlem olarak ortaya çıkmaktadır.
60
Grup 6:
Grup 11:
Grup 12:
Grup 14:
ġekil 4.3 “Football” imge kümesi baskın kümeler sonuçları örnek imgeler
61
Çizelge 4.3 “Sky” arama sonuçlarına uygulanan baskın kümeler algoritmasının farklı uzaklık ölçütleri ve test kümeleriyle yapılan performans analiz sonuçları
T1 T2 T3 T4 T5 T6 T7 T8 T9 T10 T11 T12
Euclidian
Prec 0.0000 0.2692 0.1154 0.2308 0.3846 0.1154 0.2308 0.2692 0.2692 0.3846 0.1154 0.1923 Recall 0.0000 0.2500 0.1429 0.2500 0.2632 0.1304 0.2069 0.2258 0.2188 0.2500 0.1304 0.1515 F 0.3038 0.3577 0.3220 0.2622 0.3143 0.2746 0.3291 0.3284 0.3464 0.3500 0.3438 0.3409 F1 NaN 0.2593 0.1277 0.2400 0.3125 0.1224 0.2182 0.2456 0.2414 0.3030 0.1224 0.1695
City Block Prec 0.1667 0.3750 0.2083 0.3750 0.4583 0.2917 0.2917 0.3750 0.5417 0.6250 0.2500 0.2917 Recall 0.2000 0.3214 0.2381 0.3750 0.2895 0.3043 0.2414 0.2903 0.4063 0.3750 0.2609 0.2121 F 0.3147 0.3695 0.3772 0.2374 0.3264 0.3084 0.3565 0.3629 0.3865 0.3876 0.3622 0.3505 F1 0.1818 0.3462 0.2222 0.3750 0.3548 0.2979 0.2642 0.3273 0.4643 0.4688 0.2553 0.2456
Minkowski Prec 0.0455 0.2727 0.1818 0.3182 0.3636 0.1364 0.2273 0.3636 0.4091 0.5909 0.1818 0.3182 Recall 0.0500 0.2143 0.1905 0.2917 0.2105 0.1304 0.1724 0.2581 0.2813 0.3250 0.1739 0.2121 F 0.2725 0.2707 0.2743 0.2136 0.2622 0.2486 0.2505 0.2475 0.2462 0.2956 0.2724 0.2795 F1 0.0476 0.2400 0.1860 0.3043 0.2667 0.1333 0.1961 0.3019 0.3333 0.4194 0.1778 0.2545
Chebyshev Prec 0.0294 0.1471 0.0588 0.1176 0.2353 0.0588 0.0882 0.1176 0.1471 0.2059 0.1176 0.1176 Recall 0.0500 0.1786 0.0952 0.1667 0.2105 0.0870 0.1034 0.1290 0.1563 0.1750 0.1739 0.1212 F 0.2747 0.3064 0.3018 0.2255 0.3476 0.2663 0.3082 0.3084 0.3225 0.3721 0.3070 0.3442 F1 0.0370 0.1613 0.0727 0.1379 0.2222 0.0702 0.0952 0.1231 0.1515 0.1892 0.1404 0.1194
Sorensen
Prec 0.2609 0.3913 0.1739 0.3478 0.5217 0.2174 0.3913 0.3478 0.4783 0.6957 0.1739 0.3478 Recall 0.3000 0.3214 0.1905 0.3333 0.3158 0.2174 0.3103 0.2581 0.3438 0.4000 0.1739 0.2424 F 0.3038 0.3604 0.3452 0.2282 0.3227 0.3033 0.3406 0.3562 0.3647 0.3749 0.3450 0.3354 F1 0.2791 0.3529 0.1818 0.3404 0.3934 0.2174 0.3462 0.2963 0.4000 0.5079 0.1739 0.2857
Gower
Prec 0.1765 0.5294 0.2353 0.5294 0.7647 0.2941 0.2941 0.4706 0.8235 0.7647 0.2353 0.4706 Recall 0.1500 0.3214 0.1905 0.3750 0.3421 0.2174 0.1724 0.2581 0.4375 0.3250 0.1739 0.2424 F 0.2589 0.2899 0.2899 0.2350 0.2540 0.2498 0.2792 0.2775 0.2711 0.2971 0.2964 0.2831 F1 0.1622 0.4000 0.2105 0.4390 0.4727 0.2500 0.2174 0.3333 0.5714 0.4561 0.2000 0.3200
Soergel
Prec 0.3684 0.5789 0.3684 0.4737 0.6842 0.4211 0.5263 0.6842 0.7895 0.9474 0.3684 0.5789 Recall 0.3500 0.3929 0.3333 0.3750 0.3421 0.3478 0.3448 0.4194 0.4688 0.4500 0.3043 0.3333 F 0.2842 0.3281 0.3280 0.2193 0.2887 0.2761 0.2917 0.3087 0.3311 0.3305 0.3073 0.3177 F1 0.3590 0.4681 0.3500 0.4186 0.4561 0.3810 0.4167 0.5200 0.5882 0.6102 0.3333 0.4231
Kulczynski d Prec 0.0571 0.2571 0.1143 0.2571 0.2286 0.0857 0.2000 0.2286 0.2571 0.2857 0.0857 0.2000 Recall 0.1000 0.3214 0.1905 0.3750 0.2105 0.1304 0.2414 0.2581 0.2813 0.2500 0.1304 0.2121 F 0.3313 0.3783 0.3706 0.3026 0.3681 0.3200 0.3815 0.3832 0.4040 0.3837 0.3579 0.3850 F1 0.0727 0.2857 0.1429 0.3051 0.2192 0.1034 0.2188 0.2424 0.2687 0.2667 0.1034 0.2059
Lorentzian
Prec 0.2083 0.3750 0.2500 0.2917 0.4583 0.2500 0.2917 0.3750 0.5000 0.5833 0.2083 0.2917 Recall 0.2500 0.3214 0.2857 0.2917 0.2895 0.2609 0.2414 0.2903 0.3750 0.3500 0.2174 0.2121 F 0.3144 0.3542 0.3809 0.2414 0.3303 0.2961 0.3442 0.3564 0.3861 0.3679 0.3557 0.3498 F1 0.2273 0.3462 0.2667 0.2917 0.3548 0.2553 0.2642 0.3273 0.4286 0.4375 0.2128 0.2456
62
Çizelge 4.3 “Sky” arama sonuçlarına uygulanan baskın kümeler algoritmasının farklı uzaklık ölçütleri ve test kümeleriyle yapılan performans analiz sonuçları (devam)
T1 T2 T3 T4 T5 T6 T7 T8 T9 T10 T11 T12
Czekanowski Prec 0.2609 0.3913 0.1739 0.3478 0.5217 0.2174 0.3913 0.3478 0.4783 0.6957 0.1739 0.3478 Recall 0.3000 0.3214 0.1905 0.3333 0.3158 0.2174 0.3103 0.2581 0.3438 0.4000 0.1739 0.2424 F 0.3038 0.3604 0.3452 0.2282 0.3227 0.3033 0.3406 0.3562 0.3647 0.3749 0.3450 0.3354 F1 0.2791 0.3529 0.1818 0.3404 0.3934 0.2174 0.3462 0.2963 0.4000 0.5079 0.1739 0.2857
Kulczynski s Prec 0.0357 0.0714 0.0357 0.0000 0.1429 0.0357 0.1071 0.0714 0.1429 0.1429 0.0000 0.0357 Recall 0.0500 0.0714 0.0476 0.0000 0.1053 0.0435 0.1034 0.0645 0.1250 0.1000 0.0000 0.0303 F 0.2193 0.2319 0.2380 0.1631 0.2346 0.2381 0.2195 0.2312 0.2469 0.2486 0.2375 0.2416 F1 0.0417 0.0714 0.0408 NaN 0.1212 0.0392 0.1053 0.0678 0.1333 0.1176 NaN 0.0328
Inner Product Prec 0.0385 0.1154 0.0385 0.0769 0.1923 0.0000 0.1154 0.1538 0.0000 0.1538 0.0000 0.1154 Recall 0.0500 0.1071 0.0476 0.0833 0.1316 0.0000 0.1034 0.1290 0.0000 0.1000 0.0000 0.0909 F 0.2361 0.2407 0.2178 0.1346 0.2462 0.2586 0.2379 0.2307 0.2516 0.2560 0.2424 0.2585 F1 0.0435 0.1111 0.0426 0.0800 0.1563 NaN 0.1091 0.1404 NaN 0.1212 NaN 0.1017
Squared Euclidian
Prec 0.0513 0.2051 0.1026 0.1795 0.2051 0.1026 0.1795 0.1795 0.2051 0.3333 0.1282 0.1795
Recall 0.1000 0.2857 0.1905 0.2917 0.2105 0.1739 0.2414 0.2258 0.2500 0.3250 0.2174 0.2121 F 0.2708 0.3461 0.3181 0.3006 0.3575 0.2714 0.3608 0.3512 0.3638 0.4188 0.3348 0.3618 F1 0.0678 0.2388 0.1333 0.2222 0.2078 0.1290 0.2059 0.2000 0.2254 0.3291 0.1613 0.1944
Correlation Prec 0.0526 0.2632 0.1053 0.1842 0.3158 0.1316 0.2105 0.2105 0.2895 0.3947 0.1053 0.1842
Recall 0.1000 0.3571 0.1905 0.2917 0.3158 0.2174 0.2759 0.2581 0.3438 0.3750 0.1739 0.2121 F 0.2876 0.3581 0.3423 0.2753 0.3640 0.3056 0.3357 0.3639 0.3912 0.4290 0.3404 0.3751 F1 0.0690 0.3030 0.1356 0.2258 0.3158 0.1639 0.2388 0.2319 0.3143 0.3846 0.1311 0.1972
Çizelge 4.3‟de görüldüğü üzere kullanılan uzaklık ölçütlerinden Soergel uzaklık ölçütü,
“sky” imge kümesinin gruplandırılması sırasında da diğer ölçütlere göre daha baĢarılı sonuçlar sunmaktadır. “Sky” imge kümesinin gruplandırılmasıyla elde edilen gruplara örnekler ġekil 4.4‟de verilmiĢtir. Burada görüleceği üzere Grup 9 ve Grup 16‟da yer alan imgelerin benzer görsel içeriğe sahip oldukları rahatlıkla söylenebilmektedir. ġekil 4.4‟de örnek olarak sunulan Grup 8 ve Grup 10‟da ise önceki gruplara göre daha değiĢik bir durum gözlemlenmektedir. Bu gruplar içinde yer alan imgelerin görsel olarak bir çeĢitlilik içerdiği ve daha baĢarısız bir sonuç oluĢturduğu söylenebilir.
63 Grup 8:
Grup 9:
Grup 10:
Grup 16:
ġekil 4.4 “Sky” imge kümesi baskın kümeler sonuçları örnek imgeler
64
Çizelge 4.4‟de Ġstanbul konulu kümeye uygulanan baskın kümeler algoritmasının farklı uzaklık ölçütleri ve test kümeleriyle yapılan performans analiz sonuçları verilmiĢtir. Bu analizlerin üzerinde yapıldığı imge kümesi diğerlerinden farklı olarak, internet üzerinden toplanmamıĢ ve daha çok masaüstü çalıĢmalarda algoritmanın baĢarısını gözlemlemek için birbiriyle daha ilintili olan imgelerden seçilmiĢtir. Bu birbiriyle ilintililikten dolayı baĢarım oranlarının Çizelge 4.4‟de görülebileceği gibi daha yüksek çıktığı gözlemlenmiĢtir. Masaüstü imgelerde de bu tür bir ilintililik sıkça görülecektir.
Bu nedenle imgelerin seçiminin doğru yönde yapıldığı düĢünülmektedir.
Yapılan bu uygulamada sadece iki test kümesinin bulunmasının sebebi, uygulama için seçilen kümenin kiĢisel nitelikte imgeler oluĢturmasıdır. Çizelge 4.4‟de görülebileceği gibi her iki test kümesi için de uygulanan algoritma, internet ortamından elde edilen imge kümelerine oranla oldukça baĢarılı sonuçlar vermektedir.
Çizelge 4.4 Ġstanbul konulu kümeye uygulanan baskın kümeler algoritmasının farklı uzaklık ölçütleri ve test kümeleriyle yapılan performans analiz sonuçları
T9 T10 T9 T10
Euclidian
Prec 0.5600 0.6800
Kulczynski d
Prec 0.5313 0.4375 Recall 0.5185 0.6538 Recall 0.6296 0.5385
F 0.5867 0.6160 F 0.6167 0.6196
F1 0.5385 0.6667 F1 0.5763 0.4828
City Block
Prec 0.5185 0.5185
Lorentzian
Prec 0.5185 0.5185 Recall 0.5185 0.5385 Recall 0.5185 0.5385
F 0.5947 0.6228 F 0.6010 0.6291
F1 0.5185 0.5283 F1 0.5185 0.5283
Minkowski
Prec 1.0000 1.0000
Czekanowski
Prec 0.5769 0.5000 Recall 0.5556 0.6538 Recall 0.5556 0.5000
F 0.3709 0.3875 F 0.5849 0.5979
F1 0.7143 0.7907 F1 0.5660 0.5000
Chebyshev
Prec 0.6190 0.4286
Kulczynski s
Prec 0.6000 0.4000 Recall 0.4815 0.3462 Recall 0.3333 0.2308
F 0.4478 0.4246 F 0.2958 0.2954
F1 0.5417 0.3830 F1 0.4286 0.2927
Sorensen
Prec 0.5769 0.5000
Inner Product
Prec 0.2500 0.4375 Recall 0.5556 0.5000 Recall 0.1481 0.2692
F 0.5849 0.5979 F 0.3280 0.3322
F1 0.5660 0.5000 F1 0.1860 0.3333
65
Çizelge 4.4 Ġstanbul konulu kümeye uygulanan baskın kümeler algoritmasının farklı uzaklık ölçütleri ve test kümeleriyle yapılan performans analiz sonuçları (devam)
T9 T10 T9 T10
Gower
Prec 0.6800 0.6800
Squared Euclidian
Prec 0.4000 0.3143 Recall 0.6296 0.6538 Recall 0.5185 0.4231
F 0.5779 0.5943 F 0.5926 0.5786
F1 0.6538 0.6667 F1 0.4516 0.3607
Soergel
Prec 0.7083 0.5833
Correlation
Prec 0.2973 0.2703 Recall 0.6296 0.5385 Recall 0.4074 0.3846
F 0.5896 0.6317 F 0.6060 0.5830
F1 0.6667 0.5600 F1 0.3438 0.3175
Çizelge 4.4‟de görüldüğü üzere kullanılan uzaklık ölçütlerinden Soergel uzaklık ölçütü, Ġstanbul konulu imge kümesinin gruplandırılması sırasında da diğer ölçütlere göre daha baĢarılı sonuçlar sunmaktadır. Ġstanbul konulu imge kümesinin gruplandırılmasıyla elde edilen gruplara örnekler ġekil 4.5‟de verilmiĢtir. Burada görüleceği üzere Grup 1, Grup 5 ve Grup 13‟de yer alan imgelerin benzer görsel içeriğe sahip oldukları rahatlıkla söylenebilmektedir. Grup 19‟da ise önceki gruplara göre daha değiĢik bir durum oluĢmakta ve bu grup içinde yer alan imgelerin görsel olarak bir çeĢitlilik içerdiği ve daha baĢarısız bir sonuç oluĢturduğu gözlenmektedir.
66 Grup 1:
Grup 5:
Grup 13:
Grup 19:
ġekil 4.5 Ġstanbul konulu imge kümesi baskın kümeler sonuçları örnek imgeler