kgobcls{i:. Jıarran_
), oztç_nıcl((_ :sakarya.:_edu.u.
SAC'
Fen Bilinıleri Enstitüsü Dergisi IO.Cilt. l.Sa,. ·ı2006
Endüktift)e:rennıe Algoritnıalarının Kural ...__Ü
r
ctnıcYöntenıleri ve
Pcrfonnanslarının Karşılaşıırı !ın ası.Ö. A kgöbek
ENDÜKTİF ÖGRENME ALGORİTMALARININ KURAL ÜRETME
•• •
YONTEMLERI VE PERFORMANSLARININ KARŞILAŞTIRILMASI
Ömer AKGÖBEK1, Ercan ÖZTEMEL2
1 Harran Üniv., Müh. Fak., Endüstri Müh. Bölünıü, Şanlıurfa, Tel:414
3128456,_o
.. ..e.�i_Lj_J.r ..-sakarya Univ., Müh. Fak., End. Müh. Bölünıü, Adapazarı.Tel:264
3460353(281
••
OZET
.. Bilgi Çağı'' ve '"Bilgi Toplunıu'' gibi terinılerin sıklıkla kullanıldığı gününıüzde, bilginin önenıi daha açık bir şekilde ortaya çıknıaktadır. Bilginin önenıi arttığı oranda o bilgiye ulaşabilıneyi sağlayan sistenılerin de önenıi artnıaktadır. Bilgisayar teknolojisindeki büyük gelişnıeler sayesinde, dünyanın herhangi bir yerinde üretilen bilginin sayısal hale getirilerek saklannıası ve o bilgiye dünyanın herhangi bir yerinden çok kısa sürede erişinı nıünıkün olnıaktadır. Bununla birlikte prograınlaına dillerindeki büyük gelişıneler sayesinde bilgiyi işlenıek ve istenen bilgiye erişınek de kolaylaşnıaktadır. Bu çalışnıada. bilgiyi elde etnıek anıacıyla kullanılan Endüktif Öğrenıne teknikleri anlattlacak ve bu a
1
and a ge1
iştiril e n a1gor i t nı a1
ar ka rşılaştırıI
a c akt ır.Anahta r Keliıneler- Endüktif öğrennıe ](arar ağacı, Kural üretıne, Bilgi kazanıını
RULE GENERATION METHODS OF INDUCTIVE LEARNING
AL(;ORITHMS AND COMPARISOIN OF THEIR PERFORMANCES
1BSTRACT
•Frequent eınphasis on the phrases such as "Inforınation Age" and ''Jnfornıation Society'' clearly expresses the
İnıportance of knowledge in our daily life. As the İnıportance of knowledge increases, so does the need for tools to reaclı and retrieve the knowledge. Thanks to great developınents in the conıputer technology, it is possible to store the
infornıation generated nıiles away in an electronic fornıat and retrieve it back quickly at any location in the world, when ııeedcd. ın addition, rapid developnıents in progranınıing languages also nıade it easy to process the information and acccs it in case of need. ln this study inductive learning techniques which are used to acquire infornıation will be cxplained and the algorithms developed for such purposes \Vill be conıpared with eacb other.
Key\vo rds - Inductive le arn ing, Decision tre e, Rule i nduction, I( now ledge acquisition
• •
I.
GIRIŞ
8i
1
gi s ayar teknoI
ojisini n büyük b ir hızla gel işınesi i le beraber yapay zeka alanında çok büyük ve hızlı gelişnıelcr yaşan n ıaktad ı r. Bu gelişnıelerle beraber yapay zekanın bir alt dalı olan uznıan sistenılerde de büyük iler le nıe ler kay d ed i lınekted ir.Biloi b ., oenelb kaynak
l
ardan, o larak . arşıv bir uzmandan, bilgilerinden, konu i le gözlenı ilnilib veya ıdeney
1
er d en e 1 d e e d i1e b i 1ir. B ir uz nı an da n b i1
gi e1
d e et nıe,karş ılı k lı görüşıneler gerektiren uzun zanıan alan dikkat isteyen ve sisteınatik çalışnıalar gerektiren bir işlenıdir.
U
z ınanı
ar, uz111an lı k bi lg iı
er i n i gün lük çal ı ş111a1
arı n darahatlıkla kul lanabi tınelerine rağınen, bunları özetlenıe ve
'-bir uznıan sistemde kullanılabilir hale getirnıede aynı
başarı yı göster e ın ey e b i li
rl
er.B
u bilg i ler i n d eğer1
endirilnıesi ve bir uznıan sistenı için bilgi tabanı haline
dene\. .J
' ..
SAl
·
Fen
BilinıleriEnstiUisli Dcr ısi
1 0.( ·iıı. l.Sa\ ı 'OOhyolla oluşturulnıası heın uzun zaıııaıı alnıakla
i
l cııı dey
li k s e k nı a 1 iyet ger e ktirı nekted ir.Ç U
n kLi
bu i ıenı ler iyerine getirecek uznıan kişilere ihtiyaç duyulnıakta, bu eleınanları buln1ak zorlaşnıakta ve istihdaını cta yük ek nıaJi
yet gerektirı
n ekte dir.Bi
1
g i nin e J de e d i Inıe sin e · 'bi 1 gi ka z a n ını ı " dcni r .Araştırnıacılar bilgi kazanınıını. bir uznıaıı sistcnıiıı._
ge
ı
işti riı
nıesinde en büyü k darboğaz oı <ıra k kah
u ıetnıekted i r
ı
e r. Fe i genbau nı f1
] b u lıusu
sul) ) ıc di ı e
gerirnıektedir: .. Bilginin gösteriıııi. kullanıınıa ı e
kazanıııııası ile ilgili çözülıııesi gereken <;nk öı
ı
enıliproblenıler vardır. Bunlardan bilgi kazanınıı problcıııi eıı önenıı i kritik darboğazı o
ı
uş tu rnıaktadır''.Bütün bu ve benzeri zorluklar araştırnıl1cıları bu darb oğaz ı aşnı a k iç i n a
ı
ternatif tc k ni k 1 cr gc1
i lı rı ney
e sevk etıniştir. Bu konuda birçok teknik gcliştırilıni vegcliştirilnıeye devanı edilnıektcdir. (}eliştirilen bu
tekniklerin anıacı bilgi kazanınıını otoıııatik lıalc '-Qetirınektir. Bunlardan bir tanesi de 'Endüktif ÖQrcnnıc · L (lnductive Learning) tekniğidir.
Endüktif öğren ın e alanında birçok algoritına ge
1
iş
t i r i 1nıi ş tir. B u algorit nı a1
arın k ura 1 ür et nıcy
öntenıl er i arasında fark I ılık lar oı ın asına rağnıen, sonuçta örnek set ını e n iy i şeki l d e te nı s iı ede n ku ra ll arı nü
r ct i Inıesin isaQiarlar.L
Bu çalışnıanın ikinci bölünıündc cndüktif öğrenıne
tekniğinin ana hatları üzerinde durulnıuş.
üçüncü
bö
1 U
nı ünde endükt if öğrennıe a1
gorit ıııa lar ı ve bu algoritnıalarııı kural üretnıe nıetotları açıklaıınıış ve dördüncü
bö 1ünıde i se bu a lgorit nıa ların perfornıans ları karşılaştı r ıl nı ıştır.Endüktif
... .
.
.-2. ENDUKTIF Q(;J ENME
öürennıe· ::;. ı b nözlenı.
veritabanından elde edilen örnek setinden
e va bir genel bilgi
'-
'-çıkarnıa tekniği ve otonıatik bilgi kazanıını için pratik
yaklaşınılardan birisi olarak kabul edilir [2].
Son yıllarda araştırnıacılar endüktif öğrenebilirliğin teorisi üzerinde çalışnıışlar ve tenıel teorik analizler
üzerinde endüktif öğrennıenin ınüınkün olabilirliğini ka n ıt1 anı ay ı başa rı n ı ş 1 ardı r.
İ
1k o larak Va p n i k veC h
crvonen k is [3 J
öğrenc
b i 1 nıeni
n b ir ö lç li
s ü o 1 ara k VCboyutu'nu sunnıuşlardır. {)aha sonra öğrenebilıne alanında birçok teorik çalışına yapılınıştır [4, 5].
Endüktif öğrenın
e
de "'öğreıınıe" kavranıı i1
e eğ
itıneörneklerinden bir kavranıı en iyi açıklayan bilgilerin elde edilnıesi kastedilnıektedir. Burada örneklerden karar kuralları denilen kurallar o1uş turu lur. Örnek ler d en gene1 ifadelere (kurallara) ulaştidığından endüktif öğrennıcye
"tli nı c var ını ö ğ rennıe·' de den i lnıektedir [
6
].2
1 ıı d ı· , k tı ı ( ) ı �..· ı ı ı ı h.' \ ı l ıı ı l ıı ı . ı
Lı
r
ı
n ı
ıık
ıır
ıl
l r ıın
c 'ı ı ' ııiL·ııı k : , ,' '
1
\:
rı
)rn
ı..ıı bıı r
ın
ıı
ı 1\. .. ı r ::ı ı ıı
ı ı rı ını
:ı -..ı .
( > \ k l • b�..· k1-.rıdiiktir
ö Tcıııııc
.._ al uritıııal ırıııııı tasarııııındaki en-hii)'Cık
prn bleııı , dü7cnsi:� örneklerden a ırı clcrcccdckarınl.l ık tanıınlaııı<ıları liretıııcktcıı sakınnıanııı ılt.t ıl olacaQıdır. Bozuk, eksik. lıeı cn ii' verilerden öğrcıınıc.·
\O k say
ıu
a verinısi1
örnekIc
r taııııı11 anı lı ve karnı cı ı k karar kurallarının çok 1yıdd ulıııasıııa sebep olabilir.Bu
durunıda üretilen kcıvranı t:ınııııı cncllikle ck iko
I
nıak ta d ır 16] .Genel olarak endüktif
taıııııılanabilir 17. RI: Verilen ler:
....
aşcığıdak i .... u
i
bi
• Bazı dene\ .,. \'e\ .. tl duruıııl<ır lıt.lkkıııdt-ı hil i\ i österen
"- - ..._
bir örnek set i
(.1 )
.o Geçici k e s in o 1n
ı a
lııı c n du
k t ir
id d i(1(
h
o
o1
abi1
ir) .• Gcçnıiş bilgi
K.
Buluııanlar:
• Ornekleri il'adc cdcıı vc gcçıııi
K bilgisini
tcnısileden bir
h
hip ot eL.İ.
Bunu ıı g ö st cri nı ih
1\A.
=-> .-
i
şeklindedir. 13u ifade ,
h
lıipotczi ve geçıni1\
bil isinin. '--'A
örnek setiniif H.lc
etti[!:ini gösterir..... .... Burada 1\ ınantıksal çıktıyı gösterir.;rnın yapısına bağlı nh1rak endliktif öğrenı nenin iki
ıııCınıkün
durunıu v ırdır. Bunlar: danışnıanlı vedanı ş nıans ı z.
A
' da k iö
r n ck1
cr önc
edc n sındl
andırıl nı ış
sa bu öğrennıeye daııışn1anlı. diğer dunınıda danışınansız cılarak adlandırılır.Bir
.4
örnek setinde e ;,ıclct ()rnek ve s adet(d1,d_),
. ..,dj
farklı ınıf olsun ve
e(tli).
d,
sıııılına ait bir örneği göstersin.A
'dan bilgi veya kavrunı öğreıını
e:o 1arak gö st c ri1 i r. Burada
1)
es(d,).
cl,
sın ı fı kav ra nı ıntanınııdır. Herhangi bir cndüktif öğrennıe prosedürü tarafından talınıin edilebilen iki şart vardır. Bunlar. eksizlik ve tutarlılık şartıdır. Eksiksizlik:
Bu şart ile bütün örneklerde,
d,
sınıfıDes(d)
kavranıı tarafı n da ıı kapsa nnıa1ıdır.'r
u tar 1 ılık :Bu şart end
Li
ktifö
ğ re nnıcd c çok önenılidir.D
e s(dj
kavraını_c/,
sınıfına aıt olnıayan herhan2.i bir örııeQi kap sa nı anı Jlıdır.""--S(
flrt
ı1
.... • 1... .. , ll... .. -·- ·r- ... _ ; ; ; i • . '· . . -. . . : -... !'\... - - --- _..._,.,_ __ - .... ·-· --' :L.
LJ • ..1 • ·-! ! ; • ' ' ' • ·- ' : • • \ -- -...,._. ... .. .... _ 1 ···rı
' ,• .•. • • • • • : 1 ... -· 1 • ....
.. . . ' 1 • ı .n r'· , '. J.. .. . . ....: : 1c.:
i ! , ( ' ,, ,..,.t'
•
• • f. .. --·---- ·-.. ---r--
· _ ... __ ... ----..1
..
... , ....11
. 1 • 1 ' ' ı -... ı ı ıo
1
(
)
gö'tcrir.
\l 1
cııHıliınkrı
f·ıhtıtiı-..iiı
kı ·ı-..ı 1 ı ıl ill. 1 \,ı\ ı _1(Hl(ıl:ndliktif öğrcnıııc
:ıbır
· · ,·ııınc i k·ı
ıı ıı
ı tk
· hiılanı
ü
nıkü
n
çı
kt
ı
c 1d
e
L'
'·lı
· .. ı i ; •!
. ı ,. 'dı'
1
1
hu
t
t·ın
nıii
ı
ıık Li
ıı
Çiktıiarı
iÇCI"eJ1 bir hip\ t\.· ; Ut · · : ı'll11J
Jldtikll r t) ırL'IııllL'.h
irh
lıipotczini
bulıııak
i
·ıı 1i/
lı:ı-ı,
ık·;
ıı;ıt ııhl,ı bır;,ıraıııa
prnseetürü olarak
açıkl(tll lhııir.\r<ıın;,ı i kınıııı
:dparkcıı
ck
si
ksi
1 1ik vc
tu
tar
lı lık ı
rt ı._ı rını-
t ) 1 <)nüı
Hk·
l u ı ;ır
dk
ıy
n
ıza
ınanda
K
geç
111i bi1g
isini
u
clalını
in cd
cr 19.
1
Oı.
Fııdüktif öğrcnınedc kul
lan
ıı<ı
ca
k
olan bilgi
örnek
eti
L)larak
adlandırılır.
Bir
örnek
seti
{
·
olarak
taıııınlandı0.ında.
("daki(1rııcklcr bir
k ırah:tcriqik
L'ti (. ,'c·,.c·_',
.. . ,(."/
\·chir
/)
,'/)
1
.
/J
_
. . /J,111
karar
k
dr 1h:tcr
isti
...0:i tararı
rıdaıı
t:ı
ıııııll ınır.K<
ırak
IL' ri"t
i
k k
ri
n
h
i
1ı
d 1allıl
·
tara
rınd
ın \ cri
ıi
r ( 1 · / 1 1,l
· ,. .. 1
1111 ).
J 1
crbir
< , ( · o
1
a
11 C ·, ki.lrak
tL' r ı \)t
i
:
ı
ı1 ıııh
ı1
iı
1; ıııı 1 ,d
L' e r " c 1i
di
r . ...ı
· . .1
·• c1
o
1Cl
n
g<)
1 k'n1lcnL'h
i
1
ir
h i
r(k'
g
cr sct
i
d i
ı · .1
/'
lliıı
hn llt
ll vc d ıııC
ıı
nk i
i 11h
i
1)ı.'
lL' 1k
ıııı " ı ı -., ı :li
1 1 ı ll 1;: 1 1 ı ll 1 l • .. •·nlarak lıc"apl8nır.
) ı
rt h.ari.ıktLTi"tikkriıkili
ahip i c
!!
!!
- -L
C'
'
2
_'
olur.
ll
1 ı ll
' '•
Buı ada açıkça görl'ılli)tır ki.
nçok büyük bir değer
olduğuııJa hlitl'ın hipntc/
ıı;a,ıııı ara tırıııak pratik. hJtta
nılinı
h.
Lin d
c '-Qi 1d
ir.
Araıııa nıctodu, endliktir ()ğrcıııııc prosedürleri için çok
liııcn1lidir 1ıo.ıı].
/\raıııa nıetocluııa alt rnatir olarak
hipotel
lll8yıııı
ıııünıkün
olan enaz
sevıycyc indir
en
nı
ctot
1ar d
ngl'
1i
tir
ilı
rıiştir
16,
12j.
..
..
..
. - .3.
ENDUK'riF
()(;J ENl\1 E
AL(;()I{J ' I'MALAI I
C)ğrcnıııe onuçları )a kesin
)-3
da tahnıini sonuçlar
olarak
bir
karar ağacı
veya bir kural seti şeklinde
\ınıllaııdırılclrak g(') tcrilcbilir. Karar ağacı şeklinde kural
üreten
algoritınalar
fJöl-ve..:fetlıet yah:laşııııını. doğrudan
kural
üreten
algoritnıalar ise
kapsanıa
yaklaşıııııııı
kullanırlar.
B
ö 1-vc-
ı
cth
ct yak
1aşınıını ku
1 1ana
n
e
n
dU tif
öğ
ren
111 ea
1g
nr
itnı
H 1ar
ı bi
1g
i
y
ibir karar ağa
cı ş
ek
1inde gösterir
1er.Bu
yaklaşıın.
karar
ağacı kullanınıından dolayı
gcrcği
n
dc
n ra
z 1a kura
1tanın1lanıaIarı
içer
ebi1
ir. A yrıcaLirctilcn kurallardaki şart
sayılarınınt 1zla olnıa ından
dolayı sonuçlar basitleştirilıııiş şekilde değildir. Bir diğer
dc;avaııtajı ise, her örnek seti için sadece bir tek karar
ağacı
oluşturıııası
vebu
ağacın
kural
setine
döııli türüln1csi ilc yOk sayıda kuralın üretilnıcsidir. Bunu
ııgellcınck için
1·
ı ıd (i k
li
r
(
) Q rcrı lllc;\ ı
u()ri
Lll1 (ıli.ırı 11ııı K ll r;ıl l
.rL'l11lL'
( ııı ll' 1 ll k 1 ı \L'
'- ...
Pcrl()rın;_ııısli.ırının K;ır ıL.ı ıırılın;ı,ı. ( )
\kL'1)hL·k
'
bu
danıa \'öntenılcr
ikullcın
ıJır. Bu
d
u
nını
d<
ıi\
cd
o0
1ulu
k
or
lll ıııd
adLi ü
olur.
Kapsanıa
yakla ııııını
kull<lııan
ndliktir
<1Qrcıııııc....
a 1 -
oritnıa
1
arıb
i 1'-' u.i\'i do
.. \..-0.
rudan
h ir
kur<ıl eti
ek
lind
eösterirlcr.
...
Karar a
Qacı
vc:kura
1scti kavra
ın1
arı
S
cki
1 ı·k
ötcr
ilen
'
iki sınıflı
sınıflandırnıa probleıııi
içinaçıkl 1nıııı ıır.
\<•• · ·ı .. . ! . ... . ;
.
.. .. .. ... ' t ... . . . .. . ... ... ... . .. ...--... ...._._ ... . . .. .. ..._.. ___... . ..
....
. ·-· -· ..
.... ...-... .. . -... .. i1 • -....
... : ''"''''""'OHh•o• : ,,.. ... . . ... .....
.... ... .' 1 ı... .•, ... . ..
..., . ' . . .. ...'
..
, - .. . ' .. . . • ..
.'
. . ... ---- . 1 -. ' . ı .r!�··. r·;. .. ;ı :-• r: t. . ... -... .. .. .. .. ... .. ... ...···... ... ·--··· ... ... ... ·''.
..
,.. ... . . .. ' , o ·.. ..., ... .... :· .. .... . ..
: ,_...-... ... ... ... .. ·· ·-.... ...
.- ·. .. ....
... . . ... t' ....
• ... .. . t... ... "'-... ,.... ..,... .... ... -···...···... . '/ ... ___.... ; ' ·--.. .. .....
....
.
.. ... . ' . . .- ·-·· .. . i : · . · -· · .... . ... .... _.__ .. ,).
' . . "' ' .._ .. -· ..·-·.... ... ·-· '\" ·- ...---... .... • • .. ... ,. 1 r - .......
ı (····-···�... · -· · --: '.
d\i
1 1. Ornek l!t iŞekil
1 'dekiörneklerin şekilsel gösteriınkrini, cııdUktif
ö
b ürennıc
11
roscdLir
1crindcki
nöstc
rinıini k
ı.) 1a)
'ıaştırnıak
için Tablo
1'de gö tcrildiği
gibikarakteristik-değer
şekline dönüştürülnıü tür. Tablo
ı
'deki
örneklerdört şart
arakteristiği
(('1• c· . ('3, C'-1)
ve bir karar karakteristiği
( ınıf)
tarafından
tanınılannıı tır.
ller
bir
şart
karakteristiği bir geonıetrik şekle karşılık gelınektedir.
Örneğin,
c·,
daireyi
( Ü
),C2
uzun çubuğu (
).
C3
ü
ç
g
e ni( 6
)
veC4
ise kareyi
( D
)
göstern1ektedir.
Bir şart karakteristiğinin
değeri (Cı).ilgili şeklin
birka
ç
e 1 e
nıan
ını
(
değer) göst
erir [ 1 3] .
Tablo I ·deki her bir satır bir örneği be
..
...1
irtnıekted
ir.Orneğin. ikinci satır
/C-.1=1. C':-=2. ('3
-=3.
c·
-�
-
J. Stn{{-1
/
Şekil ı·dcki ilk sınıfın ikinci
örneğini Burada:ı
adet daire.
2
adet uzun çubuk.
3adet üçgen \c
2
adet kare
bulunıııaktad
ır.c2 ('1 Cı 2 1 7 "ı 7 7 -· - - - -- - ---"'
-Sınır
-' J {} - .- , ., _, ,vS/\Cl F ıı
B iliınieri Enstitüsü Derg:isi I O.Cilt. I.Sa\ ı2006
Ta b 1o 1.
)
i
ı ı v c ri ıen ör
ııek
set
iııi
nk a ra k l c r
is l ik
-dcğer b içi
ıni
()rııe
No Cı Sınır ı -1 - ( ) ı ) ı 3 7 - ... ı 1 1 1 ı _, - - -1 ı ı ı 1 {) "1 o o , ) -6 ' 1 "1 () - - _) 7 -1 -1 ı ( ) R -1 ( ) ( ) - - ---· --- ---·---Şekil
2. örnek setinden kural seti ve karar ağacı
çıkarınıını
gösternıekted ir.Kural etindeki ilk kural:
E
..er:: ıiç·gen1·ar
ise
Jnolu stndl.t aittir
şek
1
i n d e
y
or u n ıla n
ır.
l ablo
1
'deki örnek veri seti kullanılarak üretilen kurallar
aşağıda veriınıiştir (l<.ural seti
edilıniştir).
RE X-
1 a
1 ...go ri t
nıas ı i
1e e
1
de
J(ura
1
ı
J(u rn
1 1J( u ra
1
1(
ura
1 -ı . . . .E
Q
...crC
j
=
2
1-ğcrC
1ı
LQcrl'1 1 _ ve ...c
3 _), ... EQ.._er
C ı2
ve
C
j -=-ı ...
, n ır
1
ıs
c .Sınıf
1
ıs
c ıscSınır
o
.Sınır
o
ıs
cKural
5
.
.Fğcr
(
-
o
ısc
.o
Tablo
ı'de
ki
örnek seti için üretilen karar
2'tl e
\ cr i
1
n1
i t
ir
(1<
ara r
ağa
cı ,
C' -ı
.
5
ku ll a ııılı.1 ra k
c1
d ccd i Inı i ştir)
r ı
41-(_' ı
ı
(_..' --")
Sel il 2. '
Karar alla
c ı_3.
ı. Ka ra rAğttcı
·ra ba nlı Al
go
ritnıala rağacı Şekil
a1 or i t
.._ nıas ı
( )
ı·arar a[!.acı-tabanlı al oritnıalar, genellikle karar ağacını
oluşturnıak ıçın en büyük bilgi kazaneını veren
ö
7c ll i k
1
crd
cn ara nı a yap nı ak iç i n bi lg i n i n e nt ro
pi
ö
1
ç ü
sün ü ku ll an ı r
1
ar [ 1
4,
15]. B u a ın aç 1a karar ağa
cı n ı
olu turınak için örnek setini küçük alt setiere bölerler.
Karar ağacı
gel
iş
tirnı
e proedürü, eğ
itnı
eörneklerini
ku\\an ı c
ın ı n b
c1
i r
1
cdi ği s
on
1
an
dı
rına ö
1
çü tü n e gör
e d oğruı n ı
llandı rı lı nca\' a kadar d e
-' va
nıe
d er.Karar ağacı-tabantı algoritınalar Böl-ve-Fethet nıetoduna
göre işlcın yaparak örnekleri alt setiere ayırırlar.
Böl-ve-Endüktil'()ğrcnnıe /\I L)ritınalarının Kural Cıretınc Ynnteınkri
'c
.._ ...
Perfornıan_ larının Karsılastırılması.
()
.
/\k!2.ı'1bc"
• 1 .._
Fet h et end ü ktif öğrenıne
'- nıetod unun anafikri, b ir örnek
setini, her bir alt settesadece tek bir sınıf kalınca\
.;·
a kadar
alt setiere ayırır.
Bun
ıet
oduı
isonucu bir karar ağacı
şek!i ndedir. Gene
1
olarak Bö 1-vc- Fet h ct endükt if öğren nı
eproscdürü aşağıdaki gibidir:
1.
Verilen
S
örnek seti,
S11•
S
1
• .. . .S1"
şeklinde alt
setiere ayrıştırılır. Bu:
1 1
2.
Her bir.)·,, alt seti için, S11'de tek bir sınıf varsa
ayrıştırnıa işlenıi tanıanılanır ve buraya bir sınıf
etiketi olarak
düğünı konur.
...__Şek i 1 3 ' tc ay
rıştır nı a p
rose d ür
Li
gö ter i1nı i şt i
r.B urada, b i r
sınıfı gösternıek üzere düğünı olarak dikdörtgen şekli
kul la n ıl nı ı ştı r.
P
ro
sc
dürü
llbaş1 an g ıç no
kta s ı
en d ü
ş
ü k
ayrıştı rnıa sevı ye s ı n ı göster ir. Bir düşük ayrışt ırnıa
s
cviyes
in
de bi r d
Cı
ğ
ü
nı
gör
Li
1 c b i 1 i r.
B
un
1ar
yü
k
s e
k
sev iv e
1
erdcn da lı a
ge n e 1
d
i
r.Ay r ı ca ay n ı ay
rıştır
nı
aseviyesinde ·çocuk'
düğüıııü ileonların ·ebeveyn'
d
ü ğ ü
nıü a ras
ı
ll da k
i i
1
i ş k il c
r i ç i n
:
ı. 'l
ı '1 ) ( 1. 1 ) ==u
5,'(
ı
1
) 1 11
)( 1 ıı
k 1J..
ve
ifadeleri vazılabilir. Buradaki
1
ayrıştırına seviyesını
gösterir
....
S=(C'.D.
V)
bir
örnekseti olarak alındığında, bu örnek
setincieki
elcnıanlar
'3ırasıyla:
C
==
{(
,
!.C
2
, ... ,Cn}
karakteri·tik setini,
ı·{1'/.l'.?
...
..
Vn/
değerler
setini
veD
-=
{D/
.
f)?
,
...
.
!)n/
ise karar karakteristik (sınıf) setini
belirtir. Tablo
1
'de verilen örnek seti, Böl-ve-Fethet
en d ükt if öğrcn nı e nıetoduna göre çok fark lı alt set ler
eayrış t ı r ıla b i
1
ir.
B u
ör n c
ks
eti
:C = {C'
/.
C
1.
c·3.
C
-1-/ ,
ı
l
-
1,
1
• ?ı
,") ı
'-1
1-
1
11
) 1 1()
1 ? 1 11 ? 3
l
1o 1
) ll.J, 1 ll .-,. 1 . • -, . . . -. ,, 1 , .-t;
ve
D
-
(0
.
1 /
bilgilerinelen oluşnıuştur. Bu bilgilere göre 239
ınüınkUn alt ct oluşturulabilir. Bu nıetot ile her bir
d
ü
ğ
Cıın d e
ki a) rı
ştı
rn
1a1ar
o
pti
nıiz
e ed i 1 er e k
veri
nı! i
ve
kabul edilebilir bir yapı elde edilebilir.
Karar ağaçları olu turulduktan sonra. ağacın her dalı bir
kural olusturacak sekilde kurallara dönüştürülür. Ancak
1 1karar
ağacını
karar kurallarına
çevirnıenin bazı
de7.avaııta.i ları vardır 1151 ve karar
ağaçlarıile işlenı
yapınak oldukça zordur. l ler örnek seti için bir tek karar
ağa
cı o lu ş tu r ul nı"
sı n da n d
o1
ay ı kök
o 1ar ak seç i 1 e n
karakteri ·tik bütün kurallarda yer alacaktır. Bunun
sonucu olarak birçok gereksiz kural üretilecek ve üretilen
kurall ar çok sayıda şart i fade s i içerecektir.
1 ı • • .. -.... --� .. '
,
l ı ..• .. ' • / ' , .. ' <(' ' . . , . ... --, . ·· \"'• ·-. ' < . , ,, ... _...,_.,""('_ .. __ t' .... '·· ("' t.·;..
... ... ) . ı . wo rı r.• f'O fO. . ., ... . . .. ...
....
.. ·' ,e. · ·•·r .... o ) , ... i t, ·,b
i
h
.
!, i
---1 .
( 1 • • • ı-·
St\C'
F n B i l i nı leri E n t i t ü s ü Dcrg i i I O. C i l t . I . Sa\ ı2 00()
""" .. ' - -.
ı .-. .. .1l.
..
:.: '!...:.!.:
....
!
:
::
·
ı
'
' ,
# • .·"*·
o)o -'}
.
' . . ! . . ···� ı t ' . .-- .,.· · --··.
.
... .. . . . . ..._ . .. 1 1 ,1 ' .. . ,· : ı'>' '; .... ..
.
... .. . -. ..;) .#.. '( ... ,.,1 ıt't• ... ;-ol ,_ ..• • .. ..,
·' • •• ·- -. • • ._ · ...·••• \. ... ,. .. : ·.s 1 · :: · · ,! .. . ..; .. · - . ı • . . o ' t ... ,..! o . · - . '('..ı .. .. _.. • · r ı c ... t•tt•ekil 3. B<H-\ t:-Fct het cndük t ı l' öü.n:nmc metodunda a\TJ t ırma
1 ._ •
prn'\ cd ü nı
Herlıanu i b i r s ı n ı1land ı rnıa hakk ı nda
elde etınek
h
Cı
t U
n ağac
ın
g
ö
7d
cn geç ir i 1 nı e
s
in i ger
ck
t
iri r.
Bi r
prnhknıi
çö11ııek,
karar ağac ı n ı k urallara d ö ııüşt ürnıekle
ıııüıııh.ündür. /\ ncak ağaç lar tara fı ndan göstcri lenıeyecek
kur;ıl lar
d a
\ ard
ı r. Örnek olarak. aşağıdak i k ura l seti
\ er i l "ı i n .
K ural 1 :
EC
E R a
K ura l 2 :
I
·
.
C
'i
l
-
R
c
ı VE
b
ı
i S E S ı n ı f
=
1
ı
V 1
-.
d
1 1 S
E
ın ı
r ı
K ural- l
veK ura l - 2 ' n i n S ı n ı f 1 ' i kapsad ı ğ ı n ı ve d iğer tlin1
kuralların i c S ı n ı r 2' \ c a i t o lduğu kabul cd i ld iQ i nde. her
._ ._i k i kural tck b i r ağa<ı: tara fı ndan gcistcr i le ıı1cz. Çünkü
a tlc ın kökü b i r karaktcrist i Qc öre a\ r ı l ı r ve her iki
""" .._ "'"'- ...kura
1
<1a it o
1a n b ir karakteri st ik yoktur . Bu d ur u nı u
ö
"'t
e
rnı
c
k iç i
n vcri
1
c n k u ra 1
1
a ra
b i r şa
r
t ın
1 1
z1ad a n
ck lcıııııc i gerekecekt i r. B u da sonuçta en az b i r fazla
kura l ı n ç ı kıııa ı ııa sebep o lacakt ı r
r
1
6 1
.K
arar ağa c
ın ı k u l l ana
n
i
1
k a 1
go
ri t nı a.
I
1
u nt l l 7 1 tarafı nda
n
geli t i r i lcn
(" L S
( Concept
Learn i n g
Sytenı )
algoritınasıdır. (_'LS serisi algoritnıaları n toplanı sayısı
doku1dur. Bun lardan i l k sekizi sadece i k i sın ı fl ı örnek
etleri ı k
çal ı ab i l i rkcn,
CLS9 algoritnıası nd a çok s ı n ı tl ı
tHııck lcr
çö;ü leb i l nıckted ir.
Daha son ra Q u i n l an [9]
tar 11'ından \ C bu nıetodu k u l lanan 1 [)3 a i l e · i a l goritnıaları
.._g
c1
i
t
i r
ı l ın i t i r.
(
I D 3 ,
,\
S TA
N 1
veC L
5
)
.
I D
3
J 1g
cı
rit
nı
a
ı
11d
a,
ayrı
ş
t ı r nı a) a re lı b er 1i k ed e
ce k b ir b i 1gi
ö
1ç
i h
ü
(
cn t
ro
p i
)
k u l l an ı 1 nı ışt ı r.
B
i lgi11 in c n t ro p
i
si (
1
)
ve
( ") ) eşit l i kleri yard ı ııı ıy la he aplan ı r.
1 ( s )
I
jJ( /J
=r./1 ) log: p( D
c/1 )
1. , .. 1 • .-'
1 ( .) )
.)
1( ı )
( 2 )
• ••.
.
..
l ·: n d ü k t i !' ( ) Q rc n nıc ;\ l oritınaları n ı n K
urlti l
:
rc tınc Y <.)ı 1 l c ın kri ' c'-
'-5
Pcrl(H·ınan ::;ları n ı n K ar ı l n t ı rı l ına ı.
(
). i\ k t)hck/(S). S
ö rnek et ı n ı n b i lg i değerini gösterir.
/:((
·, ,
S;_ C
·
i
s ı n ı fı nd a k i örnek lere a i t b i l g i n i n cntrop i. i n i gösterır.
B i lg i kazancı ise (3 ) eş i t l i ğ i i l c hesaplan ı r.
( 3 )
I D 3
a l goritınası b i lgi kazane ı n ı nıaksi ııı ize eden bir
...karakteristiği kök düğünı olarak seçer. l ler düğünı için
i lg i l i alt etin b i lg i kazan c ı hesaplanarak bu düğüıııe göre
alt set iere a) rıştırnıa i şlcın int. her düğliındc tck sın ı f
ka l ı ncava kadar d evanı e d i 1 ir.
"'Daha sonra. 1 03 cndLikı i f ÖQrcııınc al nritıııalar ı n ı 11 b i r
... ...serisi ge l işti r i Id i . Bu seri 1 03 a i l e · i algorit ınaları olarak
ad land ı rı l ı r
[ 1 8 1 .
ID3
algorit 11ıası n ı n versiyonları, I D3 - I V
[ 1 9] G I D3 [ 1 9 ] , 1 04 [20 ] , 1 05
f 2 1 ],
ID
5 R ve I [)5 R-hat
[22]
o larak say ı la b i l i r.
I
D
3 a 1gori t nı as ın ın d eva nı ı o larak g
c
1 işt iri
1en C
4
.S
algori tnıas ı, I D 3 a lg or it nı as ın ı n e nd Listriye 1 versiyon u
o larak kabu l e d i l nıekte ve bugün b i rçok uznıa n l ı k
a
ı
a nı n d a yay g ı n o
1
arak k u l l an ıl nı ak ta d ır l 23
J
. I D 3
·Lın
gel işnı i ş b i r şek l i olan C4 .5 a lgoritınas ı n ın en büyük
öze l l i ğ i karar ağac ı n ı n gereksiz d a l lar ı n ı tespit ederek
b udanıası d ı r . 8 u algori t nıan ı n b i r d i ğer öze l l iği ise eksik
... ... '-'veri ve sayı sal değerlerle de çal ı şab i l nı es i d i r.
K arar a
oa c ı Li r ct c n b i r d i
b u-er a
1
b oor it nı a ise B re i nıa
ntararından gcl iştiri l ııı işt i r : C A RT ( C'Iass i ficat ion and
R
c gr e
s s
i
o
n
.
r
r c c
s
)
1 1-+ 1.
C!\ R
T ,h er d ü
ğ
ü nı U ıı dck i t ünı
karakter i st i k leri b i rer b i rer araşt ı r ı r. I ler b i r karakterist ik
i ç i n en çok katk ıyı ·ağlayan en i y i a; rıştırıııa) ı bu l ur
,.c nadet aday içeri · i nden en iyi ayrı t ı rına)
ıcçer. Sa) ısal
ver i leri i lcnıck li/ere tasarlanan hu algoritnıa Böl-vc
Fethct enelCı kt i r öğrcnnı e ınetoduna göre i ş lenı ) ap nıakta
ve sadece i k i l i karar ağac ı o luşturnıaktayd ı .
Daha s o n ra ka ra r ağa c ı n ı n k ısa o
1
nı as ın ı sağ 1anıak ı ç ın
Cra\v ford 1 25 1 tarafından C A RT algoritnıasının uzantısı
o lan
OC
1 algoritınası i le G DT
-N
R ve GDT-RS
[76 J
a1oorit n ı a
b ıarı <'c1 i ştiri 1nı işt i r .
3.2. K u ra l 'J' a banh Algo rit m a l a r
K ural-taba n l ı algoritnı a lar kapsanıa nıetodunu k u l lanırlar.
Bu nıetot verilen örnek set inden daha genel kural lar elde
._etınck i ç i n örnek seti n i s ı n ı tlara ayı r ı r. K.apsaına nıetoJu
veri len örnek set i ne daya l ı b i r k ural uzayı h ipote;.i kurar.
R u kural uzayı h i potczi, aranıa işleınieri boyunca cl iıııinc
edi lerek en genel kural lar b u l un nıaya ç a l ı ş ı l ı r . ·K ural
u;.a yı lı i p ot c 1 i
'·erst\
o n ıcuy
1o lara k adlandır ıl ır. .
İ lk o larak M itche l l
[ 8 ]_
kap
·
anıa nıctt)dunu k u l lanarak
aday-clcnlc nlgoritnıa ı n ı gc l iş t i rııı i t i r. Bu nıctodu
k u l lanan n l gori t ıııa l ar aşağ ı d a k i nıant ığa gore i lcııı
yaparlar:
1 �-J
.. ı ..:
'-/)
\w ı
'rn
\
.
\
l
.
ı· L'I1 l ı ı i nı krı ı -.ıbl ıtCı....li Dcr i:-;i I O. C i lt.
1 . '
ı
I H )h
S
b i r örnek set i ve
!!
vers i y o n
UL<.l\ı k a b t ı l cd i l c.l i Q i ııdc.
.
()rn e k l c r
ı ıı ı tl a r ı ıı a göre po;: i t i f veya n egat i f olara k
s ı ı ı ı tl a n d ı r ı l ı r lar. Seçi len örnek i l c av n ı s ı ıı ı ıta o l an
ö rn e k l e r po7 i t i f o l arak kabu l ed i l i rken, d iğer t linı ı n ı Ilanı
a i t c)rn e k l c r negar i f o l arak d i k kate a l ı n ı r . Baş langıçta //.
\·
c r i l c n po7 i t i f örn ek lerd e k i t ü ııı ı n li n ı k üıı k avranı lan
k a p l r. B u d u r u nıda gösteri len ö rnek l erd e k i
...erek s i z
cı
d
a y k a \ ra 111 1 a r
1r
da
n
e 1e n cr c k , sa
d
e c c b i
r
.
ı n ı
tı
a i t
ka\ ran ı l ar ı n k a l ıııa · ı ag lan ır. F lcıııc i ş l enı i şö} l e y ap ı l ır:
Pt)/ i t i r 1 rııc k l c n.k·
\o.()
_
·
tcr
i
l c ıı ve / / ' y i gcnc l l e\·cıı t üııı ö;el
.., --k{l\T ıın t aı ı ı ııı l a ı ı ı a l a r ı / / ' den i l i n i r. B u i ş lcnı ııc nt i f
s ı ı ı ı tl ar Li 1 r i ııdc de tekrarl anarak ç o k genel ka
;
ranı
ta n ı nı lcuııcl l c.l rı e l d e ed i l i r . B u vo l la
.,
ll.
sad eec i ·tcııcn
k t t \ r(ı ı ı ı t a ıı ı ın l a n ı c ı l ar ı k a l ı ncaya kadar kadcnı c l i o l arak
k t ı \· ü l t ü l ü r. Öğren i l e n ka\ ranı l a r
· f:.:. er hill illi ise kt rur ·;ı
L' k
1i ıı
d
c
k
ura l l a r i 1 c
... Q.ö
s
t
c
ri
1
i r
.
B u
a
1
'-n
r
i t nı a
\e r i
1c n
(
1r
11c k
-.,�._· t i ı ı d c ıı t;cı k sa) ı d a k 'ı b u l ed i l eb i l i r k a v raın ı b u l ab i l i r .
,
\
n L: l ı
k
.
l)k
b ti \ Cı k örııcl-.
ct ı ı ç ı n ba lang ıçta
If' ı
' ı u t u ı-ınak n k 1.nr. lıc.llt<l ha1ı d u ruııı l arda i ın kans ı ;:d ı r.
S
b i r t1 r ı ı c k set i o l d u ğuna göre, po1 i t i f set
( S )
ve negat i f
-.;ct
(
S
-
·
)
o l n ıı.ık li/ere bö l li n c b i l i r.
S
' d a k i örnek lerin hepsi
(l \ J1 ı
s ı n ı fa n i t t i r ve
ıS
;
u ,
==L 1
ve ıS
-Tn
s;
=cjJ
o l u r.
ı,
u
1"
ı nı a
n
ı
ct
o
d u n u k u l l
a n
a n d
i
.._
Q
cr b i r a
1
'-o
r it ın <l
i
s c\
1 ı
L 1 d ıt <
1r
C. lrı n d all
g c
ı
i ş t i ri l e n
A
Q
a i
ı
e s i
l ı1 ı H.
it ıı ı
a1
ar ı d ı r
1
'7 1.
B u a
1
go ri t nı a 1ar da k u l l all ı
1
an
\ ö n t
cnı a d a
\ --e
1
c
ıı ıe a l or it nı a 1ar ı n da k i i le bc n zer d i
r.J ' ı.nk l ı o l ar a k b a ş l a n g ı tH o l uşturulan
/ J.
boş t a n ı ın lanıa lar
.
.
ı c r ı r.
J ),"Qrudan k u ra l üreten a l gorit nıal ara.
AQ
1\ i lesi.
CN2.
R \
'
L I
'
S
a i l e s i
f 2 ] .I L/\ - 1
[29].
I L A-'
1 0 1 .
\ eR E X
-\ ı l
i
1 -'
l l d lg o r i t nı u ları örnek o larak veri l e b i l ir.
- L i\ l >
f
'
K·ri
F
()(; n.
E N !\1 E A
LG() R i ·rM ,\ L
.ı
\ R l
N
1 N
P E 1 F< > 1 M
i
\ N
S
L
t
\ I{ I N
1
K A R Ş I LAŞl I R M A
J >cr !'urı n a ı ı s k a r ı la t ı rıııa ları i ç i n e n yayg ı n k u l la n ı lan
a l gtH·i t ıı ı a l a r i lc gerçek hayattan a l ı n nı ış t o p lanı 1 1 adet
v e r i set i scç i l nı i t i r l b k7.
3 2 3 3 ] .B u veri e t l e r i n i n k ura l
· ı karıı1a ( c ğ i t i ın set i ) ve ı karı lan k u ra l ları test etnıek ( test
s e t
i) i ç i n i k i ra
rk l ı
set i b u l u n nı a k tad ı
r.B
u ve ri
·
c
t
1
er i i
1
ei
1
g
i 1 i
h
i 1
g
i l e r
,
ra b 1
o
2
'd
cveri l ı n
i
ş t i r .
T'
ab
I
o
3 •1·
ab
1
o
4
vc
1
ab lo
5
· t c \
'
e r i len
R E X
a l goritınal arı na a i t sonuç lar
turdl'ıın ı / d a ı ı . d i ğer a l gor itnıalara a i t s o n u ç l a r ise i l gi l i
rc
Ic
ra n
1
ar
d
aıı
e1d c
cd i Inı i ş t i r.
.t . 1 . K a ra r
1
\ ğ
a
c 1.'
\ lg
or i t ın a 1 a r
1i 1
e Perfo r n1 a n
sKa r a l n t
1rnıa
\ 1
(' Ilk
ı
.
\
1 l)n
k
1\ c
\1
oıı k 3 örnek setleri ( bkz. Tab lo ' ),
k lr ır a0:a c ı ü reten a l goritnıalar o l an
...!DJ ,
( '-1. 5 .
r -1.
5
1<
111l · ' .( ·
-1
5
J>
rune.j-
P run e di
1
e d
o...Q nı da n k u ra
1
Urct ı l tı l r, r i t ııı " l l1r u lan
R f.: \'a i lesi a l oritnı a l a r ı
k u l !.ın ı l trdk l'ırL·ti lcn kur 1 l lar
·
rab l
o 3 · rc ve douru l u k
.._ı Haıı l < t r ı
i-.,L
l tı h ı .) -l ' te g 1stcri l ın i şt i r [bk;
3 - L J ) J 6 . 3 7 j .ı
id
u "-t
ı
ı
< F, r .-ıı
nk\
ı
(ı
rı
t ı ıı.
ı 1 .! ı · q : , ı, ,.
.
ı l
ı ıı
ınL'
'ı
. ı
ı
ı!L'
ı n ı
ı ı ' L' 1 \:r
1 'rı ı ı:ı
ı ı 'L.
:·ı ıı ı ıı ı-.: ı ı , ıLı:-.
ı
ı ıı ı
ın ,ı ...,ı.
< ) \"
l 'h
ck
• •1 3 u :-ı()n u ç l ır ı
\ cri l ııı i t ir :
or
c ...;. ı p ı L.ı ı ı
1 s a
J '-u ı d a
•
1\1 oıık
ı prob lcıı1i ı ı ıı
·
ı
(lhln
3
· ıcki h i l i lcrc
...
ör
e n•
•
;.u
nt la en az k u r;t l ı L·ı rctcıı <t l o r i t ıııa ı ı ı n
(·-1 . 5 Prune
o
1
d u
ğ
Llg ö
r
Li
Inı
ek
t
L'd
i r
.
r\
n
c'1
k
1
1 b
1
o
-+
·t
ck
i
d
o._
Q
r u
1
u k
l ) J·a n l a r ı ııcı blık ı l d ı {! ı ııd ı h u ı l tH·iıınaıı ı ıı d o üru l u k
.. ... ._)raıı ı ı ı ı n
° o75 . 7
c d d u 0. t ı ve bu orı.ı n ı n d i Q.e r
ı l go r it ı
na l
a
r ı
g u
r c d U Cı k
,) 1
d u
C!
u
...
(irU I nı
ck t
cd
i
r.:\1oıık 1 pruh lcııı i i i ıı cıı
. \U k ck d o 0. ru l u k oran ı
J e
ğ
cr1c ri
C · -1 5
(ıı
o (> ' . :'
ı \ L'R 1·. X (
o o 9 7.
2
.
0 o9 7 .
)0
o
96
.
8
)
a i
Ic"'
i
l l
l)
rı t ıı1 ; ı
L
ı r ı n ,
ı
<. ti tt i
r.
1 3
u a l
o
r i t 111
a 1 arı n
'-kural sa ı ları ' "'c
c · ; 5; ırulll'd ı ı ıı d a k i
J i er
..._
a l g.orit ına L .ı rd,lıı
Çl'K
d ı h .ı d li i ı k t l'ı r. ( ·-1 _- a l or i t ın a s ı
...
3 1
id c
lku ra
1
i
k 11
u 1.)]
•-d
t ) ru l t ı
k
or' ı n ı n a u
lc:i
sı r k
en .
. RE.\·- 1ı l lH· i t nıd -.. ı
1
k u r<l l ı k
0 o07. '
d �.) r u l u k
l)nıı1 ı ıı
<.1u l
tl ıı n ı
' ıı r
( )mc k\ct
ı\'uıc
\ l u ı ı k l \ l n ı ı k \ 1 1 ) i l k 3 / ı Hl ı C: ll -\ 1...''\Pd ı ıı , ' ·
rıc- ' 1
ac-'J ( l l'Spl ı,·c
Pro ı ı Hıı�...·r
IriF !!.ıı ıııı \�...·ı ı
l )f fh.: k\;1\ ı'ı ı
: ( ll ı 1 14ı
() 1) ı ") 1 "7 (ı 1 ı h ı f )i ) -( lt \ ı ( 1() 7 { ) ı c....ı \cı
ı ı .;; 1 '.2 1 2 ' - X .L ı ı ' ı 'fl...
- - ------
-" arakı
c rı ı ık
\n,
-ı s ı--
---l o (ı 6 6 ı () -+ ı u l) 60 5 7.
.ı --- --·--- ---·--·-l\1 n ı d( ) prob lcıııi i ç i n
1{thıı.ı
.ı · t L' k i b i lg i l ere göre en
a; k ura l ürctL'Il a l gl)rit ıııltlar ırası) l a
j-prunedr]])
\ C
( '-! 5
J>rtlltt'r55;
a l or i t nHtlarıd ı r . Tab l o 4 ' teki
h i l g i lcrc g()rc h u a lgnritıı1a ların doğruluk ora n l ar ı
ise
1-
ri/'
Iflll'di
<;
i ll
o o
5
5
.
7 \' l' (,
-1.
5
p1 'l/17ei
ç i
rı oo6
5
. o
'd
ı
r .( ); sa.
N/ -. \'- 1�. ı lg\)rit ıı1 1s ı
78.
RE.Y-Ja lgor i t ınası
83
v
c
R1-:. \'-
3a
1
g
n
r it n
1a
ı
i
sc7
9
ad et k ural ü r
et
nı
i
ş
t
i
r .Kural <-ıay ı ları n ı n el iğer i k i a lgoritınadan yüksek
n l n1asına kar ı l ı k . doğ.nı l u "- oranları
NF.\'- 1i ç i n
(). 7 ')
1
'\'
l. .
n n . _ , .
-
-° :, 7
7 \ ı...'NI-- \- .,
··
·
h _)
ı <; ı n ıse
0 o76.9
.
dur. Bu b i l ı i lcı ...l,ı2nıddtl kural üreten
R I:.
.
\,
tl i lc i (tlgorit ııuı lar ı ıı ı n d P 0 r u l u k t'raıı ların ı n çok daha
\
Li k L· k cJ i d LIQllllll " k' rl l1l'ktcd i r
-
-
....
\1 u ı ı k 3 probk'ııı inı...·
ghrc
L: l l(1/ k u rtı l ı üreten
j-Prunedv e
c ·-1. 5 />rune
a lglH·i t ıı ı t l n ı d ır. Bu a l oritıı1alar
'
tara l ından Lirct i kıı k ural ay ı ları sırası\
·
la
1 3ve
l O . d ir f\ onk3 verı et i n i .
;- Prunt:d0 o90.9 ve
( '-1. 5
fJI'lllll> 0 o9 7 . 2
doğru l u k la s ı n ı fland ı rınışt ır.
RL';.\'- 11 lgor i t nıası ic;c
26
k u ra l i le
0/o93 . 5doğru l u k l a
ı ıı ı lla ııd ırah i l ııı işt i r . H u b i l g i ler. Monk3 p ·ob lenı ı
i i rı
(·-1
5erulll'ttl urıııı ıLı.-.. ı n ı ıı l)k daha i) i bir onu
- - - -- - -- ----') ' 1 7 . ) ) ,., l ı ') 1 - - - -h .... ... .., - - - ----°1o ı g g t ' . ğ ... . ı.z \ \ l h : n l i i l ı ın l cri 1 - n t i t lhü Dl' r i i
ı ()
C i l t .ı
S a \ . ı ' ( )( )()Lıhlo 3. \ l n n k prııhl .:mkrı ı ç ı n elde cdıkıı kural "a ı l a rı
- --\ l ı , r ı ı ı ı ı a \ 1t)ll k ı \ l o n k : \1onk3 -- · -l -l ) ' - ' l O:' ) () l ı "' (1( ) l U -\.. ı .; 111 ll l l L' t) l() ( ı "' 1\uk 3 1 l)7 , , _ J ı - P ı ııııcd 1 :' ı 3 k i \- ı 2 1 7 X ., () . ı .. 1 - .\ -- X3 2 · IZ I · .\ - 79 ">6
I
n dCı
k t i f o gr l..' n ııı e a 1gori t nı a 1 a r ı aras ı n d a e n ıyıd
.ı1.1 rıt ı na1 ar o1
ara C'-ı. 5 a1... gori t lll a1
arı ka b u l cd i 1 d i ğ in d e n....ı -.,() lllt lara gürL'
R I X
a i lesi algoritnı a l a r i l c e l d e ed i lennu laı ın ·uk
I)
i o l d u ğ u rahat l ı k la söy l e n eb i l i r. Çünkü: algori tııı ,1]ar veri len c ğ i t i nı set i n den daha az sayıda
r ı l lar
Lı
ret ınc lde " c test veri 1cr i ne t:ı o öreveı
_. ksekcl
o <r ru b1
ukıııııııd ı sonu \ L' rt ncktcd irler.
1 l o 4. l t'"l \ L'I I
l'tkı ı
k ı t i l a n ı l a ra k cltlc cd ı kıı dn!!n ı l u k ora n l arıl l l iHd ... l ' l lllll' \ l l l i l k ı X 1 ı lO o cı X ) , _ lt )0 11 - .., )" .... ( ll -\ l n n k 2 \ 1 on k ) ( >rtalama ()t) l)()" 1) l) ı 7()"1) Xll X7''o ()l) 7( )11 o l)( ı 3 0° C) xo xoıı o (, { l( )Cl l) l)7 20° Cl 7l> _;o· o
1
.;; 1\Uk\ l} "' ' '" " () () -">( )ll ll l)(1 3 ()O ll X -1 ) ·' _) ... .... oo llll.'d lı' X( ııı ıı \ ı l) 7 2011 " - - 7()0 )) o 76.4011 o l){) {)()O Cl 9] )( )' o 7 ı .-+7' (l / X9. 03 \ 1 \ "' lJ7 -1 ( )0 (\ 7 ' . "'O'% S9 .40°/cı 8 6 . 1 7o/o \- ; l)(ı xıı" cı 7 6 l)( )Ot() l) ı . ()()ll ) t . - _) ) , U o1. 2 . ( ; c .-\'t'k
\'t'
ri
Setleri i l c Pcrfo r n1a n s K a rşı laştı r m adh ll)
2 · d
ck i ' er i leri k u l lanarak. a ! Qoritnıalar '- t arafındanL' ı ' c ri sL' t i i
<;
ı ıı L' ldc cd i lcn d oğru 1 u k oraıı 1 arı Ta b 1o5
' te\ L ı i l ı n i ı i r l hk 1 . 2 9 , ) 0 . 3 5 .3 7 3 8 1 . E l d e e d i len bu d eğerler,
' o
1
cl nQru l u k ... lH·an ları nc1 ... göre s ı ralan d ı k larında en\ Cık L'k d()ğnı l t ı k ()r ı n ı n ı sağ layan a l go ri tnıa o l arak R
EX-' lı lg.\)r i ı n1a ı g()rli l nıcktcd ir. Tablo S ' t c k i koyu ( bo l d )
ı 1
ı l
t1r L' 11 -\ ük �.ıL' k dcğer'--"1
eri '--göster nı e k t e d i r . B u n a ör e ...1
5 R uh·, a h .!L) r i t nı ısı 3 ,C-1. 5Prıii7C!
a l o r i t nıa ı ' ·!DJ
...
l o ı itın ısı
. . ll. 1
a l o r i t nı a ... ı .3 . 1/. A - a l o r i t nıası-L
( 1 ltl l)riı nı ı ı ' . ( '.\'} a l 0.orit n ı a s ı 3 , R L.\'- 1
...__
l ..!oritıııtt�.ıı
ô.
ur·.\ a l or itnıası 4 \ e R f:.\--3 a l orit ıııası... ._
ür n c ktc L'n \ ü - ksc k d oğru l u k o ran 1 a r ı n d a k ura 1...
rı.?l 111 i-.. krd ir. 1
lıhlu ) ' tL·k i (1rnek set l e ri n i n ort a laına doğru luk ._
uran lar ına ör c c n v- ü k ek doY,r u 1 u k ora n ı 0/o8 6 . 9
2
i1
cN F_\-- 1 . i k i n c i en \ üksek doğru l u k oranı ô 8 5 .-+2 i lc R
E)(-.
3.
U
·u
r ı cCı
c11) Li
c k d oğru 1u k oran ı 8 4 .O
7
i1
eC '1\'l
ved
(
)rd
L
ın c ü c11 -\Li
ksc k do ru l u k ora n ı i se t> 8 4 .O
3 i 1 e R E.'(-'l
a 1 uri t111..._ ı.1 sı na ;J i tt iı ..
...
F n d Ct k t i r ( > ü rcn ınl' /\ l un r i t n w l a r ı n ı n K u r; ı l t l rl' l ı n c Y d ııtcıııkri \ C7
L l 'c r l (. ı r ı ı ıa n l a r ı n ı n K c ı r ı l n t ı rı l ı ı w -.; ı .C\
5.
SON UÇLAR
H erhang i b i r prob l e n ı i çözn1ek ı ç ı n kul lan ı lc:ıcak a l gor i t nı a n ı n scç i n ı i çok önenı l i d i r. D i k kat ed i l ecek tenıel
i k i k avranı vard ı r : B i r i n c i i : örnek set ı n ı en ıvı
s ı n ı tl an d ı ra b i len başka h i r i f ıdc i l c doğru l u k ora n ı en y üksek o l a n a l goritnıa n ı n . d i ğeri ise: en ai' a) ıda kural
ü reten a lgori tnıan ı n seç i I nı e - id i r . "ü n k ü büyük bi r örnek
setinden ü ret i len k ural ların çnk
.
ay ıda a l nıasık aç ı n ı l nı azd ı r . B i r örnek ver ı n ı n bu kural lara '-öre
d eğer
1
en d i r i Iere k b i r so n u ç c1
d e e d i1
nı e s i tülll k u ra l ları nve bu k ural larda yer alan şart ların kontrolüne göre yap ı l ı r.
B u n d an do
1
ay ı h ız l ı s o n uçLi
r ct i 1 nıcs i n i ger e kt i r e nd u nını larda k ura l say ı s ı n ı n az o l ınası büyük önenı taşır.
Endükt i f öğrcnnıe alanındaki a l goritn1alar iki fark l ı
yak
1
aş ı nı k u l l ana ra k kura1
y
ıkarnıa iş 1 e nı i n igerçc k l şt irı n cktcd i r. ]( arar ağacı yak l aş ı nı ı ı1ı k u l lanan
a h 2,oritınalar '-;adece b i r karar aQac ına göre kural ...__
ü retnıc lcrin Jcn do layı t ı z l a sayıda k u ral ç ı k nı a s ı n a sebep
o 1 nı ak ta d ı r. B u n u cng c l l c nıe k iç in az ön c nı c sa lı i p o
1
ank u ra l l a r budanıııaktad ır 1 bkz. 3 9 J . Doğrudan kural üreten a
1
gor iı n ı a1
ar is c b i1
g i n i n d e ğ cr in i ö1
çnıcd e n kura1 ü rett i k lc r i n dcn. gerck si1. b i lgi içeren k ura l l arı n ç ı knıasına sebep o l nıaktad ır. CN2, C4 . 5 a i lesi veRE X
ai lesi a l goritıı ı a l arı n ı n öze l l i k le entro p i ö l ç üsüne göre k ural ü retıneler inden dolayı daha ıyı son uçlar ürett i k leri görü l nı e k tcd i r .._
R E X
a i l e s i a lgorit ınalar ı n ı n so n u ç l a r ı d i k kate a l ı nd ı ğ ı nda.ge 1 işt i r i lecek yen i e nd ükt i f öğren nıe a lgoritnı a ları nda s adece aranıa yönteın lerini k u l l a n nıak yerine. b i lgi ö l çüsüııü k u l lannıak ve buna göre kura l lar e lde etıııek a lgori t nı an ı n daha az sayıda kural üretnı esi ve daha
y ü ks e k d oğru l u k oran ı na sa h i