• Sonuç bulunamadı

Bulanık Mantığın Veri Madenciliğine Uygulanması

N/A
N/A
Protected

Academic year: 2021

Share "Bulanık Mantığın Veri Madenciliğine Uygulanması"

Copied!
72
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

İSTANBUL TEKNİ K ÜNİ VERSİ TESİ  FEN Bİ Lİ MLERİ ENSTİ TÜS Ü

BULANI K MANTI ĞI N VERİ MADENCİ LİĞİ NE UYGULAN MASI

YÜKSEK Lİ SANS TEZİ Mat. Müh. Sel ahatti n BOS TANCI

MAYI S 2003

Anabili m Dalı : MÜHENDİ SLİ K Bİ Lİ MLERİ Progra mı : SİSTE M ANALİ Zİ

(2)

ĠSTANBUL TEKNĠ K ÜNĠ VERSĠ TESĠ  FEN BĠ LĠ MLERĠ ENSTĠ TÜS Ü

BULANI K MANTI ĞI N VERĠ MADENCĠ LĠĞĠ NE UYGULAN MASI

YÜKSEK LĠ SANS TEZĠ Mat. Müh. Sel ahatti n BOS TANCI

509011204

MAYI S 2003

Tezi n Enstitüye Veril diği Tari h : 5 Mayı s 2003 Tezi n Savunul duğu Tari h : 28 Mayı s 2003

Tez Danı Ģ manı : Yr d. Doç. Dr. Ali ERCENGĠ Z Di ğer Jüri Üyel eri Doç. Dr. ġaki r KOCABAġ

(3)

ÖNS ÖZ

Tezi mi hazırlarken bana her konuda yar dı mcı ol an ve manevi dest eği ni hi çbir za man esirge meyen sayı n hocam Yr d. Doç. Dr. Ali ERCENGĠ Z‟e;

Beni veri madencili ği konusuna yönl endiren, bil gisi ni ve dest eği ni beni mle her za man payl aĢ mıĢ ol an sayı n hoca m Pr of. Dr. Gazanfer ÜNAL‟ a;

Beni hi çbir za man yal nız bırakmayan ve benim bu nokt aya gel me mde en büyük paya sahi p ol an anne me, baba ma ve abl a ma;

Bu t ezi hazırla ma mda yar dı mları nı benden esirge meyen canı m sevgilim E. Aygül KAYNAK‟ a çok t eĢekkür ederi m.

(4)

Ġ ÇĠ NDEKĠ LER

KI SALT MALAR v

TABLO LĠ STESĠ vi

ġEKĠ L LĠ STESĠ vii

SE MBOL LĠ STESĠ viii

ÖZET i x

SUMMARY x

1. VERĠ MADENCĠ LĠĞĠ 1

1. 1 GiriĢ 1

1. 2 Veri Madencili ği Modell eri 2

1. 2. 1 Sı nıfla ma ve Regresyon Modell eri 3

1. 2. 2 Kü mel e me Modell eri 4

1. 2. 3 Birli kt eli k Kuralları ve Ar dıĢı k Za manlı Ör ünt ül er 4

1. 3 Ör nek Uygul a mal ar 4

1. 4 Met odol oji 6

2. VERĠ MADENCĠ LĠĞĠ NDE BULANI K MANTI K YAKLAġI MI 8

2. 1 GiriĢ 8

2. 2 Bul anı k Kü mel er 10

2. 2. 1 Üyeli k Fonksi yonl arı 11

2. 2. 2 Bul anı k Deği Ģkenl er 16

2. 2. 3 Te mel Bul anı k Küme ĠĢl e mleri 17

2. 2. 4 Bul anı k Kü meni n Özelli kl eri 19

2. 3 Bul anı k Mantı k 19

2. 3. 1 Bul anı k Mantı ğı n Tari hçesi 20

2. 3. 2 Bul anı k Mantı ğı n Özelli kl eri 20

2. 3. 3 Bul anı k Mantı k ile Kl asi k Mantı ğı n Farklılı kları 21

2. 3. 4 Dilsel DeğiĢkenl er 21

3. BULANI K SORGULAMA Ġ LE BĠ LGĠ KEġFĠ 23

3. 1 GiriĢ 23

3. 2 Bul anı k Sor gul a ma 24

(5)

3. 4 Bul anı k Fonksi yonel ve Dereceli Fonksi yonel Bağlılı kl ar 29

3. 4. 1 Bul anı k Fonksi yonel Bağlılı k 30

3. 4. 2 Dereceli Fonksi yonel Bağlılı k 32

3. 4. 3 Bul anı klı k Operat örü 38

4. GELĠ ġTĠ RĠ LEN UYGULAMANI N GENEL YAPI SI 39

4. 1 GiriĢ 39

4. 2 Veritabanl arı 39

4. 2. 1 ġirket Veritabanı 39

4. 2. 2 Borsa veritabanı 41

4. 3 GeliĢtirilen Araç 42

4. 3. 1 Bul anı k Sor gul a ma 43

4. 3. 2 Dilsel Özet 44

4. 3. 3 Bul anı k Fonksi yonel Bağlılı k ve Dereceli Fonksi yonel Bağlılı k 44

4. 3. 4 Yeni Bul anı k Al anl ar Tanı mla mak 45

4. 4 Borsa Veritabanı ndan Üretilen Kurallar 47

4. 4. 1 BFB Kull anılarak Ür etilen Kurallar 47

4. 4. 2 DFB Kull anılarak Ür etilen Kurallar 49

4. 4. 3 Borsa Veritabanı nın Değerl endiril mesi 56

SONUÇLAR VE ÖNERĠ LER 58

KAYNAKLAR 59

EKLER 60

EK A : GELĠ ġTĠ RĠ LEN UYGULAMA 60

(6)

KI SALT MALAR

Ġ MKB : Ġst anbul Menkul Kı y metler Borsası VT : Veri Tabanı

FB : Fonksi yonel Bağlılı k

BFB : Bul anı k Fonksi yonel Bağlılı k DFB : Der eceli Fonksi yonel Bağlılı k

(7)

TABLO LĠ STESĠ

Tabl o 2. 1 Veri Tabanı Teknol ojisi ni n Evri mi . . . 8

Tabl o 3. 1 Ör nek verit abanı . . . 25

Tabl o 3. 2 Uzun boyl u insanl ar sor gusu . . . 25

Tabl o 3. 3 Uzun ve ĢiĢma n i nsanl ar sor gusu . . . 26

Tabl o 3. 4 Uzun boyl u insanl arı n üyeli k derecel eri . . . 27

Tabl o 3. 5 Uzun boyl u ve ĢiĢ man i nsanl arı n üyeli k derecel eri . . . 28

Tabl o 3. 6 Ör nek veri tabanı . . . 31

Tabl o 3. 7 Bul anı k Fonksi yonel Bağlılı k Değerleri . . . 32

Tabl o 3. 8 Ör nek verit abanı . . . 35

(8)

ġEKĠ L LĠ STESĠ

ġekil 1. 1 : Veri madencili ği çalıĢ ması nda kull anılan met odol oji. . . 7

ġekil 2. 1 : 3‟e yakı n sayıl arı n bul anı k kü mel erde farklı göst eri mleri . . . 12

ġekil 2. 2 : (a) Ya muk fonksi yonu ( b) Üçgen fonksi yonu . . . 12

ġekil 2. 3 : Üçgen fonksi yonda (a) Art an yapı (b) Azal an yapı . . . 13

ġekil 2. 4 : Si gmoi d fonksi yonda (a) S yapı (b) Z yapı . . . 14

ġekil 2. 5 :

yapı . . . 15

ġekil 2. 6 : A ve B kü mel eri ni n üyeli k fonksi yonları nda a) BirleĢi mi b) KesiĢi mi . 18 ġekil 2. 7 : Ave A t ümleyen kü mel eri ni n üyeli k fonksi yonl arı ile göst eri mi . . . . 18

ġekil 3. 1 : Bul anı k kavra m ol arak (a) uzun boyl u insanl ar (b) ĢiĢ man i nsanl ar . . 24

ġekil 3. 2 : Çoğu bul anık fonksi yonu . . . 27

ġekil 4. 1 : ġirket veritabanı nı n içerdi ği tabl ol ar . . . 39

ġekil 4. 2 : Ya muk Fonksi yonu . . . 40

ġekil 4. 3 : Bul anı k_T Tabl osunun içeri ği . . . 40

ġekil 4. 4 : Nicel eyi ci Tabl osunun içeri ği . . . 41

ġekil 4. 5 : Kayıtlar Tabl osunun içeri ği . . . 41

ġekil 4. 6 : VTabanı _D Tabl osunun içeri ği . . . 41

ġekil 4. 7 : Hisse Senetleri Tabl osunun i çeri ği. . . 42

ġekil 4. 8 : AçılıĢ Ekranı . . . 42

ġekil 4. 9 : Bul anı k sorgul a ma ekranı . . . 43

ġekil 4. 10 : Dilsel Özet ekranı . . . 44

ġekil 4. 11 : BFB ve DFB ekranı . . . 45

ġekil 4. 12 : Yeni Bul anık Al an Ekl e me . . . 46

(9)

SE MBOL LĠ STESĠ

µ

A : A bul anı k kü mesi ni n üyeli k derecesi

Oi : Verit abanı ndaki her hangi bir nesne Aj : Verit abanı ndaki al anl ar

Oi. Aj : Oi nesnesi ni n Aj alanı ndaki değeri S : Özetl eyi ci

Q : Nicel eyi ci

: Bir kuralı n doğr ul uk değeri

: Bul anı k benzerli k operat ör ü Gi : Der eceli teri m

(10)

ÖZET

BULANI K MANTI ĞI N VERĠ MADENCĠ LĠĞĠ NE UYGULANMAS I

Son yıllarda, veri t abanı siste mleri ni n kull anımı gitti kçe art makt adır. Bu artıĢ beraberi nde pot ansi yel değerli veriler i çerebilecek veri yı ğı nl arı nı yarat mıĢtır. Gel eneksel sor gu veya r aporl a ma araçl arı nı n veri yı ğı nl arı karĢısı nda yet ersi z kal ması, veritabanl arı nda bil gi keĢfi yada veri madencili ği adı altı nda, sürekli ve yeni arayı Ģl ara neden ol makt adır.

Ör ünt ü t anı ma ve sı nıflama pr obl e mleri üzeri nde yoğunl aĢan yapay zeka ve i st atisti k di si pli nl eri ndeki geliĢ meler veri madencili ği ni n t e mell eri ni ol uĢt ur makt adır. Ayrı ca veri madencili ği, uz man si st e mler, veri t abanl arı, maki ne öğreni mi, optimi zasyon, görselleĢtir me, yüksek perfor manslı paral el iĢle mcil er gi bi çeĢitli disi pli n ve teknol ojilerdeki geliĢ mel er den de et kilenmekt edir.

Kl asi k kü mel er üye ol ma ve üye ol ma ma iliĢkisi çerçevesi nde geliĢtiril miĢtir. Bu t ür kü mel erdeki el e manl arı n üyeli kl eri ni ifade edebil mek i çi n 0 veya 1 değerl eri nden biri kull anılırken, bul anı k kü me t eorisi nde bu üyeli k değerl eri 0 il e 1 arası nda deği Ģ mekt edir. Bul anı k kü mel eri n bu özelli ği sayesi nde günl ük hayatta kull anıl an cü ml el eri mat e mati ksel ol arak i fade edebiliriz. Bunun bir sonucu ol arak da veritabanl arı ndan daha esnek sor gul a mal ar yapabiliriz. Ayrı ca yi ne bul anık kü mel eri kull anarak veri t abanları nı n al anl arı arası ndaki iliĢkileri i ncel eyi p kurall ar çı karabiliriz.

Bu t ezde, bul anı k mantık ve bul anı k kü me t eorisi nden yararlanılarak bir uygul a ma geliĢtiril miĢtir. Bu uygul a ma Windows pl atfor munda, Micr osoft Vi sual Basi c 6. 0 ve Mi cr osoft Access kull anılarak yazıl mıĢ ol up, kesi n ol mayan, belirsiz di lsel sor gu cü ml el eri yl e, sıradan veritabanı sist e mleri üzeri nde bul anı k s or gul a ma yapabil mekt edir. Ayrı ca, bu yeni sor gul a ma dili yl e benzer ör ünt ül er aranabilir, bul anı k kurallar çı karılabilir, bul anı k f onksi yonel bağlılı k ve dereceli fonksi yonel bağlılı kl ar hesapl anabilir.

(11)

SUMMARY

APPLI CATI ON OF FUZZY LOGI C ON DATA MI NI NG

In r ecent years, t he use of dat abase s yst e ms has been i ncreasi ng r api dl y. Thi s r ai se has creat ed mount ai ns of dat a t hat cont ai n pot entiall y val uabl e kno wl edge. Because of t he i nsuffi ci ency of conventi onal quer y s yst ems and r eporti ng t ool s agai nst t hese dat a st acks, a ne w fi el d has gr own t o satisfy t hi s need whi ch call ed dat a mi ni ng or kno wl edge di scover y i n dat abases.

The devel op ment i n artifi ci al i nt elli gence and st atisti cs di sci pli nes whi ch beco me dense i n patt er n r ecogni ti on and cl asiffi cati on probl e ms, f or m t he f undame nt al s of dat a mi ni ng. Besi des t hese di sci pli nes, dat a mi ni ng has al so been affect ed by t he devel op ment i n expert s yst e ms, dat a bases, machi ne l ear ni ng, opti mizati on, vi suali zati on and massi vel y parall el pr ocessi ng syst e ms.

Cl assi cal set s have been devel oped wi t h t he r el ation of bei ng a me mber of t he set or not bei ng a me mber of t he set. I n t hese ki nd of sets a val ue of 1 or 0 i s bei ng used t o t o expr ess t he me mbershi p, whil e i n f uzzy set t heor y t hi s me mbership val ue i s bet ween 1 and 0. Thi s propert y of t he f uzzy set s, ma kes easi er t o expr ess dail y used sent ences as mat he mati cal expr essi ons. As a r esult of t hi s pr opert y, we can ma ke mor e fl exi bl e queri es i n dat abases. Al so, wit h t he hel p of f uzzy set t heory, we can easil y fi nd t he rel ati on bet ween t he fi el ds of dat abases and t ur n t he m i nt o rul es. In t hi s t hesi s, a f uzzy t ool has been devel oped by usi ng f uzzy l ogi c and fuzzy set s. Mi cr osoft Vi sual Basi c 6. 0 and Micr osoft Access i s used i n Windo ws pl atfor m f or devel opi ng t hi s appli cati on. Wit h t hi s t ool, we can defi ne i ndefi nit e, uncert ai n li ngui sti c quer y sent ences as queri es i n conventi onal dat abases. Furt her more t hi s ne w quer y l anguage makes i t possi bl e t o search f or patt er ns li ke t ypi cal val ues, f uzzy rul es, fuzzy functi onal dependenci es and gradual functi onal dependenci es.

(12)

1. VERĠ MADENCĠ LĠĞĠ

1. 1 GiriĢ

Günü müzde, t eknol oji nin çok hı zlı bir Ģekil de geliĢ mesi ve fir mal ar arası ndaki rekabeti n sadece kaliteli ür ün üret mekl e sı nırlı kal ma ması nı n bir sonucu ol arak, fir mal ar pi yasada daha i yi bir yer edi nebil mek i çi n müĢt eri me mnuni yeti ni en üst düzeye çı kar mayı hedefle mekt edirler. Bunu yapabil mek i çi n de, bil gisayar siste mleri ni n geç miĢe oranl a çok daha ucuz ve güçl ü ol ması nı n da et ki si yl e bil gisayar siste mleri nden en et ki n bi çi mde faydal an makt adırlar.

Ör neği n eski den süper mar kett eki kasa basit bir topl a ma maki nesi nden i baret ken ve sadece müĢt eri ni n o anda satı n al mıĢ ol duğu mall arı n t opl a mı nı hesapl a mak i çi n kull anılırken, günü müzde kasa yeri ne kull anılan satıĢ nokt ası t er mi nalleri sayesi nde bu hareketleri n büt ün det ayl arı sakl anabil mekt edir. Sakl anan bu bi nl erce malı n ve bi nl erce müĢt eri ni n hareket bil gileri sayesi nde her malı n za man i çi ndeki hareketleri ve eğer müĢt eriler bir müĢt eri nu marası il e kodl anmıĢsa bir müĢt erini n za man içi ndeki verileri ne ul aĢ mak ve analiz et mek de ol ası hal e gel miĢtir.

Bu analizl eri n sonucu ol arak her mal i çi n bir sonraki ayı n satıĢ t ah mi nl eri çı karılabilir; müĢt eriler satı n al dı kl arı mall ara bağlı ol arak gr upl anabilir; yeni bir ür ün i çi n pot ansi yel müĢteriler belirlenebilir; müĢterileri n za man i çi ndeki hareketleri i ncel enerek onl arı n davranıĢl arı ile il gili t ahmi nler yapıl abilir. Bi nl erce malı n ve müĢt eri ni n ol abileceği düĢünül ürse bu anali zin ell e ve gözl e yapıla mayacağı, ot omati k ol arak yapıl ması nı n gerekti ği ort aya çık makt adır. Veri madencili ği burada devreye girer. Veri madencili ği, büyük mi kt arda veri i çi nden gel ecekl e ilgili t ah mi n yapabil meyi sağl ayacak bağı ntı ve kuralları n bil gisayar pr ogra mları kull anarak aranması dır.

Veri madencili ği, astrono mi, bi yol oji, fi nans, pazarla ma, si gort a, tı p ve bi rçok baĢka dal da uygul anmakt adır. Son 20 yıl dır Ameri ka Bi rl eĢi k Devl etleri‟nde çeĢitli veri

(13)

ma dencili ği al gorit mal arı nı n gi zli di nl e meden, ver gi kaçakçılı kl arı nın ort aya çı kartıl ması na kadar çeĢitli uygul a mal arda kull anıldı ğı bili nmekt edir.

Bununl a birli kt e günü müzde veri madencili ği t ekni kl eri özelli kl e i Ģl et mel er de çeĢitli al anl arda baĢarı il e kull anıl makt adır. Bu uygul a mal arı n baĢlıcal arı il gili alanl ara göre özetl enmiĢtir.

Paz arl ama

MüĢt erileri n satı n al ma örünt ül eri ni n belirlenmesi,

MüĢt erileri n de mografi k özelli kl eri arası ndaki bağlantıları n bul un ması,

Post a ka mpanyal arı nda cevap ver me oranı nı n artırıl ması,

Me vcut müĢt erileri n el de tut ul ması, yeni müĢt erileri n kazanıl ması,

Pazar sepeti anali zi ( Market Basket Anal ysis)

MüĢt eri iliĢkileri yöneti mi ( Cust omer Rel ati onshi p Manage ment)

MüĢt eri değerl endir me (Cust omer Val ue Anal ysis)

SatıĢ Tah mi ni (Sal es Forecasti ng). Bankacılık

Far klı fi nansal göst ergel er arası nda gi zli korel asyonl arı n bul un ması,

Kr edi kartı dol andırıcılı kları nı n tespiti,

Kr edi kartı harca mal arı na göre müĢt eri grupl arı nın belirlenmesi,

 Kr edi talepl eri ni n değerlendiril mesi. Si gort acılık

Yeni poliçe talep edecek müĢt erileri n tahmi n edilmesi,

Si gort a dol andırıcılı kl arını n tespiti,

 Ri skli müĢt eri örünt ül erini n belirlenmesi.

1. 2 Veri Madencili ği Modell eri

Veri madencili ği nde kul lanılan modell er, t ahmi n edi ci ( Predi ctive) ve t anı mlayı cı ( Descri pti ve) ol mak üzere i ki ana baĢlı k altı nda i ncel en mekt edir.

(14)

Tah mi n edi ci modell erde, sonuçl arı bili nen verilerden hareket edil erek bir model geliĢtiril mesi ve kur ul an bu model den yararlanıl arak sonuçl arı bili nme yen veri kü mel eri i çi n sonuç değerleri n t ahmi n edil mesi amaçl an makt adır. Ör neğin bir banka önceki döne ml er de ver miĢ ol duğu kredil ere iliĢkin gerekli t üm verilere sahi p ol abilir. Bu verilerde bağı msı z deği Ģkenl er kredi al an müĢteri ni n özelli kl eri, bağı mlı deği Ģken değeri ise kredi ni n geri ödeni p öden medi ği dir. Bu verilere uygun ol arak kur ul an model, daha sonraki kredi t al epl eri nde müĢt eri özelli kl eri ne göre verilecek ol an kredi ni n geri ödeni p öden meyeceği ni n tahmi ni nde kullanıl makt adır.

Tanı mlayı cı modell erde i se karar ver meye rehberli k et mede kull anılabilecek mevcut verilerdeki ör ünt ül eri n t anı mlan ması sağl anmakt adır. X/ Y aralı ğı nda geliri ve i ki veya daha fazl a arabası ol an çocukl u ail el er ile, çocuğu ol mayan ve geliri X/ Y aralı ğı ndan düĢük ol an ail el eri n satı n al ma örünt ül eri ni n birbirleri ne benzerli k göst erdi ği ni n belirlenmesi tanı mlayı cı modell ere bir örnektir.

Veri madencili ği modelleri ni gördükl eri iĢlevl ere göre,

Sı nıfla ma ( Cl assificati on) ve Regresyon ( Regression),

Kü mel e me ( Cl ust eri ng),

Bi rli kt eli k Kur alları ( Associ ati on Rul es) ve Ar dı Ģı k Za manlı Ör ünt ül er (Sequenti al Patt erns),

ol mak üzere üç ana baĢlı k altı nda i ncel e mek mü mkündür. Sı nıfla ma ve r egresyon modell eri t ahmi n edi ci, kü mel e me, birli kt eli k kuralları ve ar dıĢı k za manlı ör ünt ü modell eri tanı mlayı cı modellerdir.

1. 2. 1 Sı nıfl ama ve Regresyon Modell eri

Me vcut verilerden hareket ederek gel eceği n t ahmi n edil mesi nde faydal anılan ve veri ma dencili ği t ekni kl eri içerisi nde en yaygı n kullanı ma sahi p ol an sı nıfla ma ve regresyon modell eri arası ndaki t e mel fark, tah mi n edil en bağı mlı deği Ģkeni n kat egori k veya süreklilik göst eren bir değere sahi p ol ması dır. Ancak çok t eri mli l ojisti k r egresyon ( multi nomi al l ogi sti c regressi on) gi bi kat egori k değerl eri n de tahmi n edil mesi ne ol anak sağl ayan t ekni kl erle, her i ki model gi derek bi r biri ne yakl aĢ makt a ve bunun bir sonucu ol arak aynı t ekni kl erden yararlanıl ması mü mkün ol makt adır. Sı nıfla ma ve regresyon modelleri nde kull anılan baĢlıca tekni kl er,

(15)

Yapay Si nir Ağl arı ( Artifici al Neural Net works),

Ge neti k Al gorit mal ar ( Geneti c Al gorit hms), K- En Yakı n Ko mĢ u ( K-Nearest Nei ghbor),

 Nai ve- Bayes.

1. 2. 2 Kü mel e me Modelleri

Kü mel e me modell eri nde a maç, üyel eri ni n bi rbirleri ne çok benzediği, ancak özelli kl eri ni n birbiri nden çok farklı ol duğu kü mel eri n bul un ması ve veri t abanı ndaki kayıtları n bu f arklı kü mel ere böl ün mesi dir. BaĢlangı ç aĢa ması nda veri tabanı ndaki kayıtları n hangi kü mel ere ayrılacağı veya kü mel eme ni n hangi deği Ģken özelli kl eri ne göre yapıl acağı bili nmeme kt e, konunun uz manı ol an bir ki Ģi t arafı ndan nel er ol acağı tah mi n edil mekt edir.

1. 2. 3 Bi rli kteli k Kurall arı ve Ardı Ģı k Za manlı Ör ünt ül er

Bi r alıĢveriĢ sırası nda veya birbiri ni i zl eyen alıĢveriĢl erde müĢt eri ni n hangi mal veya hi z metl eri satı n al maya eğili mli ol duğunun belirl en mesi, müĢt eri ye daha f azl a ür ünün satıl ması nı sağl a ma yoll arı ndan biri dir. Satı n al ma eği li mleri ni n tanı mlan ması nı sağl ayan birli kt eli k kuralları ve ardıĢı k za manlı ör ünt ül er, pazarl a ma a maçlı ol arak pazar sepeti analizi adı altı nda veri madencili ği nde yaygı n ol arak kull anıl makt adır. Bununla birli kt e bu t ekni kl er tı p, fi nans ve farklı ol ayl arı n birbirleri ile iliĢkili ol duğunun belirlenmesi sonucunda değerli bil gi kazanı mı nı n söz konusu ol duğu orta mlarda da öne m t aĢı makt adır.

1. 3 Örnek Uygul a mal ar

Yukarı da anl atılan modellerde kull anılan t eknikl eri n bir kı s mı il e il gili ör nekl er aĢağı da veril miĢtir.

 BAĞI NTI: “Çocuk bezi al an müĢt erileri n %30‟ u bira da satı n alır.”

Sepet anali zi nde müĢt erileri n beraber satı n al dı ğı mall arı n anali zi yapılır. Bur adaki a maç mall ar arası ndaki pozitif veya negatif korel asyonl arı bul maktır. Çocuk bezi al an müĢt erileri n ma ma da satı n al acağı nı veya bira satı n al anl arı n ci ps de al acağı nı tahmi n edebiliriz. Ama sadece ot omati k bir anali z büt ün ol asılı kl arı gözönüne alır ve kol ay düĢünül meyecek, örneği n çocuk bezi ve bira arası ndaki bağı ntıları da bul ur.

(16)

 SI NI FLANDI RMA: “ Genç kadı nl ar küçük araba satı n alır, yaĢlı, zengi n er kekl er büyük, l üks araba satı n alır.”

Amaç bir malı n özelli kleri ile müĢt eri özelli kl eri ni eĢl e mektir. Böyl ece bir müĢt eri içi n i deal ür ün veya bi r ür ün i çi n i deal müĢt eri pr ofili çı karılabilir. Örneği n bir ot omobil $ Ģirketi geç mi Ģ müĢt eri hareketl eri ni n anali zi il e yukarı daki gi bi i ki kural bul ursa; genç kadı nl arın okuduğu bir der gi ye r ekl a m verirken, küçük modelli arabal arı nı bu dergi ye koy mayı terci h edecektir.

 REGRESYON: “Ev sahi bi ol an, evli, aynı i Ģ yeri nde beĢ yıl dan fazl adır çalıĢan, geç miĢ kredilerinde geç öde mesi bir ayı geç me mi Ģ bir er keği n kredi skor u 825‟ dir. ”

BaĢvur u skorl a mada ( appli cati on scori ng) bir fi nans kur umuna kredi i çi n baĢvuran ki Ģi ile il gili fi nansal güvenilirli ği ni notl ayan örneği n 0 il e 1000 arası nda bir skor hesapl anır. Bu skor ki Ģini n özelli kl eri ne ve geçmi Ģ kredi hareketleri ne dayanıl arak hesapl anır.

 ZAMAN Ġ ÇĠ NDE SI RALI ÖRÜNTÜLER: “Ġl k üç t aksiti nden i ki veya daha fazl ası nı geç öde miĢ ol an müĢt eriler %60 ol asılı kla kanuni taki be gi di yor. ” DavranıĢ skor u ( behavi oral score), baĢvur u skorundan farklı ol arak kredi al mıĢ ve taksitleri ödeyen bir kiĢi ni n s onraki t aksitlerini öde me/ geci ktir me davranıĢı nı notl a mayı a maçl ar.

 BENZER ZAMAN SI RALARI: “ X Ģirketi ni n hi sse fi yatları ile Y Ģirketini n hi sse fi yatları benzer hareket edi yor. ”

Amaç za man i çi ndeki i ki hareket serisi arası nda bağı ntı kur maktır. Bunl ar i ki malı n za man i çi ndeki satıĢ mi ktarları ol abilir. Ör neği n dondur ma satıĢları ile kola satıĢları arası nda pozitif, dondurma satıĢları ile sahl ep satıĢları arası nda negatif bir bağı ntı bekl enebilir.

 Ġ STĠ SNALAR ( FARK SAPTANMASI): “ Nor mal den farklı davranı Ģ göst eren müĢt erileri m var mı?”

Amaç önceki uygul a maları n aksi ne kural bul mak değil, kural a uy mayan i stisnai hareketleri bul maktır. Bu da ol ası saht ekarlı kl arı n sapt anması nı (fraud det ecti on) sağl ayabilir. Ör neği n Vi sa kredi kartı i çi n yapıl an CRI S sist e mi nde, bir yapay si nir ağı kredi kartı hareketl eri ni t aki p eder ve müĢt eri ni n nor mal davranıĢı na uy mayan

(17)

hareketler gözl edi ği nde müĢt eri ni n bankası ile t e masa geçerek müĢteri onayı ist eyebilir.

 DÖKÜMAN MADENCĠ LĠ ĞĠ: “ ArĢi vi mde ( veya i nt ernet üzeri nde) bu dökü mana benzer hangi dökü manl ar var?”

Amaç dökü manl ar arası nda ayrı ca elle bir t asnif gerek meden benzerli k hesapl ayabil mektir (t ext mi ni ng). Bu genel de ot o mati k ol arak çı karılan anaht ar sözcükl eri n tekrar sayısı sayesi nde yapılır.

1. 4 Met odol oji

Bi r veri madencili ği çalıĢ ması nda kull anıl an met odol oji ġekil 1. 1‟ de veril miĢtir. St andart f or m i çi nde verilen veri, öğren me ve dene me ol mak üzere i ki ye ayrılır. Her uygul a mada kull anılabilecek birden çok t ekni k var dır ve önceden hangi si ni n en baĢarılı ol acağı nı kestirme k ol ası değil dir. Bu yüzden öğren me kü mesi üzeri nde L deği Ģi k t ekni k kull anılarak L t ane model ol uĢt urul ur. Sonra bu L model dene me kü mesi üzeri nde denenerek en baĢarılı ol anı, yani dene me kü mesi üzeri ndeki t ah mi n baĢarısı en yüksek ol anı seçilir.

Eğer bu en i yi model yet eri nce baĢarılı ysa kull anılır, aksi t akdirde baĢa dönül erek çalıĢ ma t ekrarlanır. Tekrar sırası nda baĢarısız ol an ör nekl er i ncel enerek bunl ar üzeri ndeki baĢarı nı n nasıl arttırılabileceği araĢtırılır. Ör neği n st andart f or ma yeni al anl ar ekl eyer ek pr ogr ama veril en bil gi arttırılabilir; veya ol an bil gi deği Ģi k bi r Ģekil de kodl anabilir; veya a maç daha değiĢi k bir Ģekil de tanı mlanabilir.

(18)

ġekil 1. 1 : Veri madencili ği çalıĢ ması nda kull anılan met odol oji. Ġl k St andar d For m De ne me kü mesi Öğr en me kü mesi Mo del 1 Mo del 2 Mo del L En i yi yi seç Ol ası modelleri öğrenme kü mesi üst ünde eğit

Yet eri nce i yi ise kabul et

(19)

2. VERĠ MADENCĠ LĠĞĠ NDE BULANI K MANTI K YAKLAġI MI

2. 1 GiriĢ

Veri t abanı siste mleri, oluĢu ml arı ndan beri pek çok konuya baĢlı k ol muĢ ve pek çok teknol oji ni n geliĢ mesi ne sebep ol muĢt ur. 1970‟li yıllarda veritabanları sadece kayıtları mızı t ut maya ve onl ardan basit raporl ar al abil me mi ze yararken, günü müzde teknol oji ni n de geliĢ mesi yl e çok daha det aylı sorgul ara cevapl ar al abileceği miz, gel ecek hakkı nda bi ze fikirler verebilecek sist e mler hali ne dönüĢ müĢl erdir. Tabl o 2. 1 de bu t eknol oji k evri m daha det aylı bir Ģekil de göst eril mekt edir.

Tabl o 2. 1 Veri Tabanı Teknol ojisi ni n Evri mi

Evri msel Adı m Ör nek ĠĢlet me Sorus u Ol anak Sağl ayan Te knol oji Ür ün Sunan Fi r mal ar Özelli kl er Veri Topl a ma (1970)

Son 5 yıl daki geliri m ne kadar?

Veri Tabanı I BM St ati k yapı, geri ye

bak mayı sağlı yor.

Veri EriĢi mi (1980)

Geçen yıl mart ayı nda satıĢları m ne

ol du? ĠliĢkisel Veri Tabanl arı, SQL Or acl e, Mi cr osoft, Inf or mi x Di na mi k yapı, kayıt sevi yesi nde

veri ye eriĢi m. Veri Ambarı (1995) Son üç ayda Ankara‟ daki X mağaza mda Y ür ününden ne kadar sat mıĢı m?

OLAP I BM, Cognos Det aylı sor gul a ma,

geç miĢe ve Ģi mdi ki za mana

dönük.

Veri Madencili ği Gel ecekt e Ankara‟ daki satıĢları m ne kadar

ol acak?

Ġleri al gorit mal ar, ist atisti k, yapay

zeka

I BM, SPSS Veriler arası ndaki

gi zli benzerli kl eri n keĢfi.

(20)

Bur ada di kkat edil mesi gereken Ģey, ist er veritabanı ndan çok basit bit sor gu yapar ken, i st er de bir OLAP ( Onli ne Anal yti cal Pr ocess) aracı il e çok kar maĢı k bi r sorgul a ma yapar ken, yapılan büt ün sorgul a mal arın kesi n ve katı kurallar içer mesi dir. Fakat günl ük hayatı mızda kur duğu muz cü ml el ere di kkat edilirse, böyl e kesi n ve katı kurallar yada kararlar yokt ur. Bunl ar yeri ne daha çok belirsizli k i çeren cü ml el er var dır. Mesel a, bir basket bol koçu t akı mı na oyuncu seçer ken uzun boyl u i nsanl arı seç mek i st eyecektir. Fakat oyuncul arı n kayıtları bil gisayar da t ut ul uyorsa ve veritabanı ndan oyuncular seçilecekse yapıl acak SQL sor gusu katı kurall ar içerecektir. Yapıl abilecek sor gu boyu 1. 9m‟ den uzun oyuncul arı gör ünt üle gi bi bir sorgu ol acaktır. Bu duru mda da 1. 89 m yada 1. 88m boyunda ol anl ar sor gul a ma sonucunda gör ünt ül enmeyecektir. Böyl ece bel ki de çok i yi oyuncul ar basket bol koçunun gözünden kaçabil ecektir. Bunun yeri ne bul anı k mantı k ve bul anık kü mel eri kull anarak, veritabanı ndan uzun boyl u i nsanl arı göst er di ye bir sor gu yapılırsa büt ün her kes üyeli k derecel eri sırası yl a koçun karĢısı na çı kacaktır ve böyl ece de koç takı mına oyuncu seçerken daha az hat a yapmıĢ olacaktır.

Gör ül düğü gi bi i nsan dili belirsizli kl er i çer mektedir. Belirsizli ğe, ist enme yen bir dur u m anl ayı Ģı yl a yakl aĢ mak yeri ne, büyük bir fayda al anı açan ve üzeri nde çalıĢıl ması gereken öne mli bir durum anl ayıĢı yl a yakl aĢ mak daha doğr udur.

Yukarı daki basket bol örneği nde de ol duğu gi bi sor gul a mal ara belirsizliği kat arak veritabanl arı ndan bul anık sor gul a mal ar yap mak daha i yi sonuçl ar verir. Bununl a birli kt e, sadece bul anı k sor gul a ma yapar ken değil, veritabanl arı ndan bil gi keĢfi yapar ken yada al anl ar arası ndaki iliĢkiler i ncel enirken de bul anı k mantık et kili bir bi çi mde kullanılabilir.

Bu çalıĢ mada, bul anı k mantı k ve bul anı k kü me t eorisi nden yararlanılarak, Wi ndo ws pl atfor munda, Micr osoft Vi sual Basi c 6. 0 ve Micr osoft Access kull anıl arak geliĢtiril miĢ, kesi n ol mayan, belirsiz dilsel sor gu cü ml el eri yl e, sıradan veritabanı siste mleri üzeri nde bulanı k sor gul a ma yapabil en, veritabanl arı ndan kurall ar çı karabilen ve veritabanl arı nı n al anl arı arası ndaki iliĢkileri i ncel eyen bir araç ol uĢt urul muĢt ur.

Pr ogra mı n son kı s mı nda bahsedil en ve al anl ar arası ndaki iliĢkileri bul anı k ma ntı k ve bul anı k kü me t eorisi ne göre i ncel eyen böl ümde örnek veritabanı ol arak ĠMKB‟ deki (Ġstanbul Menkul Kı y metler Borsa) hi sse senetleri ni n günl ük kapanıĢ değerl eri

(21)

kull anıl mıĢtır. Bu uygul ama nı n sonucu ol arak; “X hi sse senedi ni n fi yatı art arken, Y hi sse senedi ni n de fi yatı artar” yada “ X hi sse senedi il e Y hi sse senedi ni n hareketleri arası nda %80‟li k bir benzerli k vardır” gi bi kurallar üretilebil mekt edir.

Pr ogra mı n yapı sı, iĢleyi Ģi ve ör nek uygul amal ar Böl üm 4‟t e ayrı ntıları il e açı kl anacaktır.

2. 2 Bul anı k Kü mel er

Bul anı k kü me kavra mını anl ayabil mek i çi n kl asi k anl a mdaki kü me kavra mı nı n, eli mizdeki bil gileri n değerl endiril mesi nde yet ersi z kal dı ğı yerl er üzerinde biraz düĢün me mi z yet erli dir. Bi r ör nek ver mek gerekirse, X   ol sun ve X sıfıra yakı n reel sayıl arı n kü mesi ni göst ersi n. Kl asi k küme t anı mından yol a çı ktı ğı mızda her hangi bir at a ma değeri ni, kü meye ait ol ma ya da ol ma ma özelli ği olarak t espit edi p, bu aralı kt aki büt ün sayıları X‟i n el e manı, dıĢı ndakil eri de X‟i n el ema nı değil Ģekli nde nit el endir me dur umundayı z. Sor un bu değeri n nasıl belirleneceği nden zi yade belirlendi kt en sonra, belirlenen değeri n çok yakı nı ndaki sayıl ara haksı zlı k yapıl dı ğı konusundaki itirazl ar ol acaktır. Yani 2 atl a ma değeri ol arak seçilirse

2. 001 ni ye kü meni n ele manı ol ması n. Bu aynı za manda kü meni n yet eri nce i yi tanı mlan ma ması anl a mı na da gel mekt edir.ĠĢte bu ti p sor unl arı ort adan kal dırabil mek içi n bul anı k kü me t eorisi kull anılabilir.

Kl asi k kü mel er üye ol ma ve üye ol ma ma iliĢkisi çerçevesi nde geliĢtiril miĢtir. Bu t ür kü mel eri ifade et mek i çi n özel bir f onksi yon t anı mlanabilir ve bu fonksi yona karakt eristi k f onksi yon denilir. Kar akt eristi k f onksi yon her bir el e mana 1 ve 0 değerl eri nden biri ni üyeli k dur umuna göre atayarak evrensel kü me üzeri nde tanı mlanan ve bi zi m ilgil endi ği miz özelli ğe sahi p ol an el e manl arı n ol uĢt ur duğu kü meyi belirler.

Ör neği n; X evrensel kümesi üzeri nde belirli bir özelli ği t aĢı yan el e manl arı ayırarak ol uĢt urduğu muz A kü mesi ni karakt eristi k fonksi yon yardı mıyl a, x  X i çi n;

A x 0, A x 1, ) (       x XA (2, 1)

verilir. Fonksi yon A kümesi ne ait el e manl ara 1 değeri ni, ait ol mayan el ema nl ara i se 0 değeri ni ata makt adır.

(22)

Bu f onksi yon evrensel kü meni n el e manl arı na belirli bir aralı kt a ol mak üzere ve gözl e m altı ndaki kü meni n el e manl arı nı n üyeli k derecel eri ni ifade edecek bi çi mde genell eĢtirilebilir. Daha yüksek değerl er üyeli k derecesi ni n yüksekli ği ni göst erir. Bu fonksi yona üyeli k f onksiyonu ve bu f onksi yonun ol uĢt urduğu kü meye bul anı k kü me denir.

X boĢ ol mayan bir kü me ol sun. X‟ deki bir Bul anık A kü mesi  xX i çi n; A: X  [0, 1] f onksi yonu il e verilir. A ya bul anı k kü me ye karĢılı k gel en üyeli k f onksi yonu adı verilir. Bul anı k A kü mesi i se X deki her ele manı n üyeli k derecesi yle birli kt e ol uĢt urduğu kü medir. x‟i n A ya ait ol ma veya üyeli k derecesi A(x) ol arak okunur.(

µ

A ol arak da gösterilebilir)

Üyeli k f onksi yonunun değer aralı ğı i çi n yaygı n ol arak [ 0, 1] aralı ğı kul lanılır. Bu dur umda, her üyeli k fonksi yonu bir kl asi k evrensel kü meni n el e manl arı nı bu aralı kt aki bir sayı ya karĢılı k getiren bir fonksi yondur.

Bul anı k küme kavra mı nın te msili içi n genel ol arak;

µ

A: X  [ 0, 1] (2, 2)

göst eri mi kullanılır.

Bul anı k kü mel er daha önce de ifade edil di ği üzere doğal dil deki belirsiz ve bul anı k kavra mları t e msil et me mize ve onl arı mat e mati ksel ol arak ifade et me mi zi mü mkün kıl arlar. Bu t e msil iĢl emi sadece kavra mı n kendi si ne değil kavra mı n kull anıl dı ğı al ana da bağlı dır. Ör neği n; “yüksek ı sı ” kavra mı hava ol ayl arı i çi n kull anıl dı ğı nda ol uĢt urul acak bul anı k kü meyl e, bir nükl eer reakt ör i çi ndeki ısı yı ifade et mede kull anıl dı ğı nda ol uĢt urulacak bul anı k kü meni n birbiri nden t a ma mı yl a farklı ol ması gerekti ği açı ktır. Hatt a aynı al an i çerisi nde ki aynı kavra mı n farklı bul anı k kü mel erl e ifade edil ebileceği dur uml arı n ol ması i mkan dahili ndedir. Fakat, böyl esi dur u ml ar da bu farklı kümel eri n bazı te mel niteli kl er bakı mı ndan birbiri ne benze mesi gerekir. 2. 2. 1 Üyeli k Fonksi yonl arı

Üyeli k f onksi yonl arı bir çok farklı Ģekillerde ol abilir. Özel bir Ģekli n uygun ol up ol mayacağı nı t espit et mek çalıĢıl an uygul a ma al anı t arafı ndan el de edil en veril erl e belirlenir. Fakat, birçok uygul a ma bu t ür Ģekil değiĢi kli kl eri ne karĢı çok f azl a duyarlılı k göst er mezl er. Hesapl a ma açısı ndan getirdi ği kol aylı kl ar göz önüne

(23)

alı narak i st enilen Ģekil de üyeli k f onksi yonunun seçil mesi, bul anı k kü me t eorisi ni n esnekli ği ni yansıt ması nda öne çı kan bir dur umdur. Çoğu dur u mda, üçgen ve ya muk üyeli k fonksi yonl arı iĢi mizi görecek niteli kl ere sahi ptir.

(a) (b)

ġekil 2. 1 : 3‟e yakı n sayıl arı n bul anı k kü mel erde farklı göst eri mleri

ġekil 2. 1‟de, “3 e yakı n reel sayılar kü mesi” kavra mı nı t e msil eden üyeli k fonksi yonuna ait i ki örnek var dır. Açı kça görül mekt edir ki bul anı k kü mel eri n kull anıĢlılı ğı büyük oranda bi zi m, farklı kavra ml ara uygun üyeli k derecesi fonksi yonl arı nı ol uĢt urabil me beceri mize dayan makt adır. AĢağı da bazı çok kull anılan f onksi yon tipl eri ve bunl arı n analiti k ol arak nasıl hesaplanabil eceği göst eril miĢtir.

(a) (b)

ġekil 2. 2 : (a) Ya muk fonksi yonu ( b) Üçgen fonksi yonu

0 1 2 3 4 5 6 0 1 2 3 4 5 6

A B C D A B C

1 1

(24)

0 ; x < A x- A B- A ; A  x < B 1 ; B  x  C (2, 3) Ya muk( x; A, B, C) : D- x D- C ; C  x < D 0 ; x  D 0 ; x < A x- A B- A ; A  x < B Üçgen( x; A, B, C) : 1 ; x = B (2, 4) D- x D- C ; C  x < D 0 ; x  D

Ya muk ve üçgen yapı daki üyeli k f onksi yonl arı nın f or müll eri sırası yl a ( 2,3) ve ( 2, 4), Ģekilleri ise ġekil 2. 2‟de göst eril miĢtir. Ya muk yada üçgen yapı dan sadece art an yada sadece azal an yapılarda geliĢtirilebilir. Bu yapılar ġekil 2. 3‟de göst eril miĢtir.

(a) (b)

ġekil 2. 3 : Üçgen fonksi yonda (a) Art an yapı (b) Azal an yapı A B 1 0 A B 1 0

(25)

0 ; x < A x- A B- A ; A  x < B ( 2, 5) LS( x; A, B) : 1 ; x  B 1 ; x < A B- x B- A ; A  x < B (2, 6) LZ( x; A, B) : 0 ; x  B

Bi r baĢka çok kull anılan f onksi yon ti pi de si gmoi d f onksi yon ti pi dir. Si g moi d fonksi yonda S yapı ve Z yapı ġekil 2. 4‟de, hesapla mal arı ise sırası yl a ( 2,7) ve ( 2, 8) de göst eril miĢtir. Bir baĢka si gmoi d f onksi yon ti pi ol an

yapı ġekil 2. 5‟ de, hesapl anması ise (2, 9) da göst eril miĢtir.

(a) (b)

ġekil 2. 4 : Si gmoi d fonksi yonda (a) S yapı (b) Z yapı

0 ; x  A 2*(x- A B- A )2 ; A < x  ( A+B)/ 2 (2, 7) S( x; A, B) : 1 - 2*(x- B B- A )2 ; ( A+B)/ 2 < x  B 1 ; x > B A B A B 1 0 1 0

(26)

1 ; x  A 1 - 2*(B- Ax- A )2 ; A < x  ( A+B)/ 2 (2, 8) Z( x; A, B) : 2*(B- Ax- B )2 ; ( A+B)/ 2 < x  B 0 ; x > B ġekil 2. 5 :

yapı S( x; A, B) ; x < B

( x; A, B, C, D) : 1 ; B < x  C (2, 9) Z( x; C, D) ; x > C

Yukarı da göst erilen büt ün f onksi yon ti pl eri ve bunl arla ol uĢt urul abilecek bul anı k kü mel er sonsuz el e mana sahi ptirler. Fakat bazı dur uml ar da bul anı k kü mel er sonl u el e mana da sahi p ol abilirler. Bu dur umda bu kümel er Ģu Ģekil de ifade edilebilirler:

A B C D 1

(27)

Ör nek ol arak uzun boyl u i nsanl arı bir sonl u bul anı k kü me ol arak Ģu Ģekil de de ifade edebiliri z:

Uz un boyl u i nsanl ar = { 0 / 160 + 0. 2 / 165 + 0. 5 / 175 + 0. 8 / 185 + 1 / 190 }

El e manl arla üyeli k derecel eri arası ndaki böl üm i Ģareti ve t opl a ma i Ģareti gerçek kull anı mındaki anl a mı nda değil dir. Sadece el e manl ar arası iliĢkileri ve ele manl arl a üyeli k derecesi arası ndaki iliĢki yi ort aya koy mak i çi n kull anılırlar. Yukarı daki ör nek içi n 165c m boyundaki i nsanl ar kü meye 0. 2 üyeli k derecesi yl e dahil edilirken, 185c m boyundaki i nsanl ar kü meye 0. 8 üyeli k derecesi yle dahil edilirler. Fakat kü me sonl u sayı da el a mana sahi p ol duğu i çi n kü meye ait ol mayan boy uzunl ukl arını n üyeli k derecel eri 0 ol ur. Yani 188c m yada 202c m boyundaki i nsanl ar kü meye ait ol madı kl arı içi n üyeli k derecel eri 0‟dır.

2. 2. 2 Bul anı k DeğiĢkenl er

Günl ük kull anı m dili ne ait ol an düĢük, ort a sevi ye, yüksek ve bunun gi bi kavra ml arı te msil eden çeĢitli bul anık kü mel er bir deği Ģkeni n dur u ml arı nı t anı mla mak a macı yl a kull anılırlar. Bu değiĢkenlere bul anı k değiĢkenl er ve onun alt dur uml arı na da bul anı k teri mler denilir. Ör neği n “ı sı ” kavra mı kendi i çinde çok düĢük, düĢük, orta sevi ye, yüksek ve çok yüksek gi bi dur uml arla nit el enebil en bul anı k bir deği Ģken ol arak alı nabilir.

Bul anı k değiĢkenl eri n öne mi kavra ma ait bu dur uml ar arası ndaki geçi Ģi yansıtabil mesi ndeki kolaylı kt a yat ar. Bu dur umda da belirsizli k altı nda yapıl an yönt e m ve öl çü ml erle ilgil enme ve onl arı ifade et me de di ğer yönt e mlerden daha baĢarılı sonuçl ar verir. Gel eneksel kl asi k deği Ģkenl er i se bu kapasit eden yoksundurl ar. Bir dur umun kl asi k deği Ģkenl er yardı mı yl a t anı mlan ması mate mati ksel ol arak doğr u ol duğu hal de, kaçı nıl maz öl çüm hat al arı i çerdi ği nden gerçeğe uygunl uk göst ere mez. Bu Ģekil de t anı mlan mıĢ dur u ml arı n arası nda ki sı nırl arı n ci varı ndaki değerl er i çi n yapıl acak bir öl çüm, sadece dur u ml arı n biri ni dest ekl edi ği bir gözl e m ol arak al gılanır. Böyl esi bir karar kaçınıl maz ol arak belirsizli k içerse dahi mat e mati ksel t anı mla mal ar ve hesapl a mal ar buna göre yapılır. Her hangi bi r öl çü mün sı nırı n her i ki t arafı ndaki dur uml ar i çi n de destekl eyi ci bir gözl e m ol arak kabul edil mesi gerekti ği yer olan bu değerl er de belirsizli k en yüksek düzeye ul aĢır. Fakat, kl asi k deği Ģkenl er yol uyla i Ģl e mler yapılırken bu dur uml ar dahi gör mezli kten geli nir ve i hmal edilir. Yapıl an Ģey, dur uml ar arası sı nır değeri ni keyfi mate mati ksel

(28)

tanı mla mal arla sadece t ek bir dur uma ait miĢ gi bi göst er mek ve deneysel ölçüml er de bu değeri n tek bir duruma ait dest ekl eyi ci bir değer ol arak kabul edil mesi dir.

Bul anı k deği Ģkenl er, belirsizli kl eri deneysel verileri n bir parçası olarak el e al dı kl arı ndan dol ayı, gerçeğe daha uygundurl ar ve bi ze ol gul ar hakkında kl asi k deği Ģkenl ere dayanan bilgil erden daha doğr u bil giler verirler. Ünl ü fi zi kçi Ei nst ei n bu dur umu Ģu Ģekil de ifade et miĢtir: “ Mat e mati ğin kavra mları kesi n ol dukları sürece gerçeği yansıt mazl ar, gerçeği yansıttı kl arı sürece de kesi n değillerdir. ”

Bul anı k kü mel er üzeri ne kur ul an mat e mati ksel yapı, kl asi k mat e mati kt en daha f azl a açı kl ayı cı bir güce sahip ol ması na rağ men kullanılabilirli ği uygul a ma al anl arı nda karĢı mıza çı kan kavraml ar i çi n uygun üyelik f onksi yonl arı nı n i nĢa edil mesi ne bağlı dır. Fakat, bu i Ģl e mi n t at mi n edi ci düzeyde gerçekl eĢ mesi bir çok ek ar aĢtır ma gerektirir.

2. 2. 3 Te mel Bul anı k Küme ĠĢl e mleri

Bul anı k kü mel er de, sıradan kü mel erdeki gi bi t e mel de üç i Ģl e me sahi ptir. Bu iĢle mler; birleĢ me, kesiĢme ve t üml e medir. Bul anı k kü mel er üyeli k f onksi yonl arı il e tanı mlandı kl arı ndan bu kü mel er üzeri ndeki iĢl e mler de üyeli k f onksi yonl arı yar dı mı yl a yapılır.

Bi rl eĢ me: A ve B bul anı k kü mel eri n birleĢi mi A  B kü mesi aĢağı daki üyeli k fonksi yonu il e t anı mlanır. BirleĢ me i Ģl e mi se manti k ol arak VEYA‟ ya karĢılı k gelir. Bu iĢl e m grafi ksel ol arak ġekil 2. 6 (a)‟da göst erilmi Ģtir.

( A  B( x)) = ( A( x)) ( B( x)) = Max(( A( x)), ( B( x)) (2, 10) KesiĢ me: A ve B bul anı k kü mel eri n kesiĢi mi A  B kü mesi aĢağıdaki üyeli k fonksi yonu il e t anı mlanır. KesiĢ me i Ģl e mi se manti k ol arak VE‟ ye karĢılı k gelir. Bu iĢle m grafi ksel ol arak ġekil 2. 6 (b)‟da göst eril miĢtir.

( A  B( x)) = ( A( x)) ( B( x)) = Min(( A( x)), ( B( x)) (2, 11) Tü ml e me: A kü mesi ni n t ü ml eyeni A aĢağı daki üyeli k f onksi yonu il e t anı mlanır. Tü ml e me i Ģl e mi se mantik ol arak DEĞĠ L‟e karĢılı k gelir. Bu i Ģl e m grafi ksel ol arak ġekil 2. 7‟de göst eril miĢtir.

(29)

Mi n ve max operat örlerini n birl eĢ me özelli ği dolayısı yl a bu t anı mlar her hangi sayı da bul anı k kü me üzeri ne de geni Ģl etilebilirler.

ġekil 2. 6 : A ve B kü mel eri ni n üyeli k fonksi yonları nda a) BirleĢi mi b) KesiĢi mi

ġekil 2. 7 : A ve A t ümleyen kü mel eri ni n üyeli k fonksi yonl arı ile göst erimi Ġki sonl u bul anı k kü me arası ndaki birleĢ meyi, kesiĢ meyi ve bir kü meni n t üml eyeni ni bir örnekl e açı kl ayalı m;

A = {0. 6/-2 + 0. 3/-1 + 0.6/ 0 + 1. 0/ 1 + 0. 6/ 2 + 0. 3/3 + 0. 0/ 4} B = {0. 1/-2 + 0. 3/-1 + 0.9/ 0 + 1. 0/ 1 + 0. 9/ 2 + 0. 3/3 + 0. 2/ 4} ise, A  B = {0. 6/-2 + 0. 3/-1 + 0. 9/ 0 + 1. 0/ 1 + 0. 9/ 2 + 0. 3/ 3 + 0. 2/ 4 } A  B = { 0. 1/-2 + 0. 3/-1 + 0. 6/ 0 + 1. 0/ 1 + 0. 6/ 2 + 0. 3/ 3 + 0. 0/ 4 } A = {0. 4/-2 + 0. 7/-1 + 0. 4/ 0 + 0. 0/ 1 + 0. 4/ 2 + 0.7/ 3 + 1. 0/ 4} B = {0. 9- 2 + 0. 7/-1 + 0. 1/ 0 + 0. 0/ 1 + 0. 1/ 2 + 0. 7/ 3 + 0. 8/ 4} ol ur. A( x) B( x) AB( x) 1 0 x A( x) B( x) AB( x) 1 0 x A( x) A( x) 1 0 x (a) (b)

(30)

2. 2. 4 Bul anı k Kü me ni n Özelli kl eri

Kl asi k kü mel er i çi n bili nen t üm i Ģl e mler aĢağıdaki i ki dur um hari ci nde bul anı k kü mel er içi n de geçerli dir.

1. A A = X ve 2. A A = 

Bu i ki dur um bul anı k kümel er i çi n geçerli değil dir. Bul anı k kü mel erde geçerli ol an di ğer dur uml ar ise aĢağı da sunul muĢt ur;

A, B ve C, X evrensel kümesi üzeri nde tanı mlı bulanı k kü mel er ol mak üzere 1- AB=BA, AB=BA 2- ( AB)C= A( BC), ( AB)C= A( BC) 3- AA= A, AA= A 4- A= A 5- A( BC) = ( AB) ( AC) , A( BC) = ( AB)( AC) 6- (A) = A 7-  ( AB) = AB  ( AB) = AB

2. 3 Bul anı k Mantı k

Bul anı k mantı k, adı ndan da anl aĢılacağı gi bi kesi n çı karı mlardan çok yakl aĢı k çı karı mlar el de edil en mantı ktır. Öner mel er doğal dille ifade edil di ği nde, çoğunl ukl a doğal dili n yapı sı gereği belirsizli kl er t aĢırlar. Dol ayısı il e bu çeĢit öner mel er den kesi n çı karı m yap mak olanaklı ol maz. Ġ nsanl ar çoğu za man kesi n çı karım yap mak yeri ne yakl aĢı k çı karı m yaparl ar. Ör neği n i nsanları n boyunun kaç c m ve kaç mm ol duğunu bil meden ve ilgil enmeden, i nsanl arı uzun boyl u, ort a boyl u, kısa boyl u vs. gi bi kü mel ere ayırırlar.Yani i nsan düĢünüĢü ve çı karı mı bul anı ktır deme k he men he men doğr udur.

(31)

2. 3. 1 Bul anı k Mantı ğı n Tari hçesi

Mat e mati ği n doğr ul uğundaki ve büt ünl üğündeki baĢarısı nda Arist ot el es‟in ve onun izi nden gi den düĢünürleri n büyük kat kısı olmuĢt ur. Onl arı n mantık t eorisi ni ol uĢt ur ma çabal arı il e mate mati k geliĢ miĢ ve “ DüĢünceni n Yasal arı” ol uĢt urul muĢt ur. Bu yasal ardan biri her öner meni n “ Doğr u” yada “ YanlıĢ” ol ması gerekti ği ni öngör müĢt ür. Bu kavramı Per mi nedes il k ort aya attı ğı za man bil e ( yaklaĢı k M. Ö. 400) karĢı gör üĢl eri n ol uĢ ması uzun sür me mi Ģtir. Her aclit us bazı Ģeyl eri n aynı anda he m doğr u ol ması nı n he m de doğr u ol ma ması nı n mü mkün ol abileceği ni savun muĢt ur.

Bul anı k Mantı ğı ol uĢt uracak t e mel düĢünceyi Pl at o, “ Doğr u” ve “ YanlıĢ‟ı n” i ç i çe girdi ği üçüncü bir duru mu belirterek ol uĢt urdu. Hegel ve Mar x gi bi moder n düĢünürl er bu düĢünceyi dest ekl edi ancak il k kez Lukasi e wi cz Arist ot eles‟i n i ki -değerli mantı ğı na siste mati k bir alternatif getirdi.

Lukasi e wi cz 1900‟l eri n baĢı nda 3. bir değer ortaya attı: “ol ası ”. Lukasie wi cz daha sonra 4., 5., 6. vs. gi bi değerl eri de ol uĢt urdu ve “ Doğr u” il e yanlıĢ arası nda sonsuz farklı değerl er at anabileceği ni göst erdi. Lukasi e wi cz ve onu i zl eyen di ğer mat e mati kçiler bu değerleri nü meri k ol arak ifade et miĢ ol sal arda , 1965 yılı nda Lotfi A. Zadeh, bu değerl eri [0. 0, 1. 0] aralı ğı ndaki sayılarla ifade etti ği t eorisi ni “ Bul anı k Ma ntı k” adlı çalıĢ masında t anı mlayana dek, sonsuz- değerli mantı k uygul a mada baĢarılı ol a ma mı Ģtır.

2. 3. 2 Bul anı k Mantı ğı n Özelli kl eri

Bul anı k mantı ğı n bazı karakt eristi k özelli kl eri ni Ģöyl e sıral ayabiliri z:

 Bul anı k mantı kt a, kesi n çı karı m yakl aĢı k çı karımı n özel bir hali ol arak gör ül ür.

 Her hangi bir mantı ksal sist e m bul anı kl aĢtırılabilir.

 Bul anı k mantı kt a bil gi, bir değiĢkenl er kü mesi üzeri nde t anı mlı ol an bul anık kı sıtlar ol arak yor uml anır.

(32)

2. 3. 3 Bul anı k Mantı k ile Klasi k Mantı ğı n Farklılı kl arı

Bul anı k mantı k, gel eneksel mantı k siste mleri nden he m ana düĢünüĢ Ģekli ol arak he m de det ayda farklılı kl ar göst erir. Bu farklılı kl arı n birkaçı nı Ģöyl e sıral ayabiliriz:

Doğr ul uk ( Tr ut h): Ġ ki değerli sist e mlerde doğr ul uk sadece i ki değer al abilir. Çok değerli sist e mlerde i se doğr ul uk genelli kl e sonl u bir kü meni n el e manı dı r. Bul anı k ma ntı kt a doğr ul uk, verilen kü meni n [0, 1] aralı ğı ndaki bir bul anı k alt kümesidir. Yükl e mler ( Predi cat es): Ġki değerli sist e mlerde yükl e mler kesi ndir. Mesela “ Ankara Tür ki ye‟ni n baĢkenti dir” kl asi k mantı kt a basit bir öner medir. Fakat günlük hayatt a kull andı ğı mız çoğu cüml eni n yükl e mi aslı nda bulanı ktır.(büyük, küçük...)

Yükl e m Deği Ģtiriciler (Predi cat e modifi ers): Geleneksel sist e mlerde kul lanıl an t ek modifi kat ör değil deği Ģtiricisi dir . Bul anı k mantı kt a buna ek ol arak pek çok deği Ģtirici kull anılabilir. Ör neği n çok , aşağı yukarı, aşırı vs.

Ni cel eyi cil er ( Quantifi ers): Gel eneksel si st e ml er de sadece i ki nit el eyen kul lanılır, her ve bazı. Bul anı k mantı kta i se pek çok ni cel eyi ci kull anıl abilir. Ör neği n bi rkaç, çoğu , sı ksı k, pekçok vs.

2. 3. 4 Dilsel DeğiĢkenl er

Bul anı k mantı k ve yakl aĢı k çı karı ma i hti yaç duyul ması nı n nedeni daha önce bahsetti ği miz gi bi kesi n ve belirli bir anl a mı ol mayan veya birden f azla anl a ma gel ebil en dilsel deği Ģkenl erle karĢılaĢ ma mı zdır. Dilsel deği Ģkenl er belirli bir kü meni n bul anı k alt kü mel eri ol arak el e alı nabilir. Deği Ģtiriciler i çi n sı kça kull anıl an ve kabul gör müĢ bazı mat e mati ksel modell erden konsantrasyon, yoğunl aĢtır ma ve geni Ģl e me modell eri sırası yl a aĢağı daki gi bi dir.

 kon ( A)( x) = A( x)2

 yog ( A)( x) = 2* (A( x))2

 gen ( A)( x) = (A( x))0.5

Bu modell eri kullanarak Ģu değiĢtiricileri ol uĢt urabiliriz.

 ÇOK ( A) = kon( A)

(33)

 HAFĠ FÇE A = ( BĠ RAZ A ve DEĞĠ L ÇOK)

Bu dilsel deği Ģkenl ere ör nek ol arak, bir ki Ģi 0. 6 üyeli k derecesi yl e çalıĢkanl ar kü mesi ne üye i se, “çok çalıĢkan” ifadesi o ki Ģi içi n 0. 64 l ük bir doğr uluk payı na sahi ptir.

(34)

3. BULANI K SORGULAMA Ġ LE BĠ LGĠ KEġFĠ

3. 1 GiriĢ

Günü müz moder n i nsanını n her alıĢveriĢi nde, her bankacılı k i Ģl e mi nde, her t el efon gör üĢ mesi nde kaydedil en, uzakt an al gılayı cılardan, uydul ardan t opl anan, devl et ve iĢlet me yöneti minde yapılan i Ģl e mler sonucunda sakl anan veriler her an i nanıl maz boyutl arda art makt adır.

1995 yılı nda biri ncisi düzenl enen Knowl edge Discovery I n Dat abases konferansı bil diri kit abı sunuĢunda, enf or masyon t eknol ojileri ni n ol uĢt urduğu veri dağl arı aĢağı daki cüml el er ile vurgul anmıĢtır.

“Dünyadaki enf or masyon mi kt arı nı n her 20 ayda bi r i ki ye katl andı ğı t ahmi n edil mekt edir. Bu ham veri seli ile ne yapma mı z gerek mekt edir? İ nsan gözl eri bunun ancak çok küçük bi r kıs mı nı görebilecektir. Bil gisayarl ar bil gelik pı narı ol mayı vaat et mekt e, ancak veri selleri ne neden ol makt adır. ”

Veri t abanı siste mleri nin art an kull anı mı ve haci mleri ndeki bu ol ağanüst ü artıĢ, or gani zasyonl arı el de t opl anan bu verilerden nasıl f aydal anılabileceği probl e mi il e karĢı karĢı ya getir miĢtir. Bunun sonucu ol arak veri madencili ği adı altı nda birçok yeni yönt e m ort aya çı kmı Ģtır. Bu çalıĢ mada, bul anı k mantı k ve bul anı k kü me kull anılarak, Dan Ras mussen ve R. R. Yager‟i n 1997 yılı nda yazdı ğı “Fuzzy Query Language For Hypot hesis Evalı ati on” adlı makal e t e mel alı narak bir uygul a ma geliĢtiril miĢtir.

Önceli kl e veritabanı ndan bul anı k sor gul amal arı n nasıl yapıl acağı ve veritabanl arı ndan kuralları n nasıl çı karılabileceği anl atılacak, daha sonra da, bul anı k fonksi yonel ve dereceli bağlılı k adı altı nda, veritabanl arı ndaki al anl ar arası ndaki iliĢkileri n nasıl hesapl andı ğı anl atılacaktır.

(35)

3. 2 Bul anı k Sorgul a ma

Veritabanl arı ndan bil gi çeker ken kull andı ğı mız sor gu cü ml eci kl eri bazı katı kurall ar içer mekt edir. Mesel a “ MaaĢı 1 Mil yardan fazl a olanl arı gör ünt ül e” sor gusu st andart bir SQL sor gusudur. Bulanı k sor gul a mal arda i se kı sıt kıs mı farklı dır. Bi r bul anı k sorgul a mada “uzun, ĢiĢma n, yakl aĢı k” gi bi dilsel ifadel er kull anabiliriz. Böyl ece ol uĢt urul an sorgunun sonuçl arı daha iĢe yarar hal e gelir.

Ör neği n bir sı nıftaki öğrencil eri n baĢarı dur uml arı nı sor gul arken “Ort al aması 70 ve devamı < 10” sor gusu yeri ne “ort al aması i yi ve devamı nor mal ” Ģekli nde bir sorgu daha kull anıĢlı dır. Böyl ece sor gul a manı n sonuçl arı nda 69 ort al amalı ve 9 deva mlı bir öğrenci gözümüzden kaç ma mı Ģ ol ur.

Bul anı k sor gul a manı n veri t abanl arı nda nasıl yapıl dı ğı nı anl a mak i çi n bi r ör nek ver mek gerekirse; VT veritabanı ol sun, Oi veritabanı ndaki bir nesne ve A = {a1, a2,...,an} veritabanı ndaki al anl arı n özelli kleri ol sun. Bu dur u mda Oi.aj bi ze Oi nesnesi ni n aj özelli ği ni n değeri ni verecektir. Bunun dı Ģı nda ayrı ca bul anık kısıtları tanı mla ma mı z gerekir. uzun( Boy) bi ze Boy al anı ndaki uzun kavr a mı nı t anı mlar. uzun( 1. 8) =0. 5 i se 1. 8m boyun uzun bul anı k kü mesi ne 0. 5 üyeli k derecesi yl e ait

ol duğunu göst erir. ġekil 3. 1(a) uzun boyl u i nsanl ar, ġekil 3. 1(b) ĢiĢ man i nsanl ar bul anı k kavra mları nı tanıml ar.

(a) (b)

ġekil 3. 1 : Bul anı k kavra m ol arak (a) uzun boyl u insanl ar (b) ĢiĢ man i nsanl ar 1 0 170 190 BOY uzun 80 100 KĠ LO 1 0 Ģi Ģ man

(36)

Veritabanı ndaki her bir bul anı k sor gu, veritabanı ndaki her nesneni n bir üyeli k derecesi al ması ile sonuçl anır. Burada nesnel eri üyeli k derecel eri ne göre sıral a mak sonuçl arı daha i yi ve et ki n gör mek açısı ndan f aydalı dır. Verit abanımı z Tabl o 3. 1‟deki gi bi üç el e mandan ol uĢsun.

Tabl o 3. 1 Ör nek verit abanı

Ġsi m

Boy

Ki l o

Can 180 100

Ah met 170 90

Me h met 190 85

“ Uzun boyl u i nsanl arı göst er” sor gusu Ģu Ģekil de göst erilir. Üyeli k dereceleri Tabl o 3. 2‟de göst eril miĢtir.

Qb oy=uzun ( VT) ={ Oi  VT | uzun( Oi. Boy) } (3, 1)

={1/( Mehmet, 190, 85), 0. 5/( Can, 180, 100), 0/( Ah met, 170, 90)} Tabl o 3. 2 Uzun boyl u insanl ar sor gusu

Ġsi m Boy Ki l o Üyeli k Der.

Me h met 190 85 1

Can 180 100 0. 5

Ah met 170 90 0

Sor gu cü ml el eri bir den f azl a cü ml eden de ol uĢabilir. Bu dur u mda cü ml el er VE yada VEYA bağl açl arı il e birleĢtirilir. Cü ml el er t e mel bul anı k kü me i Ģl e mleri di kkat e alı narak birleĢtirilir. Ör nek ol arak “uzun ve ĢiĢ man i nsanl arı göst er” sor gusu Ģu Ģekil dedir. Sor gunun sonucunda ol uĢan üyeli k derecel eri Tabl o 3. 3‟de gösteril miĢtir.

(37)

Qb oy=uzun VE kil o=yüksek( VT) ={ Oi  VT | uzun( Oi. Boy) yüksek( Oi. Kil o) }

Qb oy=uzun VE kil o=yüksek( VT) = { Oi VT | mi ni mum(uzun( Oi. Boy , yüksek( Oi. Kil o)) }

={ mi n( 1/( Meh met ), 0. 5/(Can), 0/( Ah met )), mi n( 1/(Can), 0. 5/( Ah met ), 0. 25/(Me h met ) } ={0. 5/( Can), 0. 25/( Meh met), 0/( Ah met ) }

Tabl o 3. 3 Uzun ve ĢiĢma n i nsanl ar sor gusu

Ġsi m Boy Ki l o Üyeli k Der.

Can 180 100 0. 5

Me h met 190 85 0. 25

Ah met 170 90 0

3. 3 Dilsel Özetl er

Di l sel özetler, bir veritabanı ndaki bil gilerden hareket ederek o veritabanı na ait genel çı karı mlar yap mak i çi n kull anılır. Dilsel özetlere ör nek ol arak “Bu verit abanı ndaki çoğu i nsan uzundur” veya “Bu verit abanı ndaki yüksek maaşlı i nsanl ar şiş mandı r” veril ebilir.

Bi çi msel ol arak t anı mladı ğı mızda dilsel özet, f or mat ol arak sor gu cü ml esi i çi nde, “ VT‟ deki S nesne Q ( doğrul uk değeri il e)” Ģekli nde göst eril ebilir. Bur ada S özetl eyi ci, Q i se sor gunun uyuĢ ması ndaki öl çüt olarak adl andırılabilir. Bul unan dilsel özet  il e göst eril en ve [ 0, 1] aralı ğı nda ol an bir doğr ul uk değeri ne sahi ptir.  „ nun al acağı değer bi ze o kuralı n veritabanı nda ne kadar geçerli ol duğunu göst erir.

Bi r dilsel özeti n ‟ nu hesapl ayabil mek i çi n VT={ O1, O2,..., On} veritabanı nı

ol uĢt uran kayıtlar kü mesi olsun. S özetleyi ci ol arak kull anılan bul anı k bir i fade, Q bul anı k ni cel eyi ci, A‟ da VT veritabanı ndaki bir al an ol arak t anı mlansı n. VT veritabanı ndaki kayıtlar i çi n yapıl acak dilsel özetle me i Ģl e mi aĢağı daki gi bi tanı mlanabilir;

(38)

2. r = 1 n i =1

n

s ( Oi), S‟ yi sağl ayan VT‟ deki kayıtl arı n oranl arı bul unur. (3, 2)

3.  =

Q(r), Bul unan r değeri Q ni cel eyi ci si nde yeri ne konarak  değeri hesapl anır. Di l sel özet e ör nek ol arak “ X veritabanı ndaki çoğu i nsan uzundur” sorgusunun  doğr ul uk değeri ni hesaplayalı m.

X veritabanı ve her kayıt içi n

uzun değeri Tabl o 3.4‟ de göst eril miĢtir. Tabl o 3. 4 Uzun boyl u insanl arı n üyeli k derecel eri

Ġsi m

Boy

Ki l o

uzun

Can 180 100 0. 5

Ah met 170 90 0

Me h met 190 85 1

Ġki nci adı m ol arak büt ün

uzun değerl eri t opl anır ve t opl a m kayıt sayı sı na böl ünür. r = (0. 5 + 1 + 0) / 3

r = 0. 5

Daha sonra bul unan bu r değeri

çoğu bul anı k f onksi yonunda yeri ne konur ve  doğr ul uk değeri bul unur.

ç oğu bul anı k fonksi yonu ġekil 3. 2 de göst eril miĢtir.

ġekil 3. 2 : Çoğu bul anık fonksi yonu r = 0. 5 ise

0. 5 1 1

0. 5

(39)

 =

çoğu (0. 5)

 = 0. 5 ol arak bul unur.

Bu sor gul a ma ti pi ne ek ol arak daha spesifi k bir sor gul a ma yap mak i çi n dilsel özetl e meyi Ģu Ģekil de de kull anabiliriz

“ X veritabanı ndaki çoğu ĢiĢ man i nsan uzundur. ”

Bu sor gul a mada, il k sorgul a maya ek ol arak ĢiĢma n i nsanl ar kü mesi bi r alt küme ol arak ekl enmiĢtir. Bu sorgul a ma ti pi ni n genel hali ise Ģu Ģekil de göst erilir:

VT „ deki Q R i nsan S „dir (

doğrul uk değeri ile) R : alt küme

Bu Ģekil deki bir dilsel özetle meni n doğr ul uk değeri ni n hesabı ise Ģu Ģekil de yapılır: 1. Veritabanı ndaki her kayıt içi n S özetleyi ci değeri hesapl anır.

2. r =

i =1 n T

(

S ( Oi),

R ( Oi))

i =1 n

R ( Oi) (3, 3)

3.  =

Q(r), Bul unan r değeri Q ni cel eyi ci si nde yeri ne konarak  değeri hesapl anır. 2. basa makt a ort aya çı kan T, bir t-nor m i Ģl e mi dir. T- nor m, mi ni mu m ve çar pı m altı nda tanı mlı ve VE operat örünü sağl ayan bir grup i kili operat ördür.

Az önce ver di ği miz ör nek i çi n hesapl anmıĢ

uzun ve

Ģi Ģ man değerl eri Tabl o 3. 5 de göst eril miĢtir.

Tabl o 3. 5 Uzun boyl u ve ĢiĢ man i nsanl arı n üyeli k derecel eri

Ġsi m

Boy

Ki l o

Ģi Ģ man

uzun

Can 180 100 1 0. 5

Ah met 170 90 0. 5 0

(40)

 değeri ni n hesabı i çi n Tabl o 3. 5‟ deki

uzun ve

Ģi Ģ man değerl eri ni n her kayıt i çi n mi ni mu ml arı alı nır ve alt kü me ol arak t anı mladı ğımı z

Ģi Ģ man değerl eri ni n t opl a mı na böl ünür.

r = [ mi n( 0. 5, 1) + mi n( 0, 0. 5) + mi n( 1, 0. 25) / (1 + 0. 5 + 0. 25)] r =0. 428

= çoğu( r ) =0. 428

Sonuç ol arak “ X veritabanı ndaki çoğu ĢiĢ man i nsan uzundur.” kuralı veritabanı mızda %42. 8 lik bir doğr ul uk değeri ile hesapl anmıĢ ol ur.

3. 4 Bul anı k Fonksi yonel ve Dereceli Fonksi yonel Bağlılı kl ar

1980‟li yıllarda ort aya çıkan iliĢkisel veritabanı sist e mleri yl e birli kt e, veritabanı ndaki gereksi z verileri yok et mek i çi n f onksi yonel bağlılı kl ar ( FB) kul lanıl maya baĢl anmıĢtır. Yi ne f onksiyonel bağlılı kl ar veritabanı yöneti m sist e mleri nde büt ünl ük kı sıtları ol arak da öne mli rol oynarl ar. “Aynı zaman i çi nde bi r arabanı n t ek bi r sahi bi vardır” cü ml esi f onksi yonel bağlılı k içi n ör nek ol arak verilebilir. Bir fonksi yonel bağlılı ğı mat e mati ksel ol arak Ģöyl e ifade edebiliriz. X Y, ( X i n Y‟ ye fonksi yonel bağı mlı ol ması i çi n) Oi  VT i çi n;  Oi, Oj | Oi . X = Oj . X  Oi . Y= Oj

. Y. Yani X i n her değeri içi n Y de aynı değeri n karĢılı k gel mesi gerekli dir.

Bul anı k veri t abanı kavra mı nı n ol uĢ ması yl a birli kt e, bul anı k f onksi yonel bağlılı k ( BFB) kavra mı da ort aya çı kmıĢtır. Fakat FB‟l eri n aksi ne, BFB‟l er veri büt ünl üğü sakl a makt an çok veri tabanl arı ndan bil gi keĢfi i çi n kull anıl makt adırlar. BFB‟ ye ör nek ol arak, “Aynı ti p arabaya sahi p ol anl arı n, gelir düzeyl eri de bi rbirine benzer” verilebilir. BFB‟ de amaç, i ki yada daha fazl a al an arası ndaki benzerli ği n bul un ması dır.

Bi r baĢka f onksi yonel bağlılı k ti pi de dereceli f onksi yonel bağlılı ktır ( DFB). Dereceli fonksi yonel bağlılı k, veritabanl arı ndaki nesnel eri n hareketl eri arası ndaki monot onl uğu i ncel er. DFB‟ ye ör nek ol arak “Bir kişi ni n yaşı arttıkça, maaşı da art ar” verilebilir.

(41)

Sonuç ol arak, BFB ve DFB‟l eri kull anarak veritabanl arı ndan kurallar üret ebiliriz. Ür etti ği miz bu kurallar daha öncede bahsetti ği miz büt ün bul anı k kü me ve bul anı k ma ntı k kriterleri ne uyarlar ve daha önce de ol duğu gi bi üretti ği miz her kuralı n [ 0, 1] aralı ğı nda bir  doğr ul uk değeri var dır.

3. 4. 1 Bul anı k Fonksi yonel Bağlılı k

FB‟ de yukarı da da anl atıl dı ğı gi bi bir al an baĢka bir al ana ya f onksi yonel bağlı dır yada değil dir, yani al anı n üyeli k derecesi 0 yada 1 dir. BFB de i se bu üyelik derecesi 0 il e 1 ar ası ndadır ki bu raka m 1 i se al an i çi n f onksi yonel bağlı dır da di yebiliri z. X ve Y arası ndaki BFB‟ yi göst er mek i çi n FB deki Oi . X = Oj . X bağı ntısı nın yeri ni Oi

. X  Oj . X bağı ntısı alır. Burada  bul anı k benzerli k oper at ör üdür ve

Agg( Xi 1Xj 1,..., XinXj n) fonksi yonuyl a tanıml anır.

BFB de, X ve Y arası ndaki benzerli ği bul abil mek i çi n her nesne i çi n birer bul anı k kural üretil meli dir. Bir bul anı k kuralı n genel for mu Ģu Ģekil dedir.

Rk : HER Oj  VT, EĞER Ok . X  Oj . X Ġ SE Ok .Y  Oj . Y (3, 4)

Ol uĢt urul an her kural i çin bir de doğr ul uk değeri hesapl a ma mı z gerekir. Bu doğr ul uk değeri ni n hesabı ise Ģöyledir.

k= i d ( Ok  VT | i d (Oi  { Oj  VT | Ok . X  Oj . X} | Ok . Y  Oi . Y )) (3, 5)

{ Oj  VT | Ok . X  Oj . X}; X baz alı narak ol uĢt ur ul muĢ bul anı k bir altkü me, i d;

bul anı k ni cel eyi ci i d(

) =

ve ; bul anı k benzerli k operat örü Max((2 - | x – y | )/ 2 , 0) ‟ dir. Bul anı k benzerli k operat örü Agg( Xi 1Xj 1,..., Xi nXj n) f onksi yonunda “” yeri ni “=” al arak ve t opla m f onksi yonu “ Agg”, t-nor m operat örüne eĢit olduğu kabul edilerek ol uĢt urul ur.

Her bir kural i çi n

k değerl eri hesapl andı ğı nda, BFB X F Y ni n

değeri bul un muĢ

ol ur. Ol uĢt urul an kural, “Eğer verit abanı ndaki herhangi i ki nesne X i çi n benzer değerl ere sahi pse, Y i çi nde benzer değerl ere sahiptir” Ģekli ndedir. X i n Y‟ ye BFB „si ni n doğr ul uk değeri ni bul mak i çi n büt ün kuralları n doğr ul uk değerl eri topl anır ve t opl a m kural sayısı na bölünür.

(42)

= i =1

n

k

n (3,6) Bi r ör nek ver mek gerekirse; veritabanı mız Tabl o 3. 6‟daki gi bi olsun ve A al anı nı n B ye ne kadar BFB ol duğunu bul alı m.

Tabl o 3. 6 Ör nek veri tabanı

Nes ne

A

B

O1 1 1 O2 2 4 O3 4 4 R1 : EĞER 1  Oi . A Ġ SE 1  Oi . B dir. R2 : EĞER 2  Oi . A Ġ SE 4  Oi . B dir. R3 : EĞER 4  Oi . A Ġ SE 4  Oi . B dir.

Her kural içi n doğr ul uk değerl eri ni hesapl ayalı m: 1  Oi . A i çi n 1  1 = max (( 2 - | 1 – 1| ) / 2 , 0 ) = 1 1  2 = max (( 2 - | 1 – 2| ) / 2 , 0 ) = 0. 5 1  4 = max (( 2 - | 1 – 4| ) / 2 , 0 ) = 0 1  Oi . B içi n 1  1 = max (( 2 - | 1 – 1| ) / 2 , 0 ) = 1 1  4 = max (( 2 - | 1 – 2| ) / 2 , 0 ) = 0 1  4 = max (( 2 - | 1 – 4| ) / 2 , 0 ) = 0

1 = mi n ( 1, 1) + mi n( 0. 5, 0) + mi n( 0, 0) 1 + 0. 5 +0 = 2 3

R1 i çi n doğr ul uk değeri 0. 67 ol arak bul unur. Hesapl anan büt ün iliĢkiler Tabl o 3. 7‟ de

Referanslar

Benzer Belgeler

Akkuş Gayrimenkul , kalitesiyle adından söz ettiren Alya Residence, Alya Trio, Alya Penta ve Alya Grandis projelerini hayata geçirmiştir. 1993 yılında kurulan Lübnan’lı

Sabah sporunda Fatih 2 saat koşarken, Emre 2 saat yürüyor. 2- Buna göre Fatih, Emre’den kaç kalori fazla yakmıştır?.. A) 234 B) 244

The basic objective of this project is to describe various approaches of leadership as well as their implications for managerial practice and to make a study for determine

ADANA / SEYHAN / Yeşilevler Mesleki ve Teknik Anadolu Lisesi Anadolu Teknik Programı ADANA / SARIÇAM / Türk Tekstil Vakfı Mesleki ve Teknik Anadolu Lisesi Anadolu

• 21 Mayıs günü Osmanlı lağımcıları, gözetleme kulelerinden yoksun Kaligaria Kapısı civarında ikinci bir tünel daha açtı ve o da şehirdekiler tarafından

FESTİVALLER 40th İSTANBUL FİLM FESTIVALİ ULUSAL YARIŞMA (Temmuz, 2021) 25th TALINN BLACK NIGHTS FILM FESTİVALİ ANA YARIŞMA (Kasım, 2021- resmi duyuru henüz yapılmadı)...

Tecrit binaları mevcut sari veya salgın hastalıklar için kullanıldığı gibi sarî hastalık memul edildiği ahvalde karantine için de kul- lanılırlar.. Güzel

Ufak bir aile için düşünülerek yapılan bu tip, yerden 2 basamakla girilen methal, ye- mek ve oturma odası, 2 yatak odası ve büyük yatak odasından çıkılabilecek bir veranda,