Osmanli
Artivleri Iserik-Bazli Sorgulama (IBS)
Sistemi
Content-Based Retrieval
(CBR) System
for
Ottoman Archives
Ismail
Sengo5r
Altingo5vdel,
Ediz
3aykoll,
Ozgur Ulusoy',
Ugur
GzdPkbay
, A. Enis
(7etin2,
Muammer
G5qmen3
1
Bilgisayar
Muihendisligi
B6luimui,
Bilkent
Universitesi,
Ankara
2Elektrik
ve
Elektronik
Muihendisligi
B6lumui,
Bilkent
Universitesi,
Ankara
3
Islam Tarihi
ve
Sanatlari B6lumi,
Suileyman Demirel Universitesi,
Isparta
{ismaila, ediz, oulusoy, gudukbay}@cs.bilkent.edu.tr, cetin@ee.bilkent.edu.tr, mumen@sdu.edu.tr
Ozet e Ancak tahmin
edilebilecegi
gibi,
bu durumda sadece,,zumlemeleri
yapilmi*
belgeleri yine sadece bu Buqali*mada sayisalla*tirilmi*
Osmanli ar,iv belgeleri ,czumlemelerde ge,en Tulrk,e kelimelerle sorgulamak ve uzerinde i,erik-bazli sorgulama yapilabilmesinisaglayan
birsonu,ta
da belgelerin kimlik bilgilerini almak mulmkuln sistem onerilmi,tir. Sistemde belgelerden ,ikarilan olabilmektedir. Bu makalede geli,tirilen Osmanli Ar,ivleritanimlanmami*
i,aretlerin yonlendirilmi, biryakla*imla
daha IBS(I,cerik-Bazli
Sorgulama) sistemi ile bu soylenenlerden onceden simgekultulphanesine
yerle,tirilen simgelerdenen,ok daha farkli vegeli,mi,
fonksiyonlarin saglanmasi
benzeyene e,le,tirilmesi
saglanmi*tir.
Kullanicilar istedikleri hedeflenmektedir: Herhangi gibi bir on tasnife veya bir belge uzerinden istedikleri simge grubunu se,erek belge ,cozumlemeye ihtiya, duyulmaksizin, varolan Osmanlicakulmesi
i,erisinde aratabileceklerdir. Sistemin prototipi ,u an belgelerdirekt
olarak dijital ortama aktarilip kullanici Internet uzerindekullanicilarin hizmetineaqilmi*tir.
eri,imine a,ilabilecek;
kullanici Osmanlicasimgeler
uzerinden ornek-tabanli sorgular yapabilecek ve bulunan belgelerin sadece kimlik bilgilerine
degil
metin-resmi Abstract,seklindeki
goruintuisuine
deula,abilecektir. Boylece
hem Wepropose acontent-based retrieval(CBR)systemfordigital,cozumlemesi yapilmami*
belgeler de elektronik ortamda Ottoman archive documents. In this system, the symbolsara*tirilabilecek,
hem deOsmanlica
bilenara*tirmacilar
extracted from the documents are matched with the most isterlerse
,czumlemedeki
kelimeler iledegil
direktOsmanlica
similar one in the symbol library, which is created in a
sembollerle
arama yapabilmekimkanina
kavu*acaktir.
Bu supervised manner. The users specify queries by marking a durum, bir taraftan tasnif vb.a,amalarda
belgelerin
otomatik region on an example document and the system retrieves all olarak biron
gruplandirilmaya
tutulmasini
saglayip
bu documents that include thesymbolsfound in the queryregion.i,lemlerle
ugra,an
uzmanlara i*ik
tutacak,diger
taraftan da bu Aprototypeof the system iscurrentlyavailable on the Web.belgeler
uzerindeara*tirma
yapanki,ilerin istedikleri
belgeleri orijinal diliyle arayip kolaycabulabilmesine imkan verecektir. Boylece Osmanli ar,ivleri uzerinde bilimsel
1.
Giris
qali*malar
yapantulm
ara*tirmacilarin
i,lerinin onemli olciide
kolayla*masi
ve eri,imin hem kalitesinin hem de hizinin Osmanli ar,ivleri,yllzyillarca hulkulm
surmu,s bir artmasisaglanacaktir.
imparatorlugun
milletimizebirakmi*
oldugu
kultur mirasi Yukaridabahsedildigi
uzere Latin alfabesi ileyazilmi*
i,erisinde hi, ,suphesizkiolduk,a onemlibir yer tutmaktadir. yeni vedulzguln
baskili materyalinsayisalla*tirilip,
optik Her nekadar buar,ivler,ge,tigimiz
onyillarboyuncasayisiz karakter tanima sistemleri ile metine ,evrilebilmesi kolayveara*tirmacinin
en temelkaynagi
olmu,sa da, ar,ivlerinyulksek
ba*ari
oranlarinda (%99'a varan)mulmkuln
olsa da,i,erdigi
engin bilgi ve belgelerinbultuln
potansiyeliyle farkli alfabeler ve basim kalitelerindeki belgeler i,in ayni kullanilabilmesi veara*tirmalarin
daha hizli, kapsamli veba*aridan
bahsetmekmulmkuln
degildir [3].
Ozellikle
verimli
yulrultullebilmesi
i,ingulnulmulz
teknolojisinin Osmanlica belgelerdu,sunuldugunde
a*ilmasi
gereken onemli yardimina ihtiya, vardir. Bilgisayar bilimindeki ilerlemeler zorluklar ,Oyle siralanabilir: (i) Osmanlica dil ozellikleri sayesindebuguln
ba,ta Latin alfabesi olmak uzere ,e,itli (biti,ik yazim, harflerin kelimedeki yerlerine gore farkli dillerdeyazilmi*
eserlerinsayisalla*tirilarak
dijital ortama ,ekillerde yazilmasi, kelime i,erisinde bo,luklar aktarilmasi ve uzerlerinde geli,mi, sorgular da dahil olmak bulunabilmesi, vb.), (ii) Ar,iv belgelerinin i,erik,e,itliligi
uzere ,e,itli i,lemler yapilmasi
mulmkuln
olmaktadir(ornegin,
(ar,ivde matbu ve el yazisi belgelerin bulunmasi, ve ozellikle bkz. [1]). Devlet Ar,ivleri GenelMuldulrllgui'nuln
bu ikinci gruptakilerin ,ok farkli yazi stilleri ileyazilmi*
,cali,smalariyla
Osmanli ar,sivleri
de sonbirka,c yii i,cerisinde
olmasi), ye (iii) Ar,sivleri olu,sturan beigekulmesinin
sayisalsayisal
ortamaaktariimaya
ba,sianmi,stir
[2].$u
ani,cin
(2005bulyulklugu.
Buzoriukiar
go$z o$nune aiindiginda tulm
ar,sivyiii itibariyia)
bu kurumun Internet sitesindenTulrk,ce
anahtarbeigeleri i,cin hizii ye
kesin olaraki,cerik-bazii
sorgulamasoizculkler
girilerekbeigelerin,cozumiemeieri
(transkripsiyon) yapabilecek bir sisteminin bir anda olu,sturulabilmesi uzerinde aramayapiiabiimekte ye
sorguya cevap olanmulmkuln goirulnmemektedir.
Ancak, buzoriukiar
farkii beigelerinkimlik bilgilerineuia,siiabiimektedir.
ara,stirmaciiarin
ar,siv beigelerinin degi,sik altkulmelerine
yogunla,sarakyeni
,cozumier
buimasiyiaa,siiabiiir.
Bu
qali*ma
,er,evesinde, el yazisi ve matbu Osmanlica * (likartilan i,aretlerin simge kultulphanesinde daha once belgeler i,in i,erik tabanli bir sorgulama sisteminin ilk kaydedilmi, simgelerlekar*ila*tirilarak
(eger
varsa) adimlariatilmi*
ve prototip bir sistem ortayaqikarilmi*tir.
benzer simgenin tespit edilmesi. Bu ama,la bahsedilenA*agidaki
bolumde ilk onceliteratulrdeki
benzerqali*malar
qali*mada
bir yonlendirilmeyen (unsupervised)yakla*im
kisacatarti*ilmaktadir.
U,cincu boluimuinde, simgekullanilmi*tir.
Buyakla*imda
simge ,ikartici modul kultulphanesininolu*turulmasinda
kullanilan yonlendirilmi, Osmanlica karakterler hakkinda herhangi bir on bilgiyeyalka*im
ve histogram boluftlemeteknigi
anlatilmaktadir, ve sahipdegildir,
yaniba*langiqta
simge kultulphanesi Web-tabanli prototip sistem sunulmaktadir. Dordulncul bo,tur. Modulresimden her bir izole i,areti,ikardiginda
bolumdeyse varilan sonu,lar ve olasi gelecekqali*malar
kultulphaneye
o ana dek kaydedilmi, simgelere bakar,belirtilmektedir.
eger
kayitli simgelerdenbirieldeki i,arete (veya i,aretiniqerisinde
bir par,aya) belli bir e,ikdegerin
uzerinde2. Onceki (;alimalar
benziyorsa o
i,aretin
(veya
par,asinin)
bilinen bir simge
Latince karakterler
i.eren
dilolduguna
hulkmeder,
koordinatlarini vehangi simge
Latince
karakterlerve erendiller
krt nbasnli
eserlerin
olduunukayit
ederek bir sonrakii'arete
ge.er.
Eger
sayisalla,stirilmasi ye optik karakter tanima sistemleriyleelkiiae nekerbnzrbummiabnuyi elektronik ortamda metin belgelerine ,evrilip sorgulanmasi bir sime
oarak
'kl
eye
ilaver
eder.bunueesi
i.i
yaia.aimlr*
nogul*i eeiee birsimge
olarakkuituphaneye
ilaveeder.Boylece
simge
i,cin
yapilan,cali,smalar
,su anolgunla,smi,
denebilecekkultuphanesi
sabit bir stildeki alfabe harfierini degil, dulzeydedir [4].Diger
taraftan,
Arap alfabesiyle biti,ikbelgelerde
bun
durumunabalf
oaharfierin
yazilan belgeler
i,in ayni ol,icde birba*aridan
soz etmekbetlg
lerdeku
hlrini
uarli
ira
haferinmulmkuln
degildir.
Amin'in onlarca makaleyitaradigi
'ti
kaybileeki
r.qali*masinda,
Arap,a belgeler i,in optik karakter tanimakapsayabilecektir.
sistemlerinde kullanilan ,e,itli
yakla*imlar
(karakter Dikkatedeger
birdiger
konu dabelgeden
qikartilmi*
bir bolumleme, yapay siniraglari,
,izge teorisi tabanlii,aret
ilekultulphanedeki
birsimgenin
benzerliginin
nasil algoritmalar, Markov model tabanli algoritmalar, vs.)kar*ila*tirilacagidir.
Birbelgede
bulyulk
yazilmi*
bir harf siralanmakta, ancak buyakla*imlarin
hi, birinin karakterlerin(simge)
birba*kasinda
,ok kiiuik
yazilmi*
olabilir.dogru
taninmasi i,leminde istenenba*ari
seviyelerine Sembollerin benzerlikkar*ila*tirmasi
i,in
bahsedilen,ikamadigina
dikkat ,ekilmektedir [3]. Her ne kadarqali*mada
uzaklik vea,isal
dagilim
vektorleri
kullanilmi*tir.
Osmanlica Arap,a'dan farkli bir dil olsa da, genel yapisi Bu
vektorlerin simge
bulyulklulguinden
bagimsiz
olmasinin itibariyle Arap dillerine olan benzerliklerinden dolayi, bu yukarida belirtilen ol,ceklenebilirlik sorununu,cozdugu
konuda yapilacak
qali*malarda
ilgili literatulruln taranmasi belirtilmi,tir.faydali gorulmu,stur. Bu makalede
genel
olarakyukaridaki
bu sonqali*mada
Literatulrde
dogrudan
Osmanlica ya da Osmanlica sunulan ,er,eve esasalinmi*
ve gerek simgekultulphanesinin
belgeler i,in yapilan
qali*malarin
sayisi ise ,ok daha azdir.belirlenmesi, gerekse simgelerinin
kar*ila*tirilmasi
sirasinda Atici ve Yarman-Vural'inqali*masinda
[5] oncezincir kodudegi,ik
yakla*imlar
uyarlanarak performansin artirilmasina (chain code) donu,sumu karakter darbelerineuygulanmi*,
qali*ilmi*tir.
tanima i,lemi i,inse gizli Markov modelinden
yararlanilmi*tir.
Sistem
ba*arili
olmakla
beraber, bu
ba*ari
3. Osmanli Arsivlerini Icerik-Bazli Sorgulama
algoritmanin zayiflatma (thinning)
a*amasinin
kesinligine
bagimli
durumdadir. Birdiger
makaledeyse Osmanlica3.1.
Simge
k.titiphanesinin
y.nlendirilen yakla.imla
karakterlerin yapay sinir
aglari
ile taninmasina,ali,ilmi*tir
olu>turulmasi
[6].
Buqali*mada
tanima a,amasinda sistemin karakterleribiti,ik bir sembol grubundan nasil
,ikardigi
a,ik,a Simgekultulphanesinin
olu*turulmasi
bu makalede hedeflenen belirtilmemi, olmasinakar*in, anla*ildigi
kadariyla gerek i,erik tabanli sorgu sisteminin gerek performansini gerekse siniraginin
ogrenmesi,
gerekse tanima testleri sirasinda sorgu cevaplayabilmeba*arisini
belirleyen en onemlia*amasi
sistem sadece izole durumdaki harflerikullanmi*tir.
Bu durumundadir. Burada, oncekiqali*madaki
[7] yonteme durumda harflerindogru
tanimlanmaba*arisinin
%94'lere alternatif olarak bir yonlendirilenyakla*im
onerilmi,tir. kadar,ikabildigi
gorulmu,stur.Ancak bu makalede ongorulen Bunun gerek,esi ise ,syle a,iklanabilir:sistem i,in tanima i,leminin belgenin tulmul uzerinden Osmanlica karakterlerin belgelerde olduk,a farkli ger,ekle,mesi
gerektigi
a,iktir. Yapay siniraglarinin
bizim bi,imlerde(ve biti,ik ,ekilde) yazilabiliyor olmasi ve bu ,e,it sistemimizde de kullanilabilmesi i,inqali*malarimiz
belgelerin harflerdi*inda
i,aretler de i,erebilmesi (motif,sulrmektedir.
,izik, leke, vs.) sebebiyle yonlendirilmeyenyakla*im
farkli$aykol
ve Ark.'nin [7]qali*masindaysa
ama,, oncelikle belgelerden ,ikartilan pek ,ok i,areti yeni simgeler olarak eldeki belgekulmesinden
bir "simge"kultulphanesi
(alfabe) kaydetmektedir. Boylece simge kultulphanesiistenildigi
olu*turulmasi
vesonrasinda da herbelgenini,erdigi
simgeleri ,ekilde harflerve bunlarin ,e,itli yazim bi,imlerinikapsadigi
listeleyenbir metindosyasina (kod kitabi)donu,sturulmesidir. gibi, istenmeyecek ,ekilde bahsedilen
harf-di*i
pek ,ok Simge ,ikartici altmodulul
temel olarak ,u i,levlerisembolul
de i,ermektedir. Bunun bir sonucu olarak da simgegercekle,tirmektedir:
kutu!phanesi
cok buyumektedir. Simge cikartimi sirasinda o ana kadarkultuphaneye
ilave edilmi,s simgeler, eldeki yeni * Belge-resmi uzerinde bulunantulm
izoleiEaretlerin
,cikarilan
simgenini,cerisinde
aranmakta, bu arama sirasinda(birle,sik
siyah noktagruplarinin)
bulunup,cikartilmasi.
eldeki simgenini,cinden alinan
herpar,ca i,cin uzaklik ye
a,cisal
Bui,s icin
literatllrde
bilinen algoritmalarkullanlmi,stir.
dagilim vektoirleri
geri kalantulm
simgelerinvektoirleriyle
bulyulmesiyle sistem performansinin du,smesine yol
baglanti
noktalarindaki toplamdeger
a*agidaki
formullea,abilmektedir. gosterilen ortalamanin altinda olacaktir. Bu formullde
Alternatif olarak onerilen yonlendirilen
yakla*imda
(Denklem 1), NCsultunsayisi,Xj
isejsultunundakisiyah piksel Osmanlica belgelerdebulunabilecegi
du,sunulen karakterler sayisidir.(,e,itli yazi tiplerinde) daha onceden simge kultulphanesine
elle ilave edilmi,tir. Bu simgeler Osmanlica harflerin ,e,itli Ortalama=
(lINJ)
' C (1) bi,imleridir; ,icnkulharfler kelimeninba*inda,
ortasinda veya J'= Isonunda farkli bi,imlerde yazilabilirler. Simge kultulphanesi
Boylece
bubaglanti
noktalarindan
kelimepar,alanarak
bu ,ekilde olu,turulduktan sonra daha onceoldugu
gibieldeki herpar.anin
bir harfe(ya
da bizim sistemimizdesimgeye)
belgeden ,ikartilan her
i*aret
kultulphanede hazir bulunanbenzerligine
(yine daha oncebahsedilen vektorler
simgelerlekar*ila*tirilacaktir.
Elbette ki buyakla*imin
dakuiianiiarak)
bakiiabiiir.
Ancak buyakla*imin
dezavantajlari
bulunmaktadir: Sistemin adaptasyon kabiliyetiuygulanabilmesi iqin histogramin
i.inde
pe* pe*egelen
(farkli yazim bi,imlerini taniyabilmek
a,isindan)
simge tepelerarasidaki
uzakligin
karaktergeni,liginin
1/3'ulnulkultulphanesine
konulan harflerle sinirli olacaktir.Eger
ge.memesi
gibi
baziko*ullarin
saglanmasigerekmektedir.
Bu kultulphane yeterince kapsayicidegilse
belgelerde bulunan bakimdan buyakla.im
klltllphanedeki simgeier
iqin 6nceden
i,aretler
kultulphanede
sinirli sayidaki simgeden ilgisi olmayantanimianacak
bire*ik
karaktergeniliii
degerine bagldir
ve birinebenzer olarakbulunabilir (yadahi, bir simgeyebenzer esnekdegildir. Diger
taraftan iseyapiian
deneylerde
bu bulunmaz). Bu durum da sorgulardadogru
belgeleriyakla*imin
testyen kllmesinde
tanimakesini..inde
fazia
bir bulabilme oranini du,surecektir. Burada bir ,czum yolukayba
yoi
a.madan
simge
tanimai..eminin
hiziniinemi
sistemin ba,ka simgelere benzetmektezorlandigi
simgeleri orandaarttirdigi
gozlenmi,tir.
saklayip, belirli araliklarla kultulphaneye ilave etmek uzere
degerlendirmesidir.
Ornegin,
her bir ka, bin belge i,lendikten 3.3. Prototip Sistem sonra, bu taninmayan simgeler kendi aralarindakar*ila*tirilabilir.
Boylece, ,ok sik rastlanilan simgeler Yukarida aniatiianyakia,smiar haii hazirdaInternet uzerinde otomatik olaraktespit edilebilir. Busimgeler daha sonra birqali*makta
olanbirprototipsistemde([7]'deanlatilan
mimari uzmana sunulupkultulphaneye
eklenmeden once kullanici ve kodlamanin uzerine adapteedilerek)
ger,ekle,tirilmi,tir.
onayi alinabilir ve yari-otomatik bir ,czumle kiltulphane Sistem mimarisi
$ekil
2'deverilmi,tir.
i,eriginin dogrulugu
korunabilir. Her ,artta bir takim simgelerin ka,irilmasimulmkulndulr.
Ancak, buyakla*im
nispeten
dahadu,suk
tanimaba*arisiyla
da olsa dahabulyulk
kutpoiaL
belge
kulmelerinin
i,lenmesine olanaksagladigi
i,in cazip gorunmektedir. Deneyler sirasinda da buyakla*imin
simgetanima hizini ve buna
bagli
olarak birim zamanda -gikaiiai
Bectmd
i,lenebilecek
belge
sayisini onemli miktardaarttirdigi
Wigeler vetag3llF kaab1i (txg6~~rilml* 1 -i
3.2. Histogram tabanli
boluitleme
Vg1
Daha once
bahsedildigi
uzerebir belgeden ,ikartilan izole her I rnsi*aretin
(harf
veya harfgrubu
olabiiir)
i,erisinde
simge
uygulaau
-Java
kultulphanesinde
bulunanturm
simgeleraranmaktadir. Birdiger
soyleyi,le, eldeki i,aretin her bir par,asi i,in (belli bir e,ik
buyuklgui ge,tigi
sulrece)
vektorler hesaplanip bu par,aninkultulphanedeki
simgelerebenzerligi
hesaplanmakta, en ,ok 5ekil]: Sistem mimarisi.benzedigi
simge bulunmaktavebenze,im oraniyinebir e,ikdegerin
(genellikle%90 ya da %95)uzerindeysebu par,aninBeilgeerden
yoiniendirien
yakia,er
mia
simgelerin
o simgeolduguna
karar verilip bu par,a eldeki i,arettenkookartdimasl
ye
herbeigenin
i,cerdigisimgeieri
ye silinmektedir. Bui,lem eldekii*aretin
her par,asi birsimgeyekoordinatiarini
iisteleyen
kodkitabi
oiuldturuimasi
C++'dae,le*tirilene
ya dayeni
birsimge
olarakklltllphaneye
ilave yaziianbirprogramiaturulanmkod
k ii2'dermirn
bir edilenekadarsulrmektedir.
beige yebununi,inoiu,turuian
kodkitabigosteriimi,tir.
Kod Bu makalede yukarida anlatilan "tanima" i,leminin kitabinda her satirdakiilk
sayibelgedeki
simgenin performansini artirmak i,inliteratulrde
dahaonceden onerilen(kultulphaneye gore) numarasini,
diger
dort
sayi
ise "histogram tabanli bolutleme" algoritmasikullanilmi*tir.
koordinatlarini
(bironceki
sembole gore
goreceli
olarak
x ve WBylece, eldeki belgeden ,ikartilan bir i,aret sadece y eksenindefarklar,
simgegeni,ligi
veyuksekligi)
algoritmaninbuldugu
noktalardan (ve genellikle az sayida) vermektedir.par,alaraayrilmaktadir. Buradaelbette sistemperformansinin
artmasi
kar*iiiginda
tanimaba*arisindan
fedakarlik yapiiabiimektedir.Bu
boliutieme
teknigi,soyie oizetienebiiir
[31. Arap,ca(oizeiiikie
matbu)keiimeierde karakterierin
birie,sme
noktaiarindaki
geni,sig~in
karakteringeni,sig~inden
,cok
daha azoidugu goruimu,stur.
Buradan hareketie, keiimeyioiu,sturan
r._ .,i
Ei.>. ~~~~Web-tabanli
IBS uygulamasi sc~ilen sorgu alaniningwt.b -11 6!X"
<,' 1,,, 1t ~koordinatlarini
belirieyerek o belgede sc~ili alanda bulunant£< + S +. <<
Ei xr =i ; X41
l~~itapiarinda
ayni simgeilerin peiendeii anrer belirvdiger.tmlo < S v_
r... _, rq
E-g}4~~~~~kars1ihk
Son olarakgelen
sorguOsmanlica
sonucunda tespit edilen kod kitapiarina(sayisaiiastiriimis)
beigeler
41*J; < - 12 S4b;@lkuiianiciya sunulur. Bu beigeler uzerinde sorguya cevap olan
9>
< <
| - }C 3
S~ ~~
alaniar
renkli olarak
goisterilir.
441
jS
_ fJ; lN
i1rJ-r
4.
Sonuvlar
,f0 3;kr - i-| Bu makalede Osmanli ar,sivieri i,cin sayisaiia,stiriimi,sbeigeler
W _ w _ W
~~~~~~~~~uzerindeicerik-bazii
sorgulm
itmnnikaiiratiimi,stir. Boiyie bir sistemin ger,cekie,tiriimesinde gerek
Osmaniica'nin dii oizellikleri gerekse ar,sivlerin buyuklugu ye 5ekil2: OrnekOsmanlica beige(soida)vye kar,shk ,ce,sitiigiinden kaynakianan oinemli zoriukiar oidugu bir gelen kodkitabi (sagda). ger,cektir. Bu ,cah1,ma ,cer,cevesinde beigelerden Osmanlica
Son~~ ~
ku.nc
nentaalzl(ei )aaiiiisimgeierin
,cikartiiamamasi
ye
taninmasi
i,cin
,ce,sitii
sistemdeki Osmanlica beigeleri tarayabiiir ye se,ctigibir beige ykaiirgi~iii yuam~y nentUeid uzerindedikdoirtgen
bir alani* , ,.,,,X sorgulamada kuilanmak .a~nbrpottpsse ku.nclrEl~~~~~~~Bde
ediien sonu,clar geiecek
,caii,maiar i,cin
sum~u. cesaretamaciyiabeiirieyebiiir (~~ekii 4)
vericidir.
Bumakaie
i,cin
geiecek
,caii,maiar
arasinda
,suniar
_____________________________________________sayiiabiiir: (i)oizeiiikie yapay siniragiarinin ye daha geli,smi,s4simge tanima aigoritmaiarinin
sisteme adapte ediimesi, (ii) -' iiS5t!gms1test veni kulmesinin yulzierce beige seviyesinden ,cok dahar iS| X} i.,^1bulyuk
rakamiara
,cikariimasi,
(iii) sisteminmakui
birtanima
,,,:A1gh':n
~~~~~~~~yllzdesiyie
ger,cek beige kllmeieri uzerinde,caii,acak
haiinin f2 Y2l W2>/ LiLiKbl6k; #$rLw~bu
aiandaki
uzmaniarin
hizmetinesunuimasi, ye
(iv)sistemin riiSA *1ek1 c.ir~~~~~uzmaniardan
geiecek
geri-biidirimiere
go$re
hataiarini
>;>ig
ffrf;>S ~~~~~duzeitecek ,sekiideesnekhaie getiriimesi.
xi i66*; {Sjh
txi
~~5. Te~ekkur
,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, >itYE
SipAtiiBu
,caii,ma
Deviet Pianiama
Te,skiiati
2004K120720sayiii
*iFiig, X 1 4
~~~~proje
tarafindandestekienmi,stir.
Dahao$nce geli,stiriien
sistemin kodiarini saglayan A. Kemai Sinop'a ye bu liai.iailadtd: g
,c~~~~~~aii,smada
bahsediien
yakia,simiarin
kodianmasinda yardimci
oianIsmetZekiYainiz yeHakanYiimaz'a te,sekkurederiz.
+
~~~~~6.
Kaynakva
.~~~~~~~~~~~~~~~~1
*
~~~[2]
Deviet
Ar,sivieri
GeneiMuduriugu
Web Sitesi,5ekil3:Osmanii
ar,sivieri
IBSsistemi Webarayulzu.
[3] Amin, A., "Off-iine Arabic Character Recognition: The State of the Art", Pattern Recognition, Vol. 3], No. 5,_
~~~~~~~~~~~~~~~~~1998,pp.
517-530.I 1
~~~~~~~~~~~~~[4]
Witten, I. H., Moffat, A. and Beii, T. C., ManagingI *- E * z I
~~~~~~~~~~~Gigabytes,
InternationaiThomson Pub., 1994.$>1 el
~L i4
sJ 4 .. [5]Atici,
A. A. andYarman-Vurai,
F. T., "A Heuristic * lti * t t lg~~~~~~~Aigorithm
for Opticai Character Recognition of Arabick>-J=
1TL
A- Script", Signal Processing, Vol. 62, 1, 1997, pp. 87-99.| S 1 4Ij .-\J¶ [6] Oztulrk. A., Gune,s, S. and Ozbay, Y.,"Muitifont Ottoman
I ffi * v11 * * rt i 1
In~~~~~t.
Conf. onEiectronics
Circuits and Systems(ICECS),
| > * } dwf gI~~ December 17-20, 2000, pp. 945-949, Jounieh, Lebenon.
|~~~~~~~~~~~~~~~7 4aykoi, B.,eSino, A. K., "CnetBGldllkbay, U., Uiusoy, 0.
| t * * t
* t~~~~
Ottoman Documents Stored as Textuai Images", IEEEg! # g
~~~~~~~~~~~~~~Transactions
on ImageProcesn(TP,vl13no,
2004, pp. 314-325.