• Sonuç bulunamadı

Osmanlı arşivleri içerik-bazlı sorgulama (İBS) sistemi

N/A
N/A
Protected

Academic year: 2021

Share "Osmanlı arşivleri içerik-bazlı sorgulama (İBS) sistemi"

Copied!
4
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

Osmanli

Artivleri Iserik-Bazli Sorgulama (IBS)

Sistemi

Content-Based Retrieval

(CBR) System

for

Ottoman Archives

Ismail

Sengo5r

Altingo5vdel,

Ediz

3aykoll,

Ozgur Ulusoy',

Ugur

GzdPkbay

, A. Enis

(7etin2,

Muammer

G5qmen3

1

Bilgisayar

Muihendisligi

B6luimui,

Bilkent

Universitesi,

Ankara

2

Elektrik

ve

Elektronik

Muihendisligi

B6lumui,

Bilkent

Universitesi,

Ankara

3

Islam Tarihi

ve

Sanatlari B6lumi,

Suileyman Demirel Universitesi,

Isparta

{ismaila, ediz, oulusoy, gudukbay}@cs.bilkent.edu.tr, cetin@ee.bilkent.edu.tr, mumen@sdu.edu.tr

Ozet e Ancak tahmin

edilebilecegi

gibi,

bu durumda sadece

,,zumlemeleri

yapilmi*

belgeleri yine sadece bu Bu

qali*mada sayisalla*tirilmi*

Osmanli ar,iv belgeleri ,czumlemelerde ge,en Tulrk,e kelimelerle sorgulamak ve uzerinde i,erik-bazli sorgulama yapilabilmesini

saglayan

bir

sonu,ta

da belgelerin kimlik bilgilerini almak mulmkuln sistem onerilmi,tir. Sistemde belgelerden ,ikarilan olabilmektedir. Bu makalede geli,tirilen Osmanli Ar,ivleri

tanimlanmami*

i,aretlerin yonlendirilmi, bir

yakla*imla

daha IBS

(I,cerik-Bazli

Sorgulama) sistemi ile bu soylenenlerden onceden simge

kultulphanesine

yerle,tirilen simgelerdenen,ok daha farkli ve

geli,mi,

fonksiyonlarin saglanmasi

benzeyene e,le,tirilmesi

saglanmi*tir.

Kullanicilar istedikleri hedeflenmektedir: Herhangi gibi bir on tasnife veya bir belge uzerinden istedikleri simge grubunu se,erek belge ,cozumlemeye ihtiya, duyulmaksizin, varolan Osmanlica

kulmesi

i,erisinde aratabileceklerdir. Sistemin prototipi ,u an belgeler

direkt

olarak dijital ortama aktarilip kullanici Internet uzerindekullanicilarin hizmetine

aqilmi*tir.

eri,imine a,ilabilecek;

kullanici Osmanlica

simgeler

uzerinden ornek-tabanli sorgular yapabilecek ve bulunan belgelerin sadece kimlik bilgilerine

degil

metin-resmi Abstract

,seklindeki

goruintuisuine

de

ula,abilecektir. Boylece

hem Wepropose acontent-based retrieval(CBR)systemfordigital

,cozumlemesi yapilmami*

belgeler de elektronik ortamda Ottoman archive documents. In this system, the symbols

ara*tirilabilecek,

hem de

Osmanlica

bilen

ara*tirmacilar

extracted from the documents are matched with the most isterlerse

,czumlemedeki

kelimeler ile

degil

direkt

Osmanlica

similar one in the symbol library, which is created in a

sembollerle

arama yapabilmek

imkanina

kavu*acaktir.

Bu supervised manner. The users specify queries by marking a durum, bir taraftan tasnif vb.

a,amalarda

belgelerin

otomatik region on an example document and the system retrieves all olarak bir

on

gruplandirilmaya

tutulmasini

saglayip

bu documents that include thesymbolsfound in the queryregion.

i,lemlerle

ugra,an

uzmanlara i*ik

tutacak,

diger

taraftan da bu Aprototypeof the system iscurrentlyavailable on the Web.

belgeler

uzerinde

ara*tirma

yapan

ki,ilerin istedikleri

belgeleri orijinal diliyle arayip kolaycabulabilmesine imkan verecektir. Boylece Osmanli ar,ivleri uzerinde bilimsel

1.

Giris

qali*malar

yapan

tulm

ara*tirmacilarin

i,lerinin onemli olciide

kolayla*masi

ve eri,imin hem kalitesinin hem de hizinin Osmanli ar,ivleri,

yllzyillarca hulkulm

surmu,s bir artmasi

saglanacaktir.

imparatorlugun

milletimize

birakmi*

oldugu

kultur mirasi Yukarida

bahsedildigi

uzere Latin alfabesi ile

yazilmi*

i,erisinde hi, ,suphesizkiolduk,a onemlibir yer tutmaktadir. yeni ve

dulzguln

baskili materyalin

sayisalla*tirilip,

optik Her nekadar buar,ivler,

ge,tigimiz

onyillarboyuncasayisiz karakter tanima sistemleri ile metine ,evrilebilmesi kolayve

ara*tirmacinin

en temel

kaynagi

olmu,sa da, ar,ivlerin

yulksek

ba*ari

oranlarinda (%99'a varan)

mulmkuln

olsa da,

i,erdigi

engin bilgi ve belgelerin

bultuln

potansiyeliyle farkli alfabeler ve basim kalitelerindeki belgeler i,in ayni kullanilabilmesi ve

ara*tirmalarin

daha hizli, kapsamli ve

ba*aridan

bahsetmek

mulmkuln

degildir [3].

Ozellikle

verimli

yulrultullebilmesi

i,in

gulnulmulz

teknolojisinin Osmanlica belgeler

du,sunuldugunde

a*ilmasi

gereken onemli yardimina ihtiya, vardir. Bilgisayar bilimindeki ilerlemeler zorluklar ,Oyle siralanabilir: (i) Osmanlica dil ozellikleri sayesinde

buguln

ba,ta Latin alfabesi olmak uzere ,e,itli (biti,ik yazim, harflerin kelimedeki yerlerine gore farkli dillerde

yazilmi*

eserlerin

sayisalla*tirilarak

dijital ortama ,ekillerde yazilmasi, kelime i,erisinde bo,luklar aktarilmasi ve uzerlerinde geli,mi, sorgular da dahil olmak bulunabilmesi, vb.), (ii) Ar,iv belgelerinin i,erik

,e,itliligi

uzere ,e,itli i,lemler yapilmasi

mulmkuln

olmaktadir

(ornegin,

(ar,ivde matbu ve el yazisi belgelerin bulunmasi, ve ozellikle bkz. [1]). Devlet Ar,ivleri Genel

Muldulrllgui'nuln

bu ikinci gruptakilerin ,ok farkli yazi stilleri ile

yazilmi*

,cali,smalariyla

Osmanli ar,sivleri

de son

birka,c yii i,cerisinde

olmasi), ye (iii) Ar,sivleri olu,sturan beige

kulmesinin

sayisal

sayisal

ortama

aktariimaya

ba,sianmi,stir

[2].

$u

an

i,cin

(2005

bulyulklugu.

Bu

zoriukiar

go$z o$nune aiindiginda tulm

ar,siv

yiii itibariyia)

bu kurumun Internet sitesinden

Tulrk,ce

anahtar

beigeleri i,cin hizii ye

kesin olarak

i,cerik-bazii

sorgulama

soizculkler

girilerekbeigelerin

,cozumiemeieri

(transkripsiyon) yapabilecek bir sisteminin bir anda olu,sturulabilmesi uzerinde arama

yapiiabiimekte ye

sorguya cevap olan

mulmkuln goirulnmemektedir.

Ancak, bu

zoriukiar

farkii beigelerinkimlik bilgilerine

uia,siiabiimektedir.

ara,stirmaciiarin

ar,siv beigelerinin degi,sik alt

kulmelerine

yogunla,sarakyeni

,cozumier

buimasiyia

a,siiabiiir.

(2)

Bu

qali*ma

,er,evesinde, el yazisi ve matbu Osmanlica * (likartilan i,aretlerin simge kultulphanesinde daha once belgeler i,in i,erik tabanli bir sorgulama sisteminin ilk kaydedilmi, simgelerle

kar*ila*tirilarak

(eger

varsa) adimlari

atilmi*

ve prototip bir sistem ortaya

qikarilmi*tir.

benzer simgenin tespit edilmesi. Bu ama,la bahsedilen

A*agidaki

bolumde ilk once

literatulrdeki

benzer

qali*malar

qali*mada

bir yonlendirilmeyen (unsupervised)

yakla*im

kisaca

tarti*ilmaktadir.

U,cincu boluimuinde, simge

kullanilmi*tir.

Bu

yakla*imda

simge ,ikartici modul kultulphanesinin

olu*turulmasinda

kullanilan yonlendirilmi, Osmanlica karakterler hakkinda herhangi bir on bilgiye

yalka*im

ve histogram boluftleme

teknigi

anlatilmaktadir, ve sahip

degildir,

yani

ba*langiqta

simge kultulphanesi Web-tabanli prototip sistem sunulmaktadir. Dordulncul bo,tur. Modulresimden her bir izole i,areti

,ikardiginda

bolumdeyse varilan sonu,lar ve olasi gelecek

qali*malar

kultulphaneye

o ana dek kaydedilmi, simgelere bakar,

belirtilmektedir.

eger

kayitli simgelerdenbirieldeki i,arete (veya i,aretin

iqerisinde

bir par,aya) belli bir e,ik

degerin

uzerinde

2. Onceki (;alimalar

benziyorsa o

i,aretin

(veya

par,asinin)

bilinen bir simge

Latince karakterler

i.eren

dilolduguna

hulkmeder,

koordinatlarini ve

hangi simge

Latince

karakterlerve eren

diller

krt n

basnli

eserlerin

olduunu

kayit

ederek bir sonraki

i'arete

ge.er.

Eger

sayisalla,stirilmasi ye optik karakter tanima sistemleriyleelkiiae nekerbnzrbummiabnuyi elektronik ortamda metin belgelerine ,evrilip sorgulanmasi bir sime

oarak

'kl

eye

ilaver

eder.

bunueesi

i.i

yaia

.aimlr*

nogul*i eeiee bir

simge

olarak

kuituphaneye

ilaveeder.

Boylece

simge

i,cin

yapilan

,cali,smalar

,su an

olgunla,smi,

denebilecek

kultuphanesi

sabit bir stildeki alfabe harfierini degil, dulzeydedir [4].

Diger

taraftan,

Arap alfabesiyle biti,ik

belgelerde

bun

durumuna

balf

oa

harfierin

yazilan belgeler

i,in ayni ol,icde bir

ba*aridan

soz etmek

betlg

lerdeku

hlrini

uarli

ira

haferin

mulmkuln

degildir.

Amin'in onlarca makaleyi

taradigi

'ti

ka

ybileeki

r.

qali*masinda,

Arap,a belgeler i,in optik karakter tanima

kapsayabilecektir.

sistemlerinde kullanilan ,e,itli

yakla*imlar

(karakter Dikkate

deger

bir

diger

konu da

belgeden

qikartilmi*

bir bolumleme, yapay sinir

aglari,

,izge teorisi tabanli

i,aret

ile

kultulphanedeki

bir

simgenin

benzerliginin

nasil algoritmalar, Markov model tabanli algoritmalar, vs.)

kar*ila*tirilacagidir.

Bir

belgede

bulyulk

yazilmi*

bir harf siralanmakta, ancak bu

yakla*imlarin

hi, birinin karakterlerin

(simge)

bir

ba*kasinda

,ok kiiuik

yazilmi*

olabilir.

dogru

taninmasi i,leminde istenen

ba*ari

seviyelerine Sembollerin benzerlik

kar*ila*tirmasi

i,in

bahsedilen

,ikamadigina

dikkat ,ekilmektedir [3]. Her ne kadar

qali*mada

uzaklik ve

a,isal

dagilim

vektorleri

kullanilmi*tir.

Osmanlica Arap,a'dan farkli bir dil olsa da, genel yapisi Bu

vektorlerin simge

bulyulklulguinden

bagimsiz

olmasinin itibariyle Arap dillerine olan benzerliklerinden dolayi, bu yukarida belirtilen ol,ceklenebilirlik sorununu

,cozdugu

konuda yapilacak

qali*malarda

ilgili literatulruln taranmasi belirtilmi,tir.

faydali gorulmu,stur. Bu makalede

genel

olarak

yukaridaki

bu son

qali*mada

Literatulrde

dogrudan

Osmanlica ya da Osmanlica sunulan ,er,eve esas

alinmi*

ve gerek simge

kultulphanesinin

belgeler i,in yapilan

qali*malarin

sayisi ise ,ok daha azdir.

belirlenmesi, gerekse simgelerinin

kar*ila*tirilmasi

sirasinda Atici ve Yarman-Vural'in

qali*masinda

[5] oncezincir kodu

degi,ik

yakla*imlar

uyarlanarak performansin artirilmasina (chain code) donu,sumu karakter darbelerine

uygulanmi*,

qali*ilmi*tir.

tanima i,lemi i,inse gizli Markov modelinden

yararlanilmi*tir.

Sistem

ba*arili

olmakla

beraber, bu

ba*ari

3. Osmanli Arsivlerini Icerik-Bazli Sorgulama

algoritmanin zayiflatma (thinning)

a*amasinin

kesinligine

bagimli

durumdadir. Bir

diger

makaledeyse Osmanlica

3.1.

Simge

k.titiphanesinin

y.nlendirilen yakla.imla

karakterlerin yapay sinir

aglari

ile taninmasina

,ali,ilmi*tir

olu>turulmasi

[6].

Bu

qali*mada

tanima a,amasinda sistemin karakterleri

biti,ik bir sembol grubundan nasil

,ikardigi

a,ik,a Simge

kultulphanesinin

olu*turulmasi

bu makalede hedeflenen belirtilmemi, olmasina

kar*in, anla*ildigi

kadariyla gerek i,erik tabanli sorgu sisteminin gerek performansini gerekse sinir

aginin

ogrenmesi,

gerekse tanima testleri sirasinda sorgu cevaplayabilme

ba*arisini

belirleyen en onemli

a*amasi

sistem sadece izole durumdaki harfleri

kullanmi*tir.

Bu durumundadir. Burada, onceki

qali*madaki

[7] yonteme durumda harflerin

dogru

tanimlanma

ba*arisinin

%94'lere alternatif olarak bir yonlendirilen

yakla*im

onerilmi,tir. kadar

,ikabildigi

gorulmu,stur.Ancak bu makalede ongorulen Bunun gerek,esi ise ,syle a,iklanabilir:

sistem i,in tanima i,leminin belgenin tulmul uzerinden Osmanlica karakterlerin belgelerde olduk,a farkli ger,ekle,mesi

gerektigi

a,iktir. Yapay sinir

aglarinin

bizim bi,imlerde(ve biti,ik ,ekilde) yazilabiliyor olmasi ve bu ,e,it sistemimizde de kullanilabilmesi i,in

qali*malarimiz

belgelerin harfler

di*inda

i,aretler de i,erebilmesi (motif,

sulrmektedir.

,izik, leke, vs.) sebebiyle yonlendirilmeyen

yakla*im

farkli

$aykol

ve Ark.'nin [7]

qali*masindaysa

ama,, oncelikle belgelerden ,ikartilan pek ,ok i,areti yeni simgeler olarak eldeki belge

kulmesinden

bir "simge"

kultulphanesi

(alfabe) kaydetmektedir. Boylece simge kultulphanesi

istenildigi

olu*turulmasi

vesonrasinda da herbelgenin

i,erdigi

simgeleri ,ekilde harflerve bunlarin ,e,itli yazim bi,imlerini

kapsadigi

listeleyenbir metindosyasina (kod kitabi)donu,sturulmesidir. gibi, istenmeyecek ,ekilde bahsedilen

harf-di*i

pek ,ok Simge ,ikartici alt

modulul

temel olarak ,u i,levleri

sembolul

de i,ermektedir. Bunun bir sonucu olarak da simge

gercekle,tirmektedir:

kutu!phanesi

cok buyumektedir. Simge cikartimi sirasinda o ana kadar

kultuphaneye

ilave edilmi,s simgeler, eldeki yeni * Belge-resmi uzerinde bulunan

tulm

izole

iEaretlerin

,cikarilan

simgenin

i,cerisinde

aranmakta, bu arama sirasinda

(birle,sik

siyah nokta

gruplarinin)

bulunup

,cikartilmasi.

eldeki simgenin

i,cinden alinan

her

par,ca i,cin uzaklik ye

a,cisal

Bui,s icin

literatllrde

bilinen algoritmalar

kullanlmi,stir.

dagilim vektoirleri

geri kalan

tulm

simgelerin

vektoirleriyle

(3)

bulyulmesiyle sistem performansinin du,smesine yol

baglanti

noktalarindaki toplam

deger

a*agidaki

formulle

a,abilmektedir. gosterilen ortalamanin altinda olacaktir. Bu formullde

Alternatif olarak onerilen yonlendirilen

yakla*imda

(Denklem 1), NCsultunsayisi,

Xj

isejsultunundakisiyah piksel Osmanlica belgelerde

bulunabilecegi

du,sunulen karakterler sayisidir.

(,e,itli yazi tiplerinde) daha onceden simge kultulphanesine

elle ilave edilmi,tir. Bu simgeler Osmanlica harflerin ,e,itli Ortalama=

(lINJ)

' C (1) bi,imleridir; ,icnkulharfler kelimenin

ba*inda,

ortasinda veya J'= I

sonunda farkli bi,imlerde yazilabilirler. Simge kultulphanesi

Boylece

bu

baglanti

noktalarindan

kelime

par,alanarak

bu ,ekilde olu,turulduktan sonra daha once

oldugu

gibieldeki her

par.anin

bir harfe

(ya

da bizim sistemimizde

simgeye)

belgeden ,ikartilan her

i*aret

kultulphanede hazir bulunan

benzerligine

(yine daha once

bahsedilen vektorler

simgelerle

kar*ila*tirilacaktir.

Elbette ki bu

yakla*imin

da

kuiianiiarak)

bakiiabiiir.

Ancak bu

yakla*imin

dezavantajlari

bulunmaktadir: Sistemin adaptasyon kabiliyeti

uygulanabilmesi iqin histogramin

i.inde

pe* pe*e

gelen

(farkli yazim bi,imlerini taniyabilmek

a,isindan)

simge tepeler

arasidaki

uzakligin

karakter

geni,liginin

1/3'ulnul

kultulphanesine

konulan harflerle sinirli olacaktir.

Eger

ge.memesi

gibi

bazi

ko*ullarin

saglanmasi

gerekmektedir.

Bu kultulphane yeterince kapsayici

degilse

belgelerde bulunan bakimdan bu

yakla.im

klltllphanedeki simgeier

iqin 6nceden

i,aretler

kultulphanede

sinirli sayidaki simgeden ilgisi olmayan

tanimianacak

bir

e*ik

karakter

geniliii

degerine bagldir

ve birinebenzer olarakbulunabilir (yadahi, bir simgeyebenzer esnek

degildir. Diger

taraftan ise

yapiian

deneylerde

bu bulunmaz). Bu durum da sorgularda

dogru

belgeleri

yakla*imin

test

yen kllmesinde

tanima

kesini..inde

fazia

bir bulabilme oranini du,surecektir. Burada bir ,czum yolu

kayba

yoi

a.madan

simge

tanima

i..eminin

hizini

inemi

sistemin ba,ka simgelere benzetmekte

zorlandigi

simgeleri oranda

arttirdigi

gozlenmi,tir.

saklayip, belirli araliklarla kultulphaneye ilave etmek uzere

degerlendirmesidir.

Ornegin,

her bir ka, bin belge i,lendikten 3.3. Prototip Sistem sonra, bu taninmayan simgeler kendi aralarinda

kar*ila*tirilabilir.

Boylece, ,ok sik rastlanilan simgeler Yukarida aniatiianyakia,smiar haii hazirdaInternet uzerinde otomatik olaraktespit edilebilir. Busimgeler daha sonra bir

qali*makta

olanbirprototipsistemde([7]'de

anlatilan

mimari uzmana sunulup

kultulphaneye

eklenmeden once kullanici ve kodlamanin uzerine adapte

edilerek)

ger,ekle,tirilmi,tir.

onayi alinabilir ve yari-otomatik bir ,czumle kiltulphane Sistem mimarisi

$ekil

2'de

verilmi,tir.

i,eriginin dogrulugu

korunabilir. Her ,artta bir takim simgelerin ka,irilmasi

mulmkulndulr.

Ancak, bu

yakla*im

nispeten

daha

du,suk

tanima

ba*arisiyla

da olsa daha

bulyulk

kutpoiaL

belge

kulmelerinin

i,lenmesine olanak

sagladigi

i,in cazip gorunmektedir. Deneyler sirasinda da bu

yakla*imin

simge

tanima hizini ve buna

bagli

olarak birim zamanda -

gikaiiai

Bec

tmd

i,lenebilecek

belge

sayisini onemli miktarda

arttirdigi

Wigeler vetag3llF kaab1i (tx

g6~~rilml* 1 -i

3.2. Histogram tabanli

boluitleme

V

g1

Daha once

bahsedildigi

uzerebir belgeden ,ikartilan izole her I rns

i*aretin

(harf

veya harf

grubu

olabiiir)

i,erisinde

simge

uygulaau

-Java

kultulphanesinde

bulunan

turm

simgeleraranmaktadir. Bir

diger

soyleyi,le, eldeki i,aretin her bir par,asi i,in (belli bir e,ik

buyuklgui ge,tigi

sulrece)

vektorler hesaplanip bu par,anin

kultulphanedeki

simgelere

benzerligi

hesaplanmakta, en ,ok 5ekil]: Sistem mimarisi.

benzedigi

simge bulunmaktavebenze,im oraniyinebir e,ik

degerin

(genellikle%90 ya da %95)uzerindeysebu par,anin

Beilgeerden

yoiniendirien

yakia,er

mia

simgelerin

o simge

olduguna

karar verilip bu par,a eldeki i,aretten

kookartdimasl

ye

her

beigenin

i,cerdigi

simgeieri

ye silinmektedir. Bui,lem eldeki

i*aretin

her par,asi birsimgeye

koordinatiarini

iisteleyen

kod

kitabi

oiuldturuimasi

C++'da

e,le*tirilene

ya da

yeni

bir

simge

olarak

klltllphaneye

ilave yaziian

birprogramiaturulanmkod

k ii

2'dermirn

bir edilenekadar

sulrmektedir.

beige yebununi,in

oiu,turuian

kodkitabi

gosteriimi,tir.

Kod Bu makalede yukarida anlatilan "tanima" i,leminin kitabinda her satirdaki

ilk

sayi

belgedeki

simgenin performansini artirmak i,in

literatulrde

dahaonceden onerilen

(kultulphaneye gore) numarasini,

diger

dort

sayi

ise "histogram tabanli bolutleme" algoritmasi

kullanilmi*tir.

koordinatlarini

(bir

onceki

sembole gore

goreceli

olarak

x ve WBylece, eldeki belgeden ,ikartilan bir i,aret sadece y ekseninde

farklar,

simge

geni,ligi

ve

yuksekligi)

algoritmanin

buldugu

noktalardan (ve genellikle az sayida) vermektedir.

par,alaraayrilmaktadir. Buradaelbette sistemperformansinin

artmasi

kar*iiiginda

tanima

ba*arisindan

fedakarlik yapiiabiimektedir.

Bu

boliutieme

teknigi

,soyie oizetienebiiir

[31. Arap,ca

(oizeiiikie

matbu)

keiimeierde karakterierin

birie,sme

noktaiarindaki

geni,sig~in

karakterin

geni,sig~inden

,cok

daha az

oidugu goruimu,stur.

Buradan hareketie, keiimeyi

oiu,sturan

(4)

r._ .,i

Ei.>. ~~~~Web-tabanli

IBS uygulamasi sc~ilen sorgu alaninin

gwt.b -11 6!X"

<,' 1,,, 1t ~koordinatlarini

belirieyerek o belgede sc~ili alanda bulunan

t£< + S +. <<

Ei xr =i ; X41

l~~itapiarinda

ayni simgeilerin peiendeii anrer belirvdiger.tmlo < S v

_

r

... _, rq

E-g}4

~~~~~kars1ihk

Son olarak

gelen

sorgu

Osmanlica

sonucunda tespit edilen kod kitapiarina

(sayisaiiastiriimis)

beigeler

41*J; < - 12 S4b;@lkuiianiciya sunulur. Bu beigeler uzerinde sorguya cevap olan

9>

< <

| - }C 3

S~ ~~

alaniar

renkli olarak

goisterilir.

441

jS

_ fJ; lN

i1rJ-r

4.

Sonuvlar

,f0 3;kr - i-| Bu makalede Osmanli ar,sivieri i,cin sayisaiia,stiriimi,sbeigeler

W _ w _ W

~~~~~~~~~uzerindeicerik-bazii

sorgulm

itmnnikaiir

atiimi,stir. Boiyie bir sistemin ger,cekie,tiriimesinde gerek

Osmaniica'nin dii oizellikleri gerekse ar,sivlerin buyuklugu ye 5ekil2: OrnekOsmanlica beige(soida)vye kar,shk ,ce,sitiigiinden kaynakianan oinemli zoriukiar oidugu bir gelen kodkitabi (sagda). ger,cektir. Bu ,cah1,ma ,cer,cevesinde beigelerden Osmanlica

Son~~ ~

ku.nc

nentaalzl(ei )aaiiii

simgeierin

,cikartiiamamasi

ye

taninmasi

i,cin

,ce,sitii

sistemdeki Osmanlica beigeleri tarayabiiir ye se,ctigibir beige ykaiirgi~iii yuam~y nentUeid uzerinde

dikdoirtgen

bir alani* , ,.,,,X sorgulamada kuilanmak .a~nbrpottpsse ku.nclr

El~~~~~~~Bde

ediien sonu,clar geiecek

,caii,maiar i,cin

sum~u. cesaret

amaciyiabeiirieyebiiir (~~ekii 4)

vericidir.

Bu

makaie

i,cin

geiecek

,caii,maiar

arasinda

,suniar

_____________________________________________sayiiabiiir: (i)oizeiiikie yapay siniragiarinin ye daha geli,smi,s

4simge tanima aigoritmaiarinin

sisteme adapte ediimesi, (ii) -' iiS5t!gms1test veni kulmesinin yulzierce beige seviyesinden ,cok dahar iS| X} i.,^1

bulyuk

rakamiara

,cikariimasi,

(iii) sistemin

makui

bir

tanima

,,,:A1gh':n

~~~~~~~~yllzdesiyie

ger,cek beige kllmeieri uzerinde

,caii,acak

haiinin f2 Y2l W2>/ LiLiKbl6k; #$rLw

~bu

aiandaki

uzmaniarin

hizmetine

sunuimasi, ye

(iv)sistemin riiSA *1ek1 c.ir

~~~~~uzmaniardan

geiecek

geri-biidirimiere

go$re

hataiarini

>;>ig

ffrf;>S ~~~~~duzeitecek ,sekiideesnekhaie getiriimesi.

xi i66*; {Sjh

txi

~~5. Te~ekkur

,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, >itYE

SipAtiiBu

,caii,ma

Deviet Pianiama

Te,skiiati

2004K120720

sayiii

*iFiig, X 1 4

~~~~proje

tarafindan

destekienmi,stir.

Daha

o$nce geli,stiriien

sistemin kodiarini saglayan A. Kemai Sinop'a ye bu liai.iailadtd: g

,c~~~~~~aii,smada

bahsediien

yakia,simiarin

kodianmasinda yardimci

oianIsmetZekiYainiz yeHakanYiimaz'a te,sekkurederiz.

+

~~~~~6.

Kaynakva

.~~~~~~~~~~~~~~~~1

*

~~~[2]

Deviet

Ar,sivieri

Genei

Muduriugu

Web Sitesi,

5ekil3:Osmanii

ar,sivieri

IBSsistemi Web

arayulzu.

[3] Amin, A., "Off-iine Arabic Character Recognition: The State of the Art", Pattern Recognition, Vol. 3], No. 5,

_

~~~~~~~~~~~~~~~~~1998,pp.

517-530.

I 1

~~~~~~~~~~~~~[4]

Witten, I. H., Moffat, A. and Beii, T. C., Managing

I *- E * z I

~~~~~~~~~~~Gigabytes,

InternationaiThomson Pub., 1994.

$>1 el

~L i4

sJ 4 .. [5]

Atici,

A. A. and

Yarman-Vurai,

F. T., "A Heuristic * lti * t t lg

~~~~~~~Aigorithm

for Opticai Character Recognition of Arabic

k>-J=

1TL

A- Script", Signal Processing, Vol. 62, 1, 1997, pp. 87-99.

| S 1 4Ij .-\J¶ [6] Oztulrk. A., Gune,s, S. and Ozbay, Y.,"Muitifont Ottoman

I ffi * v11 * * rt i 1

In~~~~~t.

Conf. on

Eiectronics

Circuits and Systems

(ICECS),

| > * } dwf gI~~ December 17-20, 2000, pp. 945-949, Jounieh, Lebenon.

|~~~~~~~~~~~~~~~7 4aykoi, B.,eSino, A. K., "CnetBGldllkbay, U., Uiusoy, 0.

| t * * t

* t~~~~

Ottoman Documents Stored as Textuai Images", IEEE

g! # g

~~~~~~~~~~~~~~Transactions

on Image

Procesn(TP,vl13no,

2004, pp. 314-325.

Referanslar

Benzer Belgeler

Bunlardan birincisi, öğrenciler bilimsel sorgulamayı ve bilimsel sorgulama ile yapılan deneylerle yeteneklerinin gelişeceğinin bilincinde olmalıdır.. İkincisi, bilimsel

g) COVID şüphesi olan veya şüpheli semptomları taşıyan hastalar gerekli testlerin yapılmasını sağlamak amacı ile Sağlık Bakanlığının COVID hasta yönetim

Cihodaru, Zanavarda'yı Dobruca'da Türk hakimiyeti devrinin müstakbel liman şehri olan Karaharman ile ayni olarak gösterirler.. Muahharen

Faik Reşid Unat, pek haklı olarak, buradaki Leh elçisi Mehmed Efen- di'nin kimliği üzerinde durmakta ve bunun 7 nr.lu Nôme-i Hümayun Def- teri12 ile Hammer

Asya'daki mücadeleleri, Kuzey Siüng-nu'nun Han'lara teslim olması ve sonradan yine isyan etmeleri, Han hükümetinin Orta Asya'daki küçük dev- letlerle münasebetler,

Yeni dönemde görev alacak yardımcı editörlerimizin ve meslektaşlarımızın katkıları ile Tepecik Hastanesi Dergisi'nin daha da güçleneceğine ve uluslararası düzeyde hak

Han'ın mutemed ve gözde beğlerinden Kingeş Koygan Oğlu Dervişek Mir- za da Mangıt ilindendP 0 • Mangıt kabilesi beğlerinden Edigü Beğ de ay- nen Nogay gibi

SULTAN ALP ARSLAN DEVRiNE AiD BİR KÜMBE1 117 zengin tuğla süslemeler, Türk mi'marisinde daha sonraki devirlerin mi'mari süslemelerine kaynak olmuştur.. Özellikle·