• Sonuç bulunamadı

Kaynak Keşif Yeteneğinin Artırılması için İnternet Kaynaklarının İçeriklerinin Standart Biçimde Tanımlanması görünümü

N/A
N/A
Protected

Academic year: 2021

Share "Kaynak Keşif Yeteneğinin Artırılması için İnternet Kaynaklarının İçeriklerinin Standart Biçimde Tanımlanması görünümü"

Copied!
33
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

BügiDünyası 2(X)(). 1(1):56-88

KAYNAK KEŞİF YETENEĞİNİN ARTIRILMASI İÇİN

INTERNET KAYNAKLARININ İÇERİKLERİNİN

STANDART BİÇİMDE TANIMLANMASI

Baha OLGUN* - Hayri SEVER**

Öz

lnternet kaynaklarının makinaca anlaşılabilir olmamasından dolayı, kullanıcıların bilgi ihtiyacını karşılamada sorunlar yaşanmaktadır. Kay­ nakların yapısal olarak gösterilmemesi ve nasıl yorumlanması ge­ rektiğinin ilgili kaynağa özgün çözümlerle hal/edilmeye çalışılması, ilk göze çarpan nedenleri oluşturmaktadır. lnternet kaynaklarının gerek sa­ yısal ve gerekse de hacimsel olarak çok hızlı artışı göz önünde bu­ lundurıJlduğunda, içerik sözcüklere dayalı arama makinalarına ilaveten, otomatik kaynak keşfine ve bilginin harmanlanmasına olanak veren ya­ zılım araçlarının gerekliliği ortaya çıkmaktadır. Bu tür yazılım araçlarının başarısı ise, işlenecek kaynakların modellenmesinin standart bir biçimde yapılmasına çok yakından bağlıdır. RDF (Resource Description Fra­ mework), böyle bir çabadan doğan anlamsal bir modellemedir ve bu model üzerinde yapılan çalışmalar WWW (World Wide Web) Kon­ sorsiyumu tarafından kontrol edilmektedir. DC (Dublin Core) üstveri ele­ manları, elektronik katalog bilgilerini tutmak için, RDF"in genişletilebilir/ik özelliği kullanılarak tanımlanmıştır. Bu makalede, RDFIDC modeli kul­ lanılarak Türkçe elektronik kaynakların içeriklerinin tanımlanmasını sağ­ layan H-DCEdit adlı editör aracı tanıtılacaktır. RDF modelinin seri/eştirme sözdizimi olarak SGML (Standard Generalized Markup Language) kul­ lanılmıştır. Bu çalışmaya ek olarak, RDF/DC belgelerinin, DSSSL (Do­ cument Style Semantics and Specification Language) standardı yar­ dımıyla farklı belge biçimlerinde yeniden biçimlenmesi de sağlanmıştır.

Anahtar Sözcükler: lnternet kaynak keşfi, Web maden/eme, RDF, DC, SGML, DSSSL, editör.

ABSTRACT

Since lnternet resources are not yet machine-understandable, there are some problems with satisfaction of information needs of users. Un­ structural representation of resources and employing ad-hoc solutions tor

Arş. Gör., Hacettepe Üniversitesi Bilgisayar Mühendisliği Bölümü (baha@hacettepe.edu.tr) •• Ooç. Dr., Hacettepe Üniversitesi Bilgisayar Mühendisliği Bölümü (sever@hacettepe.edu.tr) 56

(2)

Kaynak Keşif Yeteneğinin Anınlnıası İçin Internet Kaynaklannın

İçeıiklerinin Standart Biçimde Tanımlanması Bügl Diinyas: 2()(J() l(J).56,J8

the issue of how to interpret these resources constitute the reasons that an eye would easily catch at first sight. Given that a drastic and staedy in­

crease in the number as we/1 as in the volume of lntemet resources has been obseNed over years, in addition to search engines based on content terms, the necessity of software agents being capable of automatically discovering and haNesting these resources has arisen. Success of this type of software agents very closely depends on standartization of mod­ eling of resources to be processed. A semantic modeling defined as a re­

sult of such an effort is called RDF (Resource Description Framework), and the studies on this model is controlled by WWW (World-Wide Web) Consortium. The DC (Dublin Core) metadata elements have been defined using the property of extensibility of RDF to handle electronic catolog in­ formation. in this article, an authoring editor, called H-DCEdit, is intro­ duced. This editor makes use of RDF/DC model to define contents of Turkish electronic resources. To serialize (or to code) a RDF model, SGML (Standard Generalized Markup Language) has been used. in addi­ tion to this work, by using DSSSL (Document Style Semantics and Spec­ ification Language) standard, the format information in regard to a given

RDFIDC document has been separated from its content, and hence H­ DCEdit provides different views of an RDFIDC document.

Keywords: Discovery of lnternet resources, RDF, DC, SGML,

DSSSL, Web mining, authoring editor.

1.GİRİŞ

lnternetin günümüzde ilgiyle karşılanmasının bir nedeni, büyük miktarlarda bilgi içermesidir. lnternet üzerindeki her şey makinaca-okunur özelliğe sahip ol­ masına rağmen, makinaca-anlaşılır özelliğe sahip değildir {Lassila 1998). Bu durum lnternet üzerindeki verinin kullanıldığı işlerin otomatik olarak yapılmasını . engellemektedir. Büyük miktarlardaki lnternet verilerini klasik yöntemlerle iş­

lemekse bilgi miktarının büyüklüğü açısından imkansızdır.

Web 1 tabanlı bir yazılım aracının (software agent) bilgiyi otomatik olarak ta­ nıma, yorumlama, keşfetme yeteneği HTML (HyperText Markup Language) di­ line özgü bir takım karakteristik kısıtlamalarla sınırlı kalmaktadır. Örneğin. çeşitli sitelerdeki elektronik satış kataloglarını tarayarak belirli bir ürün bazında müş­ teriye en uygun fiyatı sunmaya çalışan bir yazılım aracının, belirli bir katalogda

Web ve lnternet kelimeleri, makale boyunca eş anlamlı olarak kul/anılmışlardır.

(3)

Büa olgun - Hayri sever Bllgı Düryası

2ag,-} . ] (1i5G38

ürün adınln "<l>ad:</l>" ile nitelendirildiğin1 öğrenmesi, başka bir katalogdaki ad nitelendirmesi konusunda ona pek bir ipucu Vermez.

Bu

.<b>adl</b>'' ola-bileceği gibi 'isim:' de olabilir (Doorenbas, Etzioni Ve Weld 1 996). Fiyat bilg jsi

bi-rimi katalogdan kataloğa değişebilir. Benzer şekilde, bir elektİonik (daha özel olarak Web) katalogda ürünler arasl jlişkileİ hiper bağIaçlar (hyper links) araclllğl ile kurulur. VeriIen bir katalog bazlnda, hangi ilişkinin (benzer, opsiyon, genel, özel, parça, vb.) hangi hiPer bağlaç taraİlndan sağlandığlnln öğrenilmesi, -ki bU

öğrenme

süreci zaman

açıslndan oldukça

pahall

Ve

elle

(manuel) ger-çekleştirilen bir

süreçtir-

başka kataloglara da uygulanabilen bir kazanıma te-kabül etmeyebilir. Aynca, HTML sayfasın|n içeriği doğal dİl ile yazılmış saf me-tinlerden oluşur. Doğal dil ile yazılmlş metinlerden, içerik ile algili bilgi çlkarmak ise pratik değildir (Etzioni 1996; Manber Ve Bigot 1998). Bundan dolayl, metin üzerinde yapllan kelime arama yönteminden, daha farkll Ve daha etkin bir yön-tem araylşl başlamtştır. Buna bağll olarak, arama işlemlerinde ihtiyaç duyulan biİ-gilerin oluşturulması gerekliliği de ön plana çıkmıştır, Üzerinde arama yapllan

belgenjn konusu,

yaza\ ya da

yayım tarihi gibi bilgilerin anlaşllmasl ge-rekmektedjr. Bu bilgilerin doğal dil ile yazllmış belgenin metin içeriğinden çl-kanlmasl

da

oldukça güçtür, hatta imkanslzdlr. Öyleyse

bu

bilgiler

iyi

ta-nlmlanmlş olmalı

ve

makinaca-anlaşılır

bir

biçimde tasarlanmalüdlr. Sorgu

sonuçlarlnın iyileştiriIebilmesj, daha akıllı sorgularln yapllabilmesi, kaynaklann özelliklerinin tanlmlanması Ve standart bir yölrtemin Varllğl ile sağlanabitir.

lnternet üzerindeki kaynaklar, saklanma biçimlerine göre, yapIsal otmayan,

yarlyaplsal, ya da tam yaplsalVerilerden oluşur. Veri biçimlerindekiçeşitliliğe pa-raleI olarak, bu Verileri işleyen yazllIm araçlan mimarileri

de

larkllllk gös-lermektedir. Yap|sal olmayan Veriler için arama makinalar| (search engines) yaygın seçenek olarak yer almaslna karşln, yaplsal olmayan ya da yarl yapısal Veriler

için meta-arayıcılaf

(metasearchers)

Ve

yaplsal

VeriIer

için

ara-bulucular (mediators) kullanllmaktadIr (Gravano Ve Papakonstantinou 1998).

Bi ngla-arayıc,, yapüsal olmayen lntamel ka0aklan ü2qinclen kullanücınün bilgi lhlyac]nü karşlamacta, arama makinalannü kullanlflar. Mota.alayıcılann bu bağlandaki ana işlevj, taban aldıklan arama na-kinalannln veitabanlannı kullanıclya şollaı hale getirmekir.

2

(4)

rüyrıak r,eşif YeEneğinin Anırılrıası iÇn Intemet toynaklarııın

içeriklefinin sandan Biçimde Tanmlanması Bııgl Düüır,as' 2tü. 1 t l ) 56.ü

Aşağlda, meta-araylcllarda Ve arabulucularda ortak (ya da işlevsel olarak ben-zer) işlemler açlklanmaktadlr.

sistem yaplslnda her bir dağltlk Veri kaynağtyla ilişkili bir Paketleyici (wraP-per) bulunur. Veri kaynaklar|, her biri farkll biçimlerde verileri bulunan ve farklı §orgu girdi Ve çlktllanna sahip bağlmslz arama makinalan olabilir. Paketleyicinin

görevi, Veri kaynaklan için ortak bir Veri modeli görünüşü sağlamaktlr.

Pa-ketleyici, aynı zamanda, bir ortak sorgu arayüzü kullanma olanağl da sağlar.

Meta-araylcl ya da arabulucudan gelen sorguyu ilişkili olduğu kaynağln özel sorgu diline çeVirir. Kaynak taraİlndan iletilen sorgu sonuçlannI da ortak Veri mo-deline dönüştürür. BU sayede arayüz şeffaflığı sağlanır.

Meta-arayıcıların ve arabulucuların sistem işlevleri de üç ana işlemle ifade

edilebilir:

veri

tabanl seçimi,

sorgu

dönüştürümü

Ve

sonuçlarln

bir, leştirilmesi (Gravano Ve Papakonstantinou, 1998). VeritabanI seçiminde sorgu ile ilgili Verinin bulunduğu Veri tabanı belirlenir. Sorgu dönüştürümü adımında, sorgu, seçilen her bir Veritabanl üzerindeki paketleyicinin anlayabileceği bir

bi-çime dönüştürülür. ilgili Veritabanı paketleyicisi sunulan sorguyu işletir Ve

so-nuçlarl döndürür. Sonuçlann birleştirilmesi adlmünda

ise,

döndürüIen bu soİgu sonuçlan belirli bir taklm işlemden (tekrarlı bilgilerin aylklanrnasl,

'arklı slralama algoritmalarlnca slralanm|ş belgelerin yeniden slralanmaya tabi tUrulmasl, farkll kodtanmlş aynl tür bilgilerin tek bir kodlamayla ifade edilmesi3, vb.) geçirildikten sonra bİrleştirilir (Gauch ve Wang 1996).

Meta-araylcılar, prensip olarak yaplsal olmayan metinler (düz

ya

da ser-bestçe hazlrlanm|ş metinler) ya da yarl yaplsal sayllan lakl (tag) ile işaretlenmiş belgeler (HTML, SGML ya da XML) üzerinde işlem yapar ve dağıtık veri kay-naklarl üzerinden kullanlcllara tek bir küreseI sorgu arayüzü sunarlar, Dağütlk Ve tam yaplsal Veriler, örneğin ilişkisel Vera tabanlarl, ilgili paketleyiciler taraflndan

modellenir Ve bu yerel Veri modelleri üzerinden arabulucu (mediators) katmanl/ aracl arac|llğl ile tek bir küresel sorgu arayüzü, kullanlclya sunulur (Manber Ve

3

Kodlafuadaki (Encodjlg) t'aü*ttük, i4iti bilginin Mslü tı)ıulduğu jüa iügiüidn. Örn6ğin, sücakl]k bltgisi soğuk, ülık ve srcak ile ilade edilebilocEi qki şanligrat ile da

(5)

lösıenlebiln-Büa Olgun . Hayri Sever Biıgı Dürülrsı 2ta0 , 1(]),56a8 Bigot 1998). Arabulucular aynl zamanda etiketlerinin Ve düğümlerinin özel an-lamlan olan Ve çizge ile ifade edilen yan yaplsaİ belgeler üzerinde de çal|şlrlar.

Yukarda yapllan tartlşmalar çerçevesinde, arama araçlarlnln yetefjnce kesin sonuçlar döndürebilmesi Ve heterojen lnternet kaynaklarlnln tümleştirilmesi (in-tegration) için gereksenen model, şu Veya bu şekilde üstveri (Veri hakk!nda Vari) tantmlama Ve sözcük haznesi kontrolu olanaklarlnl sağlamall Ve çeşitli uygulama alanlarlna genişletilebilir

olmalİ

r, denilebilinir (Singh 'l998). Bu konudaki en

id-dialı seçenek de, RDFa (Resource Description Framework) modelidir. Çünkü

RDF karmaşık ilişkileri tanlmlama yeteneğine sahiptir, kultanlml koİaydlr, model üzerinde sözcük haznesi kontrolu mümkündür Ve genişletilebilir esnek bir an-laylşa sahiptir.

Üstveri çeşitli uygulamalara kaynak otmaktadIr. Üsweri, Web kaynaklarınln içeriklerinin tantmlanmaslnda yani kataloglamada kullanllabilir. Arama araçlarl taraf|ndan daha kesin sonuçlar elde edebilmek amaclyla, katalog girişleri olarak kullanllabilir. Üstveri, elektronik ticaret alanlnda bilginin kodlanmaslnda da kul-lanılabilir. Bunların yanında, Web sayfalar|na erişimin filtfelenmesi amaclyla içe-rik etiketi olarak kullanllabilir. içerik seçimi iIe ilgili çallşmalar büyük öIçüde web

üstveri kavramlna dayandlrllmaktadır. Elektronik ortamda, elektronik imza olarak kullanıImasl da üstveri uygulama alanlarındandır. Aynca üstveri, kişileı.in ya da Web sitelerinin gizlilik özelliklerinin de İanlmIanmaslnda kullanllabilır. En yaygln

olarak ise; üstveri, elektronik belgelerin içerik bilgilerinin Ve entellektüel özel-liklerinin tanımlanmaslnda kullanlllr, AnlaŞllacağ| gibi, Web kaynaklannın da için-de oIduğu eIektronik kaynakların ve tüm elektronik ortam nesnelerinin (Web

say-falan, Web sİteleri, kullanlcllar, vs.) kesin Ve açlk tanlmlarlnln yaplImasl çok önemlidir (Lassila 1 998; wond... 1998).

4

RDF (Resourca Desciplibn Framework), üstveri işlenmesiyle ilgili bir modeldir ve web üzeindeki na-kinaca-anlaş

i

bilginin uyqulanalar ans]nda işlenebililiğini sağlal. RDF, Web kaynaklarünün atonatjk iş-lenmesini sağlayan alanaklan içeir. wold Wide web Kansorsiyumu, lntemeı üstvei için yeni bir standad olarak RDF madelini sunmuştul RDF tasarüfu süraslnda çeŞjli disiplinler üstvei qösleimi ve laş]nmasıyla ilqili konularda kaIkıda bulunnuşladn. HTML (Hypeftex! Markup Language) üslven, PlcS (Platt'arm far ln-Iernet conlenl selec on), SGML (standard Generalized Markup Language) va xML (Fxtensible Markup Language) slandailanndan yararlan müştür. Bunlar dışında, nesneye-yöneljk progranlana kavramlanndan ve veri tabanı kavramlanndan da yanrlanılnıştül.

(6)

Fül,nak Ke§if Yeteneğinin Anln]ına§ı lçin Intemet Kamaklannın

içeriİlerinin sandart Biçimde Taüımlannıası Bılgı Dilrlrsı )0tü , ] )::{Jü

RDF modelinin amacl, Web kaynaklarlna ait üstverinin tanlmlanmasl, iliş-kilendirilmesi Ve standartlaştlnlmasıdlr.

RDF

ile tanlmlanacak kaynaklar URl

(Uniform Resource lndicator) ile isimlendirilebilecek tüm kaynaklardır. Fakat

kaynak ile ilgili herhangj bir kısıtlama getirilmemiştir. RDF uygulamadan, söz-dizimdenVeortamdanbağlmslzbirmodeldir(world... 1999b).

RDF modeli, yönlü etiketli çızge ile gösterilebilir. RDF Verisi, düğümler Ve dü-ğüme iIiştiriİmiş öznitelik/değer çiftleri ile iİade edilebilir. Düğümler herhangi bir

web kaynağl otabitir. Öznitetikler düğümlerin isimlendirilmiş özellikleridir Ve çiz-gede Web kaynağınl gösteren düğümden çıkan yay olarak gösterilir|er. Öznitelik değerleri ise ya atomiktr (karakter dizgi) ya da başka düğümdür. Özniielik de-ğerleri de çizgede yaytn diğer ucundaki düğüm olarak görünürler. Yani RDF mo-delinin temeli düğümlere, özelliklere Ve değerlere dayanır. sözgelimi, A'nln bir B özelliği Varsa Ve B'nin değeri

c

ise; A ile

c

bir çizgenin düğümleri olurlar. B ise aralanndakiyayln etikelidir. Yayın yönü ise A'dan c'ye doğrudur.

RDF modelinin t4nımlarlnI bir kütükte saklamak Ve uygulamalar araslnda kul-lanmak için, çizge gösİerimini serileştirme dili olarak XML (ExtensibIe Markup Language) kulIanılmaKadır. RDF ile XML birbirlerini tamamlamaktadır (Lassila 1998). XML, RDF modeline serileşme sözdizimiolarak destek Vermektedir. RDF

ise XML dilini güçlendirmiştir Ve XML, üstveri tanlmlarlnI anlamll hale getirmek için RDF tanlmlanna ihtiyaç duymaktadlr. Her ne kadar XML, RDF gösterimi için seçilmiş olsa da, diğer sözdizim biçimleri de kullanllabilir Ve bu konuda kesin bir klsltlama yoktur.

BDF'IanlmtnIn Çizge ile Gösterimi

._iaT5?-->

www.cs.hUn.edu.tr webadmin

(7)

Büa o]gun - }Ialri sever 8ılgı Düıros, 2ün l 0 ):fiag RDF Tanımının XML ile Gösterimi

<?XmlVersion='1 .0'?> <rdl:RDF xmlns: rdf ="http://www.w3.org/RD F" xm lns:dc="http://pur1.orgy'Dubl jncore''> <rdf :Description about=-http://www.cs.hun.edu.tr'> <rdf:Description> <rdf:RDF>

RDF, üstveri kodlamasi için önceden tanlmll bir sözlük içermez. Çeşitli

amaç-larla geliştirilmiş sözlüklerden destek allr. Bir sözlük, kaynak tanlmlama ko-miteleri laraflndan tanlmlanmlş üstveri elemanları ve öznitelikler kümesidir. Dub-lin cores Initiative (Dublin... 1998) uIuslararasl birçal|şma komitesidir Ve RDF modelinin üzerine kütüphane kataloglarl için gerekli üstveri elemanlarını ek-lemek üzerine yoğunlaşmlştlr. Bu çalışmanın sonucu

Dc

(Dublin core) üstveri elemanları kümesi olarak bilinir.

Dc,

RDF modeli üzerine inşa edildiği için, kı-saca RDF/Dc olarak da adlandlnllr.

Var olan üsfueri elemanlarl kümelerinin farklılığı; Web üzerinde kUllanllacak, birbirini tamamlayacak ama birbırinden de bağımslz ele allnabilecek üstveri ele-manlan kümelerinin tasarlanmaslnl gerektirmektedir. WWW Konsorsiyumu (kl-saca

w3c

olarak da biIjni0 taraf lndan geliştiriIen RDF, genişletilebilme özelliği

sayesinde

temel

yapl

taşı

görevi

yaplp,

bir çok

üstveri kümesini des-tekleyebilmektedir. Dc, bu amaç doğrultusunda yapllan bar çallşmadır Ve RDF

modeline saylsal kütüphaneler açlsından destek Vermektedir.

Dc

elektronik kaynaklar için basil bir içerik lanlmlama modeli sunar. An-lamları üzerinden uluslararast çalışma grupları Ve uzmanlar taraİ|ndan fikir birliğa 5

62

Dublin core elektronik kaynak keşfinds, kullanülan üstvei alemanlan kümesjniifade eder. Dublin core gi-rişimi, lnlemel'in gelişon altyapüsında önomli bh yer tutmaya baştafuüş!ır. Dublin core bi9ok komjte

ta-rahndan, kaynak lanımlama konusuncla anlamsal

bi

ol1ak yaklaşüm geliştirme açüsından

des-leklenmektedi. Bu sayecle, yapılan çahşmalar uluslalarasü bir geçdiliğe ulaşmışır. Dubüin Core standadü on beş eleman jçeir, Elemanlann genel anlamlaı Üzeince utrslararasü liki billiği oluşmuştur.

(8)

Kzynak Leşif Yeteneginin Anınlııası için lnlernet r\aynaklanft n

içeriklerinin sıandan Biçimde Tanunlanması Bugl Dİoİrası

]M

ü(' $38 oluşmuş on beş üstveri elemanlndan oluşur (Dublin... 1998).

Dc

üsfueri ele-manlarl şunlardlr : Başhk, (Title),Yaralğ (creator), Kon,J (subject), Tanlmlama (Description),Yaylmc] (Publisher), orijinal Kaynak (sou rce), Kalkl Y apan (cont-ributoo,Tarih (Date),Tür (Type),Biçim (Fornat),Belirleyici (ldentifie0, ilişki (Re,

lation),

Dl

(Language), Kapsam (Coverage) Ve Haklar (Rights). BU elemanlarln

bazılarının an'Iamı açlkça tanlmlanmıştlr, bazülarl ise henüz deneyseIdir. Ta-nımları açık olan elemanlann da kullanlm biçimleri konusunda bir sınlrlama yok-tur. Dc üstveri eIemanlarlnln uluslararasllaşmasl için de çahşmalar sürmektedir. Böylece üstveri elemanlarlnln kullanlmlnın ulusal niteliklerden bağımsız hale ge-tiriImesi sağlanmaya çallş|lmaktadlr.

Dc

üstveri elemanlarının avantajlarlnın başında kullanlmlndaki basitlik gelir.

Bunun yanlnda, elemanlarln anlamlarının

da

aynl şekilde yorumlanmasl Ve arama işlemlerinin aynl sonuçlarl üretilmesi sağlanmaktadır. Bu özelliği, üstveri elemanlarü üzerindeki uluslararasü anlaşma Ve katkılar da desteklenmektedir.

Ay-rıca elemanların genişletilebilmeii olanağl sayesinde, özel uyguİamalarda

Dc

eIemanlar|na ek yapllabilmesi de mümkündür.

lnternet artlk sadece tanltlm sayfalarlnın sergilendjği Ve kullanıcıların bu say-İalar üzerinde gezindiği sanal bir ortam olarak düşünülemez. lnternet büyük

mik-tarlarda bilginin saklandığl heterojen Veri tabanİarl kolleksiyonu olarak dü-şünülmelidir (Singh 1998), Kullanlcllara, lnternet bilgileri üzerinde sorgulama olanağı sağlamak da önemli bir çallşma konusu olmuştur. Klasik anlamda sorgu işlemleri, okunabilir Web kaynaklarl üzerinde yapllabilen işlemlerdir Ve kaynak içeriği içinde kelime arama yöntemini temel almıştlr. Bu yöntem her zaman doğru sonuçIar olUşturmamakta, sorguIar çoğunlukla istenilen dlşında sonuçlar üret-mektedar. Yelerince kesin sonuçlar üretilememesinin en önemli nedenleri, kay-naklarün tanlmlanmasıyla ilgili bir yöntemin eksikliği Ve kaynak hakklnda bilgiye ulaşmak için kaynağın kendisine ulaşllmasl zorunluğudur. Üstveri kavramı, kla-sik anlamda, Web kaynaklannün sorgulanmasl yöntemlerinin değişmesini sağ-lamlştlr. Anahtar kelime arama yöntemi yerine, daha üst düzeyIi bir kavramsal model üzerinde inceleme yapma yönlemi gelmiştir.

(9)

Baha olgun - Ha,Yri sever B gı Düqa.1 2(xn.I(]lfr&9 Üstveri üzerindeki ilk çahşmalar wWW Konsorsiyumu'nun P\CS (Plattorm for lnternet content selecıion) adllçahşmasl ile başlar. PlCs (World...1999c) bjrsu-nucudan istemcilere, Web sayfalarıyla ilgili bazl değerlendirmeler iletmek için kullanllan bir yöntemdir. Bu değerlendirmeler, Web sayrası içerik bilgileridir. Ör-neğin, bir sayfan|n yetkili bir araştlrmacl taraİından yaratlhp yaratılmadlğı;

iÇe-riğinde şiddet, cinsellik

ya da

bozuk

dil yer allp

almadığl gibi bilgiler de-ğerlendirme öıçütlerdir.

Plcs,

sabit öıçütler kulIanmak yerine, bir değerİendIrmğ sisteminin yarahlmasl için standart bir yöntem sunar. Böylece kullanlcılar Web sayfalarlnln kendi ölçütlerine uymayanlarlnl İiltreleme olanağt bulurlar. Özellikle aileler çocuklarlnln lntemet kullanlmlnda belirli ölçütler koyarak, onlann kötü et-kilenmeleriniengelleyebilirler.

Plcs

slnİrll birkullanlm olanağ|na sahiptirVe daha

genel amaçlı içerik

tanımlamasında kullanIlamaz.

Ömeğin

sayısal

kü-tüphanelerin Ve lnternet kaynaklannln içerik tanlmlaylcl bilgilerinin oluşturulmasl

gereksinimlerini karşllayacak işlevsel yeterliliğe sahip değildir.

Bu

nedenle

WWW Konsorsiyumu, Web için daha genel üstveri tanımlama modeli olarak

RDF

çalışmaslnI başlatmlştır- RDF klsaca web kaynaklannln işlenmesinin oto-matikleştirilmesini sağlayan olanaklarl ifade eder.

Benzeri bir üsveri çallşmasl da

KlF

(Knowledge lnterchange Format) dilidi.

Birgösterim diliolarak KlF'in çok iyi tanlmlanm|ş bir sözdizimi Ve semantİğiVar-dır (singh 1998). Aynl zamanda işleç önde tarzında bir ifade dilini (prefax Version ol İirst-order predicate calculus) kullanlr Ve KlF'le karmaşlk ifadeler tanlmlamak mümkündür.

KlF

sadece üstveri tanlmlanmasında kullan|ldığlndan,

KlF

cüm-leleri ile ilişkili eylemi irade etmek mümkün değildir. Bu nedenle, KlF dilinin üze-rine bir iletişim katmanl görevi yapacak Ve KıF cümleleri için istem türünü

ta-nlmlamaya yarayacak başkaca dil özelliklerini sağlayan

KQML

(Knowledge Query and Manipulation Language) kullanılır (Singh 1998). Her KQML iletisi, bir iş|em türü ve i|gili KlF ifadelerini içerir. KQMLve KlF kullanılması, anlamsal aç|-dan kuwetli üsfueri tanlmlama Ve etkin işleme olanağ| sunar. Ancak ifade ye-teneği gelişkin olan bu katmanll modelin uygulamaya konmasl kolay değildir. Bu nedenle RDF, basitliğiyle bu modele göre önemli bir avantaj sağlar. Ayrlca RDF

modelinin anlaşllmasl ve iİade edilmesi daha kolaydır.

(10)

ç9 !ü]ğüuuepese|

u!5!

lepulnep)el ıdeuQ6 ouü'

ulueapq o^ nı uuepıue uawpa§ü üaueaı

ıeulqeJnğnlo e6pq ua.ıa5! !d!q Fsıde/('1wos üpuepüzeq

ıpepue§ uoıPluopl 1xe!-6u!sso9oJd pue ealgo -uep{s pazllqauao pJepue€ dn Jew a6enate1 nwo' :6188 og uepuüPJq (uo!rez!ue6.]o spJeNe]S puolpuo]ul osl 'u!5! ıewp6 uepulseıs? ulepfuos Jn! ng l§euep -Jryıeauns u!]ouap opulJoz| !6lq !ıapu!a! oqoq e.ıepMelpı ep agq lPuuns l§eu4p euepese| üsıcle]( aaeq

ıau'a ng !üpelıeun,4w 'ueuÜ weq aarczell

'e,lüıü!ü awztuQl Jlq ıeaele4.üeı lulJelululsrleJeo uuepüue

D| ,leuuelln ,Jepltlqaleaa]sü aa! el'nuos u)e|ezeü( ep ueLl l

opu!Ölq

ıuİe ueuez,ıaıJ

ül!6lq

)Eıoıue

nx eaoq 4üu+epepue§ ısıdetr nı ıuualrlalsü uue|cüue zeuele|Üeı nıun' ıq

ıol

te\e!

,Jepap

\euJıpueJl BpuüDüpües ex§eq 'ellq Jüq eİeuo ufuos aaoa ,üue.er6 ı]epezel uepueŞ lulJepaaq Jıq eİıcleüI -ep -.]e^ laopnzo' uuepnJos !I!6I alü{üseunıŞw epuLüa4 eluop ulapapq §üuuepl2eq e$IJeuo ıluüuel3 ,zouJül!loöp nuopJ uluueuöp ı]$eq nq 'allq esp \ıJe! ğOuN96 hepalıço )üp]ute 0p uapunaO\w Uluoaeq 'et! npü !rlepu!3! o6pq ıI2Ü uıu]ueaep ıüFeq !rapu!5! o6pq J!€ ,!p!l!q! alt!ğıülzlp ullqpeuep 'ıo5

uelıeup J9le.ls! ıdBİ eü!s!6lq lugplpq o'ü§ıdel uluaapg uluoapq uuuepEwslg anaıpuan]ufuQ' rceu ütı6lı

ep )eüe"ü6uuc el 'JBlııFeq !ıepu!5! g6pq )!a ,!p!9!6l!q üdeı 'ıJel€Lülpq lulJe|oJ uuaplsoı lrtopua uıou

Jlg 9puepe 'unJos uepelıe uyopapq uapüJJo^ ıeaeülel§es ıuısealJüpüJelüde^ deİ ululs!fuq ,!p!o!lıgıe

puag Jıpıpü§aq aetü}uu,{e !l!6l! gl§Oulpj uepruŞop !a!Jaa! uluadpq ueuepüzeq 0ıu0!

'JIpe]\euBuerJE gp ,Jıp!?auıJea! uazeq op ılJaJ! -ıe

!au!Fz? )]e ğf,euırleu u!.ıep6pq ugıJepızeq 'esİluspeu unung ,Jıpe»Ieueweuüğq Denu2le !fit! ol! pa$OunJQo upepdpq nq epJepunp lzeq 'ep esnc^ou )alaal -u_ol !Nğe' !!a! euJe]ıe eleu!ıeu uepeOlrteu uepdpq \epeı au )oH Jığ!w!p6 apq

lpouç ıuıseau§ epwelJo Jüa nt uepücıue oulJaŞüp -el 'lluoJuep upap5pq ue\Joı§np 'ıs9uğBlu6İel u!.üellcuel§! galpy alüpoN b6en6ue1 dnıJew pezteJauo9 uepuas) 1wos -eö ep

ıeıe|o

u^p 'ppuıup^ u!u!saurıığa|ıaö]e6 ııal§; ,ııq ıluıelue alı(ııalıuıse1 Ip

unl

ualsıs

,ıauIpaııauıaIlauap ıuual§ı,(al§ı uLıa|uJısaı lle ııe;lnp1o ılııl§ılı 'ası ue;u.ııuel tıa5lq

.ınl a6|eq ılefep auııuıııplıq 1y195 ,ııpılŞeq auıu!JIpI!q

]u\cs

.:alıel§ı 'uepunQnp|o uals|s Jıq ıl|auıal

ly195

uıalsıs ıqı6 nŞnplnJ96 ap, ! l|ıa§ ]!pla|uJlsaı uaualığ auJelsls uepuEğlp !a|Lulsaı ualllaı -sQ6 n^oı epe.ıng ,.ıı§ıu.ıluals96 ap, r

lııa§

auı|ııq a|,(!ıaluıısaı p 'ısa6z!ö

^a|ğ! ",ppo1111) t (866 apuua|auInJn$nugp J!q tuılel ,:e1>1ılı(e1o1 ıpeupuıplQes )

ualsıs

a,-l!!X

ue|o |||p auJtı§e|uas uualeElaq ueue|uııuel apuı|apouı

co/log

a^ l!paıığure|ıalsep ualla}ıPJP) aÖ>l.ı41 'apuuala6laq

-ly!es

ueı(n euıtuıuel.:çı1 nq 'ıuıuel,ın1 a6laq

1yl99

uelıde1 ,,ı4§ııuue|u.ııueı uepuı|eıpl (986 t ",|puo|ıEuıatu|) 9"lli\9)S ıeJeullP |auo] ltl,]lzlpzgs

co/JoH

'lslde^ 6o|eıP) ,llpuaI16|lq 6otPlPı uele lauıa} ıuı|apouı

co/Jou

ası nunjn uıuıılızp1 ,Jıı§ıulıu?||nı up||EJnı

JoU

IauJal a^ ,ıu§ıu-ılııaı{,ıaı( apıuıöıq apes epıuılızeı{ aulIapoul

loU

,,ıılöıu.ılıuellnl leje;o 1nlzos Jıq apuı|apouı

loH

ıJpIueuJa|a ua^ısn

co

Eptııı|ızp1 ,,ııp!sau]|u[ğa|)io5ıa6 uıuı|ız -e,(.ılq ueAelQes lUlsEtlJue|ulueı u!uua|ı!jaöl uı.ıelleu,(e1 ıüuolua|a 'ıe,leIluel

-|nı

llP|uE[uaIa uaNsn

co

a^

llapoul

lou

'lcP[ıJe uıuılızP,( ualull§llag J-lo3co-H : wl,tzV^ Nv^\nU{lNvl lN|U3,D|lH]Öl

ıvN^V)

$ıNu3tNl

,z is?tuuu ltuüurI JptUI5üg u?puns ulupallpa5l uruw!{vu(ol ıauJalul uı51 ıstıuluıuy uıuıŞauaıalJü§ax )pu,(sx 9 8899

ol

'NOa ıİDİll|lo |8Pg

(11)

Baha olgun - Hayri Sever Bılgı Dün}a.İı 20N , ](1) 5648 hştlrllabilir. sistemin alt kesimleri mümkün olduğu kadar birbirlerine slkl bağlü ol-mayacak biçimde tasarlanarak, her bir alt kesimin yeniden kullanılabilirliği amaç-IanmıştIr. Ancak editör kesimi sistemde, diğer alt kesimlerden destek alan kesim olduğundan bu tanImlamanln dışlndadlr. Çizelge 1'de yazlllm alt kesimlerinin satır saylsl bilgileri Verilmiştir.

Şekil 1. sistem modeli

l

RDF/DC Aynştıncı

<_

sGl/L

Belgesi

SGML

Belgesi

<->

{

Yerel yardlmcl programlar (Vi, netscape, xview...) Yeniden biçimlenmiş belge çlktlsı (html, rtİ, TeX) SGtvlL Bildirimi

Dc

lemanlar Editörü :ıDS§§L]:Bildii]'üi ::,Biaariİ]]BililiiıiTii] RDF/DC Belge Tür Tanımı

RDF/Dc

Bicem Tanımı

rrş'--Çr..

(12)

rü}l]ak rleşif Yeıeneğinin Anınlması için Internet lQlnaklarınln

İçenklerinin Sandart Biçimde Tanımlanması Bı18l Dijqrıs, 20N, 1(]156ü

yazlllm Alt kesimi Programlama Dili Satlr Saylsl

sP-1 ,2 (sGML Aynştlrlcl) C++ 70.000

C++ 800

H-DcEdit 1 .0

c(MoTlF)

5.000

JADE1.0,1

(DsSsL

N.4otoru) C++ 52.000

Çizelge 1. Yazılım alt kesimleri sattr sayllarl

2.1.

sGML

Bildiriminin oluşturulmasl

YazıIIm içinde kullanIlan

sGML

bildirimi, reİerans somut sözdizimi tanImlna uyumlu olarak tasarlanmlştlr, Bu tanlma eklemeler yapllarak

sGML

işleme sis-teminin Türkçe içeriği de desteklemesi sağlanmlştlr. Aynca SGML belgelerinde

bazl XML uzantllarınln da kullanılabilmesi için SGML bildirimine bazı ekler ya-pllm lştır (sistem içerisinoe kullanllan SGlıı'lL bildirimi için bkz. Ek 'l

).

SGML bitdiriminde

cHARsET

bölümünde sekiz ikilljk (bit) belge karakter

kü-mesi tanlmlanmlştlr- Belge karakter kümesİ iki temel kafakter kümesine da-yandtrllmlştIr:

lso

646Ve EcMA-128 (lSo Latin 5). Sekiz ikillik karakter kodlarlnI simgeleyecek karakter kümesinin soltarafı için (0-127) lso646, sağ tarafl için ise (128-255) ECMA-128 kullanIlmlştlr. Bu sayede SGML belgeleri için tanımlanan

karakter kümesi Türkçe desteği Verebilecek duruma gelmiş olur. Aşağldaki SGML bildirimi kesimi SGML belgeleri için karaKer kümesi tan lm l yapmaktadır.

67

(13)

Baha Olgun - Halri Sever Biıgi Dijnyas, 20u) . ](]):7r§

BAsEsET " Iso 646- r 98 3/ /CHARSET lntelnatlona.l Reference Veİsion

GV)//Esc

2/5 4/o "

o

9

UNUSED

929

11

2

UNIJSED

l3

l

15

14

18

UNğSED

82

95

62

1e7

1

UNUSED

" Iso Registration Number 148/ /cİİARsET ECMA- I e8 Rlght Part of Latin Alphabet Nr. 5 / / Esc 2 / r 3 4 /

I3'

128

32

uNugED

160

95

32

e55

r

U}TUSED DEscsET BAsEsET DEscsET

SGML

belgeleri,

XML

ile

uyumlu olabilecek biçimde tasarlanacağlndan,

sGML blldiriminde ilgili değişiklikİerin yaptlmasl gerekmektedir. RDF modelinde şema (world... ,1 998) Ve sözlük kullanımInda XML isim uzaylan (namespaces) kullanılmaktadlr. Bu kullanüm RDF modelinin içinde nesneye yönelik yaklaşlmlarl barındırmasının bir sonucudur. XML isimuzayl, eleman adlnln isimuzayıyla ni-telenmesi biçiminde kullanıllr. Bu sayede, ayrl şema tanlmlarl içindeki elemanlar belirlenebilmekte Ve anlamsal bütünlük sağlanmaktadİr. 'Şema : Eleman" bi-çiminde bir yazlmda Şema isimuzayınl, Eleman ise şema içindeki elemanı gös-termektedir. ":"ayıracl ise isimuzayı ile elemanl ayırmak için kullan|hr. Fakat

sGML

referans somut sözdizimi içindeki SGML isimlendirme kuralİarında,

ele-man adlarlnln belirtiminde (specifacation) ":" aylraclnln kullanlml standart de-ğildir. Bu nedenle SGML bitdiriminde NAMlNG kesimine ":" aylraclnIn eklenmesi gerekmekterdir.

(14)

rüynak r,€şif Yeteneğinin Anınlmas için Inıemet l&ynaklanrun

içeriklerinin SrandartBiÇimde Tanımlanması Rügı Diinıas, 20{n , ](1):56,88

NAıIING

LcNllIsTRT

UCNMSTRT

LCNMCIIAR

'-.:'

Yukarlda

Verilen satırlardaki belirtim!er, isimlendirme kurallarünl

açlk-lamaktadlr. NAMlNG kesimindeki belirtimler, referans somut sözdizimi üzerine

eklenmek istenen isimlendirme kurallarl ifade eder.

LCNMCHAR

kesiminde küçük harf olarak kullanllacak isimlendirme karakterleri tanlmIanlr.

UCNMcHAR

kesiminde ise büyük harf olarak kullanllacak isimlendirme karakterleri tanlmlanlr. Her iki kesime de "- . :" karakİerleri eklenerek, bu karakterlerin isimlendirme

ka-rakterleri olarak algılanmasl sağlanlr.

Bu

karakterlerden ":" karakterinin ek-ienmesi de XML isim uzayl benzeri bir kullanlml SGML beİgelerinde kullanma olanağl sağlamlştlr.

2.2. RDF/Dc Belge TürTanImI

YazllImlarln kulIandığı belge tür tanlml hem temel RDF modelini hem de

Dc

elemanlannl içerdiği için "RDF/Dc" olarak adlandınlacakhr. RDF/Dc

belgetürta-nlm|, SGML bildirimiyle birlikİe anlamlıdlr.

sGML

bildirimindeki XML uyumu Ve

Türkçe desteği BDF/DC belge lürü içinde de sağlanmlşılr. Başka bir deyişle,

XML uyumu Ve Türkçe desteği belge tür tanImında tamamlanmlştır. Aşağlda RDF/Dc belge tür tanlml kesimleriVe açlklamalan Verilmiştir.

<l-- RDF and Dc elements in tİre same DTD ->

<l-- In a,ddition, xM],like output is supported -->

< !__ RDF Elements ->

<IEIJMEMI rdf;RDF - - ( rdf:Description )* > <!ATTu§T rdf :R_DF

:o_lns:rdf CDATA "http: //www.w5.org/RDr/' )<mlns:dc CDATA " http: //pull .otg/Dc /

'

(15)

Baha olguo - Hayri s€ver Bi]gı Dijrı|aü 2a{ü0 , l(1i56ü Belge tür tanümlnln yukarlda görülen kesiminde, oluşturulacak sGML belgesi için slradüzensel olarak en dİştaki rdf:RDF elemanı tanlmlanmlştır. Bu SGt\,4L

elemanl beIgenin aynl zamanda

RDF

modeline göre tanlmlandlğlnl da gös-termektedir. Yani oluşturulacak belge içeriği <rdf :RDF> Ve </rdf :RDF> takllan (Veya belirleyicileri) araslnda oluşacaktlr. sGML belgesinin içeriği ise RDF iIe ta-nImlanan her bir kaynak tanlmlamalarl olacaktlr. RDF tanlmlamalarında, Dc üst. Veri elemanlarl özellik (properıy) olarak kullanllacaklardlr. AynI zamanda XML ile uyumluluk desteğinin ilk parçası olarak, RDF çerçevesi kuran rdf:RDF elemanl içine XML isimuzayl tanlmlan eklenmiştir.

<!ElirrITY %

pıopeıty'AirY"

>

<!ELEMEI\]'I ldf:Descıiption -

-

pTopelty;>

< | ATTLIST rdf :Description ID NMTOKEN #IMPIJED about CDATA #IMPLIED aboutEach CDATA #IMPLIED baglD NMToKEN #ndPLIİD

7o

Yukarldaki her bir RDF tantmlamasl için Varhk, eleman Ve öznİtelik tanlmiarı Verilmiştir. RDF tanImlamasınl içerecek oİan SGML elemanı rdf :Description ele-manldlr. rdİ:Description elemanlnln içerik modeli bir parametre Varllk tanlmlyla gösterilmiştir. Bu tanlma göre RDF kaynak tanlmlan belge tür tanlml içinde yer alan her eleman (ANY) olabilir. Bu biçimdeki bir gösterim belge türtanlmlna son-radan yapllacak ek bazü tanlmlarln kolay bütünleşebilmesini sağlamak amaclyla

kullanllmlştlr. Öznitelik tanlmlndaysa, tanlmlanacak kaynaklar için belirleyicinin ifade edileceği öznitelik isimleri (lD, about, aboutEach, baglD) gösterilmiştir.

Ge-liştirdiğimiz yazıllm şu anda sadece lD özniteliğini desteklemektedir. Aynca XML

(16)

ta-Kaynak r€şif Yeteneğinin Aİtınlma§ı lçin Inıernet Kanak]annın

içeriklerinin Stxndan Biçimde Tanln]laüınıast Bllİı Düüoı,s, 2aa0 1(1),5G88

nımlanndan çlkarllması da XML diline yaklaşma kapsamtnda ele allnmlştlr.

or-neğin rdİ:Descriptjon elemanlnlnda takı minimizasyonu ihmal edilmiştir. Dc Elements

< !-_

<lE}rrrrY C}6 dccontent " (#PCDATA) " >

<!EIJME}IT <lE],EMEıvr <!EI,EMENT <IEI;E [E}II <!ELEMEİüI <!ELEMENT <!ELEME}ıT <lELEMENI < |ELEMElrr <!EI,EM!NT <lELEMEıfI <|EIJMENT <!EIJMENT <lELEMENT < | ELEMEI\]'[ DC:TffLE DC:CREATOR DC:SI]B.,ECT DC:DESCRIPfION DC:PIJBLISiiER DC:COIfIRIBIIIOR DC:DATE DC:TYPE DC:FORMAT DC:IDENTIFIER Dc:soÜRcE DC:LANGUAGE DC:RiLATION DC:COVERAGE DC:RIGiftS Chdccontent; > c)6dccontent; > 96dccontent; > 96dccontent; > dccontent; > C}6dccont€nt; > Cxrdccontent; > cü6dccontent; > C}6d.ccontent; > (%dccontent; > 96dccont€nt; > C}6dccontent; > (%dccontent; > 96dccontent; > 96dccoDtent; > <IATrLIST DC:DATE

year

ODATA#IMPIIED

month

CDATA #IMPLIED

day

CDATA#I}PLr8D> <lArTuf'T Dc :R.ELATIoN

type

CDATA

#ffPLIED

Iesor]Ice CDATA #IMPLIİD >

<l-

Added Elements foT

Robots

->

<IELEMENr BoDY - - 96dccont€nt; > <|ATILIST BoDY

locatıon CDATA #IMPLIED >

(17)

Baha Olgun - Hayri Sever Bugı Dürryası x}ca , l(1),56a8 Belge tür tanlmlnln yUkarıdaki kesiminde RDF kaynak tanlmlnln ögeleri olan

Dc

üstveri elemanlarl, birer SGML elemanl olarak tan|m|anmlştlr. Bir Varllk

ta-nım|yla

Dc

üstveri elemanlarlnln içerik modeli, işlenebilir

karaKer

Verisi

(#PcDATA) olarak belirlenmiştir.

Dc

elemanlanndan ''DATE'' Ve .RELATloN"

elemanlarınln içerikleri doğrudan yazllmamakta, bunun yerine öznitelik ta-nImlarlyla eleman değerleri belirlenmektedir. on beş adet Dc elemanlarl dlşlnda "BoDY" adlı bir eleman daha lanlmlanmlştlr. BU eleman, tanlmlanan kaynağln yerel sistemdeki yerini göstermesi için dahil edilmiştir Ve asllnda kaynak üze-rinde tarama yapacak Web robotlarlna yönelik tasarlanmtş üstveri elemanldır. Bu amaçla elemanün öznitelik tanlmlnda, yerel dosya adl bilgisinin tutulmasl amaçlanmlştlr. RDF çerçevesi içinde, on beŞ Dc elemanlVe birde sonradan ek-lenen elemanla birlikte on alt| özellik kullanllmaktadlr. Başka bir deyimle,

sGML

belgesi şeklinde oluşturulacak katalog kaydI on altü özelIik ile belirlenmektedir. <!-- Entities FoT Tırİkistı gupport -->

<lEİilT

rry

ccedil

CDATA

"&#199; ''>

<lEı\rfrrY

ccedil

CDATA

"&#23l; ">

<lENTrrY

oumı

CDATA

"&#214; "> <IENTITY

ouml

,CDATA

"&#246; "> <IENTITY

gcedil

CDATA

"&#ee2;'> <IENTITY

scediı

CDATA

'&#254;'>

<lElvrrrY

ldot

CDATA

"&#221; " >

<lElirrrrr

iwhdot

CDATA

" &#255; " > <lEı\ı"frrY

Uumı

CDATA

" &#22O; " >

<lElil'frrY

uıJml

CDATA

"&#P52; "> <]EIilT

rrY obrewe oDATA

"&#eo8; ">

<!E$rrry

gbrewe CDATA

"&#24o; ">

Yukandaki SGMLvarılk lanlmlanyla, oluşturulacak SGML katalog bilgileri içe-riğinde Türkçe karakterlere karşıllk varlık referanslarlnın kullanllması amaç-lanmlştlr. Türkçe desteği için EcMA-128 içinde bulunan ancak

lSo

8859-.l için-de bulunmayan on ikj karaktere karşlllk o|arak, varhk tanImları yapılmlşıır. varhk

tanImlannln karşlllk|an, sGML bildiriminin tanlmlanan belge karakter kümesinde

(18)

F,aıııak Keşif Yeteneğinin Aİtınlması için Intemet lo}ııaklannın

İçeriklerinin Sandan Biçimde Tanmlanması Bılgı Dünrai, 20ffi 1(115€,88

de bulunan kodlardlr. YaniTürkçe diline özel on iki karaktere karşlllk reİeranslarl getirilecektir. Çizelge 2'de on ikiTürkçe karakterVe EoMA-128 içinde tanlmll sa-ylsal karşllıklan bulunmaktadlr.

Bahsedilen XML ile uyumluluk özelliklerine rağmen oluşturulan belgeler birer

SGML belgesidir. Tamamen XML diline dönüştürülmeleri için aynca bir ön

iŞ-lemeye gerek duyulmaktadlr. Ancak yapılan tanlmlar bu işlemin yükünü ha-'ifletecektir.

Karakter Varlık Ec[,4A-'128 saylsal kod karşlllğl

Ç &ccedil; 199 ç &ccedil; 231

ö

&ouml; 214 &ouml; 246

ş

&scedili ş &scedil; 254 &ldot; &iwhdoİ; 253 ü &Uuml; 220 u &uuml; 252 Ğ &Gbrewe; 208 ğ &gbrewe; 240

Çizelgc 2. Türkçe kaİakterler için tanlmll Varlıklar

73

o

(19)

Baha olgun - Hayri sever Bııgı Dülrrllsı Iüco, 1i|56{8 2.3. oluşturulan

sGML

Belgeleri

RDF/DC belge

tür

tanümına

uyumlu

SGML

belgeleri,

yinelenebilir rdf:Description elemanlaründan oluŞacaktlr, Her bir rdf:Description elemanl bir katalog bilgisi girişini ifade eder. Şekil 2'de oluşturulan bir SGML belgesinin RDF

tan lmlar|na uygun çizge gösterimi Verilmiştir.

c reator Baha olgun

Title sGML

Türkiye publisher

contributor Hacettepe Üni

Type Hayri Sever

texvsgml

Şekil 2. SGML belgesinin çizge ile gösterimi

Şekil 2'de çizge gösterimi ile gösterilen kaynak tanımının

SGML

ile se-rileŞtirilmiş biçimi ise Ek 2'de gösterilmiştir.

SGML

belgesinde

XML

isimuzayl kullanllmaktadlr. DC:lDENT|FlER

ele-manlnda

Dc

şemasl içinde lDENT|F|ER elemanı ifade edilmektedir, Ayrlca Türkçe içerik desteği de Türkçe'ye özel karakterlerin

SGML

Vadlklanyla gös-İerilmesi sağlanm lştlr.

'sgml.cs.hun.edu.tr

(20)

rüvnak K€§if Yeteneğinin Artınlması lçin lntemet lgl,naklannın

İçeriklerinin Sandan Biçimde Tanımlanması Bılgı DünJası 2tn0, 1 ( ] ) : 5ı5 88

2.4. Hacettepe-Dc Üstveri Elemanlarl Editörü : H-DcEdit

sGML

bildirimine Ve belge tür tanımlna uygun SGML belgelerini oluşturmak

için, UNIX

ortamlnda

X-MoTlF

ile

geliştirilmiş bir ediiör programl kul-lanllmaktadlr. Şekil 3'de H-DCEdit programlnln arayüzü görülmektedir.

Şekil 3. H-DCEdit programl arayüzü

H-DCEdit programlnda

Dc

elemanlarlnı RDF modeli içinde tuİacak SGML

belgeleri oluşturulur.

Dc

elemanlarl girişi Şekil 4'de görülen arayüz araclllğlyla

sağlanlr.

Dc elemanlarl giriş arabirimi ile istenilen sayıda kaynak tanlml yapllabilir. Ay-nca

Dc

elemanlarlna ekıenen "BoDY" elemanı için de giriş yaptlabilir. Eğer bu eleman için değer girişi yapllmlşsa yani kaynak için yereI işleİim sistemi üzerinde yol adresi beljrtilmişse; kaynağln görüntülenmesi için olanak sağlanmıştlr, Gö-rüntüleme işleminde yerel programlar, yardlmcl olarak kullanllmlştlr, içeriği teXV html biçimde tanlmlanan bir kaynak için HTML destekli bir web göstericisi

kul-l cE.o.İ l|@ /hd,4 fu .t ib.. ı Ü,.9,1

'de.trlf er.' hq/lrnıs.h..i(ğ

''fre,,

şoı,!- TükiP (!lı.üdks crPrİar.,B.tr oLot N

saa&üı.,sol"ı, Tü*iy.

de5c./rrrbr.,scırll- T!r}iy. §r.} s.yls Arbrl9rıeİ: H.eİt.peü,rs,iEn

corıfuİar:Eğlis.fr

'aıa.,0' Trıpe: İ.*-üo_1$a lalgr]qe: ğ

Rcıaİbn: bRğa.@By nq i\,w.€ jE.eE

'&ü(s.,ürğ H.ük s.İ!&

75

(21)

BiIPi Dijryas, 2uD , ]t]).5688 lanllabilir. Aynl şekilde içeriği image/giİ olan bir kaynak, gif biçimini destekleyen

bir grafik gösterici program

ile

kullanılabilir. Kultanılacak

yerel

programlar,

H-DcEdit

programl

içinde

tanImlanmalldİr,

Yardlmcl

uygulamalarln ta-nlmlanmastnl sağlayan arayüz Şekil 5'de görüImektedir,

DC

Elemanlan Giriş Arayüzü araclllğl ile katalog bilgileri oluşturup sak-landlktan sonra; ilgİli katalog bİlgileri, H-DCEdit programlnın arayüzü taraİlndan listelenir. Şekil 3'de, Ek 2'de Verilen örnek bir SGML belgesi ile ilişkilendirilen bir liste görünümü yer aImlştlr.

Çizim alanında listelenmiş olan katalog bilgilerinin görünüşüyle ilgilİ de-ğişiklikler yapma olanağl da H-DCEdit programl taraf|ndan sağlanmlştlr. Şekil

6'da görünüş değişikliği sağlamak için kullanllan arabirim Verilmiştir.

Is.oo TtuCiF İıırıaıd14 s6t. td.iı6 ı,cr §dytğ{

ıl.! İd*t s*l!İ!i

76 Şekil4. Dc elemanlarl giriş arayüzü

Baha olgun " Hayıi Sever

Dğ lleetş 'ntr-f ld! 9*

9T:,

P!,

§95ğıi.fe ldqllijiet i.§rücp Iikİtirie! Titfu JFo. ".o*,

Dğr ğl -, j ıtto6t]t J&.. i Ytr! ı99E ,,

[so. ıfuıc1i

-Rğlatioo

_ ]ı!:J:.|ağgry _ .] nelatĞd aesoltce Id

(22)

L1 ,J]lğlwueluıuel!llp ope!! Jlq aA llp n6Jo5 Jlq '!t!p euep!6lq Jlq '!l!p aryOlğnuQp )!q 'apüJ!5! ıpJepue§ 1SSS? ,Ju§ıwuepie^ eüBeJeunu ]Jepue§ 966l:6110l c3l/osl 'lss9o ,Jüğeueoes uau_ol )!q uepueF u!5!

xaallqeueln ,QJqA aa]uQt 1ssso u]uüpJepue]s 'üceue eue lwcs au6l1ae6ı alü awaF! !u!Jo1!6t!q Jlq epüe

lq u!r! xeuJ!$eplq luyeppFq aae$! aI! eue eJe§! 1/l9S 'epugeaağ eua ae§! '§!uğapua6

)aH !|ıxewüİe ae§! uıueuJnl§np ewe 1cewe eua\xı'lq )eŞ!p a^ we$! '!u!lal!bM uapulslpual ulueapq

ğla6epue? ]uaunaod 1SSso ğpİs pue So!]ueues uolp.lllcads (a6en6ue1 ,lpau l nzn^ğJğ eule|ıılluPı ğııleIn6^n lcırllpJğA,9 |!lağ -lE^ (aul6uf "lssso,sauJP|) nloloru

"lsssQ

apel. up|luPllnl

leleto

ulPJoold lcllllple^ ua|a6laq

"ly\es

uP|o tsl}ı15

uluel6old

,.ltpauaualıau9 Pp IulŞEue|o aulalul5lq ululpJepuEıs (966

!

",|euoneu.ıatul)

/"lSsso

'ıuıe,ıoojd

1p39q-g

,,ııuı§ -el auıa}sıs ualı6lıq a6leq 1eıelıuepeıeı( uepuısıuıö uıuıcı,ııl§ı,ıı(e a^ JnInuns ıEJ -e1o §uı0 Qasıed) eı(ıcı.ıı}ğuı(e

cQ/loU

ısa6laq "l1ı\OS uıö! unung ,,ıueı ep ıŞeue1o atual§ı uepıuaı( dı^a|ın^ ıuua|a6|aq 1y195 nQnpınlön1o ıuıe:6o,ıd

p:ıco-H

ısztuuquııur1 apuı5ıg uvpuğ]s uluuapua5l uıuuclılıııiv1 ıau.ıaıu1 uı51 ıs,zuıluııry uıuı.fleuaıalJl§ry )teuizy l 1 I

ı,

i,, la!Oı.İ

-l*'q,B

s9§0I

au)a ı§oİ,üIo |3ı!g

(23)

Baha Olgun - Hayri Seıer Riıgı Di,iryas, ]ta0 {1):5G83

dımıyla HTML, RTF ya da TeX olarak yeniden biçimlenebilmektedir (ÇeVrimiçi,

elektronik

adres:

http://www.

jclark,com/jade

http://www, jclark.com/jade, [25.12.1999]). Böylece,

sGML

standardlnln ilişkili olduğu DSSSL standardı da örneklenmiştir. Biçimleme işlemi için, belge tür tanlmlyla Uyumlu bir biçem tanıml yapılmlştlr. Bu tanlm sayesinde başka biçimlere çevirim işlemiyapllmlştIr.

Şekil6. Çizim alanl görünüş değişikliği sağlayan arayüz

2.5. RDF/Dc

Ayrlştlrlclsl

RDF/DC ayrıştıncl program|

SGML

belgesini ayr|ştürlr Ve H-DcEdit prog-ramlnln anlayacağü biçimde bir ayrlştlrma çlktlsl oluşturur. Çlkn H-DCEdil prog-ramı tarat]ndan sisteme yüklenerek eski bilgilerin yeniden işlenmesi sağlanır, Ay-rlştlrlcl program taraflndan oluşturulan ara ç|kh H-DcEdit programlna yöneliktir.

RDF/Dc programl, bir sGML ayrıştlrlclsl olan

sP

(sGML Parser) paketi

üze-rine oturtulmuştur (Çevrimiçi, elektronik

adres:

http://www.jclark,com/sp 77 http://www.jclark,com/sp [25. 1 2, 1 999]).

sP

paketi sGML standardlnI büyük ölçüde desteklemektgdir. Bu da RDF/Dc

programlna zaman içinde istenildiği biçimde değiştirilebilecek olma esnekİiğini kazandlrlr. ill}EaltEla :Tİİıİ :iıDJDm :lrlstaIPrtlrl :E@,nüB colliımrİ(n TlPE llİratt

!ğıtİ&ıc tih§ - l fdt§ile l12 c]r56t to80§9_9 -. !a.i]dtt ,eili@ - l P6h@ f@& - ] iriqeğıt 3trt .

EıtrEı

Gataıog İİeents §l YfuüIe

(24)

rüinak Keşif Yeteoeğinin Anınlnlası için lnternet Kı\,naklaflfun

içeriklerinin Slandan Biçimde Tanı!ı]anmiısı Bilgi Dünraiı 2000 , ](l) 5683

SP paketi programcllara sGML belgeleri üzerinde işlem yapma olanağlnl bir

API (Application Program lnterface) araclllğlyla sunar. RDF/DC ayrlştlrıclsü da sunulan

APl

olanağını kullanarak

sP

paketini bir kitaplık (library) olarak

kul-lanmıştlr. Ayrlştürma aşlemi için

class

rdfdc oluşturulmuştur Ve RDF/DO

ay-rlştırlclsl da class rdfdc'yi kullanan bir SGML uygulaması oİarak geliştirilmiştir. rdİdcparse adtı uygulamanın, giriş olarak aldığl Ek 2'de görülen SGML belgesi için ürettiği ayrlştlrma çlKlsı Ek 3'te gösterilmiştir,

RDFiDc

ayrlştlnclsı SGML belgesinde tanlmlanan kaynak saylsl bilgisiyIe

başlar ve her eleman için eleman adı

ve

içeriği bilgilerini içerir. Ancak bazı

ele-manlann içeriği

sadece

H-DCEdil programının anlayacağı biçimdedii. Gö-rüldüğü gibi aynşt|nm çlktlSl özel amaçlı bir içeriğe sahiptir ve H-DCEdit uy-gUlamasl İaraf lndan kullanlldlktan sonra silinmektedir. Yani bu çlktjy| kullanlcınln anlamasIna gerek yoktur. Çünkü sadece bir ara çlkll olarak kullanlllr, ihtiyaç kal-madlğlnda ise silinir,

2.6.

DssSL

Biçem Tanİml

DSSSL standardı dönüştürme, biçimleme ve sorgulama olmak üzere üç ana kesime ayrlllr Ve bunlar dışındaki kesimler ise bu kesimlere destek olarak kuI-lanılır. H-DCEdit programl kullanlldığı

DSSSL

motorunun bİçimleme olanağlnı kullanmlştlr.

DSsSL motoru, SGML işleme sisteminin içine yerleştirilmiş biçimdedir Ve ha-zırlanan SGML bildirimiVe belge türtanlml,

DssSL

motoru için de geçer!idir. Ay-nca, kullanllacak

DsssL

dili için genel bir DSSSL belirtiminÖ Ve DSSSL ağaç-hğrna uygulanacak bir biçem dil tanImlna ihtiyaç duiuIrnaktadlr (olgun 1999:57-65). Bu geneltanImlara uygun bir biçem tanlml yapllarak, sGML belgelerinin ye-niden biçimlenmesi sağlanmlştlr.

H-DcEdit programl taraf lndan oluşturu!an birSGML belgesiVe

DsssL

biçem tanlmlnln yönlendirdiği DSSSL motorunun biçimleme işlemi sonucunda HT1,4L,

(25)

Baha olgun - Ha}.ri sever Rllgı Düryası 2c00 , 1(1):56İ3

RTF, TeX belgeleri olarak yeniden oluşturulabilmektedir, RTF ve TeX belgeleri tek parça olarak olUşturulurken, HTML belgesi, biçim bilgisini taşlyan

css

(cas-cading Sytle sheets) tanlmlyla birlikte üreİilir (Çevrimiçi, elektronik adres: http://

www.w3.org/style/css http://www.w3.org/style/css, [18.12.1999]). Ek 4'de Ek 2'deki

sGML

belgesinin karşlllğl olan HTML belgesi Ve Ek s'de HTML biçim bilgisini gösteren

css

tanlml gösterilm|ştir.

3.

soNUç

Kaşgarlı Mahmut Bilgi Geri-Getirim

Projesi

kapsamında, meta-arayıcılar Veya arabulucular gibi yazllım aracllarlna girdi teşkil eden RDF/DC katalog bil-gilerini üreten, H-DcEdit yazıllml gerçekleştirilmiştir. SGML aynşt|rıclsü, sp-1.2, ve DSSSL motoru, jade-1.0.1, modüllerini kullanan bu yazılım, UNlX ortamında MOT|F geliştirim aracı ile C/C++ dillerinde yazılmıştır. Yazılımda model olarak

WWW Konsorsiyumunun bir çallşmasl olan

RDF

modeti temel allnmlş, sözlük olarak da

Dc

üstveri elemanları seçilmiştir. oluşturulacak eleKronik kaynaklar bilgileri İse

sGML

standardlyla desteklenmiştir. Böylece RDF çerçevesi içinde

Dc üsfueri elemanlarlnl içeren SGML belgelerini oluşturan H-DCEdit yazılımı

or-taya çıkmıştır. H-DCEdit programı ismi, "Haceüepe-Dublin Core Üstveri Ele-manlarl Editörü" kelimelerinden türetilmiş bir kısaltmadlr.

Yazılımda, ayrlca

sGML

standardlnln bir uzant|sI olan

DssSL

standardı da örneklenmiştir. Buna ek olarak; SGML belgelerinin, günümüzde HTML yerine

geçecek olan

XML

standardlna da kolay dönüşebilmesine destek Verilmiştir. oluşturuIan SGML belgelerin Türkçe içeriği des,teklemesi de sağlanmlştlr.

Kay-nak kod

Ve

belgeler

http://www.cs.hun.edu.trl-km

web salaslnda

bu-lunmaktadlr.

Çalışmamız kapsamında geliştirilen yazlllm kesimleri genişletilmeye açlkİlr.

RDF modelinin gelişmesi sürdükçe, kullanılan model karmaşlklaştlnlabiIir,

Dc

(26)

r,aynak r€şif Yeteneğinin AnınIrnası lÇn Internet Kaynaklannın

içeriklerinin Sandan oiçimde Tanürnlanması Bilgl DürttlLİ, 2t)N. l0l5ü8 üsfueri elemanlarl dlşlnda diğer sözlükler de kullanılarak bilgi tanlmlama ye-teneği artlnlabilir. Yapllan çallşma, bir dizinleme/arama aracl ile Web sitelerinde ya da kütüphanelerde kaynak tanlmlamaya Ve kaynak hakkında bilgi sunmaya

yardımcl olarak da kullanllabilir (bkz. KMBGS: Gerçek|eştirim Bölümü,

[ÇeV-rimiçi].

Elektronik

adres:

http://www.cs.hun.edu.trl-km/gerceklesİirim.html.

[05.10.1999]).

Ek 1. Yazılım sisteminin kullandlğı sGML bildirimi <|SGML "iSO 8879:1986 "

cEARSET

BA§ESET "Iso 646-1 g8s//cIİAn§ET Intsrnational Reforence verslon

@v)//Egc2/54/o,

DEscsET

o

9

IrNIrsED

oro

1

ı

e

IiNusED

l3

1

ı3

ı4

18

UNUSED

32

95

32

Izf

1

UNUSED

BASESET'

ff}o Regi§tİation Number 1

48l/cIlARsET

ECMA- r 28 Right Part of

Latlı

Alphabet ıfI. 5/ /g,sc 2/ L3 4/

13'

DESCSET

1a8

ğ2

uNugED

160

95

32

255

l

IJNUSED

cAPAcrrY

PUBLIC " Iso 8879:1986//CAPACIrY Reference//trlN "

scoPE

DocIrMENt

gYİfrAx

sİİtINcIİAR CONTROI§ 0 1 2 6 4 5 6 7 8 9

t0

11

ıe

1g 14 16 16 I7

r8 r9 20 21

222a2,4etse62l

e8 e9 s0 81

ıe7

e55

BA§ESET 'If}o 8869- r //CİİAR§ET Interna.tİonal RefeTence veTsion

(B\DI

lEsc216

4lo,

DEgcgET

0

eB6

0

rrUNoTIoN

RE

16

Rs

10

gPAcE

se

(27)

Büa olgun - Hayri Sever Bılgı Düfirosı 20ıa , 1(1) 5688

TAB

SEPCIİAR

9

NA.![ING

LCNMSTRT

UcNMSTRT

NAMECASE

GENEnAL

YEg

E}rrrrY

No

DELIM

GEITERAL

SGMLREF

sIloRTRaF

SGMLREF

NAırEs

sGMliRİF

QuA.}IIrrY

SGMLREF

NAMELEN

40 l'EATUREs

lltI}IIMIzE DATATAG No oMIrTAG YEg RA}TK No SIİoRTIAG

YEs

L]NK

§I}IPLE No IMPLICIT 1Io E)(PLICIT }Io

oTIlER

coNcIrR YEs 999999 gIJBDoc YEg 99999999 FoRMAl,

YEs

APPI}TFO NoNE>

Ek 2. H-DcEdİt programl çtktlsl bir

sGML

belgesi

<|DoCTYPE RDF:RDF

PuBIJc

' -//Batıa olgun//DTD RDF and Do//EN " >

<RDF:RDF xmlns:rdf=' http:,//I/gww.w5.orğ/RDF/ " )<mtns:dc= " http: / /pırİı. oİg/Dc / '>

<RDF:Description about= "http: /,/seml,cs.hun.edu.tİ " >

<DC:IDENTITIER>http| / /8EEl. cs.İıun, edu.tK/Dc :IDENTE'IER> <DC:CR_EATOR>BaIıa Ot€\rll</Dc:CREAToR>

<DC :TrIIJ>SGML T&uuml;rkiye Ku]l8n&iwhdot;c&iwhdot;la,T&iwhdot;

</DC:TIII,E>

<DC :9UB.IECT>SGML T&uum_l;ıkiye</DC :SIIB.IECT>

<DC:DE§CRIPfIoN>sGxtL T&uumı;İkiye web sa]İfas&iwhdot; </DC:DESCRIPIION>

<DC: PIJBLISI{ER>Eacettepe &Uuml;niversitesi</DciPI,BIJSIİER>

<DC :CoIVIRIBIIIoR>HaJrri sevel< /DC : CoIfIRIBUtOR>

<Dc:RIGİ{fS>EeI Hakİ&iwb,dot; saİl&iwhdot;d&iwbdot;İ<,/Dc:RIGETS> <Dc :TYPE>text</DC:TYPE>

<DC : FoRlIAT>text/sEEnt</DC: FoR}!AT>

<DC :LANGUAGE>tı</DC:LANGUAGE>

<Dc:DATE year= 1 998 moDth=JaJı day=o l></DC:DATE>

(28)

(uynak IGşif Yeteneğinin Anlnlmast için lnternet Fü}araklannln

İçeriklennin Standa( Biçimde Tanımlaıması B gi Dijroqn 2[w , 1t]) 5ü8

<DCIRELATIoN

resouıce=|lhttp://www.cs.hun.edu.tT" ww!Y.cs.hun.edu.tI t34ıe=I§RefeıencedBy></Dc:RELATIoN> </RDF:Descriptıon> </RDF:RDF> Ek 3. Ayrlştırlm

çıktlsl

1 RDF:DESCRIPIION DCITrfLE sGtrjL Tiırkjye

Kulanrcılan

DC:CREATOR Batıa

0l$!

DC:9UB.JECT gG rL nitrkiye DC:DESCRIPfiON

SGIIL Ttiİkiye web gaJdası

DC: PIJBLI§IiER Hacettepe

Ünive$itesi

DC: CO]fIRIBIIIOR Eayri sever DC:TYPE o DC:FORIIAT 0 DC:IDEIIJ'IIFIER

http: / / s €iml. cs. hu!. edu. tT

DC:LA§GUAGE

0

DC:RIGİİTS

HeI

Haİh

saklrdrr

DC:RELATIoIıI 6 http: //www.cs.tıun.edu,tr Dc:DATE o 0 8 l\ttp| / / B3

(29)

8aha olgun - Hayri sevef Bılgı Dijryas, 2{)00 , 1(1):5ü5-83 Ek 4. sGML belgesinin karşıhğı olan HTML belgesi

<HTML>

<IJNK EEL=STYLESHEET TYPE= " text/css " HR.EF= "dc6.css " >

<BoDY>

<DIV CLA§S=DC:IDEMIII'IER> <SPAN CLA§S=DC I IDENIIEIER>

IdentifieT: http: //seEoi.cs.huı.edu.tr http://sgml.cs.tıuı.edu.tı

</SPAN> </Dw>

<SPAN CLA§S=RDT:DESCRIPIION> <,/SPAN> <DrV CIi§S=DC :CREATOR>

<SPAN CIJ§9=DC:CR.EATOR>

creetoı: Baha

ou\ın

<,/SPAN> </DIV>

<8PA§ CLAf}S=RDF:DESCRIPIION></9PAN> <DrV CLA§S=DC:TffLE>

<SPA]ü CLA§S=DC:TİTLE>

Title: SGML

riırkıye

Kut]a.n&#605;c&#8o5;lar&#3o5; </sPA]itr>

</Dw>

<SPAN CLASS=RDF:DEgCRIPIION></SPAN> <DrV CLA§§=DC:SUB.IECT>

<SPAN CLA§S=DC: gUBcIECT> gubject: SGML T{irıdye </sPAİ{>

< /Drv>

<SPAN CLA§S=RDF:DE9CRIPIION></§PAİ,T> <DW CLA§9=DC :DE9CRIPION>

<9PAİ,I CLA.f}9=DC : DE9CRIPI ION>

Descrlption: sGML T\ifkıJıe web g&yfa.s&#3o6; </gPAN>

</Dw>

<8PAN CLA89=RDF: DE9CRİPIION>< /9PAN> <DiV Cl,A§9=DC:PIJBU9IiER>

<9PAN CI"A89=DC:PUBLIf'İİER> Publl§ber: İlacettepe Ünlversıts6i

(30)

Ka}rüak Ke§if Yeteneğinin Anüİlması için Internet F\a},naklafl run

içeriklerinin sıanda( Biçimde Tanımlanmasl Bl.ıgi Diiırwı 2ü)0 1(]) 5G88 </gPA]itr>

</DrV>

<9PA§ CLAS9=RDF: DESCRIPI !ON>< /SPAiıi> <DIV CLA§S=DC:CONIRIBUrER>

<9PA§ CLAS§=DC :COİffRİBIIIER>

contribut€r: IİaJ.!ı seveİ

</SPAN> </Drv>

<SPAN CLASS=RDF:DE9CRIPIION></SPAN> <DrV CLASS=DC:RIGET9>

<SPAN CLASS=DC:ElGITf S>

Ri€|hts:

İleı

Iİakk&#3os; 9al<l&#605;d&#5o5;ı <,/sPAtrI>

</DIV><9PAII CLA§}9=RDF:DE§CRIPITON>< /9PAN> <DrV CLASS=DC:TYPE>

<SPA_}I CLA§S=DC :TYPE> 15De: text </gPA_l\I> </Dw> <SPAN CLASS=RDF:DE9CRIPEON></SPAN> <DrV Cİ,Af}S=DC:IQRMAT> <SPAN CLAflS=DC:FORMAT> Format:

text/htıd

< /gPA_N> </DrV> <SPAN CI,A§S=RDF:DESCRİPIION></SPAN> <DIV CLA§S=DC :LANGUAGE>

<SPAİV CLAS§=DC;LANGUAGE> La.ngu8,ge:

tr

</SPAN> </Dw>

<SPAN Cl,A§S=RDF : DESCRIPIİON>< /SPAİıI> <DrV C],A8S=DC:DATE> <SPAİıI CLAf}S=DC:DATE> Date: o1-JaJx-l998 </gPAN> < /DİV> 85

(31)

Baha Olgun - Halri Sever Bılgl DüD"rı.rı 2a{)0 , 1(r,56$ <SPAN CLASS=RDF:DESCRIPI IO1{></§PA§>

<DW CIi§9=DC : R.ELATION>

<SPAN CI"A§9=DC : RELATION>

Retation:

IsReferencedBy

http://www.cs.huİ..edu.tr

www. cs.hrın. edu.tr </sPAtrT> <./Dw> </BoDY> </IIrMı> nüp:// Ek 5. HTML belgesinin

css

uzantlsl SPAİ,I.RDF:DESCRIPIION {

fonLfamily: Times Ne],Y Roman,serif; font-weiebt: 5oo;

font-8tyle: noıma];

fon}sizeI lopt;

coloT: #oooooo; }

SPAN.DC:RELATION,

SPAN.DC:DATE,

SPAN.DC:LANGUAGE,

SPAN.DC:FOR}IAT, §PAİıI.DC:TYPE,

SPAN.DC:RIGHTS,

SPAN.DC:CONIRIBUIOR, SPAN.DC:PUBLJSEER, SPAN.DC:DESCRIPIION,

9PAN.DC:SüB.JECT, SPAİ,İ.DC:TI[LE,

SPAN,DC:CREATOR,

SPAN.DC:IDEiüIIFIER {

fonLfamityi Times New Rom8n,seıif; fonLwei€tlt: 5o0;

font-style: normaı; font-size: l4pt;

colol: #00oooo; }

DrV { margin-top: opt; margln-bottom: opt; margtn-left: opt; mar€iir]-ri€|ht:

opt }

DIV.DC:RELATIOİf, DIV.DC:DATE, DIV.DC:IiNGUAGE, DIV.DC:FORMAT,

DIV.DC:TYPE,

DW.DC:RIGIfIS,

DIV.DCıCOIfIRIBUIOR,

DIV.DC:PUBU9EER,

DIV.DC:DE9CRIPIION,

DIV.DC:SUB.ITCT, DIV.DC :TIILE, DW.DC:CB.EATOR,

DrV.DC:IDENTIEIER { t€xÇalign: left; line-height: Iept;

texi-ind6nt: opti

(32)

rü}Tıak r€§if Yetenegınin Anıolmasl lçin lntemet Kaümaklrnnrı

içeriklerinin sündaft Biçimde Tanırnlanması Bııgı Drqan 20{a . 1(l) 5(138

KAYNAKçA

Doorenbas, R.B., Elzioni, o. ve Weld, D.s. (1996). "A scalable comparison-Shoppin9 Agent for the world-Wide web", Technical Fleport No. Uw-csE-96-01-03, De-patment of computer science and Engineering, University ol washington. IKaynak sayfa]. [ÇeVnmiçi].

http://www.cs.washingüton.edu/research/projects/sottbots/wwwprojects.html

[1998, Arallk]. shopBot

Poesi

1998 sonlarlnda sonlandlrlllp, ticari olarak ge-liştirilmeye başlanmlştlr

(bkz. http://www.jango.excite.com http://www.jango.excile.com)

Dublin core Metadata lnitiative. ('1998). Dublin corğ Elemenl set, Version 1.0. [Kaynak sayfa]. lÇevrimiçi]. http://www.pur1.org/dc. [1 999, Arallk25]

Etzıoni, o. (1996). "The wond wide web: Quagmire or Gold Mine?" , AcM comms., 39(1):65-68.

Gauch, s. Ve Wang, Guijun, w. (1996 ). "lnformation Fusion with ProFusion" ,

web-Net'96:The Firstworld conforence of lheweb society, San Fracisco, cA.

Gravano, L. Ve Papakonstantinou, Y. (1998). "Mediating and Metasearching on the ln-terneti, lEEE Data En9ineerin9, 21(2): 28-36.

lnternational organization for slandardization. (1986).

lso

8879/1986: lnformation Processing

-

Text and otfice systems -- standard Generalized Markup Language (sGML). Ref. No. lso 8879:1986 (E).

(1996).

lso/lEc

1o179:'1996: lnformation technology

-

Processing lan-guages

-

Document style semantics and specification Language (DssSL). Lassila, o. (1998 Temmuz-Ağustos). "web Metadata A Matteİ of semantics",

lEEEln-ternet computing, 30-37.

olgun, B. (1999). Dublin core Üstveri Elemanlan Editörü. Yüksek müİıendislik tezi, Ha-cettepe Üniversilesi, Fen Bilimleri Enstilüsü.Ankara [Çevrimiçi].

http://www.cs.hun.edu.tr/-krTı,belgeler.html [1 999, Arallk 25]

Manber, U. Ve Bigot, P.A. (1998). "connecting Diverse web search Facilities" , |EEE Data En9ineerin9, 21 |2)| 2'| -27.

Singh N. (1998 Mayls). "Unirying Heterogeneous lnformation l\,4odels", AcM comms., 4,1(5\ 37 -44.

world wade web (wsc) consortium (1999a). w3c: cascacing sytle Sheets (csss). [Kaynak Safa]. [Çevrimiçi]. http://www.w3.org/style/css. ['l999, Aralık 18]

(33)

Baha Olgun - Hayri Sever Bilgı Dün»as, 200a, 1@:5688

-.

(1999b). w3c: Resource Desciption Framework (RDF) Model and syntax specification, lKaynaksayfa]. Haz. Lassilao. Veswick, R,R. [Çevrimiçi],

http://www.w3.org/TFi/REc-rd!syntax [1 999, Şubal 24].

-.

(1999c). w3c: Plcs - The Platlorm lor content Selection. [Kaynak sayfa]. [Çevrimiçi]. http://www.w3.org/Plcs/. [1 999, Ekim i 4].

(1998).

w3c:

Resource Description Framework (RDF) schema spe-ciricaıion. lKaynak sayfa]. Haz. Brickley, D., Guha, R.V., and Layman, A. [ÇeV-rimiçi]. http://www.w3.orgi|TRAVD-rdf-schema [1 999, [,ilarl 4]

(1997). w3c: Extensible lvıarkup Language (XML). lKaynak sayİa], Haz. Bray, T., Paoli, J., Ve sperberg_McQueen, c.M. [Çevrimiçi].

http://www,w3.org/TR/PR-Xm1-971208. [1999, Arallk25].

TEşEKKÜR

Bu makalede söz konusu edilen çallşma, T.c. D.P.T. taraflndan desteklenen

97K12'l330 numarall Kaşgarll Mahmut Bilgi Geri-Getirim sistemi Projesi

kap-samlnda

gerçekleştirilmiştir.

Proje

hakklnda

geniş bilgi,

http:// www.cS.hun.edu.trl-km çevrimiçi EV Sayfasl adresinden elde edilebilinir (05/10/ 99, son günlenme tarihi),

YazarIar ayrıca, bu makaienin hakemine, titiz çallşmaslndan Ve yol gösterici önerilerinden dolayl teşekkür etmeyi bir borç bilmektedirler.

Referanslar

Benzer Belgeler

İnternetteki devasa bilgi denizinde aradığınızı bul- manın ne kadar zor olduğu dikkate alındığında keşif motor- ları kullanıcılar için

Araştırma sonucu elde edilen bulgularda, Sosyal Medyada Arama Motoru Reklamlarının genel amaç ve kullanım nedeni olarak satın almayı arttırma, kampanya stratejisi

Tepebaşı’ndan Taksim e alt katlardaki ^yeni hayat”, üst katlardaki &#34;yalnızlıktan” habersiz sürüp gidiyor t Nazım Alpman.. S inemaların “vizyonu

Vakıa itikat noktai nazannea yekdiğerle- rinden farklı iseler de kanun nazarında ve benim nazarımda hepsi müsavidir.. Diğer bir İddiaya göre de Hitler’in bu

Information systems, data banks, teacher and student websites, information resource centers, electronic information and educational resources, virtual laboratories,

Geliştirilen oyun motorunun en çok kullanılacak olan sınıfı vektör sınıfıdır.. Vektör sınıfı tasarlanırken saflığa çok dikkat

Bu tezde, uçak motorlarının tamir ve bakımı esnasında kullanılan sökme-takma ve taşıma-depolama aparatlarından olan LPT (alçak basınç türbini) taşıma arabasının

Temelleri Site Yapısının Geliştirilmesi İçerik Optimizasyonu Arama Motorlarının Sitenizi Taramasını Sağlamak Mobil Telefonlar için Arama Motoru Optimizasyonu Reklamlar ve