BügiDünyası 2(X)(). 1(1):56-88
KAYNAK KEŞİF YETENEĞİNİN ARTIRILMASI İÇİN
INTERNET KAYNAKLARININ İÇERİKLERİNİN
STANDART BİÇİMDE TANIMLANMASI
Baha OLGUN* - Hayri SEVER**
Öz
lnternet kaynaklarının makinaca anlaşılabilir olmamasından dolayı, kullanıcıların bilgi ihtiyacını karşılamada sorunlar yaşanmaktadır. Kay nakların yapısal olarak gösterilmemesi ve nasıl yorumlanması ge rektiğinin ilgili kaynağa özgün çözümlerle hal/edilmeye çalışılması, ilk göze çarpan nedenleri oluşturmaktadır. lnternet kaynaklarının gerek sa yısal ve gerekse de hacimsel olarak çok hızlı artışı göz önünde bu lundurıJlduğunda, içerik sözcüklere dayalı arama makinalarına ilaveten, otomatik kaynak keşfine ve bilginin harmanlanmasına olanak veren ya zılım araçlarının gerekliliği ortaya çıkmaktadır. Bu tür yazılım araçlarının başarısı ise, işlenecek kaynakların modellenmesinin standart bir biçimde yapılmasına çok yakından bağlıdır. RDF (Resource Description Fra mework), böyle bir çabadan doğan anlamsal bir modellemedir ve bu model üzerinde yapılan çalışmalar WWW (World Wide Web) Kon sorsiyumu tarafından kontrol edilmektedir. DC (Dublin Core) üstveri ele manları, elektronik katalog bilgilerini tutmak için, RDF"in genişletilebilir/ik özelliği kullanılarak tanımlanmıştır. Bu makalede, RDFIDC modeli kul lanılarak Türkçe elektronik kaynakların içeriklerinin tanımlanmasını sağ layan H-DCEdit adlı editör aracı tanıtılacaktır. RDF modelinin seri/eştirme sözdizimi olarak SGML (Standard Generalized Markup Language) kul lanılmıştır. Bu çalışmaya ek olarak, RDF/DC belgelerinin, DSSSL (Do cument Style Semantics and Specification Language) standardı yar dımıyla farklı belge biçimlerinde yeniden biçimlenmesi de sağlanmıştır.
Anahtar Sözcükler: lnternet kaynak keşfi, Web maden/eme, RDF, DC, SGML, DSSSL, editör.
ABSTRACT
Since lnternet resources are not yet machine-understandable, there are some problems with satisfaction of information needs of users. Un structural representation of resources and employing ad-hoc solutions tor
Arş. Gör., Hacettepe Üniversitesi Bilgisayar Mühendisliği Bölümü (baha@hacettepe.edu.tr) •• Ooç. Dr., Hacettepe Üniversitesi Bilgisayar Mühendisliği Bölümü (sever@hacettepe.edu.tr) 56
Kaynak Keşif Yeteneğinin Anınlnıası İçin Internet Kaynaklannın
İçeıiklerinin Standart Biçimde Tanımlanması Bügl Diinyas: 2()(J() l(J).56,J8
the issue of how to interpret these resources constitute the reasons that an eye would easily catch at first sight. Given that a drastic and staedy in
crease in the number as we/1 as in the volume of lntemet resources has been obseNed over years, in addition to search engines based on content terms, the necessity of software agents being capable of automatically discovering and haNesting these resources has arisen. Success of this type of software agents very closely depends on standartization of mod eling of resources to be processed. A semantic modeling defined as a re
sult of such an effort is called RDF (Resource Description Framework), and the studies on this model is controlled by WWW (World-Wide Web) Consortium. The DC (Dublin Core) metadata elements have been defined using the property of extensibility of RDF to handle electronic catolog in formation. in this article, an authoring editor, called H-DCEdit, is intro duced. This editor makes use of RDF/DC model to define contents of Turkish electronic resources. To serialize (or to code) a RDF model, SGML (Standard Generalized Markup Language) has been used. in addi tion to this work, by using DSSSL (Document Style Semantics and Spec ification Language) standard, the format information in regard to a given
RDFIDC document has been separated from its content, and hence H DCEdit provides different views of an RDFIDC document.
Keywords: Discovery of lnternet resources, RDF, DC, SGML,
DSSSL, Web mining, authoring editor.
1.GİRİŞ
lnternetin günümüzde ilgiyle karşılanmasının bir nedeni, büyük miktarlarda bilgi içermesidir. lnternet üzerindeki her şey makinaca-okunur özelliğe sahip ol masına rağmen, makinaca-anlaşılır özelliğe sahip değildir {Lassila 1998). Bu durum lnternet üzerindeki verinin kullanıldığı işlerin otomatik olarak yapılmasını . engellemektedir. Büyük miktarlardaki lnternet verilerini klasik yöntemlerle iş
lemekse bilgi miktarının büyüklüğü açısından imkansızdır.
Web 1 tabanlı bir yazılım aracının (software agent) bilgiyi otomatik olarak ta nıma, yorumlama, keşfetme yeteneği HTML (HyperText Markup Language) di line özgü bir takım karakteristik kısıtlamalarla sınırlı kalmaktadır. Örneğin. çeşitli sitelerdeki elektronik satış kataloglarını tarayarak belirli bir ürün bazında müş teriye en uygun fiyatı sunmaya çalışan bir yazılım aracının, belirli bir katalogda
Web ve lnternet kelimeleri, makale boyunca eş anlamlı olarak kul/anılmışlardır.
Büa olgun - Hayri sever Bllgı Düryası
2ag,-} . ] (1i5G38
ürün adınln "<l>ad:</l>" ile nitelendirildiğin1 öğrenmesi, başka bir katalogdaki ad nitelendirmesi konusunda ona pek bir ipucu Vermez.
Bu
.<b>adl</b>'' ola-bileceği gibi 'isim:' de olabilir (Doorenbas, Etzioni Ve Weld 1 996). Fiyat bilg jsibi-rimi katalogdan kataloğa değişebilir. Benzer şekilde, bir elektİonik (daha özel olarak Web) katalogda ürünler arasl jlişkileİ hiper bağIaçlar (hyper links) araclllğl ile kurulur. VeriIen bir katalog bazlnda, hangi ilişkinin (benzer, opsiyon, genel, özel, parça, vb.) hangi hiPer bağlaç taraİlndan sağlandığlnln öğrenilmesi, -ki bU
öğrenme
süreci zaman
açıslndan oldukçapahall
Ve
elle
(manuel) ger-çekleştirilen birsüreçtir-
başka kataloglara da uygulanabilen bir kazanıma te-kabül etmeyebilir. Aynca, HTML sayfasın|n içeriği doğal dİl ile yazılmış saf me-tinlerden oluşur. Doğal dil ile yazılmlş metinlerden, içerik ile algili bilgi çlkarmak ise pratik değildir (Etzioni 1996; Manber Ve Bigot 1998). Bundan dolayl, metin üzerinde yapllan kelime arama yönteminden, daha farkll Ve daha etkin bir yön-tem araylşl başlamtştır. Buna bağll olarak, arama işlemlerinde ihtiyaç duyulan biİ-gilerin oluşturulması gerekliliği de ön plana çıkmıştır, Üzerinde arama yapllanbelgenjn konusu,
yaza\ ya da
yayım tarihi gibi bilgilerin anlaşllmasl ge-rekmektedjr. Bu bilgilerin doğal dil ile yazllmış belgenin metin içeriğinden çl-kanlmaslda
oldukça güçtür, hatta imkanslzdlr. Öyleysebu
bilgileriyi
ta-nlmlanmlş olmalı
ve
makinaca-anlaşılırbir
biçimde tasarlanmalüdlr. Sorgusonuçlarlnın iyileştiriIebilmesj, daha akıllı sorgularln yapllabilmesi, kaynaklann özelliklerinin tanlmlanması Ve standart bir yölrtemin Varllğl ile sağlanabitir.
lnternet üzerindeki kaynaklar, saklanma biçimlerine göre, yapIsal otmayan,
yarlyaplsal, ya da tam yaplsalVerilerden oluşur. Veri biçimlerindekiçeşitliliğe pa-raleI olarak, bu Verileri işleyen yazllIm araçlan mimarileri
de
larkllllk gös-lermektedir. Yap|sal olmayan Veriler için arama makinalar| (search engines) yaygın seçenek olarak yer almaslna karşln, yaplsal olmayan ya da yarl yapısal Verileriçin meta-arayıcılaf
(metasearchers)Ve
yaplsal
VeriIeriçin
ara-bulucular (mediators) kullanllmaktadIr (Gravano Ve Papakonstantinou 1998).
Bi ngla-arayıc,, yapüsal olmayen lntamel ka0aklan ü2qinclen kullanücınün bilgi lhlyac]nü karşlamacta, arama makinalannü kullanlflar. Mota.alayıcılann bu bağlandaki ana işlevj, taban aldıklan arama na-kinalannln veitabanlannı kullanıclya şollaı hale getirmekir.
2
rüyrıak r,eşif YeEneğinin Anırılrıası iÇn Intemet toynaklarııın
içeriklefinin sandan Biçimde Tanmlanması Bııgl Düüır,as' 2tü. 1 t l ) 56.ü
Aşağlda, meta-araylcllarda Ve arabulucularda ortak (ya da işlevsel olarak ben-zer) işlemler açlklanmaktadlr.
sistem yaplslnda her bir dağltlk Veri kaynağtyla ilişkili bir Paketleyici (wraP-per) bulunur. Veri kaynaklar|, her biri farkll biçimlerde verileri bulunan ve farklı §orgu girdi Ve çlktllanna sahip bağlmslz arama makinalan olabilir. Paketleyicinin
görevi, Veri kaynaklan için ortak bir Veri modeli görünüşü sağlamaktlr.
Pa-ketleyici, aynı zamanda, bir ortak sorgu arayüzü kullanma olanağl da sağlar.
Meta-araylcl ya da arabulucudan gelen sorguyu ilişkili olduğu kaynağln özel sorgu diline çeVirir. Kaynak taraİlndan iletilen sorgu sonuçlannI da ortak Veri mo-deline dönüştürür. BU sayede arayüz şeffaflığı sağlanır.
Meta-arayıcıların ve arabulucuların sistem işlevleri de üç ana işlemle ifade
edilebilir:
veri
tabanl seçimi,
sorgu
dönüştürümü
Ve
sonuçlarln
bir, leştirilmesi (Gravano Ve Papakonstantinou, 1998). VeritabanI seçiminde sorgu ile ilgili Verinin bulunduğu Veri tabanı belirlenir. Sorgu dönüştürümü adımında, sorgu, seçilen her bir Veritabanl üzerindeki paketleyicinin anlayabileceği birbi-çime dönüştürülür. ilgili Veritabanı paketleyicisi sunulan sorguyu işletir Ve
so-nuçlarl döndürür. Sonuçlann birleştirilmesi adlmünda
ise,
döndürüIen bu soİgu sonuçlan belirli bir taklm işlemden (tekrarlı bilgilerin aylklanrnasl,'arklı slralama algoritmalarlnca slralanm|ş belgelerin yeniden slralanmaya tabi tUrulmasl, farkll kodtanmlş aynl tür bilgilerin tek bir kodlamayla ifade edilmesi3, vb.) geçirildikten sonra bİrleştirilir (Gauch ve Wang 1996).
Meta-araylcılar, prensip olarak yaplsal olmayan metinler (düz
ya
da ser-bestçe hazlrlanm|ş metinler) ya da yarl yaplsal sayllan lakl (tag) ile işaretlenmiş belgeler (HTML, SGML ya da XML) üzerinde işlem yapar ve dağıtık veri kay-naklarl üzerinden kullanlcllara tek bir küreseI sorgu arayüzü sunarlar, Dağütlk Ve tam yaplsal Veriler, örneğin ilişkisel Vera tabanlarl, ilgili paketleyiciler taraflndanmodellenir Ve bu yerel Veri modelleri üzerinden arabulucu (mediators) katmanl/ aracl arac|llğl ile tek bir küresel sorgu arayüzü, kullanlclya sunulur (Manber Ve
3
Kodlafuadaki (Encodjlg) t'aü*ttük, i4iti bilginin Mslü tı)ıulduğu jüa iügiüidn. Örn6ğin, sücakl]k bltgisi soğuk, ülık ve srcak ile ilade edilebilocEi qki şanligrat ile dalösıenlebiln-Büa Olgun . Hayri Sever Biıgı Dürülrsı 2ta0 , 1(]),56a8 Bigot 1998). Arabulucular aynl zamanda etiketlerinin Ve düğümlerinin özel an-lamlan olan Ve çizge ile ifade edilen yan yaplsaİ belgeler üzerinde de çal|şlrlar.
Yukarda yapllan tartlşmalar çerçevesinde, arama araçlarlnln yetefjnce kesin sonuçlar döndürebilmesi Ve heterojen lnternet kaynaklarlnln tümleştirilmesi (in-tegration) için gereksenen model, şu Veya bu şekilde üstveri (Veri hakk!nda Vari) tantmlama Ve sözcük haznesi kontrolu olanaklarlnl sağlamall Ve çeşitli uygulama alanlarlna genişletilebilir
olmalİ
r, denilebilinir (Singh 'l998). Bu konudaki enid-dialı seçenek de, RDFa (Resource Description Framework) modelidir. Çünkü
RDF karmaşık ilişkileri tanlmlama yeteneğine sahiptir, kultanlml koİaydlr, model üzerinde sözcük haznesi kontrolu mümkündür Ve genişletilebilir esnek bir an-laylşa sahiptir.
Üstveri çeşitli uygulamalara kaynak otmaktadIr. Üsweri, Web kaynaklarınln içeriklerinin tantmlanmaslnda yani kataloglamada kullanllabilir. Arama araçlarl taraf|ndan daha kesin sonuçlar elde edebilmek amaclyla, katalog girişleri olarak kullanllabilir. Üstveri, elektronik ticaret alanlnda bilginin kodlanmaslnda da kul-lanılabilir. Bunların yanında, Web sayfalar|na erişimin filtfelenmesi amaclyla içe-rik etiketi olarak kullanllabilir. içerik seçimi iIe ilgili çallşmalar büyük öIçüde web
üstveri kavramlna dayandlrllmaktadır. Elektronik ortamda, elektronik imza olarak kullanıImasl da üstveri uygulama alanlarındandır. Aynca üstveri, kişileı.in ya da Web sitelerinin gizlilik özelliklerinin de İanlmIanmaslnda kullanllabilır. En yaygln
olarak ise; üstveri, elektronik belgelerin içerik bilgilerinin Ve entellektüel özel-liklerinin tanımlanmaslnda kullanlllr, AnlaŞllacağ| gibi, Web kaynaklannın da için-de oIduğu eIektronik kaynakların ve tüm elektronik ortam nesnelerinin (Web
say-falan, Web sİteleri, kullanlcllar, vs.) kesin Ve açlk tanlmlarlnln yaplImasl çok önemlidir (Lassila 1 998; wond... 1998).
4
RDF (Resourca Desciplibn Framework), üstveri işlenmesiyle ilgili bir modeldir ve web üzeindeki na-kinaca-anlaşi
bilginin uyqulanalar ans]nda işlenebililiğini sağlal. RDF, Web kaynaklarünün atonatjk iş-lenmesini sağlayan alanaklan içeir. wold Wide web Kansorsiyumu, lntemeı üstvei için yeni bir standad olarak RDF madelini sunmuştul RDF tasarüfu süraslnda çeŞjli disiplinler üstvei qösleimi ve laş]nmasıyla ilqili konularda kaIkıda bulunnuşladn. HTML (Hypeftex! Markup Language) üslven, PlcS (Platt'arm far ln-Iernet conlenl selec on), SGML (standard Generalized Markup Language) va xML (Fxtensible Markup Language) slandailanndan yararlan müştür. Bunlar dışında, nesneye-yöneljk progranlana kavramlanndan ve veri tabanı kavramlanndan da yanrlanılnıştül.Fül,nak Ke§if Yeteneğinin Anln]ına§ı lçin Intemet Kamaklannın
içeriİlerinin sandart Biçimde Taüımlannıası Bılgı Dilrlrsı )0tü , ] )::{Jü
RDF modelinin amacl, Web kaynaklarlna ait üstverinin tanlmlanmasl, iliş-kilendirilmesi Ve standartlaştlnlmasıdlr.
RDF
ile tanlmlanacak kaynaklar URl(Uniform Resource lndicator) ile isimlendirilebilecek tüm kaynaklardır. Fakat
kaynak ile ilgili herhangj bir kısıtlama getirilmemiştir. RDF uygulamadan, söz-dizimdenVeortamdanbağlmslzbirmodeldir(world... 1999b).
RDF modeli, yönlü etiketli çızge ile gösterilebilir. RDF Verisi, düğümler Ve dü-ğüme iIiştiriİmiş öznitelik/değer çiftleri ile iİade edilebilir. Düğümler herhangi bir
web kaynağl otabitir. Öznitetikler düğümlerin isimlendirilmiş özellikleridir Ve çiz-gede Web kaynağınl gösteren düğümden çıkan yay olarak gösterilir|er. Öznitelik değerleri ise ya atomiktr (karakter dizgi) ya da başka düğümdür. Özniielik de-ğerleri de çizgede yaytn diğer ucundaki düğüm olarak görünürler. Yani RDF mo-delinin temeli düğümlere, özelliklere Ve değerlere dayanır. sözgelimi, A'nln bir B özelliği Varsa Ve B'nin değeri
c
ise; A ilec
bir çizgenin düğümleri olurlar. B ise aralanndakiyayln etikelidir. Yayın yönü ise A'dan c'ye doğrudur.RDF modelinin t4nımlarlnI bir kütükte saklamak Ve uygulamalar araslnda kul-lanmak için, çizge gösİerimini serileştirme dili olarak XML (ExtensibIe Markup Language) kulIanılmaKadır. RDF ile XML birbirlerini tamamlamaktadır (Lassila 1998). XML, RDF modeline serileşme sözdizimiolarak destek Vermektedir. RDF
ise XML dilini güçlendirmiştir Ve XML, üstveri tanlmlarlnI anlamll hale getirmek için RDF tanlmlanna ihtiyaç duymaktadlr. Her ne kadar XML, RDF gösterimi için seçilmiş olsa da, diğer sözdizim biçimleri de kullanllabilir Ve bu konuda kesin bir klsltlama yoktur.
BDF'IanlmtnIn Çizge ile Gösterimi
._iaT5?-->
www.cs.hUn.edu.tr webadmin
Büa o]gun - }Ialri sever 8ılgı Düıros, 2ün l 0 ):fiag RDF Tanımının XML ile Gösterimi
<?XmlVersion='1 .0'?> <rdl:RDF xmlns: rdf ="http://www.w3.org/RD F" xm lns:dc="http://pur1.orgy'Dubl jncore''> <rdf :Description about=-http://www.cs.hun.edu.tr'> <rdf:Description> <rdf:RDF>
RDF, üstveri kodlamasi için önceden tanlmll bir sözlük içermez. Çeşitli
amaç-larla geliştirilmiş sözlüklerden destek allr. Bir sözlük, kaynak tanlmlama ko-miteleri laraflndan tanlmlanmlş üstveri elemanları ve öznitelikler kümesidir. Dub-lin cores Initiative (Dublin... 1998) uIuslararasl birçal|şma komitesidir Ve RDF modelinin üzerine kütüphane kataloglarl için gerekli üstveri elemanlarını ek-lemek üzerine yoğunlaşmlştlr. Bu çalışmanın sonucu
Dc
(Dublin core) üstveri elemanları kümesi olarak bilinir.Dc,
RDF modeli üzerine inşa edildiği için, kı-saca RDF/Dc olarak da adlandlnllr.Var olan üsfueri elemanlarl kümelerinin farklılığı; Web üzerinde kUllanllacak, birbirini tamamlayacak ama birbırinden de bağımslz ele allnabilecek üstveri ele-manlan kümelerinin tasarlanmaslnl gerektirmektedir. WWW Konsorsiyumu (kl-saca
w3c
olarak da biIjni0 taraf lndan geliştiriIen RDF, genişletilebilme özelliğisayesinde
temel
yapl
taşı
göreviyaplp,
bir çok
üstveri kümesini des-tekleyebilmektedir. Dc, bu amaç doğrultusunda yapllan bar çallşmadır Ve RDFmodeline saylsal kütüphaneler açlsından destek Vermektedir.
Dc
elektronik kaynaklar için basil bir içerik lanlmlama modeli sunar. An-lamları üzerinden uluslararast çalışma grupları Ve uzmanlar taraİ|ndan fikir birliğa 562
Dublin core elektronik kaynak keşfinds, kullanülan üstvei alemanlan kümesjniifade eder. Dublin core gi-rişimi, lnlemel'in gelişon altyapüsında önomli bh yer tutmaya baştafuüş!ır. Dublin core bi9ok komjte
ta-rahndan, kaynak lanımlama konusuncla anlamsal
bi
ol1ak yaklaşüm geliştirme açüsındandes-leklenmektedi. Bu sayecle, yapılan çahşmalar uluslalarasü bir geçdiliğe ulaşmışır. Dubüin Core standadü on beş eleman jçeir, Elemanlann genel anlamlaı Üzeince utrslararasü liki billiği oluşmuştur.
Kzynak Leşif Yeteneginin Anınlııası için lnlernet r\aynaklanft n
içeriklerinin sıandan Biçimde Tanunlanması Bugl Dİoİrası
]M
ü(' $38 oluşmuş on beş üstveri elemanlndan oluşur (Dublin... 1998).Dc
üsfueri ele-manlarl şunlardlr : Başhk, (Title),Yaralğ (creator), Kon,J (subject), Tanlmlama (Description),Yaylmc] (Publisher), orijinal Kaynak (sou rce), Kalkl Y apan (cont-ributoo,Tarih (Date),Tür (Type),Biçim (Fornat),Belirleyici (ldentifie0, ilişki (Re,lation),
Dl
(Language), Kapsam (Coverage) Ve Haklar (Rights). BU elemanlarlnbazılarının an'Iamı açlkça tanlmlanmıştlr, bazülarl ise henüz deneyseIdir. Ta-nımları açık olan elemanlann da kullanlm biçimleri konusunda bir sınlrlama yok-tur. Dc üstveri eIemanlarlnln uluslararasllaşmasl için de çahşmalar sürmektedir. Böylece üstveri elemanlarlnln kullanlmlnın ulusal niteliklerden bağımsız hale ge-tiriImesi sağlanmaya çallş|lmaktadlr.
Dc
üstveri elemanlarının avantajlarlnın başında kullanlmlndaki basitlik gelir.Bunun yanlnda, elemanlarln anlamlarının
da
aynl şekilde yorumlanmasl Ve arama işlemlerinin aynl sonuçlarl üretilmesi sağlanmaktadır. Bu özelliği, üstveri elemanlarü üzerindeki uluslararasü anlaşma Ve katkılar da desteklenmektedir.Ay-rıca elemanların genişletilebilmeii olanağl sayesinde, özel uyguİamalarda
Dc
eIemanlar|na ek yapllabilmesi de mümkündür.lnternet artlk sadece tanltlm sayfalarlnın sergilendjği Ve kullanıcıların bu say-İalar üzerinde gezindiği sanal bir ortam olarak düşünülemez. lnternet büyük
mik-tarlarda bilginin saklandığl heterojen Veri tabanİarl kolleksiyonu olarak dü-şünülmelidir (Singh 1998), Kullanlcllara, lnternet bilgileri üzerinde sorgulama olanağı sağlamak da önemli bir çallşma konusu olmuştur. Klasik anlamda sorgu işlemleri, okunabilir Web kaynaklarl üzerinde yapllabilen işlemlerdir Ve kaynak içeriği içinde kelime arama yöntemini temel almıştlr. Bu yöntem her zaman doğru sonuçIar olUşturmamakta, sorguIar çoğunlukla istenilen dlşında sonuçlar üret-mektedar. Yelerince kesin sonuçlar üretilememesinin en önemli nedenleri, kay-naklarün tanlmlanmasıyla ilgili bir yöntemin eksikliği Ve kaynak hakklnda bilgiye ulaşmak için kaynağın kendisine ulaşllmasl zorunluğudur. Üstveri kavramı, kla-sik anlamda, Web kaynaklannün sorgulanmasl yöntemlerinin değişmesini sağ-lamlştlr. Anahtar kelime arama yöntemi yerine, daha üst düzeyIi bir kavramsal model üzerinde inceleme yapma yönlemi gelmiştir.
Baha olgun - Ha,Yri sever B gı Düqa.1 2(xn.I(]lfr&9 Üstveri üzerindeki ilk çahşmalar wWW Konsorsiyumu'nun P\CS (Plattorm for lnternet content selecıion) adllçahşmasl ile başlar. PlCs (World...1999c) bjrsu-nucudan istemcilere, Web sayfalarıyla ilgili bazl değerlendirmeler iletmek için kullanllan bir yöntemdir. Bu değerlendirmeler, Web sayrası içerik bilgileridir. Ör-neğin, bir sayfan|n yetkili bir araştlrmacl taraİından yaratlhp yaratılmadlğı;
iÇe-riğinde şiddet, cinsellik
ya da
bozukdil yer allp
almadığl gibi bilgiler de-ğerlendirme öıçütlerdir.Plcs,
sabit öıçütler kulIanmak yerine, bir değerİendIrmğ sisteminin yarahlmasl için standart bir yöntem sunar. Böylece kullanlcılar Web sayfalarlnln kendi ölçütlerine uymayanlarlnl İiltreleme olanağt bulurlar. Özellikle aileler çocuklarlnln lntemet kullanlmlnda belirli ölçütler koyarak, onlann kötü et-kilenmeleriniengelleyebilirler.Plcs
slnİrll birkullanlm olanağ|na sahiptirVe dahagenel amaçlı içerik
tanımlamasında kullanIlamaz.Ömeğin
sayısal
kü-tüphanelerin Ve lnternet kaynaklannln içerik tanlmlaylcl bilgilerinin oluşturulmaslgereksinimlerini karşllayacak işlevsel yeterliliğe sahip değildir.
Bu
nedenleWWW Konsorsiyumu, Web için daha genel üstveri tanımlama modeli olarak
RDF
çalışmaslnI başlatmlştır- RDF klsaca web kaynaklannln işlenmesinin oto-matikleştirilmesini sağlayan olanaklarl ifade eder.Benzeri bir üsveri çallşmasl da
KlF
(Knowledge lnterchange Format) dilidi.Birgösterim diliolarak KlF'in çok iyi tanlmlanm|ş bir sözdizimi Ve semantİğiVar-dır (singh 1998). Aynl zamanda işleç önde tarzında bir ifade dilini (prefax Version ol İirst-order predicate calculus) kullanlr Ve KlF'le karmaşlk ifadeler tanlmlamak mümkündür.
KlF
sadece üstveri tanlmlanmasında kullan|ldığlndan,KlF
cüm-leleri ile ilişkili eylemi irade etmek mümkün değildir. Bu nedenle, KlF dilinin üze-rine bir iletişim katmanl görevi yapacak Ve KıF cümleleri için istem türünüta-nlmlamaya yarayacak başkaca dil özelliklerini sağlayan
KQML
(Knowledge Query and Manipulation Language) kullanılır (Singh 1998). Her KQML iletisi, bir iş|em türü ve i|gili KlF ifadelerini içerir. KQMLve KlF kullanılması, anlamsal aç|-dan kuwetli üsfueri tanlmlama Ve etkin işleme olanağ| sunar. Ancak ifade ye-teneği gelişkin olan bu katmanll modelin uygulamaya konmasl kolay değildir. Bu nedenle RDF, basitliğiyle bu modele göre önemli bir avantaj sağlar. Ayrlca RDFmodelinin anlaşllmasl ve iİade edilmesi daha kolaydır.
ç9 !ü]ğüuuepese|
u!5!
lepulnep)el ıdeuQ6 ouü'
ulueapq o^ nı uuepıue uawpa§ü üaueaı
ıeulqeJnğnlo e6pq ua.ıa5! !d!q Fsıde/('1wos üpuepüzeq
ıpepue§ uoıPluopl 1xe!-6u!sso9oJd pue ealgo -uep{s pazllqauao pJepue€ dn Jew a6enate1 nwo' :6188 og uepuüPJq (uo!rez!ue6.]o spJeNe]S puolpuo]ul osl 'u!5! ıewp6 uepulseıs? ulepfuos Jn! ng l§euep -Jryıeauns u!]ouap opulJoz| !6lq !ıapu!a! oqoq e.ıepMelpı ep agq lPuuns l§eu4p euepese| üsıcle]( aaeq
ıau'a ng !üpelıeun,4w 'ueuÜ weq aarczell
'e,lüıü!ü awztuQl Jlq ıeaele4.üeı lulJelululsrleJeo uuepüue
D| ,leuuelln ,Jepltlqaleaa]sü aa! el'nuos u)e|ezeü( ep ueLl l
opu!Ölq
ıuİe ueuez,ıaıJ
ül!6lq
)Eıoıue
nx eaoq 4üu+epepue§ ısıdetr nı ıuualrlalsü uue|cüue zeuele|Üeı nıun' ıq
ıol
te\e!
,Jepap
\euJıpueJl BpuüDüpües ex§eq 'ellq Jüq eİeuo ufuos aaoa ,üue.er6 ı]epezel uepueŞ lulJepaaq Jıq eİıcleüI -ep -.]e^ laopnzo' uuepnJos !I!6I alü{üseunıŞw epuLüa4 eluop ulapapq §üuuepl2eq e$IJeuo ıluüuel3 ,zouJül!loöp nuopJ uluueuöp ı]$eq nq 'allq esp \ıJe! ğOuN96 hepalıço )üp]ute 0p uapunaO\w Uluoaeq 'et! npü !rlepu!3! o6pq ıI2Ü uıu]ueaep ıüFeq !rapu!5! o6pq J!€ ,!p!l!q! alt!ğıülzlp ullqpeuep 'ıo5
uelıeup J9le.ls! ıdBİ eü!s!6lq lugplpq o'ü§ıdel uluaapg uluoapq uuuepEwslg anaıpuan]ufuQ' rceu ütı6lı
ep )eüe"ü6uuc el 'JBlııFeq !ıepu!5! g6pq )!a ,!p!9!6l!q üdeı 'ıJel€Lülpq lulJe|oJ uuaplsoı lrtopua uıou
Jlg 9puepe 'unJos uepelıe uyopapq uapüJJo^ ıeaeülel§es ıuısealJüpüJelüde^ deİ ululs!fuq ,!p!o!lıgıe
puag Jıpıpü§aq aetü}uu,{e !l!6l! gl§Oulpj uepruŞop !a!Jaa! uluadpq ueuepüzeq 0ıu0!
'JIpe]\euBuerJE gp ,Jıp!?auıJea! uazeq op ılJaJ! -ıe
!au!Fz? )]e ğf,euırleu u!.ıep6pq ugıJepızeq 'esİluspeu unung ,Jıpe»Ieueweuüğq Denu2le !fit! ol! pa$OunJQo upepdpq nq epJepunp lzeq 'ep esnc^ou )alaal -u_ol !Nğe' !!a! euJe]ıe eleu!ıeu uepeOlrteu uepdpq \epeı au )oH Jığ!w!p6 apq
lpouç ıuıseau§ epwelJo Jüa nt uepücıue oulJaŞüp -el 'lluoJuep upap5pq ue\Joı§np 'ıs9uğBlu6İel u!.üellcuel§! galpy alüpoN b6en6ue1 dnıJew pezteJauo9 uepuas) 1wos -eö ep
ıeıe|o
u^p 'ppuıup^ u!u!saurıığa|ıaö]e6 ııal§; ,ııq ıluıelue alı(ııalıuıse1 Ipunl
ualsıs
,ıauIpaııauıaIlauap ıuual§ı,(al§ı uLıa|uJısaı lle ııe;lnp1o ılııl§ılı 'ası ue;u.ııuel tıa5lqaı
.ınl a6|eq ılefep auııuıııplıq 1y195 ,ııpılŞeq auıu!JIpI!q]u\cs
.:alıel§ı 'uepunQnp|o uals|s Jıq ıl|auıally195
uıalsıs ıqı6 nŞnplnJ96 ap, ! l|ıa§ ]!pla|uJlsaı uaualığ auJelsls uepuEğlp !a|Lulsaı ualllaı -sQ6 n^oı epe.ıng ,.ıı§ıu.ıluals96 ap, rlııa§
auı|ııq a|,(!ıaluıısaı p 'ısa6z!ö^a|ğ! ",ppo1111) t (866 apuua|auInJn$nugp J!q tuılel ,:e1>1ılı(e1o1 ıpeupuıplQes )
ualsıs
a,-l!!X
ue|o |||p auJtı§e|uas uualeElaq ueue|uııuel apuı|apouıco/log
a^ l!paıığure|ıalsep ualla}ıPJP) aÖ>l.ı41 'apuuala6laq-ly!es
ueı(n euıtuıuel.:çı1 nq 'ıuıuel,ın1 a6laq1yl99
uelıde1 ,,ı4§ııuue|u.ııueı uepuı|eıpl (986 t ",|puo|ıEuıatu|) 9"lli\9)S ıeJeullP |auo] ltl,]lzlpzgsco/JoH
'lslde^ 6o|eıP) ,llpuaI16|lq 6otPlPı uele lauıa} ıuı|apouıco/Jou
ası nunjn uıuıılızp1 ,Jıı§ıulıu?||nı up||EJnıJoU
IauJal a^ ,ıu§ıu-ılııaı{,ıaı( apıuıöıq apes epıuılızeı{ aulIapoulloU
,,ıılöıu.ılıuellnl leje;o 1nlzos Jıq apuı|apouıloH
ıJpIueuJa|a ua^ısnco
Eptııı|ızp1 ,,ııp!sau]|u[ğa|)io5ıa6 uıuı|ız -e,(.ılq ueAelQes lUlsEtlJue|ulueı u!uua|ı!jaöl uı.ıelleu,(e1 ıüuolua|a 'ıe,leIluel-|nı
llP|uE[uaIa uaNsnco
a^llapoul
lou
'lcP[ıJe uıuılızP,( ualull§llag J-lo3co-H : wl,tzV^ Nv^\nU{lNvl lN|U3,D|lH]ÖlıvN^V)
$ıNu3tNl
,z is?tuuu ltuüurI JptUI5üg u?puns ulupallpa5l uruw!{vu(ol ıauJalul uı51 ıstıuluıuy uıuıŞauaıalJü§ax )pu,(sx 9 8899ol
'NOa ıİDİll|lo |8PgBaha olgun - Hayri Sever Bılgı Dün}a.İı 20N , ](1) 5648 hştlrllabilir. sistemin alt kesimleri mümkün olduğu kadar birbirlerine slkl bağlü ol-mayacak biçimde tasarlanarak, her bir alt kesimin yeniden kullanılabilirliği amaç-IanmıştIr. Ancak editör kesimi sistemde, diğer alt kesimlerden destek alan kesim olduğundan bu tanImlamanln dışlndadlr. Çizelge 1'de yazlllm alt kesimlerinin satır saylsl bilgileri Verilmiştir.
Şekil 1. sistem modeli
l
RDF/DC Aynştıncı<_
sGl/L
BelgesiSGML
Belgesi<->
{
Yerel yardlmcl programlar (Vi, netscape, xview...) Yeniden biçimlenmiş belge çlktlsı (html, rtİ, TeX) SGtvlL BildirimiDc
lemanlar Editörü :ıDS§§L]:Bildii]'üi ::,Biaariİ]]BililiiıiTii] RDF/DC Belge Tür TanımıRDF/Dc
Bicem Tanımırrş'--Çr..
rü}l]ak rleşif Yeıeneğinin Anınlması için Internet lQlnaklarınln
İçenklerinin Sandart Biçimde Tanımlanması Bı18l Dijqrıs, 20N, 1(]156ü
yazlllm Alt kesimi Programlama Dili Satlr Saylsl
sP-1 ,2 (sGML Aynştlrlcl) C++ 70.000
C++ 800
H-DcEdit 1 .0
c(MoTlF)
5.000JADE1.0,1
(DsSsL
N.4otoru) C++ 52.000Çizelge 1. Yazılım alt kesimleri sattr sayllarl
2.1.
sGML
Bildiriminin oluşturulmaslYazıIIm içinde kullanIlan
sGML
bildirimi, reİerans somut sözdizimi tanImlna uyumlu olarak tasarlanmlştlr, Bu tanlma eklemeler yapllaraksGML
işleme sis-teminin Türkçe içeriği de desteklemesi sağlanmlştlr. Aynca SGML belgelerindebazl XML uzantllarınln da kullanılabilmesi için SGML bildirimine bazı ekler ya-pllm lştır (sistem içerisinoe kullanllan SGlıı'lL bildirimi için bkz. Ek 'l
).
SGML bitdiriminde
cHARsET
bölümünde sekiz ikilljk (bit) belge karakterkü-mesi tanlmlanmlştlr- Belge karakter kümesİ iki temel kafakter kümesine da-yandtrllmlştIr:
lso
646Ve EcMA-128 (lSo Latin 5). Sekiz ikillik karakter kodlarlnI simgeleyecek karakter kümesinin soltarafı için (0-127) lso646, sağ tarafl için ise (128-255) ECMA-128 kullanIlmlştlr. Bu sayede SGML belgeleri için tanımlanankarakter kümesi Türkçe desteği Verebilecek duruma gelmiş olur. Aşağldaki SGML bildirimi kesimi SGML belgeleri için karaKer kümesi tan lm l yapmaktadır.
67
Baha Olgun - Halri Sever Biıgi Dijnyas, 20u) . ](]):7r§
BAsEsET " Iso 646- r 98 3/ /CHARSET lntelnatlona.l Reference Veİsion
GV)//Esc
2/5 4/o "o
9
UNUSED929
11
2
UNIJSEDl3
l
1514
18
UNğSED82
95
621e7
1
UNUSED" Iso Registration Number 148/ /cİİARsET ECMA- I e8 Rlght Part of Latin Alphabet Nr. 5 / / Esc 2 / r 3 4 /
I3'
128
32
uNugED160
95
32e55
r
U}TUSED DEscsET BAsEsET DEscsETSGML
belgeleri,XML
ile
uyumlu olabilecek biçimde tasarlanacağlndan,sGML blldiriminde ilgili değişiklikİerin yaptlmasl gerekmektedir. RDF modelinde şema (world... ,1 998) Ve sözlük kullanımInda XML isim uzaylan (namespaces) kullanılmaktadlr. Bu kullanüm RDF modelinin içinde nesneye yönelik yaklaşlmlarl barındırmasının bir sonucudur. XML isimuzayl, eleman adlnln isimuzayıyla ni-telenmesi biçiminde kullanıllr. Bu sayede, ayrl şema tanlmlarl içindeki elemanlar belirlenebilmekte Ve anlamsal bütünlük sağlanmaktadİr. 'Şema : Eleman" bi-çiminde bir yazlmda Şema isimuzayınl, Eleman ise şema içindeki elemanı gös-termektedir. ":"ayıracl ise isimuzayı ile elemanl ayırmak için kullan|hr. Fakat
sGML
referans somut sözdizimi içindeki SGML isimlendirme kuralİarında,ele-man adlarlnln belirtiminde (specifacation) ":" aylraclnln kullanlml standart de-ğildir. Bu nedenle SGML bitdiriminde NAMlNG kesimine ":" aylraclnIn eklenmesi gerekmekterdir.
rüynak r,€şif Yeteneğinin Anınlmas için Inıemet l&ynaklanrun
içeriklerinin SrandartBiÇimde Tanımlanması Rügı Diinıas, 20{n , ](1):56,88
NAıIING
LcNllIsTRTUCNMSTRT
LCNMCIIAR
'-.:'
Yukarlda
Verilen satırlardaki belirtim!er, isimlendirme kurallarünlaçlk-lamaktadlr. NAMlNG kesimindeki belirtimler, referans somut sözdizimi üzerine
eklenmek istenen isimlendirme kurallarl ifade eder.
LCNMCHAR
kesiminde küçük harf olarak kullanllacak isimlendirme karakterleri tanlmIanlr.UCNMcHAR
kesiminde ise büyük harf olarak kullanllacak isimlendirme karakterleri tanlmlanlr. Her iki kesime de "- . :" karakİerleri eklenerek, bu karakterlerin isimlendirmeka-rakterleri olarak algılanmasl sağlanlr.
Bu
karakterlerden ":" karakterinin ek-ienmesi de XML isim uzayl benzeri bir kullanlml SGML beİgelerinde kullanma olanağl sağlamlştlr.2.2. RDF/Dc Belge TürTanImI
YazllImlarln kulIandığı belge tür tanlml hem temel RDF modelini hem de
Dc
elemanlannl içerdiği için "RDF/Dc" olarak adlandınlacakhr. RDF/Dc
belgetürta-nlm|, SGML bildirimiyle birlikİe anlamlıdlr.
sGML
bildirimindeki XML uyumu VeTürkçe desteği BDF/DC belge lürü içinde de sağlanmlşılr. Başka bir deyişle,
XML uyumu Ve Türkçe desteği belge tür tanImında tamamlanmlştır. Aşağlda RDF/Dc belge tür tanlml kesimleriVe açlklamalan Verilmiştir.
<l-- RDF and Dc elements in tİre same DTD ->
<l-- In a,ddition, xM],like output is supported -->
< !__ RDF Elements ->
<IEIJMEMI rdf;RDF - - ( rdf:Description )* > <!ATTu§T rdf :R_DF
:o_lns:rdf CDATA "http: //www.w5.org/RDr/' )<mlns:dc CDATA " http: //pull .otg/Dc /
'
Baha olguo - Hayri s€ver Bi]gı Dijrı|aü 2a{ü0 , l(1i56ü Belge tür tanümlnln yukarlda görülen kesiminde, oluşturulacak sGML belgesi için slradüzensel olarak en dİştaki rdf:RDF elemanı tanlmlanmlştır. Bu SGt\,4L
elemanl beIgenin aynl zamanda
RDF
modeline göre tanlmlandlğlnl da gös-termektedir. Yani oluşturulacak belge içeriği <rdf :RDF> Ve </rdf :RDF> takllan (Veya belirleyicileri) araslnda oluşacaktlr. sGML belgesinin içeriği ise RDF iIe ta-nImlanan her bir kaynak tanlmlamalarl olacaktlr. RDF tanlmlamalarında, Dc üst. Veri elemanlarl özellik (properıy) olarak kullanllacaklardlr. AynI zamanda XML ile uyumluluk desteğinin ilk parçası olarak, RDF çerçevesi kuran rdf:RDF elemanl içine XML isimuzayl tanlmlan eklenmiştir.<!ElirrITY %
pıopeıty'AirY"
><!ELEMEI\]'I ldf:Descıiption -
-
pTopelty;>< | ATTLIST rdf :Description ID NMTOKEN #IMPIJED about CDATA #IMPLIED aboutEach CDATA #IMPLIED baglD NMToKEN #ndPLIİD
7o
Yukarldaki her bir RDF tantmlamasl için Varhk, eleman Ve öznİtelik tanlmiarı Verilmiştir. RDF tanImlamasınl içerecek oİan SGML elemanı rdf :Description ele-manldlr. rdİ:Description elemanlnln içerik modeli bir parametre Varllk tanlmlyla gösterilmiştir. Bu tanlma göre RDF kaynak tanlmlan belge tür tanlml içinde yer alan her eleman (ANY) olabilir. Bu biçimdeki bir gösterim belge türtanlmlna son-radan yapllacak ek bazü tanlmlarln kolay bütünleşebilmesini sağlamak amaclyla
kullanllmlştlr. Öznitelik tanlmlndaysa, tanlmlanacak kaynaklar için belirleyicinin ifade edileceği öznitelik isimleri (lD, about, aboutEach, baglD) gösterilmiştir.
Ge-liştirdiğimiz yazıllm şu anda sadece lD özniteliğini desteklemektedir. Aynca XML
ta-Kaynak r€şif Yeteneğinin Aİtınlma§ı lçin Inıernet Kanak]annın
içeriklerinin Stxndan Biçimde Tanln]laüınıast Bllİı Düüoı,s, 2aa0 1(1),5G88
nımlanndan çlkarllması da XML diline yaklaşma kapsamtnda ele allnmlştlr.
or-neğin rdİ:Descriptjon elemanlnlnda takı minimizasyonu ihmal edilmiştir. Dc Elements
< !-_
<lE}rrrrY C}6 dccontent " (#PCDATA) " >
<!EIJME}IT <lE],EMEıvr <!EI,EMENT <IEI;E [E}II <!ELEMEİüI <!ELEMENT <!ELEME}ıT <lELEMENI < |ELEMElrr <!EI,EM!NT <lELEMEıfI <|EIJMENT <!EIJMENT <lELEMENT < | ELEMEI\]'[ DC:TffLE DC:CREATOR DC:SI]B.,ECT DC:DESCRIPfION DC:PIJBLISiiER DC:COIfIRIBIIIOR DC:DATE DC:TYPE DC:FORMAT DC:IDENTIFIER Dc:soÜRcE DC:LANGUAGE DC:RiLATION DC:COVERAGE DC:RIGiftS Chdccontent; > c)6dccontent; > 96dccontent; > 96dccontent; > dccontent; > C}6dccont€nt; > Cxrdccontent; > cü6dccontent; > C}6d.ccontent; > (%dccontent; > 96dccont€nt; > C}6dccontent; > (%dccontent; > 96dccontent; > 96dccoDtent; > <IATrLIST DC:DATE
year
ODATA#IMPIIEDmonth
CDATA #IMPLIEDday
CDATA#I}PLr8D> <lArTuf'T Dc :R.ELATIoNtype
CDATA#ffPLIED
Iesor]Ice CDATA #IMPLIİD >
<l-
Added Elements foTRobots
-><IELEMENr BoDY - - 96dccont€nt; > <|ATILIST BoDY
locatıon CDATA #IMPLIED >
Baha Olgun - Hayri Sever Bugı Dürryası x}ca , l(1),56a8 Belge tür tanlmlnln yUkarıdaki kesiminde RDF kaynak tanlmlnln ögeleri olan
Dc
üstveri elemanlarl, birer SGML elemanl olarak tan|m|anmlştlr. Bir Varllkta-nım|yla
Dc
üstveri elemanlarlnln içerik modeli, işlenebilirkaraKer
Verisi(#PcDATA) olarak belirlenmiştir.
Dc
elemanlanndan ''DATE'' Ve .RELATloN"elemanlarınln içerikleri doğrudan yazllmamakta, bunun yerine öznitelik ta-nImlarlyla eleman değerleri belirlenmektedir. on beş adet Dc elemanlarl dlşlnda "BoDY" adlı bir eleman daha lanlmlanmlştlr. BU eleman, tanlmlanan kaynağln yerel sistemdeki yerini göstermesi için dahil edilmiştir Ve asllnda kaynak üze-rinde tarama yapacak Web robotlarlna yönelik tasarlanmtş üstveri elemanldır. Bu amaçla elemanün öznitelik tanlmlnda, yerel dosya adl bilgisinin tutulmasl amaçlanmlştlr. RDF çerçevesi içinde, on beŞ Dc elemanlVe birde sonradan ek-lenen elemanla birlikte on alt| özellik kullanllmaktadlr. Başka bir deyimle,
sGML
belgesi şeklinde oluşturulacak katalog kaydI on altü özelIik ile belirlenmektedir. <!-- Entities FoT Tırİkistı gupport -->
<lEİilT
rry
ccedil
CDATA
"Ç ''><lEı\rfrrY
ccedil
CDATA
"l; "><lENTrrY
oumı
CDATA
"Ö "> <IENTITYouml
,CDATA
"ö "> <IENTITYgcedil
CDATA
"&#ee2;'> <IENTITYscediı
CDATA
'þ'><lElvrrrY
ldot
CDATA
"Ý " ><lElirrrrr
iwhdot
CDATA
" ÿ " > <lEı\ı"frrYUumı
CDATA
" O; " ><lElil'frrY
uıJml
CDATA
"&#P52; "> <]EIilTrrY obrewe oDATA
"&#eo8; "><!E$rrry
gbrewe CDATA
"o; ">Yukandaki SGMLvarılk lanlmlanyla, oluşturulacak SGML katalog bilgileri içe-riğinde Türkçe karakterlere karşıllk varlık referanslarlnın kullanllması amaç-lanmlştlr. Türkçe desteği için EcMA-128 içinde bulunan ancak
lSo
8859-.l için-de bulunmayan on ikj karaktere karşlllk o|arak, varhk tanImları yapılmlşıır. varhktanImlannln karşlllk|an, sGML bildiriminin tanlmlanan belge karakter kümesinde
F,aıııak Keşif Yeteneğinin Aİtınlması için Intemet lo}ııaklannın
İçeriklerinin Sandan Biçimde Tanmlanması Bılgı Dünrai, 20ffi 1(115€,88
de bulunan kodlardlr. YaniTürkçe diline özel on iki karaktere karşlllk reİeranslarl getirilecektir. Çizelge 2'de on ikiTürkçe karakterVe EoMA-128 içinde tanlmll sa-ylsal karşllıklan bulunmaktadlr.
Bahsedilen XML ile uyumluluk özelliklerine rağmen oluşturulan belgeler birer
SGML belgesidir. Tamamen XML diline dönüştürülmeleri için aynca bir ön
iŞ-lemeye gerek duyulmaktadlr. Ancak yapılan tanlmlar bu işlemin yükünü ha-'ifletecektir.
Karakter Varlık Ec[,4A-'128 saylsal kod karşlllğl
Ç ç 199 ç ç 231
ö
ö 214 ö 246ş
&scedili ş ş 254 &ldot; &iwhdoİ; 253 ü Ü 220 u ü 252 Ğ &Gbrewe; 208 ğ &gbrewe; 240Çizelgc 2. Türkçe kaİakterler için tanlmll Varlıklar
73
o
Baha olgun - Hayri sever Bııgı Dülrrllsı Iüco, 1i|56{8 2.3. oluşturulan
sGML
BelgeleriRDF/DC belge
tür
tanümınauyumlu
SGML
belgeleri,
yinelenebilir rdf:Description elemanlaründan oluŞacaktlr, Her bir rdf:Description elemanl bir katalog bilgisi girişini ifade eder. Şekil 2'de oluşturulan bir SGML belgesinin RDFtan lmlar|na uygun çizge gösterimi Verilmiştir.
c reator Baha olgun
Title sGML
Türkiye publisher
contributor Hacettepe Üni
Type Hayri Sever
texvsgml
Şekil 2. SGML belgesinin çizge ile gösterimi
Şekil 2'de çizge gösterimi ile gösterilen kaynak tanımının
SGML
ile se-rileŞtirilmiş biçimi ise Ek 2'de gösterilmiştir.SGML
belgesindeXML
isimuzayl kullanllmaktadlr. DC:lDENT|FlERele-manlnda
Dc
şemasl içinde lDENT|F|ER elemanı ifade edilmektedir, Ayrlca Türkçe içerik desteği de Türkçe'ye özel karakterlerinSGML
Vadlklanyla gös-İerilmesi sağlanm lştlr.'sgml.cs.hun.edu.tr
rüvnak K€§if Yeteneğinin Artınlması lçin lntemet lgl,naklannın
İçeriklerinin Sandan Biçimde Tanımlanması Bılgı DünJası 2tn0, 1 ( ] ) : 5ı5 88
2.4. Hacettepe-Dc Üstveri Elemanlarl Editörü : H-DcEdit
sGML
bildirimine Ve belge tür tanımlna uygun SGML belgelerini oluşturmakiçin, UNIX
ortamlnda
X-MoTlF
ile
geliştirilmiş bir ediiör programl kul-lanllmaktadlr. Şekil 3'de H-DCEdit programlnln arayüzü görülmektedir.Şekil 3. H-DCEdit programl arayüzü
H-DCEdit programlnda
Dc
elemanlarlnı RDF modeli içinde tuİacak SGMLbelgeleri oluşturulur.
Dc
elemanlarl girişi Şekil 4'de görülen arayüz araclllğlylasağlanlr.
Dc elemanlarl giriş arabirimi ile istenilen sayıda kaynak tanlml yapllabilir. Ay-nca
Dc
elemanlarlna ekıenen "BoDY" elemanı için de giriş yaptlabilir. Eğer bu eleman için değer girişi yapllmlşsa yani kaynak için yereI işleİim sistemi üzerinde yol adresi beljrtilmişse; kaynağln görüntülenmesi için olanak sağlanmıştlr, Gö-rüntüleme işleminde yerel programlar, yardlmcl olarak kullanllmlştlr, içeriği teXV html biçimde tanlmlanan bir kaynak için HTML destekli bir web göstericisikul-l cE.o.İ l|@ /hd,4 fu .t ib.. ı Ü,.9,1
'de.trlf er.' hq/lrnıs.h..i(ğ
''fre,,
şoı,!- TükiP (!lı.üdks crPrİar.,B.tr oLot N
saa&üı.,sol"ı, Tü*iy.
de5c./rrrbr.,scırll- T!r}iy. §r.} s.yls Arbrl9rıeİ: H.eİt.peü,rs,iEn
corıfuİar:Eğlis.fr
'aıa.,0' Trıpe: İ.*-üo_1$a lalgr]qe: ğ
Rcıaİbn: bRğa.@By nq i\,w.€ jE.eE
'&ü(s.,ürğ H.ük s.İ!&
75
BiIPi Dijryas, 2uD , ]t]).5688 lanllabilir. Aynl şekilde içeriği image/giİ olan bir kaynak, gif biçimini destekleyen
bir grafik gösterici program
ile
kullanılabilir. Kultanılacakyerel
programlar,H-DcEdit
programl
içinde
tanImlanmalldİr,Yardlmcl
uygulamalarln ta-nlmlanmastnl sağlayan arayüz Şekil 5'de görüImektedir,DC
Elemanlan Giriş Arayüzü araclllğl ile katalog bilgileri oluşturup sak-landlktan sonra; ilgİli katalog bİlgileri, H-DCEdit programlnın arayüzü taraİlndan listelenir. Şekil 3'de, Ek 2'de Verilen örnek bir SGML belgesi ile ilişkilendirilen bir liste görünümü yer aImlştlr.Çizim alanında listelenmiş olan katalog bilgilerinin görünüşüyle ilgilİ de-ğişiklikler yapma olanağl da H-DCEdit programl taraf|ndan sağlanmlştlr. Şekil
6'da görünüş değişikliği sağlamak için kullanllan arabirim Verilmiştir.
Is.oo TtuCiF İıırıaıd14 s6t. td.iı6 ı,cr §dytğ{
ıl.! İd*t s*l!İ!i
76 Şekil4. Dc elemanlarl giriş arayüzü
Baha olgun " Hayıi Sever
Dğ lleetş 'ntr-f ld! 9*
9T:,
P!,
§95ğıi.fe ldqllijiet i.§rücp Iikİtirie! Titfu JFo. ".o*,Dğr ğl -, j ıtto6t]t J&.. i Ytr! ı99E ,,
[so. ıfuıc1i
-Rğlatioo
_ ]ı!:J:.|ağgry _ .] nelatĞd aesoltce Id
L1 ,J]lğlwueluıuel!llp ope!! Jlq aA llp n6Jo5 Jlq '!t!p euep!6lq Jlq '!l!p aryOlğnuQp )!q 'apüJ!5! ıpJepue§ 1SSS? ,Ju§ıwuepie^ eüBeJeunu ]Jepue§ 966l:6110l c3l/osl 'lss9o ,Jüğeueoes uau_ol )!q uepueF u!5!
xaallqeueln ,QJqA aa]uQt 1ssso u]uüpJepue]s 'üceue eue lwcs au6l1ae6ı alü awaF! !u!Jo1!6t!q Jlq epüe
lq u!r! xeuJ!$eplq luyeppFq aae$! aI! eue eJe§! 1/l9S 'epugeaağ eua ae§! '§!uğapua6
)aH !|ıxewüİe ae§! uıueuJnl§np ewe 1cewe eua\xı'lq )eŞ!p a^ we$! '!u!lal!bM uapulslpual ulueapq
ğla6epue? ]uaunaod 1SSso ğpİs pue So!]ueues uolp.lllcads (a6en6ue1 ,lpau l nzn^ğJğ eule|ıılluPı ğııleIn6^n lcırllpJğA,9 |!lağ -lE^ (aul6uf "lssso,sauJP|) nloloru
"lsssQ
apel. up|luPllnlleleto
ulPJoold lcllllple^ ua|a6laq"ly\es
uP|o tsl}ı15uluel6old
,.ltpauaualıau9 Pp IulŞEue|o aulalul5lq ululpJepuEıs (966!
",|euoneu.ıatul)/"lSsso
'ıuıe,ıoojd1p39q-g
,,ııuı§ -el auıa}sıs ualı6lıq a6leq 1eıelıuepeıeı( uepuısıuıö uıuıcı,ııl§ı,ıı(e a^ JnInuns ıEJ -e1o §uı0 Qasıed) eı(ıcı.ıı}ğuı(ecQ/loU
ısa6laq "l1ı\OS uıö! unung ,,ıueı ep ıŞeue1o atual§ı uepıuaı( dı^a|ın^ ıuua|a6|aq 1y195 nQnpınlön1o ıuıe:6o,ıdp:ıco-H
ısztuuquııur1 apuı5ıg uvpuğ]s uluuapua5l uıuuclılıııiv1 ıau.ıaıu1 uı51 ıs,zuıluııry uıuı.fleuaıalJl§ry )teuizy l 1 Iı,
i,, la!Oı.İ -l*'q,Bs9§0I
au)a ı§oİ,üIo |3ı!gBaha Olgun - Hayri Seıer Riıgı Di,iryas, ]ta0 {1):5G83
dımıyla HTML, RTF ya da TeX olarak yeniden biçimlenebilmektedir (ÇeVrimiçi,
elektronik
adres:
http://www.jclark,com/jade
http://www, jclark.com/jade, [25.12.1999]). Böylece,sGML
standardlnln ilişkili olduğu DSSSL standardı da örneklenmiştir. Biçimleme işlemi için, belge tür tanlmlyla Uyumlu bir biçem tanıml yapılmlştlr. Bu tanlm sayesinde başka biçimlere çevirim işlemiyapllmlştIr.Şekil6. Çizim alanl görünüş değişikliği sağlayan arayüz
2.5. RDF/Dc
Ayrlştlrlclsl
RDF/DC ayrıştıncl program|
SGML
belgesini ayr|ştürlr Ve H-DcEdit prog-ramlnln anlayacağü biçimde bir ayrlştlrma çlktlsl oluşturur. Çlkn H-DCEdil prog-ramı tarat]ndan sisteme yüklenerek eski bilgilerin yeniden işlenmesi sağlanır, Ay-rlştlrlcl program taraflndan oluşturulan ara ç|kh H-DcEdit programlna yöneliktir.RDF/Dc programl, bir sGML ayrıştlrlclsl olan
sP
(sGML Parser) paketiüze-rine oturtulmuştur (Çevrimiçi, elektronik
adres:
http://www.jclark,com/sp 77 http://www.jclark,com/sp [25. 1 2, 1 999]).sP
paketi sGML standardlnI büyük ölçüde desteklemektgdir. Bu da RDF/Dcprogramlna zaman içinde istenildiği biçimde değiştirilebilecek olma esnekİiğini kazandlrlr. ill}EaltEla :Tİİıİ :iıDJDm :lrlstaIPrtlrl :E@,nüB colliımrİ(n TlPE llİratt
!ğıtİ&ıc tih§ - l fdt§ile l12 c]r56t to80§9_9 -. !a.i]dtt ,eili@ - l P6h@ f@& - ] iriqeğıt 3trt .
EıtrEı
Gataıog İİeents §l YfuüIerüinak Keşif Yeteoeğinin Anınlnlası için lnternet Kı\,naklaflfun
içeriklerinin Slandan Biçimde Tanı!ı]anmiısı Bilgi Dünraiı 2000 , ](l) 5683
SP paketi programcllara sGML belgeleri üzerinde işlem yapma olanağlnl bir
API (Application Program lnterface) araclllğlyla sunar. RDF/DC ayrlştlrıclsü da sunulan
APl
olanağını kullanaraksP
paketini bir kitaplık (library) olarakkul-lanmıştlr. Ayrlştürma aşlemi için
class
rdfdc oluşturulmuştur Ve RDF/DOay-rlştırlclsl da class rdfdc'yi kullanan bir SGML uygulaması oİarak geliştirilmiştir. rdİdcparse adtı uygulamanın, giriş olarak aldığl Ek 2'de görülen SGML belgesi için ürettiği ayrlştlrma çlKlsı Ek 3'te gösterilmiştir,
RDFiDc
ayrlştlnclsı SGML belgesinde tanlmlanan kaynak saylsl bilgisiyIebaşlar ve her eleman için eleman adı
ve
içeriği bilgilerini içerir. Ancak bazıele-manlann içeriği
sadece
H-DCEdil programının anlayacağı biçimdedii. Gö-rüldüğü gibi aynşt|nm çlktlSl özel amaçlı bir içeriğe sahiptir ve H-DCEdit uy-gUlamasl İaraf lndan kullanlldlktan sonra silinmektedir. Yani bu çlktjy| kullanlcınln anlamasIna gerek yoktur. Çünkü sadece bir ara çlkll olarak kullanlllr, ihtiyaç kal-madlğlnda ise silinir,2.6.
DssSL
Biçem TanİmlDSSSL standardı dönüştürme, biçimleme ve sorgulama olmak üzere üç ana kesime ayrlllr Ve bunlar dışındaki kesimler ise bu kesimlere destek olarak kuI-lanılır. H-DCEdit programl kullanlldığı
DSSSL
motorunun bİçimleme olanağlnı kullanmlştlr.DSsSL motoru, SGML işleme sisteminin içine yerleştirilmiş biçimdedir Ve ha-zırlanan SGML bildirimiVe belge türtanlml,
DssSL
motoru için de geçer!idir. Ay-nca, kullanllacakDsssL
dili için genel bir DSSSL belirtiminÖ Ve DSSSL ağaç-hğrna uygulanacak bir biçem dil tanImlna ihtiyaç duiuIrnaktadlr (olgun 1999:57-65). Bu geneltanImlara uygun bir biçem tanlml yapllarak, sGML belgelerinin ye-niden biçimlenmesi sağlanmlştlr.H-DcEdit programl taraf lndan oluşturu!an birSGML belgesiVe
DsssL
biçem tanlmlnln yönlendirdiği DSSSL motorunun biçimleme işlemi sonucunda HT1,4L,Baha olgun - Ha}.ri sever Rllgı Düryası 2c00 , 1(1):56İ3
RTF, TeX belgeleri olarak yeniden oluşturulabilmektedir, RTF ve TeX belgeleri tek parça olarak olUşturulurken, HTML belgesi, biçim bilgisini taşlyan
css
(cas-cading Sytle sheets) tanlmlyla birlikte üreİilir (Çevrimiçi, elektronik adres: http://
www.w3.org/style/css http://www.w3.org/style/css, [18.12.1999]). Ek 4'de Ek 2'deki
sGML
belgesinin karşlllğl olan HTML belgesi Ve Ek s'de HTML biçim bilgisini gösterencss
tanlml gösterilm|ştir.3.
soNUç
Kaşgarlı Mahmut Bilgi Geri-Getirim
Projesi
kapsamında, meta-arayıcılar Veya arabulucular gibi yazllım aracllarlna girdi teşkil eden RDF/DC katalog bil-gilerini üreten, H-DcEdit yazıllml gerçekleştirilmiştir. SGML aynşt|rıclsü, sp-1.2, ve DSSSL motoru, jade-1.0.1, modüllerini kullanan bu yazılım, UNlX ortamında MOT|F geliştirim aracı ile C/C++ dillerinde yazılmıştır. Yazılımda model olarakWWW Konsorsiyumunun bir çallşmasl olan
RDF
modeti temel allnmlş, sözlük olarak daDc
üstveri elemanları seçilmiştir. oluşturulacak eleKronik kaynaklar bilgileri İsesGML
standardlyla desteklenmiştir. Böylece RDF çerçevesi içindeDc üsfueri elemanlarlnl içeren SGML belgelerini oluşturan H-DCEdit yazılımı
or-taya çıkmıştır. H-DCEdit programı ismi, "Haceüepe-Dublin Core Üstveri Ele-manlarl Editörü" kelimelerinden türetilmiş bir kısaltmadlr.
Yazılımda, ayrlca
sGML
standardlnln bir uzant|sI olanDssSL
standardı da örneklenmiştir. Buna ek olarak; SGML belgelerinin, günümüzde HTML yerinegeçecek olan
XML
standardlna da kolay dönüşebilmesine destek Verilmiştir. oluşturuIan SGML belgelerin Türkçe içeriği des,teklemesi de sağlanmlştlr.Kay-nak kod
Ve
belgeler
http://www.cs.hun.edu.trl-kmweb salaslnda
bu-lunmaktadlr.
Çalışmamız kapsamında geliştirilen yazlllm kesimleri genişletilmeye açlkİlr.
RDF modelinin gelişmesi sürdükçe, kullanılan model karmaşlklaştlnlabiIir,
Dc
r,aynak r€şif Yeteneğinin AnınIrnası lÇn Internet Kaynaklannın
içeriklerinin Sandan oiçimde Tanürnlanması Bilgl DürttlLİ, 2t)N. l0l5ü8 üsfueri elemanlarl dlşlnda diğer sözlükler de kullanılarak bilgi tanlmlama ye-teneği artlnlabilir. Yapllan çallşma, bir dizinleme/arama aracl ile Web sitelerinde ya da kütüphanelerde kaynak tanlmlamaya Ve kaynak hakkında bilgi sunmaya
yardımcl olarak da kullanllabilir (bkz. KMBGS: Gerçek|eştirim Bölümü,
[ÇeV-rimiçi].
Elektronikadres:
http://www.cs.hun.edu.trl-km/gerceklesİirim.html.[05.10.1999]).
Ek 1. Yazılım sisteminin kullandlğı sGML bildirimi <|SGML "iSO 8879:1986 "
cEARSET
BA§ESET "Iso 646-1 g8s//cIİAn§ET Intsrnational Reforence verslon
@v)//Egc2/54/o,
DEscsET
o
9
IrNIrsEDoro
1ı
e
IiNusEDl3
1
ı3
ı4
18
UNUSED32
95
32Izf
1
UNUSEDBASESET'
ff}o Regi§tİation Number 148l/cIlARsET
ECMA- r 28 Right Part ofLatlı
Alphabet ıfI. 5/ /g,sc 2/ L3 4/13'
DESCSET
1a8
ğ2
uNugED160
95
32255
l
IJNUSEDcAPAcrrY
PUBLIC " Iso 8879:1986//CAPACIrY Reference//trlN "scoPE
DocIrMENtgYİfrAx
sİİtINcIİAR CONTROI§ 0 1 2 6 4 5 6 7 8 9
t0
11ıe
1g 14 16 16 I7r8 r9 20 21
222a2,4etse62l
e8 e9 s0 81ıe7
e55BA§ESET 'If}o 8869- r //CİİAR§ET Interna.tİonal RefeTence veTsion
(B\DI
lEsc216
4lo,
DEgcgET
0
eB6
0rrUNoTIoN
RE
16Rs
10gPAcE
se
Büa olgun - Hayri Sever Bılgı Düfirosı 20ıa , 1(1) 5688
TAB
SEPCIİAR
9NA.![ING
LCNMSTRTUcNMSTRT
NAMECASE
GENEnAL
YEgE}rrrrY
NoDELIM
GEITERAL
SGMLREFsIloRTRaF
SGMLREFNAırEs
sGMliRİF
QuA.}IIrrY
SGMLREF
NAMELEN
40 l'EATUREslltI}IIMIzE DATATAG No oMIrTAG YEg RA}TK No SIİoRTIAG
YEs
L]NK
§I}IPLE No IMPLICIT 1Io E)(PLICIT }IooTIlER
coNcIrR YEs 999999 gIJBDoc YEg 99999999 FoRMAl,YEs
APPI}TFO NoNE>Ek 2. H-DcEdİt programl çtktlsl bir
sGML
belgesi<|DoCTYPE RDF:RDF
PuBIJc
' -//Batıa olgun//DTD RDF and Do//EN " ><RDF:RDF xmlns:rdf=' http:,//I/gww.w5.orğ/RDF/ " )<mtns:dc= " http: / /pırİı. oİg/Dc / '>
<RDF:Description about= "http: /,/seml,cs.hun.edu.tİ " >
<DC:IDENTITIER>http| / /8EEl. cs.İıun, edu.tK/Dc :IDENTE'IER> <DC:CR_EATOR>BaIıa Ot€\rll</Dc:CREAToR>
<DC :TrIIJ>SGML Türkiye Ku]l8n&iwhdot;c&iwhdot;la,T&iwhdot;
</DC:TIII,E>
<DC :9UB.IECT>SGML T&uum_l;ıkiye</DC :SIIB.IECT>
<DC:DE§CRIPfIoN>sGxtL T&uumı;İkiye web sa]İfas&iwhdot; </DC:DESCRIPIION>
<DC: PIJBLISI{ER>Eacettepe Üniversitesi</DciPI,BIJSIİER>
<DC :CoIVIRIBIIIoR>HaJrri sevel< /DC : CoIfIRIBUtOR>
<Dc:RIGİ{fS>EeI Hakİ&iwb,dot; saİl&iwhdot;d&iwbdot;İ<,/Dc:RIGETS> <Dc :TYPE>text</DC:TYPE>
<DC : FoRlIAT>text/sEEnt</DC: FoR}!AT>
<DC :LANGUAGE>tı</DC:LANGUAGE>
<Dc:DATE year= 1 998 moDth=JaJı day=o l></DC:DATE>
(uynak IGşif Yeteneğinin Anlnlmast için lnternet Fü}araklannln
İçeriklennin Standa( Biçimde Tanımlaıması B gi Dijroqn 2[w , 1t]) 5ü8
<DCIRELATIoN
resouıce=|lhttp://www.cs.hun.edu.tT" ww!Y.cs.hun.edu.tI t34ıe=I§RefeıencedBy></Dc:RELATIoN> </RDF:Descriptıon> </RDF:RDF> Ek 3. Ayrlştırlmçıktlsl
1 RDF:DESCRIPIION DCITrfLE sGtrjL TiırkjyeKulanrcılan
DC:CREATOR Batıa0l$!
DC:9UB.JECT gG rL nitrkiye DC:DESCRIPfiONSGIIL Ttiİkiye web gaJdası
DC: PIJBLI§IiER Hacettepe
Ünive$itesi
DC: CO]fIRIBIIIOR Eayri sever DC:TYPE o DC:FORIIAT 0 DC:IDEIIJ'IIFIERhttp: / / s €iml. cs. hu!. edu. tT
DC:LA§GUAGE
0
DC:RIGİİTS
HeI
Haİh
saklrdrrDC:RELATIoIıI 6 http: //www.cs.tıun.edu,tr Dc:DATE o 0 8 l\ttp| / / B3
8aha olgun - Hayri sevef Bılgı Dijryas, 2{)00 , 1(1):5ü5-83 Ek 4. sGML belgesinin karşıhğı olan HTML belgesi
<HTML>
<IJNK EEL=STYLESHEET TYPE= " text/css " HR.EF= "dc6.css " >
<BoDY>
<DIV CLA§S=DC:IDEMIII'IER> <SPAN CLA§S=DC I IDENIIEIER>
IdentifieT: http: //seEoi.cs.huı.edu.tr http://sgml.cs.tıuı.edu.tı
</SPAN> </Dw>
<SPAN CLA§S=RDT:DESCRIPIION> <,/SPAN> <DrV CIi§S=DC :CREATOR>
<SPAN CIJ§9=DC:CR.EATOR>
creetoı: Baha
ou\ın
<,/SPAN> </DIV>
<8PA§ CLAf}S=RDF:DESCRIPIION></9PAN> <DrV CLA§S=DC:TffLE>
<SPA]ü CLA§S=DC:TİTLE>
Title: SGML
riırkıye
Kut]a.nɝco5;laro5; </sPA]itr></Dw>
<SPAN CLASS=RDF:DEgCRIPIION></SPAN> <DrV CLA§§=DC:SUB.IECT>
<SPAN CLA§S=DC: gUBcIECT> gubject: SGML T{irıdye </sPAİ{>
< /Drv>
<SPAN CLA§S=RDF:DE9CRIPIION></§PAİ,T> <DW CLA§9=DC :DE9CRIPION>
<9PAİ,I CLA.f}9=DC : DE9CRIPI ION>
Descrlption: sGML T\ifkıJıe web g&yfa.so6; </gPAN>
</Dw>
<8PAN CLA89=RDF: DE9CRİPIION>< /9PAN> <DiV Cl,A§9=DC:PIJBU9IiER>
<9PAN CI"A89=DC:PUBLIf'İİER> Publl§ber: İlacettepe Ünlversıts6i
Ka}rüak Ke§if Yeteneğinin Anüİlması için Internet F\a},naklafl run
içeriklerinin sıanda( Biçimde Tanımlanmasl Bl.ıgi Diiırwı 2ü)0 1(]) 5G88 </gPA]itr>
</DrV>
<9PA§ CLAS9=RDF: DESCRIPI !ON>< /SPAiıi> <DIV CLA§S=DC:CONIRIBUrER>
<9PA§ CLAS§=DC :COİffRİBIIIER>
contribut€r: IİaJ.!ı seveİ
</SPAN> </Drv>
<SPAN CLASS=RDF:DE9CRIPIION></SPAN> <DrV CLASS=DC:RIGET9>
<SPAN CLASS=DC:ElGITf S>
Ri€|hts:
İleı
Iİakkos; 9al<lɝdo5;ı <,/sPAtrI></DIV><9PAII CLA§}9=RDF:DE§CRIPITON>< /9PAN> <DrV CLASS=DC:TYPE>
<SPA_}I CLA§S=DC :TYPE> 15De: text </gPA_l\I> </Dw> <SPAN CLASS=RDF:DE9CRIPEON></SPAN> <DrV Cİ,Af}S=DC:IQRMAT> <SPAN CLAflS=DC:FORMAT> Format:
text/htıd
< /gPA_N> </DrV> <SPAN CI,A§S=RDF:DESCRİPIION></SPAN> <DIV CLA§S=DC :LANGUAGE><SPAİV CLAS§=DC;LANGUAGE> La.ngu8,ge:
tr
</SPAN> </Dw>
<SPAN Cl,A§S=RDF : DESCRIPIİON>< /SPAİıI> <DrV C],A8S=DC:DATE> <SPAİıI CLAf}S=DC:DATE> Date: o1-JaJx-l998 </gPAN> < /DİV> 85
Baha Olgun - Halri Sever Bılgl DüD"rı.rı 2a{)0 , 1(r,56$ <SPAN CLASS=RDF:DESCRIPI IO1{></§PA§>
<DW CIi§9=DC : R.ELATION>
<SPAN CI"A§9=DC : RELATION>
Retation:
IsReferencedBy
http://www.cs.huİ..edu.trwww. cs.hrın. edu.tr </sPAtrT> <./Dw> </BoDY> </IIrMı> nüp:// Ek 5. HTML belgesinin
css
uzantlsl SPAİ,I.RDF:DESCRIPIION {fonLfamily: Times Ne],Y Roman,serif; font-weiebt: 5oo;
font-8tyle: noıma];
fon}sizeI lopt;
coloT: #oooooo; }
SPAN.DC:RELATION,
SPAN.DC:DATE,
SPAN.DC:LANGUAGE,SPAN.DC:FOR}IAT, §PAİıI.DC:TYPE,
SPAN.DC:RIGHTS,SPAN.DC:CONIRIBUIOR, SPAN.DC:PUBLJSEER, SPAN.DC:DESCRIPIION,
9PAN.DC:SüB.JECT, SPAİ,İ.DC:TI[LE,
SPAN,DC:CREATOR,SPAN.DC:IDEiüIIFIER {
fonLfamityi Times New Rom8n,seıif; fonLwei€tlt: 5o0;
font-style: normaı; font-size: l4pt;
colol: #00oooo; }
DrV { margin-top: opt; margln-bottom: opt; margtn-left: opt; mar€iir]-ri€|ht:
opt }
DIV.DC:RELATIOİf, DIV.DC:DATE, DIV.DC:IiNGUAGE, DIV.DC:FORMAT,
DIV.DC:TYPE,
DW.DC:RIGIfIS,
DIV.DCıCOIfIRIBUIOR,DIV.DC:PUBU9EER,
DIV.DC:DE9CRIPIION,
DIV.DC:SUB.ITCT, DIV.DC :TIILE, DW.DC:CB.EATOR,DrV.DC:IDENTIEIER { t€xÇalign: left; line-height: Iept;
texi-ind6nt: opti
rü}Tıak r€§if Yetenegınin Anıolmasl lçin lntemet Kaümaklrnnrı
içeriklerinin sündaft Biçimde Tanırnlanması Bııgı Drqan 20{a . 1(l) 5(138
KAYNAKçA
Doorenbas, R.B., Elzioni, o. ve Weld, D.s. (1996). "A scalable comparison-Shoppin9 Agent for the world-Wide web", Technical Fleport No. Uw-csE-96-01-03, De-patment of computer science and Engineering, University ol washington. IKaynak sayfa]. [ÇeVnmiçi].
http://www.cs.washingüton.edu/research/projects/sottbots/wwwprojects.html
[1998, Arallk]. shopBot
Poesi
1998 sonlarlnda sonlandlrlllp, ticari olarak ge-liştirilmeye başlanmlştlr(bkz. http://www.jango.excite.com http://www.jango.excile.com)
Dublin core Metadata lnitiative. ('1998). Dublin corğ Elemenl set, Version 1.0. [Kaynak sayfa]. lÇevrimiçi]. http://www.pur1.org/dc. [1 999, Arallk25]
Etzıoni, o. (1996). "The wond wide web: Quagmire or Gold Mine?" , AcM comms., 39(1):65-68.
Gauch, s. Ve Wang, Guijun, w. (1996 ). "lnformation Fusion with ProFusion" ,
web-Net'96:The Firstworld conforence of lheweb society, San Fracisco, cA.
Gravano, L. Ve Papakonstantinou, Y. (1998). "Mediating and Metasearching on the ln-terneti, lEEE Data En9ineerin9, 21(2): 28-36.
lnternational organization for slandardization. (1986).
lso
8879/1986: lnformation Processing-
Text and otfice systems -- standard Generalized Markup Language (sGML). Ref. No. lso 8879:1986 (E).(1996).
lso/lEc
1o179:'1996: lnformation technology-
Processing lan-guages-
Document style semantics and specification Language (DssSL). Lassila, o. (1998 Temmuz-Ağustos). "web Metadata A Matteİ of semantics",lEEEln-ternet computing, 30-37.
olgun, B. (1999). Dublin core Üstveri Elemanlan Editörü. Yüksek müİıendislik tezi, Ha-cettepe Üniversilesi, Fen Bilimleri Enstilüsü.Ankara [Çevrimiçi].
http://www.cs.hun.edu.tr/-krTı,belgeler.html [1 999, Arallk 25]
Manber, U. Ve Bigot, P.A. (1998). "connecting Diverse web search Facilities" , |EEE Data En9ineerin9, 21 |2)| 2'| -27.
Singh N. (1998 Mayls). "Unirying Heterogeneous lnformation l\,4odels", AcM comms., 4,1(5\ 37 -44.
world wade web (wsc) consortium (1999a). w3c: cascacing sytle Sheets (csss). [Kaynak Safa]. [Çevrimiçi]. http://www.w3.org/style/css. ['l999, Aralık 18]
Baha Olgun - Hayri Sever Bilgı Dün»as, 200a, 1@:5688
-.
(1999b). w3c: Resource Desciption Framework (RDF) Model and syntax specification, lKaynaksayfa]. Haz. Lassilao. Veswick, R,R. [Çevrimiçi],
http://www.w3.org/TFi/REc-rd!syntax [1 999, Şubal 24].
-.
(1999c). w3c: Plcs - The Platlorm lor content Selection. [Kaynak sayfa]. [Çevrimiçi]. http://www.w3.org/Plcs/. [1 999, Ekim i 4].
(1998).
w3c:
Resource Description Framework (RDF) schema spe-ciricaıion. lKaynak sayfa]. Haz. Brickley, D., Guha, R.V., and Layman, A. [ÇeV-rimiçi]. http://www.w3.orgi|TRAVD-rdf-schema [1 999, [,ilarl 4](1997). w3c: Extensible lvıarkup Language (XML). lKaynak sayİa], Haz. Bray, T., Paoli, J., Ve sperberg_McQueen, c.M. [Çevrimiçi].
http://www,w3.org/TR/PR-Xm1-971208. [1999, Arallk25].
TEşEKKÜR
Bu makalede söz konusu edilen çallşma, T.c. D.P.T. taraflndan desteklenen
97K12'l330 numarall Kaşgarll Mahmut Bilgi Geri-Getirim sistemi Projesi
kap-samlnda
gerçekleştirilmiştir.
Proje
hakklnda
geniş bilgi,
http:// www.cS.hun.edu.trl-km çevrimiçi EV Sayfasl adresinden elde edilebilinir (05/10/ 99, son günlenme tarihi),YazarIar ayrıca, bu makaienin hakemine, titiz çallşmaslndan Ve yol gösterici önerilerinden dolayl teşekkür etmeyi bir borç bilmektedirler.