• Sonuç bulunamadı

3.5. Kurumsal Açık ArĢiv Alt Yapısı

3.5.4. EriĢim: Üst Veri Harmanlama Protokolü

Web ortamında kullanıcıların bilgi ihtiyaçlarının karĢılanması için muhtemel ilgili belgelerin tamamının kullanıcı ekranında görüntülenebilmesi, ilgili olmayanlara ise eriĢimin sağlanmaması gerekmektedir. Ġlgili belgelere eriĢimin sağlanabilmesi için iki koĢul yerine getirilebilmelidir.

 Belgenin tamamını temsil etmek üzere belge içerik üst veri tanımlamalarının uluslararası standartlara uygun olarak yapılması ve kaydedilmesi,

 Belgelere verilen üst veri tanımlamalarının kullanıcılar tarafından doğru veya yakın tahmin edilmesini sağlamak üzere gerekli yönlendirmelerin kullanıcı bilgisayarında sağlanması, çakıĢan belgelere eriĢimin sağlanması (Tonta, Bitirim ve Sever, 2002:18). KAA‟larda kullanılan iletiĢim araç ve teknolojileri, bilgiye eriĢim yöntem ve yönetimini etkilemektedir. Kurumsal arĢivlerin de dâhil olduğu tüm içerik arĢivi ve veri tabanlarında üç farklı model ile kullanıcılara hizmet verebileceği öngörülmüĢtür (Swan ve diğerleri, 2005):

 Merkezi (Centralized) model: Hem üst veri hem de kaynağın kendisi merkezi bir arĢivde depolanmaktadır.

 Tam Dağıtık (Full Distrubuted) model: Bütün üst veri ve kaynaklar kendi arĢivlerinde kalmakta, merkezi bir arĢiv oluĢturulmamaktadır.

 HarmanlanmıĢ Dağıtık (Harvesting Distrubuted) model: Karma bir model olup sadece üst veriler bulundukları arĢivlerin yanı sıra merkezi bir arĢive kopyalanmaktadır.

Merkezi eriĢim modelinde iki türlü yaklaĢım olmaktadır. Ġlk yaklaĢım tarzında mevcut içerik arĢivleri dikkate alınmaksızın tüm bilgi giriĢ, koruma ve tarama hizmetleri tek bir merkezde yapılmakta, mevcut içerik arĢivlerinin fonksiyonel olarak kullanılması sınırlandırılmaktadır. Ġkinci yaklaĢımda Web ortamında içeriklerin depolandığı ve sorgulama yapılabildiği veri tabanlarının belli bir merkezde birer kopyası tutulmakta, o merkezden yapılan sorgular ile istenen içerikler kullanıcılara yönlendirilmektedir. Bu tarz yaklaĢımlar ile hızlı ve doğru bir eriĢim arzu edilmesine rağmen veri giriĢlerinin zorluğu, tüm veri tabanlarının kopyalarının alınabilmesi, güncellenmesi ve bakımı ek bir maliyet ile sorumluluk getirmekte, idame sağlanamamaktadır.

Tam Dağıtık eriĢim modelinde ise, kurumsal arĢivlerde yer alan üst veri ve bilimsel içerikler merkezi bir yerde toplanmamaktadır. Merkezi olarak bir arayüz tasarlanmakta ve kullanıcılardan gelen istekler içerik arĢivlerine ayrı ayrı gönderilerek, gelen yanıtlar birleĢtirilmeye çalıĢılmaktadır. Bu tip yaklaĢımın maliyeti ilk çözüme göre çok daha az gibi görünmesine rağmen bazı sistemlerin çevrim dıĢı olduğu durumlarda yapılan sorguların eksik olması ve yavaĢ çalıĢma durumu ile karĢılaĢılmıĢtır (Çağıltay, 2001). Bu tip yaklaĢıma göre yapılandırılmıĢ Z39.50 standardı bibliyografik bilgi değiĢimi için kullanılmaktadır. ABD‟de Ulusal Bilgi Standartları KuruluĢu (National Information Standards Organization - NISO) ve Ulusal Standartlar Enstitüsü (American National Standards Institute - ANSI) tarafından geliĢtirilen standart ISO 2709 ismiyle 1996 yılından itibaren uluslararası düzeyde kullanıma sunulmuĢtur. ISO 2709, sistemler arasında veri değiĢiminin

gerçekleĢtirilebilmesini sağlayacak genel bir yapı oluĢturmak için gerekli kuralları içermekte ve her biçimde içeriği tanımlamak için kullanılmakta ve her tür ortamda yer alan kayıtların birbiriyle iletiĢim kurmasını sağlamaktadır. Ġlgili protokol ile istek geldiğinde farklı çevrimiçi katalogları ayrı ayrı sorgulanarak sonuçlar gösterilebilmektedir, ancak yukarıda belirtildiği gibi sistemlerden birisine eriĢilemediğinde sorun yaĢanabilmektedir (Küçük ve Soydal, 2003). Bu modellerin özellikleri EK 11‟de sunulmuĢtur.

HarmanlanmıĢ Dağıtık (Harvesting Distrubuted) model, Web üzerinde bulunan arama motoru servislerinin (servis sağlayıcıların) davranıĢ özellikleri ile benzerlik taĢımaktadır. Arama motoru servisleri içerik arĢivlerine Web sörfü yapmakta ve elde ettiği bilgilerden kendi veri tabanını oluĢturarak kullanıcılara sağlamıĢ olduğu bir arayüz üzerinden sorgulama olanağı sunmaktadır. Arama motoru servisleri çoğunlukla robot, dizin (veri tabanı) ve içerik kaynak görüntüleme bileĢenlerinden oluĢabilmektedir.

Robotlar (Web crawler, spider) ile önceden belirlenen protokollere uygun olan Web üzerinde farklı adreslerde konumlandırılmıĢ olan arĢivlere eriĢilebilmekte, arĢivlerde bulunan içeriklerin üst verisinde yer alan bilgiler ile içerik kaynak bağlantısı (linkini) harmanlanarak (metadata harvesting) arama motoru servisinde yapılandırılmıĢ dizine (veri tabanına) kaydedilebilmekte ve ajan olarak isimlendirilen bir yazılım ile arama performansı için gereksinim duyulabilecek iĢlemler veri tabanında yapılabilmektedir. Ajan tarafından ilgililik (relevance) derecelerine göre sıralama, ölü/canlı bağlantı7

tespiti (link checker), içerik değiĢikliği takibi (page change monitors) gibi önceden tanımlanmıĢ iĢlevler robotlar aracılığıyla gerçekleĢtirilebilmektedir. Veri tabanında yapılan düzenlemeler sonrasında arama motoru servisi üzerinden sunulan bir arayüz ile kullanıcılar tarafından içeriklere kolay, hızlı ve doğru bir

7

Web kaynakları tahmini olarak ortalama 75 gün değiĢmeden kalabildiği, %40‟ının her ay değiĢtiği, bir bağlantının (link) ortalama ömrünün 44 gün olduğunu belirtilmektedir (Brake, 2001; Kahle, 1997).

Ģekilde eriĢilebilmesi sağlanabilmektedir. Ġçerikler arayüz üzerinde kullanıcı davranıĢlarına uygun olarak tasarlanmıĢ algoritmalar yardımıyla bir sıra dâhilinde baĢlık (title), üst veri belirteçleri (metadata tags) ve tam metnin (full text) birkaç satırını kapsayan kaynaklar halinde grup olarak görüntülenmekte, kullanıcı tarafından yapılan tercih ile ilgili kaynağın bulunduğu arĢive yönlendirilerek içeriğin tamamına eriĢim sağlanabilmektedir (Warner, 2005; OAI-PMH, 2007) (ġekil 23).

Şekil 23: Harmanlanmış Dağıtık Model

Kaynak: OAI, 2008

OAI Üst veri Harmanlama Protokolü (Open Archives Initiative Protocol for Metadata Harvesting - OAI-PMH), Açık ArĢivler GiriĢimi (Open Archives Initiative) tarafından açık eriĢimli olarak değerlendirilen arĢivler (data provider) ile arama motoru servisleri (harvester - service provider) arasında karĢılıklı iĢlerlik kuralına uygun olarak iliĢki kurulabilmesi ve gereksinim duyulan açık eriĢim içeriğine eriĢim sağlanabilmesi amacıyla 2001 yılında yapılandırılmıĢtır. 2002 yılından itibaren 2.0 sürümüne geçen OAI-PMH protokolü ile yapılandırılmıĢ arĢivlerin üst verileri çoğunlukla Dublin Core standardında oluĢturulmuĢ ve açık eriĢimli olarak değerlendirilmiĢtir. Söz

konusu arama motoru servislerinde robotlar tarafından belirlenen aralıklar ile sörfü yapılan OAI-PMH protokolü ile yapılandırılmıĢ açık eriĢim arĢivlerinde içeriklerin üst veri ve kaynak bağlantıları servis üzerinde oluĢturulan dizine XML tabanlı olarak kaydedilmekte ve kullanıcılar ortak bir arayüz üzerinden eriĢim sağlayarak OpenURL standardına göre verilen bu bağlantılara tıkladıklarında açık arĢivlerdeki kaynakların tam metinlerine eriĢebilmektedirler. Kullanıcı tarafından gerçekleĢtirilen sorgular her bir sisteme ayrı ayrı gitmemekte, kullanıcılar tarafından her açık eriĢim arĢivinin Web adresin bilinmesine gerek duyulmamaktadır. Tüm verilerin kopyalanması yerine sadece üst verilerin kopyalanması sayesinde maliyetler azalmaktadır. (OAI-PMH 2007; Tonta ve diğerleri, 2006).

Arama motoru servisleri (servis sağlayıcı) OAI-PMH protokolü kullanan arĢive (veri sağlayıcı) ġekil 24‟de görüldüğü gibi http temelli form (get ya da post) ile istekleri iletmekte (request), arĢiv, istenen ölçütleri sağlayan bilgi kaynaklarının üst verilerini servis sağlayıcıya çoğunlukla XML biçiminde geri dönüĢümünü (response) sağlayarak dizinlerini oluĢturabilmektedir. Arama motoru servisleri 6 farklı isteği (request) bir (Get Record) ya da daha fazla kaydı (List Record) kapsayabilecek Ģekilde arĢivlere iletebilmektedir. Kullanılan söz diziminde gösterildiği gibi (syntax) verb kelimesi sonrası istekler ifade edilmektedir (ġekil 25). Kullanılabilen istekler ise Tablo 15‟de gösterilmektedir.

Şekil 24: OAI-PMH Protokolü Temel İşlevi

http://an.oa.org/OAI-script? verb=GetRecord

&identifier=oai:arXiv.org:hep-th/9901001 &metadataPrefix=oai_dc

&set=physics:hep

Şekil 25: OAI-PMH Protokolü İstek Sözdizimi

Kaynak: OAI-PMH, 2007

İstek Kapsamı

Get Record 1 Kayıt

Identifier 1 Kayıt Adresi

List Records 2-100 Kayıt (bir istek esnasında) List Identifiers 2-100 Kayıt Adresi

List Medata Formats 2-100 Kayıt Üst veri Cinsi List Sets 2-100 Kayıt Konu ve Alt konusu

Tablo 15: OAI-PMH Protokolü İstekleri

Kaynak: OAI-PMH, 2007

KAA‟larda yer alması istenen bilimsel içerikleri üst verilerinin çoğunlukla Dublin Core standardında olmasına gereksinim duyulmaktadır. Ancak KAA‟da yer almasına gereksinim duyulan içeriklerin farklı standartları destekleyen sistemlerden transfer edilebilmesi halinde ise üst verilerin Dublin Core standardına dönüĢtürülürken bilgi kayıpları yaĢanabilmekte, bazı zorluklarla karĢılaĢılabilmektedir. Olası hataları önleyebilmek için yukarıda değinilen DC üst veri editörleri kullanılabilmektedir. DC üst verisi kullanımında ise bazı elemanların belirsizlikleri yaĢanabilmektedir. Örneğin tarih (date) elemanı içeriğin yayımlanma, arĢive konulma ya da yeniden düzenlenme tarihi gibi farklı koĢulları yansıtabilmekte, biçim (format) birden fazla formatın bulunduğu içeriklerde sadece birini ifade edebilmekte, kaynak adresi (identifier) orijinal kaynak ile kaynağın kendisine bir sonraki bağlantıda eriĢimi öngörülerek, herhangi bir zamanda kaynak adresi kırık bağlantı (broken links) durumuna gelebilmektedir. Anılan olumsuzlukları önleyebilmek için oluĢturulan XML formatında düzenlemesini sağlayabilen Celestial gibi bir

dizi OAI servis ve araçları geliĢtirilmiĢtir. (Çağıltay, 2001;Tonta ve diğerleri, 2006; OAI-PMH, 2007).