Erişim ve Kullanım - Web Arşivleme Yaşam Döngüsü Aşamaları

3. WEB ARŞİVLEME

3.2. Web Arşivleme Yaşam Döngüsü Aşamaları

3.2.5. Erişim ve Kullanım

Arşivciler genellikle verilerin sağlanması depolanması, yönetilmesi ve korunması üzerine yoğunlaşmaktadır. Bununla birlikte veriler analize ve kullanıcı erişimine de açık olmalıdır. Bir Web sitesi arşivlendiğinde kalıcı bir URL ye dönüşür ve çevrimiçi olarak erişilebilir kalmaya devam eder (National Archives [NA], 2017:5). Erişim ve kullanım amacıyla Web arşivlerinde keşif ve arama izni veren kullanıcı arayüzlerinden yararlanılır.

Arayüz üzerinde sunulan erişim yöntemler ise URL arama, anahtar sözcük arama, tam metin arama alfabetik arama, gelişmiş arama ve konu araması olarak sıralanabilir.

Bir Web arşivine erişimde en yaygın kullanılan yöntem URL aramadır.

Yakalanan URL yakalama tarihiyle birleştirilir ve bu aynı kaynağın farklı versiyonlarını ayırt etmede kullanılır. Toplanan tüm verilerin dizinlenmesinin zorluğu URL arama özelliğinin sık kullanılan bir arama yöntemi olmasında etkili olmuştur. Avrupa'daki Web arşivleri üzerine yapılan bir ankette, Web arşivlerinin %68'inin URL aramayı desteklediği görülmüştür (Costa ve diğerleri, 2016:4). Fakat kullanıcıların URL'leri hatırlamasını zorunlu kıldığı için URL arama sınırlıdır ve URL arama güncel olmayan içeriği de getirebilir. Şekil 2’de Wayback Machine aracılığıyla Milli Kütüphane ana sayfasına yönelik yapılan bir URL araması göstermektedir:

Şekil 2. Türkiye Milli Kütüphanesi Ana Sayfasına Yönelik Yapılan Bir URL Araması

Canlı Web üzerinde yer alan bir URL’nin bulunamaması, eğer arşivlenmemişse, o URL’nin sonsuza kadar kaybolması anlamına gelecektir. Ayrıca URL arama ile ilgili bir diğer olumsuz durum ise URL’nin yaşı ile kaybolması arasındaki güçlü ilişkidir. 1995-2004 yılları arasında D-Lib Magazine’de yer alan makalelere erişimin test edildiği bir çalışmada (McCown ve diğerleri, 2005:10) URL’lerin yaklaşık olarak %30’una erişim sağlanamamıştır. Erişimin sağlanamadığı durumlarda en sık karşılaşılan durum kodları

"404 bulunamadı" ve ardından "500 dâhili sunucu hatası" dır (McCown ve diğerleri, 2005:1).

URL aramanın dışında yaygın olan bir diğer erişim yöntemi anahtar kelime aramadır. Anahtar kelime aramada kullanılan üstveri, arşivlenen kaynaktan otomatik olarak çıkartılabilir veya küratörler tarafından manuel olarak oluşturulabilir. Üstverinin kaynakla ilişkilendirildiği bu arama metodu Avrupa genelinde Web arşivlerinin %65’i tarafından desteklenir (Costa ve diğerleri, 2016:6). Anahtar kelime arama işlevselliği veri ve bağlantı madenciliği araştırma toplulukları arasında sözü edilen ve Web arşivlerinde giderek artan bir gereksinim haline gelmiştir (ISO, 2013:10).

Web arşivlerinde tam metin aramadan da yararlanılır. Kullanıcıların arama davranışları üzerinde güçlü bir etkisi olan tam metin arama, özellikle Google gibi Web arama sistemlerinde bilgi keşfinin egemen şekli haline gelmiştir (Costa ve diğerleri, 2016:6). Tam metin arama ayrıca bir Web arşivi işlevselliği olarak kullanıcılar tarafından talep görmektedir. Tam metin arama işlevselliği henüz istenilen seviyeye gelmemiş olsa da, işlevselliğin Avrupa Web arşivleri tarafından % 70 oranında destekleniyor olması önemlidir (Costa ve diğerleri, 2016:6).

Arama yöntemlerinden bir diğeri olan alfabetik arama içeriğin A-Z harf diziliminde sıralandığı erişim metodudur. Gelişmiş aramada ise birden fazla arama bileşeninden yararlanılır ve daha spesifik sonuçların alınması muhtemeldir.

Konu arama özellikle seçimli, tematik ve olay eksenli arşiv koleksiyonlarına erişimde yaygın olarak kullanılmaktadır. Küratöryal çaba gerektirir. Bununla birlikte geleneksel bibliyografik yönetim metotları tıpkı basılı kitapların ve dergi makalelerinin kataloglanmasında olduğu gibi konu araması yapılabilen Web arşivlerine uygulanabilir (ISO, 2013:10). Web arşiv kayıtlarını kütüphane kataloğuna aktarmak kaynakların görünürlüğünü arttıracaktır. Fakat bu yaklaşım kaynak yoğundur ve kataloglanacak nesnelerin miktarının çok olmasının yanı sıra kaynak tanımlamadaki zorluklar nedeniyle yaklaşımın Web arşivlemede uygulanması zordur (ISO, 2013:10). Web kaynaklarının kataloglanması tüm kaynaklar yerine özel koleksiyonlar seviyesinde sağlanabilir.

Web arşivleme yoluyla yakalanacak bilgi makinece ulaşılabilir olmalıdır. Başka bir ifadeyle tarayıcı Web sitesine erişebilmelidir. Giriş ekranı, onay ekranı, seçim listesi veya arama ekranı aracılığıyla sunulan bilgiye erişim, makinece ulaşılabilir değildir ve bu nedenle bir Web tarayıcı tarafından yakalanamaz (NA, 2011:9). A-Z listesi veya site haritası gibi doğrudan indirme yapılabilecek alternatiflerin yaratılması sitenin arşivlenebilmesi adına faydalı olacaktır.

Erişim sürecinde arayüz tasarımı ve kullanılan erişim metotları kadar kaynakların telif hakkı durumu da önemlidir. Birçoğuna ücretsiz erişim olmasına rağmen Internet kaynakları genel olarak telif hakkı ile korunur. Yasal mevzuata ve izinlere bağlı olarak toplama kurumları bir dizi erişim stratejisini hayata geçirmektedirler (ISO, 2013:11):

• Karanlık arşiv: Koleksiyonlara hiç kimse erişemez. (Bir görevli veya küratöryal amaçlar dışında)

• Gri arşiv: Koleksiyonlar yalnızca kendilerine yetki verilen son kullanıcılarca görülebilir (örneğin: araştırmacılar) ve/veya erişim bina bünyesinde sınırlandırılmıştır (örneğin: kütüphane okuma odası).

• Çevrimiçi arşiv: Erişim tüm kullanıcılar içindir ve kaynaklar genellikle toplayıcı kurumunun Web sitesinden erişilebilir durumdadır.

• Alternatif olarak bir arşiv, bölümlerini yukarıdaki stratejilere uyumlu hale getirerek karma bir model kullanabilir. İzinlerin sadece varsayım ve ima düzeyinde olduğu, açıkça izin verilmediği durumlarda devre dışı bırakma politikası temelinde depolanan kaynaklara erişim hak sahiplerinden izinlerin alınması yoluyla sağlanabilir.

Web arşivlerinin erişim ayrıca üstverilerin zenginliğine ve kullanılan arama ve dizinleme araçlarına bağlıdır. Uygun bir tarayıcı ile oluşturulmuş bir Web arşivi son kullanıcılara kendiliğinden erişilebilir olmadığından, arşivdeki dokümanlar, tercihen Web içeriğini dizinleme için optimize edilmiş tam metin arama motoruyla birlikte dizine eklenmelidir (Hakala, 2014:181).

Web arşivleri büyüdükçe sunduğu arama yetenekleri de büyümelidir. Web sitelerinin oluşturulma aşamasında Web arşivinin kullanıcı dostu olarak tasarlanması erişimi arttırmaktadır. Bu amaçla Web arşivlerinde görselleştirmeyi öne çıkaran daha güçlü ve etkili araçlar üretilmiştir. Örneğin Birleşik Krallık Web Arşivi, zaman içinde Web arşivinde arama terimlerinin görülmesini göstermek için arama sonuçlarını bir grafik içinde döndüren kullanıcılar için bir NGram görüntüleyici sağlamaktadır. İsmini “N”

harfi ve “Gram” kelimesinin birleşiminden alan NGram, verilen bir dizilimdeki tekrar oranını bulmaya yarayan yöntemdir [157]. Buradaki “N”, tekrarın kontrol edildiği değerdir. “Gram” ise bu tekrarın dizilim içerisindeki ağrılığını ifade etmek için kullanılmıştır. Bazı Web arşivlerinde ayrıca etiket bulutları, konu hiyerarşisi görselleştirmesi ve posta kodu tabanlı erişim de dâhil olmak üzere farklı araçlar da modellenmiştir (Hockx-Yu, Crawford, Coram ve Johnson, 2010:5).

Web arşivleme daha popüler hale geldikçe erişimi geliştirme adına kullanıcı gereksinimleri daha fazla dikkate alınmaya başlamıştır. Uygulama örneklerine bakıldığında birçok kurumun Web arşivine çevrimiçi erişim sağlamak için Internet Archive tarafından geliştirilen açık kaynak kodlu Wayback Machine’in kullandığı görülür. Arşivlenen URL, gezintinin gerçekte canlı Web'de değil de arşivde yapılmasını sağlamak için Wayback Machine tarafından anında yeniden yazılmaktadır (Lasfargues ve diğerleri, 2012:122). Internet Bellek Vakfı (IMF), dört yıl önce sunucu tarafı bağlantısını yeniden yazmayı ilk uygulayan olmuştur ve o günden beri erişimini sürekli geliştirmektedir (Lasfargues ve diğerleri, 2012:122).

Arşiv kaynaklarının yeniden gösteriminde sıklıkla “canlı Web kaçağı” olarak ifade edilen problem, arşivlenen kaynağın içerisindeki linklerin Web arşivi içerisindeki arşivlenen sürümü işaret etmek yerine canlı site üzerindeki güncel kopyayı çözümlemesinde ortaya çıkar (ISO, 2013:11). Bu genellikle URL’lerin yeniden yazımındaki yanlışlıktan kaynaklanır ve sıklıkla JavaScript’teki gömülü linklerin erişim yazılımı tarafından algılanmamasının bir sonucudur (ISO, 2013:11).

Web arşivlerinde erişilebilirlik arşivin bulunduğu ülkedeki yasal koşullara da bağlıdır. Bazı ülkelerde mevzuat ulusal kütüphaneye Web sitelerini koruma ve arşivlenmiş kopyaları erişime sunma izni verir. Yeni Zelanda'nın yasal derleme mevzuatı bunu örnekler. ABD örneğinde ise Kongre Kütüphanesi tarafından arşivlenmiş tüm Web

sitelerinin kaynakça kayıtları halka açık hale getirilmiştir ve yalnızca üreticileri tarafından izin verilen Web sayfalarına kamu tarafından erişim sağlanabilir (Grotke ve Jones, 2010:17). Web sitesi sahiplerinin izin vermediği durumlarda ise kamu tarafından Web kaynaklarına erişim sağlanamaz. Kamu tarafından erişilebilen bazı Web arşivleri, Web sitesi sahipleri ile rekabeti önlemek için daha az işlevsellik ve geciktirilmiş erişim sunar.

(Masanes, 2006:9). Bazı ülkelerde ise Web arşivleri karanlık arşivdir veya kullanıcılara yalnızca yerinde erişim sunmaktadır. Geciktirilmiş erişim örneklerine bakıldığında, bir Web sitesi derlendikten 3 ay sonra Harvard Üniversitesi erişim aracı WAX’da ve 6-12 ay sonra ise IA Wayback Machine’de görüntülenebilir (Niu, 2012b).

Belgede TÜRKİYE CUMHURİYETİ ANKARA ÜNİVERSİTESİ SOSYAL BİLİMLER ENSTİTÜSÜ BİLGİ VE BELGE YÖNETİMİ ANABİLİM DALI KÜLTÜREL MİRASIN KORUNMASINDA WEB ARŞİVLEME VE ULUSAL KÜTÜPHANE UYGULAMALARI Yüksek Lisans Tezi METEHAN SAMANCI Ankara-2018 (sayfa 60-64)