Geleneksel Bilgi Erişim - BÖLÜM: KAVRAMSAL ÇERÇEVE: ETKİLEŞİMLİ BİLGİ ERİŞİM SÜRECİ

II. BÖLÜM: KAVRAMSAL ÇERÇEVE: ETKİLEŞİMLİ BİLGİ ERİŞİM SÜRECİ

II. 1. Geleneksel Bilgi Erişim

MÖ. 3000’lerde Sümerler yazılı bilgilerin kolay bulanabilmesi ve bu bilgilere erişim sağlanabilmesi amacıyla özel alanlar belirlemişler ve geliştirdikleri her bir tableti ve içeriğini tanımlamak için özel gruplandırmalar oluşturmuşlardır. Bu durum Sümerlerin, yazılı bilgiye erişim ve bu bilginin verimli kullanımı için uygun organizasyon ve arşivlere erişimin de önemini kavradıklarını göstermektedir. Özellikle kağıt ve matbaanın bulunmasıyla yazılı bilginin saklanması ve bu bilgilere erişim önem kazanmıştır. Bilgisayarın icadının ardından ise insanlar büyük miktarda bulunan veriyi depolama ve mekanik olarak erişim için bilgisayarları kullanabileceklerini fark etmişlerdir. Büyük miktarda verinin depolanarak, bu bilgiye otomatik olarak erişim fikrini ilk olarak 1945 yılında “As We May Think” makalesinde Vannevar Bush belirtmiştir (Singhal, 2001, 1. s.).

Terim olarak bilgi erişimi, ilk kez 1950 yılında Calvin N. Mooers “The theory of digital handling of non-numerical information and its implications to machine economics" başlıklı yayınında kullanmıştır (Mooers, 1950, 3. s.). Mooers aynı zamanda

30 1951 yılında yayımlanan “Zato coding applied to mechanical organization of knowledge”

isimli makalesinde bilgi erişim kavramını, “Bir kullanıcının, bilgi ihtiyacının koleksiyonda var olan ve kendisine yarayan bilgileri içeren belgeler ile güncel bir atıf listesi oluşturabildiği süreç veya yöntemin adıdır” şeklinde ifade etmiştir (Mooers, 1951, 25. s.). Uluslararası literatüre bakıldığında bilgi erişim kavramının, bilgi biliminin (Information Science) bir alt başlığı olarak ele alındığı, bilgisayar bilimi içerisinde de veritabanı sistemleri, insan-bilgisayar etkileşimi, görüntü tanıma ve yapay zeka vb. gibi konularla örtüşerek, söz konusu konularla yakın ilişkili olduğu görülmektedir. Aynı zamanda bilgi erişim kavramının disiplinlerarası bir kavram olmasından da kaynaklı olarak bu kavrama ilişkin birbirine benzer çok sayıda tanımla karşılaşılmaktadır.

Bilgi erişim alanının öncülerinden olan Gerard A. Salton bilgi erişimi, bilginin yapısı, analizi, organizasyonu, depolanması, aranması ve erişimi ile ilgili bir alan olarak tanımlamıştır (Salton, 1968, 5. s.). Lancaster’e göre (1979, 11. s.) bilgi erişim, belge terimini en geniş anlamıyla kullanarak belirli bir konuyla ilgili olan belgeleri tanımlamak için bazı belge koleksiyonlarının taranması sürecidir. Kavramla ilgili yapılan diğer tanımlar da incelendiğinde, Salton’un 1968 yılında yapmış olduğu tanım çoğu araştırmacı tarafından hâlâ en geçerli tanım olma özelliğini korumaktadır (Croft, Metzler ve Strohman, 2010; Zobel, 2018, 19. s.). fakat literatürde karşılaşılan yaklaşımlar içerisinde Cleverdon, Salton, Sparck Jones ve Lancaster tarafından yapılan tanımlar arasında en geçerli tanımın Lancaster tarafından yapıldığını (Van Rijsbergen, 1979, 1. s.) ifade eden araştırmacılar da bulunmaktadır. Salton’un yapmış olduğu tanımın hâlâ en geçerli tanım olduğunu düşünen araştırmacılardan olan Baeza-Yates ve Ribeiro-Neto’ya göre (2011, 1.

s.) bilgi erişim, belgeler, web sayfaları, çevrimiçi kataloglar, yapılandırılmış ve yarı yapılandırılmış kayıtlar ve multimedya nesneleri gibi bilgi içeren öğelerin gösterimi, depolanması, düzenlenmesi ve erişimi ile ilgilidir. Lancaster’in yapmış olduğu tanımın anlaşılabilir olduğunu ifade eden Van Rijsbergen, veri erişim ve bilgi erişim arasındaki fark ve/veya ilişki çerçevesinde bilgi erişim kavramının değerlendirmesini yapmış (Van Rijsbergen, 1979; Gürdal Tamdoğan, 2009, 159. s.), veri erişimin tümdengelim yöntemine göre ilerlediğini ve veri erişimde tam eşleşme arandığını, bilgi erişimin ise tümevarım yöntemine göre ilerlediğini ve tam eşleşme değil kısmen eşleşen öğeler arasından bilgi isteğine uygun en iyi eşleşenlerin seçimi esasına dayanmakta olduğunu ifade etmiştir (Van Rijsbergen, 1979, 1. s.).

31 Bilgi erişim sürecinin ve bilgi erişim sistemlerinin işleyişinin kavranması, bilgi erişim ve veri erişim kavramları arasındaki fark ve/veya ilişkinin anlaşılmasını olanaklı kılacaktır.

Kullanıcıların bilgi gereksinimlerinin belirlenmesine yönelik açıklamalarını tanımlarında kullanarak Salton’un yapmış olduğu tanımı eleştirel bir ayrımla kabul eden araştırmacılar da bulunmaktadır (Zobel, 2018, 19. s). Bunlar arasında Meadow ve diğerleri (2000, 15. s.), bilgi erişimin bir iletişim süreci olduğunu belirtmişler ve bilgi erişimi kullanıcıların bilgi gereksinimlerine yönelik belgeleri, kayıtları, grafik görüntüleri ve ses kayıtlarını bulabileceği bir araç olarak tanımlamışlardır. Manning, Raghavan ve Schütze (2008, 1. s.) bilgi erişimi, genellikle bilgisayar ortamında bulunan büyük koleksiyonların içinden kullanıcıların bilgi gereksinimini karşılayan, genellikle belgelerden oluşan bir materyal bulmak olarak. Verma (2017, 3. s) ise bilgi erişim çalışmalarının amacını, kullanıcıların gereksinimlerini anlayan ve bu gereksinimlere uygun olarak sistemden, ilgili bilgileri getirerek kullanıcıların erişimine sunan sistemler tasarlamak olarak ifade ederken bilgi erişimi de, bir derme içerisinden kullanıcı gereksinimine uygun ilgili bilgileri sıralı liste halinde veren tam otomatik bir işlem olarak tanımlamaktadır.

Ulusal literatür incelendiğinde ise bilgi erişim kavramından çok bilgi erişim süreci üzerinde durulmuş, kavram olarak bilgi erişim, literatürde çok tartışılmamıştır (Gürdal Tamdoğan, 2009, 162. s.). Buna bağlı olarak kavramla ilgili tanımın çok az olduğu görülmüştür. Köksal (1981, 26. s.) bilgi erişim kavramını, “bir bilgi erişim dizgesini kullanarak, içerik bakımından araştırılan konu ve kavramlarla ilgili olabilecek, genellikle varlığı bile bilinmeyen belgelerin izini bulmayı amaçlayan araştırma” şeklinde tanımlamıştır. Tonta (2001, 200. s.) ise bilgi erişimi, bilgi toplama, sınıflama, kataloglama, depolama, büyük miktardaki verilerden arama yapma ve bu verilerden istenen bilgiyi üretme (veya gösterme) teknik ve süreci” olarak açıklamıştır. Yapılan tanımlar içerisinde neden-sonuç ilişkisi bağlamında en ayrıntılı tanımı yapan Gürdal Tamdoğan’a göre bilgi erişim, “Bilgiye seçici biçimde yaklaşan ‘kullanıcı’ ile sistematik hale getirilen ve kullanılır kılınan (depolanmış) ‘bilgi’ arasındaki bilgi akış sürecini kesintisiz biçimde sağlamak üzere, belirli yöntem ve tekniklerin kullanılarak sistem içindeki bilgi kaynağı ve/veya bilgi kaynağı içindeki bilginin çağrılması, çekilip alınması ve değerlendirilmesi sürecidir”(Gürdal Tamdoğan, 2009, 162. s.).

32 Bilgi erişim kavramı, bilgi erişim süreci ve bilgi erişim sistemleri üzerine 1960’lı yılların başından itibaren önemli gelişmeler yaşanmıştır. Bunlardan en önemlileri arasında gösterilen Luhn (1957, 317. s.), otomatik dizinleme konusunda önemli çalışmalar yaparak, artan veri ve belge üretiminde bilgiye erişim için belgelerin tamamen otomatik olarak dizinlenmesi gerektiğini belirtmiştir. Gerard Salton ve ekibi ise SMART (System for the Mechanical Analysis and Retrieval of Text) projesini geliştirerek, bu projede önerdiği sistemle metin erişimde otomatik yöntemlerin etkililiğini ve verimliliğini araştırmıştır (Buckley, Salton ve Alan, 1993, 392. s.).

SMART sistem, dili İngilizce olan belgeleri, bilgisayar arama isteğine uygun şekilde işleyebilen ve kullanıcı tarafından verilen sorgulara en çok benzeyen belgelere eriştirebilen tamamen otomatik belge erişim sistemidir (Salton, 1966, 2.s.). SMART sisteme yönelik gerçekleştirilen deneyler için yeni erişim teknikleri ortaya çıkarılmıştır.

Bunlar arasında, bilgi gereksinimiyle ilgili dokümanlardan terimler seçilerek, seçilen terimlerin kullanıcı sorgusuna eklenmesiyle sorgunun genişletilmesi fikrine dayanan ilgililik geribildirimi, iki dilli eş anlamlılar sözlüğü kullanarak her iki dilde bulunan kelimeleri aynı kavramlarla eşleştiren çok dilli erişim bir diğeri de vektör uzayı modelidir (Lesk, 1995, 17. s.). Yine günümüzde hâlâ bilgi erişim sistemleri tarafından kullanılan bir değerlendirme metodolojisi geliştiren Cleverdon ve grubu bilgi erişim, bilgi erişim süreci, bilgi erişim sistemleri konularında önemli gelişmelere imza atanlar arasındadır.

Cleverdon ve ekibi tarafından geliştirilen ilk Cranfield deneyleri, dört elci (manuel) indeksleme yöntemini test etmek üzere tasarlanmıştır (Harman, 2011, 2. s.).

Cranfield deneylerinde amaç, daha iyi indeksleme yöntemleri ve dilleri geliştirerek, bilgi erişim sistemlerinin etkinliğini artırmaktır (Cleverdon, 1970; White, 2016, 349. s.). Cranfield deneyleri, küçük bir derme, bir sorgu kümesi ve her bir sorgu ile ilgili olduğuna karar verilen belge kümesinden meydana gelen bileşenlerden oluşmaktadır. Bu durum sistem tarafından getirilen belgelerin ilgililik aşamasında niceliksel olarak ölçümünü zorunlu kılmıştır. Bu amaçla Cranfield II deneylerinde kullanılan ölçümler kesin isabet ve erişim isabeti³ ölçümlerinin türevleri olmuştur (Hildreth, 2001, 2. s.).

3 “Kesin isabet, taramanın eriştiği künyelerden ne kadarının istek yapılan konu açısından anlamlı olduğunu, erişim isabeti ise veri tabanındaki tüm anlamlı künyelerden ne kadarına erişildiğini ifade eden oranlardır.” (Alkan, 1995, 92. s.).

33 MEDLARS, NLM (National Library of Medicine) tarafından yürütülen ve Lancaster tarafından yönetilen (Saracevic, 2008, 771. s.), öncelikle Index Medicus olmak üzere diğer yinelenen bibliyografyaların üretilmesini amaçlayan çok amaçlı (Lancester, 1968, 5. s.) bilgisayara dayalı bilgi erişim sistemidir. STAIRS (Storage and Retrieval Systems), 1985 yılında IBM (International Business Machines) tarafından geliştirilen ve Blair ve Maron tarafından yürütülen, belgelerin tam metinlerini otomatik olarak indeksleyen ve erişimine olanak tanıyan sistemdir (Saracevic, 2008, 772. s.).

Bilgi erişim çalışmalarında yaşanan bir diğer önemli gelişme de TREC (Text Retrieval Conference) değerlendirmeleridir. TREC, NIST (The National Institute of Standards and Technology) ve DARPA (Defense Advanced Research Projects Agency) tarafından desteklenen, büyük hacimli elektronik belgelerden ilgili bilgilere erişim için gerekli altyapıyı oluşturmayı amaçlayan ilk olarak 1992 yılında gerçekleştirilen yıllık çalıştaydır (Voorhees ve Harman, 2000, 3. s.). TREC değerlendirmeleri, Cranfield deneylerinin gücünü artırması bakımından Cranfield deneylerinin modern halidir denebilir. Web tarama motorları da dâhil olmak üzere birçok ticari bilgi erişim sisteminin etkililiğinin değerlendirilmesinde kullanılan TREC değerlendirmelerine yönelik çalıştaylara katılım, başladığından bu yana iki katına çıkmıştır (Voorhees, 2007, 1. s.).

1996 yılında Larry Page ve Sergey Prin tarafından Page Rank algoritmasının geliştirilmesi de bilgi erişim alanının önemli çalışmaları arasında gösterilmektedir. Page Rank algoritması, web sayfasının göreceli olarak önemini ölçebilmek için web grafiğine bakarak her web sayfası için bir sıralama yöntemidir (Page ve diğerleri, 1999, 2. s.). Bilgi erişim alanına yönelik gerçekleşen önemli gelişmeler istikrarlı bir yapı göstermekle birlikte bilgi erişim alanı da tıpkı ilk günlerde olduğu gibi gelişen teknoloji ve imkânlara bağlı olarak hızlı gelişim göstermektedir. 6. Tablo’da bilgi erişim kavramına ve sürecine yönelik yaşanan önemli gelişmeler kronolojik olarak sunulmuştur.

6. Tablo Bilgi erişim tarihinde yaşanan önemli gelişmeler Bilgi erişim tarihinde önemli gelişmeler

1945-1970

Vannevar Bush’un otomatik erişim fikri (Memex)

Calvin N. Mooers’ın bilgi erişim kavramını ilk kez kullanımı Mortimer Taube- Co-ordinate and Uniterm Indexing

Luhn’un otomatik dizinleme çalışması

Cleverdon’un Cranfield değerlendirme metodolojisi ve indeks deneyleri Vektör uzayı modeli

34 Salton’un SMART (System for the Mechanical Analysis and Retrieval of Text) sistemi ve deneyleri üzerine çalışmaları

Mantıksal model

MEDLARS (Medical Literature Analysis and Information System)

1970-1990

Olasılık modeli

İstatistiksel ağırlıklandırma

STAIRS (Storage and Retrieval Systems) OKAPI Projesi

ACM SIGIR Konferansı World Wide Web (www)

1990’lar

Dil modelleri

TREC (Text Retrieval Conference) değerlendirmesi Web tarama

Sıralama Google

2000-Günümüz

Ölçeklenebilirlik Gerçek zamanlı tarama

1950’lerden bu yana bilgi erişim çalışmalarının odak noktasını, bilimsel makaleler, kitaplar vb. gibi metin ve metin belgeleri oluşturmaktadır. Belgeler içerik açısından başlık, yazar adı, özet bilgiler, tarih vb. gibi bilgileri içeren bir yapıya sahiptir (Croft, Metzler ve Strohman, 2010, 2. s.). Burada genel amaç, kullanıcıların bilgi gereksinimini karşılayacak doküman sağlamaktır. Günümüzde terim olarak doküman (document), multimedya nesneleri gibi metin dışı belgeleri de içerebilecek genel bir terim olarak kullanılmaktadır.

Kullanıcıların gereksinim duydukları bilgiye erişebilmeleri için geliştirilen çeşitli bilgi erişim modelleri bulunmaktadır. Bir bilgi erişim modeli, kullanıcıların sorgusuna göre ilgili belgeleri seçmekte ve sıralamaktadır (Amati, 2009, 29. s.). Bilgi erişim modelleri, herhangi bir araştırmaya rehberlik etmesinin ve akademik tartışmaya olanak tanımalarının yanında, bir bilgi erişim sistemi için de bilgi erişim planı olarak hizmet vermektedir (Hiemstra, 2009, 3.s.).

50 yılı aşkın bir süredir araştırmalarda kullanılan geleneksel bilgi erişim modeli aşağıda sunulduğu şekilde gösterilmektedir (Bates, 1989, 408.s.).

35 4. Şekil Klasik bilgi erişim modeli (Bates, 1989, 408. s.)

4. Şekil’de sunulduğu gibi geleneksel bir bilgi erişim modeli, kullanıcıların bilgi gereksinimlerine uygun olarak oluşturdukları sorgu cümleleri ile koleksiyonda bulunan ve kullanıcı sorgusunu temsil edilen konularla ilgili bilgi erişimine odaklanan bir süreci içermektedir. Bir başka ifadeyle geleneksel bilgi erişim modeli, kullanıcı gereksinimine uygun sorgu ile koleksiyonda bulunan belgelerin eşleşme mantığını temel almaktadır.

Belgede T. C. ANKARA ÜNİVERSİTESİ SOSYAL BİLİMLER ENSTİTÜSÜ BİLGİ VE BELGE YÖNETİMİ ANABİLİM DALI GÖZ İZLEME TEKNİĞİ ARACILIĞIYLA ETKİLEŞİMLİ BİLGİ ERİŞİM SÜRECİNİN DEĞERLENDİRİLMESİ: BİR DURUM ÇALIŞMASI Doktora Tezi Burcu AYDEMİR ŞENAY Ankara, 2021 (sayfa 49-55)