Anlamsal Bilgi Yönetiminde Üst Veri Sistemlerinin ve
Ontolojilerin Kullanımı
Yaşar Tonta
Hacettepe Üniversitesi
Bilgi ve Belge Yönetimi Bölümü
tonta@hacettepe.edu.tr
yunus.hacettepe.edu.tr/~tonta/
2
Plan
• Durum saptaması
• Bibliyografik denetim
• FRBR, RDA
• Anlamsal Web
• Bağlı Veriler
• Sorgu Sistemleri
• Sonuç
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
Durum saptaması
• Web
• Hızlı bilgi artışı
• Dijital yerliler
• Sosyal ağlar
• Kullanıcılar tarafından üretilen üst veriler
• Kişiselleştirme
4
Kütüphane kataloğu: “Fiyatı yüksek vasat ürün” (Lloyd Sokvitne)
• “Kullanıcılarımız basitlik ve anında ödül bekliyor ve bizi
kütüphaneleri Amazon, Google, ve iTunes standartlarına göre yargılıyorlar. Bizim mevcut sistemlerimiz bunların yanında
soluk kalıyor” (University of California, 2005, s. 7).
Beyond the OPAC: Future Directions for Web-Based Catalogues Canberra: AustralianCommitteeon Cataloging, 18 September 2006.(http://www.nla.gov.au/lis/stndrds/grps/acoc/papers2006.html)
Düzenin Üç Düzeni
1. Nesnelerin kendilerinin düzenlenmesi
2. Nesnelerin üst verilerinin düzenlenmesi
3. Bit’lerin düzenlenmesi
6
Üst Veri
• Yapay
• Yapıcı
• İşlem
yapılabilir
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
Kaynak: Coyle, K. (2010 January). Library Data in a Modern Context. Library Technology Reports, 46(1): 1-13. http://alatechsource.metapress.com/content/p3022442071g7655/fulltext.pdf
FRBR Kavramsal Modeli
• Varlık-İlişki Veri Modeline dayanır
Kullanıcı görevleri
• Bul
• Belirle
• Seç
• Sağla
• İlişkilendir
• Diğer olası görevler:
– Telif hakları
– Koruma
8
FRBR 1. Grup Varlıklar
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
Örnek – İnce Memed
10 BBY220
Kataloğun işlevleri (Cutter, Rules for a Dictionary Catalog, 1876)
• Bilinen bir kitabın yazarına, eseradına ve konusuna göre bulunmasını sağlamak
• Bir kütüphanenin, bir yazarın belirli bir konudaki, belirli bir yazın türünde sahip olduğu kitapları
göstermek
• Bir kitabın seçiminde yardımcı olmak
– Basımı açısından (bibliyografik olarak)
– Özelliği açısından (yazınsal/konusal)
FRBR 2. Grup Varlıklar
12
FRBR 3. Grup Varlıklar
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
MARC’ta FRBR Varlıkları ve İlişkileri
Kaynak: C. Oliver, Introducing RDA. Chicago: ALA, 2010. http://www.alastore.ala.org/pdf/9780838998908_excerpt.pdf
14
RDA: Resource Description and Access
• Kullanıcı gereksinimlerinin yanıtlanması
• Maliyet etkinliği
• Esneklik
• Süreklilik
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
Kaynak: C. Oliver, Introducing RDA. Chicago: ALA, 2010. http://www.alastore.ala.org/pdf/9780838998908_excerpt.pdf
AACR2 - RDA
Kaynak: http://www.loc.gov/catdir/cpso/RDAtest/rdaexamples.html
BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul 16
Anlamsal Web, 2001
“Anlamsal Web ayrı bir Web değil ama
şimdikinin bir
uzantısıdır. Anlamsal Web bilgiye iyi
tanımlanmış anlam verilerek
bilgisayarlarla insanların daha iyi
işbirliği yaparak çalışmasını sağlar.”
- Tim Berners-Lee, James Hendler and Ora Lassila; Scientific
American, May 2001
Anlamsal Web Mimarisi–Tim Berners-Lee
Kaynak: http://www.w3c.org/2000/Talks/1206-xml2k-tbl/
18
DBpedia
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
Dbpedia İstatistikleri
Kaynak: Christian Bizer, Jens Lehmann, Georgi Kobilarov, Sören Auer, Christian Becker, Richard Cyganiak, Sebastian Hellmann:
DBpedia – A Crystallization Point for the Web of Data. Journal of Web Semantics: Science, Services and Agents on the World Wide Web, Issue 7, Pages 154–165, 2009.
20
Türkçe DBpedia Henüz Yok
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
Wikipedia: Akasya Durağı
22
DBPedia: Akasya Durağı
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
Kongre Kütüphanesi Bağlı Veri Hizmeti
24
VIAF
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
Anlamsal Bilgi Yönetimi
• Mevcut bilgilerin
%20’si yapısal,
%80’i yapısal olmayan metin halinde
• Mevcut bilgilerin tanımları sınırlı
• Makinece işlenebilir
tanımlar gerekli
(ör., RDF, OWL,
XML)
BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul 26
Ontoloji Aracılığıyla Bilgi Bütünleştirmesi
Kaynak: Warren ve Davies, 2007, s. 182
Metindeki Varlıkların Bilgi Tabanındakilerle Karşılaştırılması
Kaynak: Warren ve Davis, 2007
28
Shirky: Abartılı Ontoloji
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
Kaynak: www.shirky.com/writings/ontology_overrated.html
Sadece Bağlantılar
Kaynak: www.shirky.com/writings/ontology_overrated.html
BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul 30
Kaynak: Madnick ve Zhu, 2006, s. 462, 466
Veri kalitesi ve yorum sorunları
• Veri
kalitesiyle
ilgili semantik farklılıklar
• Yorum sorunları (metrik
sistem, “yıl” -
son 12 ay,
takvim yılı,
mali yıl…)
Bağlı Veri
32
Bağlı Veri Kütüphaneler İçin Niçin Önemli?
• Kütüphane kaynakları Web’de daha kolay
bulunur
• Kütüphane üst
verilerine dayanan daha yaratıcı uygulamalar
geliştirilebilir
• Etkin kataloglama ve yenilik fırsatları sunar
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
Kaynak: http://lodlam.net/2012/08/09/linked-data-for-libraries-video-from-oclc/
Sözcüklerin kullanımı
• “ACCIDENT”
• “event”
• “incident”
• “situation”
• “problem”
• “difficulty”
• “unfortunate situation”
• “the subject of your last letter”
• “what happened last week was…”
• “Mr. A: We all know
why we are here.”
34
Zadeh’ye Göre Arama Motorları
• Yetersiz
• İki değerli mantıkla işliyor,
• Çıkarsama yapamıyorlar
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
Kaynak: Zadeh, 2005, 2006)
Soru Yanıt Sistemlerine Dönüşüm
• Dünya bilgisi
• İlgililik (istatistiksel/anlamsal)
– q: Vera’nın yaşı kaçtır?
– p: Vera, Irene ile yaşıttır – r: Irene 65 yaşındadır
• Algılama temelli bilgiden çıkarsama yapma
– İki değerli mantık ve olasılık geçerli değil
• Esas sorun doğal dil anlama sorunu
Kaynak: Zadeh, 2005, 2006)
BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul 36
Sorunlar
• Sorgu oluşturma
– Eş anlamlı sözcükler (“çöp teorisi”)
• Anlam yokluğu
– “Telekom şirketi Türkiye Nebi Fışkın Müdür”
– “10 Mayıstaki toplantısında İstanbul’da yerleşik Mobilfon yönetim kurulu Nebi Fışkın’ı CEO olarak atadı”
• Bağlam yokluğu
– Kullanıcının hangi bağlamda bilgi aradığı – COntext INterchange (COIN)
• Sonuçların sunulması
– Kullanıcılar ilk ekrandan sonrasına bakmıyorlar
Kaynak: Warren ve Davies, 2007, s. 179-181
Swanson’ın Yetersizlik Ön Kabulleri
• Yanıt bulunmadıkça soru kesin olarak oluşturulamaz
• Makine arama isteklerini uygun arama terimlerine çevirecek şekilde
programlanamaz
• Makineler anlamı tanıyamaz
• Ya ustaca yapılmış ilgililik
değerlendirmelerine ya da çok etkili mekanik süreçlere sahip olabilirsiniz, ama ikisine
birden sahip olamazsınız Kaynak: Swanson, 1988
38
Sonuç
• FRBR ve RDA geliştirilmeli
• Kütüphane verileri web’in bir parçası olmalı
• Kütüphanelerde geliştirilen ontolojiler web’e aktarılmalı
• Kütüphaneler bağlı açık veri modeline geçmeye özendirilmeli
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir