• Sonuç bulunamadı

Çevrim İçi Medyadaki Bilimsel İçeriklerin Çözümlenmesi

N/A
N/A
Protected

Academic year: 2021

Share "Çevrim İçi Medyadaki Bilimsel İçeriklerin Çözümlenmesi"

Copied!
5
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

Çevrim İçi Medyadaki Bilimsel İçeriklerin Çözümlenmesi

T. Berk Atmaca* 1 , Ceyhun Aytekin2, Melih Değiş1, Burak Tekin1

1 İstanbul Bilgi Üniversitesi, Bilgisayar Bilimleri Bölümü

2 İstanbul Bilgi Üniversitesi, Bilgisayar Mühendisliği Bölümü, Araştırma Görevlisi

* Haberleşmeden Sorumlu Yazar (Corresponding Author)

tbatmaca@cs.bilgi.edu.tr, caytekin@bilgi.edu.tr, mdegis@cs.bilgi.edu.tr, btekin@cs.bilgi.edu.tr

Özet: Çevrim İçi Medyadaki Bilimsel İçeriklerin Çözümlenmesi Projesi, çeşitli bilimsel kuruluşlar tarafından fonlanan geniş kapsamlı bir akademik çalışmadır. Projede amaçlanan, Türkçe içeriklerdeki bilim kültürünün gelişme eğilimlerinin boylamsal çözümlemelerinde kullanılabilecek açık bir sistem oluşturmaktır. Projeyi özgün kılan özelliği, metin madenciliği, makine öğrenmesi gibi teknolojileri, değişik sosyal bilimler metodolojileri ile bütünleştirerek bir medya çözümlemesi gerçekleştirme ve kamuoyunun bilime yönelik tutumunu ölçen yenilikçi bir sistem geliştirerek literatürdeki bu boşluğu doldurmayı hedefleme eğiliminde ve yetkinliğinde olmasıdır. Bu bağlamda, seçilen gazetelerin İnternet ortamında yer alan içeriklerini tarayarak bilim, teknoloji ve yenilik alanlarındaki metinleri derleyen, seçen, sınıflandıran ve uluslararası karşılaştırmalara uygun güncel ölçü, endeks ve göstergeler üretebilen şeffaf ve kamuya açık bir sistem tasarlanmıştır. Sistemin çıktılarının kamuoyunun bütün kesimleriyle, araştırma merkezleriyle, üniversitelerle, araştırma-geliştirme çalışmaları yapan kurum ve kuruluşlarla paylaşılması hedeflenmiştir.

Anahtar Sözcükler: Medya İzleme, İçerik Çözümlemesi, Metin Madenciliği, Makine Öğrenmesi.

Analysis of Scientific Contents in Online Media

Abstract: The project titled “Analysis of Scientific Contents in Online Media” is a comprehensive academical work which is funded by various scientific institutions. The objective of the project is to develop an open system for generating science culture indicators through media monitoring and to use these indicators for analysing the trends in the development of public sentiment in the Turkish content. For this purpose, content analysis categorisation dictionary is developed based on the dimensions of science culture indicators.

These categories will reflect the sentiments on different parameters reflecting public attitudes towards science. The feature that makes this project original is that its contribution to the science monitoring in the media studies by producing content analysis categorisation dictionary through bridging state-of-the-art text mining, machine learning technologies and social science methodologies. Within this context, the system, which is designed to be transparent and open to the general public, can retrieve, monitor and classify science-, technology- and innovation-related texts in the Turkish popular media from the Web environment for the purposes of producing up-to-date and internationally compatible science culture indicators. The output will be shared with every segment of public opinion, research centres, universities and relevant institutions.

Keywords: Media Monitoring, Content Analysis, Text Mining, Machine Learning.

(2)

0. Giriş

Bilim, teknoloji ve yenilik alanlarındaki gelişmelerin istatistikleri ve bu istatistiklere dayanarak üretilen göstergeler son elli seneden beri düzenli olarak yapılıyor olsa da, kamuoyunun bu alanlara yönelik tutumlarının ölçülmesi konusunda birtakım eksiklikler vardır. Ölçü, endeks ve göstergeler, genellikle görece yüksek maliyetli olan ve elde edilen bilgilerin hem nitelik hem de nicelik olarak kıt olduğu anket yöntemi kullanılarak üretilmektedir. Dolayısıyla, bu yetersizlikler, başka birtakım seçeneklerin önerilmesine yol açmıştır.

Bu proje, metin madenciliği ve makine öğrenmesi gibi en ileri bilişim teknolojilerini, değişik nitel ve nicel sosyal bilimler metodolojileri ile birleştiren ve medya çözümlemesi gerçekleştirerek kamuoyunun bilime yönelik tutumlarını ölçen yenilikçi bir sistem oluşturarak, literatürdeki bu boşluğu doldurmayı hedeflemektedir. Oluşturulacak sistem Türkiye kamuoyunda bilime yönelik duygu ve tutumların zaman içindeki değişim ve dönüşümünü çözümlemek için de kullanılacak bir bilişim ve yazılım sistemi kuracaktır.

Projenin ikili bir amacı vardır:

1) Medya çözümlemesi yolu ile bilime yönelik tutum ölçekleri üreten bir sistem oluşturmak ve

2) Bu sistemi Türkiye ortamında kamuoyunda bilime yönelik tutum ve duyguların ne yönde ve ne ölçüde dönüştüğünün araştırılması açısından değişik çözümlemelerde kullanmaktır.

Bu makalede, projenin ilk amacı olan “medya çözümlemesi yolu ile bilime yönelik tutum ölçekleri üreten bir sistem oluşturmak” kısmı için geliştirilen medya izleme ve bilimsel haberlerin sınıflandırılması üzerine geliştirilen yazılım altyapılarının ayrıntıları aktarılacaktır.

1. Yöntem

Çevrim içi medyada yer alan içerikler için tarama ve değerlendirme işlemlerinin kolaylaştırıldığı kamuya açık bir sistem oluşturulması, bu seçeneklerden biridir.

Özellikle yaygın gazetelerin İnternet ortamında yer alan haber ve makalelerinin izlenerek metinlerin bilim, teknoloji ve yenilik alanlarıyla olan ilgilerine göre otomatik olarak derlenmesi, seçilmesi ve sınıflandırılması işlevleri, bu yöntemde öne çıkmaktadır. Oluşturulan sistemde, metin madenciliği ve makine öğrenmesi yöntemlerinden yararlanılarak İnternet ortamında bulunan ilgili konulardaki içeriklerin çözümlenmesi ve uluslararası karşılaştırmalara uygun güncel ölçü, endeks ve göstergeler üretilmesi amaçlanmaktadır.

İlk olarak makine öğrenmesi yolu ile yazılı medyanın İnternet ortamında bulunan haberleri bilimle ilgisine göre sınıflayarak onları veri tabanlarında saklayacak bir süzgeç sistemi oluşturulacaktır. Veri tabanında saklanan haberler daha sonra metin madenciliği yolu ile çevre, sağlık, politika gibi değişik alt konulara göre sınıflandırılacaklardır.

2. Uygulama

Bu makalenin konusu olan çalışmalar için hazırlanan demo yazılımlar, Hürriyet Gazetesi'nin (http://www.hurriyet.com.tr/) ve İngiliz The Telegraph Gazetesi'nin (http://www.telegraph.co.uk/) Web siteleri kullanılarak uygulamaya geçirilmiştir.

Burada ana hatlarıyla üç temel işlem yapılıyor. İlk olarak bu iki medya kanalında, çevrim içi olarak çıkan tüm haber bağlantılarına ulaşılıyor, daha sonra haberlerin metinleri ve ilgili tüm verisi (kategori, tarih, yazar, kelime sayısı gibi) İnternet sayfasından ayıklanıyor ve son olarak, ilgili etiketler ile veri tabanına

(3)

kaydediliyor. İkinci temel işlemler serisinin amacı ise, elde edilen haber veri tabanından, metin madenciliği yöntemleri ile bilimsel haberlerin ayıklanmasını içeriyor. Bu amaçla daha önceki çalışmalar sonucu oluşturulmuş, medyada bilimsel kelimeler sözlüğü yardımıyla her haber otomatik olarak taranıyor ve aşağıda ayrıntıları anlatılan ölçütlere girenler bilimsel haber olarak ana veri tabanından başka bir veri tabanına aktarılıyor. Böylelikle seçili medya kanallarında yayımlanmış tüm haberler içinden, bilimsel içerikli olma olasılığı yüksek haberlerin bir veri tabanı oluşturulmuş oluyor. Son olarak yazılım, elde edilen verilerin görselleştirilmesi ve son kullanıcıya raporlanmasını içeren arayüzler ile tamamlanıyor.

Yukarıdaki amaçlar doğrultusunda oluşturulmuş sistemin yazılım kısmının teknik ayrıntılarına daha yakından bakmak gerekirse, yapılacak işe ilk olarak, gazetenin RSS (Rich Site Summary - Zengin Site Özeti) beslemeleri üzerinden, Python kitaplıkları aracılığıyla, haberlerin bağlantı adresleri (URL) çekilerek ve veri tabanına kaydedilerek başlanıyor. Böylelikle bir gün içinde çıkan tüm haberlerin İnternet adresleri veri tabanına kaydedilebiliyor. Daha sonra programlar aracılığıyla sırasıyla her haber kaynağına gidiliyor ve ilgili etiketler (metin, yazar, tarih, kategori gibi) içindeki veriler sayfadan çekiliyor ve veri tabanına giriliyor.

Bu kısma kadar yapılan işlemler tüm haberlerin veri tabanına kaydedilmesini kapsıyor. Bundan sonraki kısım ise projenin özgün değerini ortaya çıkaran bölümleri içeriyor. Daha önceden belirlenmiş bir bilimsel kelimeler sözlüğü yardımıyla ilgili kelimeler her haber metni içinde araştırılıyor.

Her bir haber veya makalede geçen bu belirlenmiş kelimeler haber içinde bulunuyor ve haberde kaç kere geçtikleri sayıldıktan sonra bulgular, ilgili haberle bağlantılı bir şekilde veri tabanına işleniyor. Bu aşamaya kadar arka plan işlemleri yürütülerek, daha önceden belirlenmiş medyada çıkan haberler içinden bilimsel haber içeriği bulundurma

olasılığı yüksek olanlar saptanmış ve veri tabanlarına kaydedilmiş oldu. Bundan sonra, bu verilerin son kullanıcıya sunulacağı arayüz katmanlarının olduğu ön plan işlemlerinden söz edilecektir.

Son aşama olarak, elde edilen bilgiler, kamuya açık olarak düzenlenmiş bir Web sitesinde kelime bulutu, grafik ve ilgili haberlerin bağlantıları birlikte gösterilerek bir kullanıcı arayüzü oluşturulmuştur.

Sisteme üye olan her kullanıcının kendi kelime bulutunu yaratabilmesi, belirlediği kelimelere göre veri tabanından eriştiği içerikleri inceleyebilmesi ve dolayısıyla, anket yöntemindekinin aksine, geriye dönük tarama yapabilmesi düşünülmüştür.

Böylelikle her kullanıcı, istediği tarih aralıklarında, ilgili haber kaynaklarından birini seçerek, o dönem içinde kaç tane bilimsel makale çıktığını, bunların içeriklerini ve içerdiği kelimelerin frekanslarını tek bir ekran yardımıyla inceleyebilme olanağına sahip olacaktır. Her kullanıcı, ayrıca, isterse kendi oluşturduğu kelime sözlüğü üzerinden benzer çözümlemeler yapabilecek ve sistemin ona sunduğu raporlar aracılığı ile

karşılaştırmalı incelemelerde

bulunabilecektir.

3. Sonuç

Sonuç olarak, bu projede en çok takip edilen medya organlarının İnternet ortamında yayımlanan içeriklerini otomatik olarak tarayarak bilim, teknoloji ve yenilik konuları ile ilgili temel haberleri derleyen, seçen, düzenleyen; aynı zamanda, Türkiye kamuoyunun bilime yönelik tutumunu ölçerek zaman içerisindeki değişimini anlık olarak izleyen şeffaf bir sistem oluşturulması amaçlanmaktadır. Bu amaç doğrultusunda bu kapsamlı proje içinde, ilk faz olarak belirlenen haberlerin takip edilmesi, sınıflandırılması ve kaydedilmesini sağlayan yazılımları ve raporlamanın son kullanıcıya sunulduğu arayüzleri içeren bilişim ve yazılım sistemlerini içeren demo Web

(4)

sunulmuştur. Bundan sonra mevcut demo üzerinde amaçlanan geliştirmeler, son kullanıcı için ilgili veritabanlarını kullanarak, kendi oluşturduğu sözlük üzerinden çözümlemeler yapabileceği arayüz araçları eklemek ve medya kaynaklarının sayısını artırmak yönünde olacaktır.

Kaynakça

BAUER, M., Science in the media as a cultural indicator: Contextualising surveys with media analysis, Between Understanding and Trust: The Public, Science and Technology, ed: Meinolf, D. ve Grote, C. V., Harwood Academic Publishers, Amsterdam, (2000). Pp: 157-178.

BOYATZIS, R. E., Transforming Qualitative Information: Thematic Analysis and Code Development, Sage Publications, Thousand Oaks, CA, (1998).

BOZKURT, O. ve KAYA, O. N., Teaching About Ozone Layer Depletion in Turkey:

Pedagogical Content Knowledge of Science Teachers, Public Understanding of Science, 17 (2), 261-276, (2008).

CAMPOS, L. M. ve ROMERO, E., Bayesian Network Models for Hierarchical Text Classification From A Thesaurus, International Journal of Approximate Reasoning, 50 (7), 932-944, (2009).

COLEMAN, R. Longitudinal Data Analysis, Basic Books, New York (1981).

CORTES, C. ve VAPNIK, V. N., Support- Vector Networks, Machine Learning, 20, (1995).

DASGUPTA, P. ve DAVID, P., Towards a New Economics of Science, Research Policy, 23, 487-521, (1994).

DURSUN, Ç., DURSUN, Y. ve diğer, Türkiye'de Bilim Haberlerinin Görünürlüğü ve Temsili: 1993-2008, TÜBİTAK, Ankara, (2010).

ERDOĞAN, İ., Türkiye'de Gazetecilik ve Bilim İletişimi, Gazi Üniversitesi İletişim Fakültesi, Ankara, (2007).

GODIN, B. ve GINGRAS, Y., What Is Scientific and Technological Culture and How to Measure It? A Multidimensional Model, Public Understanding of Science, 9, 43-58, (2000).

LANDAUER, T. K., FOLTZ, P. W. ve diğer., Introduction to Latent Semantic Analysis, Discourse Processes, 25, 259-284, (1998).

LATOUR, B., Science in Action: How to Follow Scientists and Engineers Through Society, Harvard University Press, USA, (1987).

MIHLADIZ, G. ve Duran, M., İlköğretim Öğrencilerinin Bilime Yönelik Tutumlarının Demografik Değişkenler Açısından İncelenmesi, Mehmet Akif Ersoy Üniversitesi Eğitim Fakültesi Dergisi, 20, 100-121, (2010).

NERESINI F. ve PELLEGRINI G., THE 2012 SCIENCE IN SOCIETY FACTS AND FIGURES, Il Mulino publishing house, (2012).

PANG, B. ve LEE, L., Foundations and Trends in Information Retrieval, 2008. E- kitap:http://www.cs.cornell.edu/home/llee/om sa/omsa.pdf

PATTON, M. Q., Qualitative Research and Evaluation Methods, Sage Publications, Thousand Oaks, CA, (2002).

(5)

SCHIELE, B., Science Culture-la Culture Scientifique Dans le Monde, UQAM, Montreal CIRST, (1994).

SHUKLA, R., India Science Report: Science Education, Human Resources and Public Attitudes, NCAER, Delhi, (2005).

SÜERDEM A., The end of an era? Potentials of text mining and online media monitoring for emulating opinion pools and attitude surveys “British Council UK-Turkey Knowledge partnership workshop”, Istanbul Bilgi University, Turkey, 7-9 January 2013, (2013).

SÜERDEM A., Text mining and network approaches to thesaurus building for science in the media monitoring, “Public Communication of Science and Technology (PCST) 2012”, Florence, Italy, 18-20 April, (2012-d).

ZEMIK, U., Shipping Departments vs.

Shipping Pacemakers: Using Thematic Analysis to Improve Tagging Accuracy.

AAAI, San Jose, CA, (1992).

Referanslar

Benzer Belgeler

Bu çalışmada, bazı Schiff bazı türevlerinin, hem susuz hem de sulu ortamdaki elektrokimyasal davranışları dönüşümlü voltametri (CV), doğrusal taramalı voltametri

Diğer yandan starter kültür içermeyen kontrol örneklerde S.aureus sayısı üretim boyunca diğer örneklerden önemli düzeyde yüksek (P<0.05) bulunmuştur.. Bunun

Bu çalışmada, lisans ve lisansüstü öğrencilerinin COVID-19 korku düzeylerinin depresyon, anksiyete, stres ve yaşam doyumu düzeyleri ile ilişkisi; ayrıca bu

Çalışmamızda patoloji sonuçlarından ve ölüm nedenlerinden habersiz olarak gerçekleştirilen analizler sonucu çalışma ve kontrol grubu vakalarında belirlenen

Bu çalışmada, Ankara, Denizli, İzmir ve Nevşehir ekolojilerinde yetiştirilen Kalecik Karası üzüm çeşidinin antosiyanin ve tanen esasına dayalı fenolik

Şekil 5.21 Jenerik model kontrol algoritması ile reaktör sıcaklığına -3 birimlik etki verildiğinde reaktör sıcaklığının deneysel olarak kontrolü.. Şekil 5.22

Tüm bu testler sonucu ve literatür takip edilerek proje amaçlarına uygun olarak seçilmiş olan HAT-P-36b ötegezegeninin 6 gecede yapılan geçiş gözlemlerinin analizi sonucu

Çirçir fabrikalarinda çalisma bölümlerinde olusan toz konsantrasyonu, hava nemi, hava sicakligi ve hava akimi degerleri Çizelge 6’te, günün çalisma saatlerine göre