• Sonuç bulunamadı

2. PARALEL M˙IMAR˙ILER VE PROGRAMLAMA MODELLER˙I

3.1. Büyük Veri, Karakteristi˘gi ve Uygulama Alanları

Büyük veri kavramı ilk olarak astronomi ve genetik alanında ortaya çıkmı¸s bir kavramdır [37]. Bu kavram zaman içinde internet için kullanılmaya ba¸slanmı¸s böylelikle farkında olmadan günlük hayatımızın dahil olan ve devamlı olarak kendisine katkı yaptı˘gımız ve bir parçası haline geldi˘gimiz bir kavramdır. Büyük veri; “insanların her gün kullandı˘gı sosyal medya payla¸sımları, nesnelerin interneti sayesinde olu¸san sensör verileri, arama motorları, internet gezintileri sırasında arkalarında bıraktıkları ayak izleri ve tekil kullanıcıların internet ile olan tüm etkile¸simlerinin bir araya getirildi˘gi devasa veri yı˘gınıdır. Bu tür bilimsel ve bilimsel olmayan birçok veri bir araya geldi. Bu durum, arkasından hayal bile edilemeyen bir ekosistemi ortaya çıkardı. Aslında büyük veri sadece büyüklük kavramını zihinlerde ça˘grı¸stırsa da verinin toplanması, analiz edilmesi, saklanması yani veriden bir de˘ger kazanılması süreçlerinin tamamını kapsar [38, 39].

Büyük veri çe¸sitli karakteristik özelliklere sahiptir: hacim (volume), hız (velocity), çe¸sitlilik (variety), do˘gruluk/kalite (veracity), geçerlilik (validity), de˘ger (value). Verinin hacmi, verinin büyüklü˘gü ve boyutunu ifade etmektedir. Teknoloji ilerledikçe verinin miktarı artmaktadır. Terabayttan petabayt seviyelerine kadar verinin verinin hacmi de˘gi¸smektedir. Gerçek zamanlı sensör gözlemleri ve konum tabanlı sosyal medya verileri, büyük miktardaki VGI verilerinin artı¸sıyla, uzaktan algılama görüntü verileri için petabyte ar¸sivleri, sadece depolama sorunu de˘gil onların analiz edilmesi sorunlarını da beraberinde getirmi¸stir.

Büyük veriyi olu¸sum formu/çe¸sitlilik (variety) itibariyle üç kategoride incelemek mümkündür: (i) yapılandırılmı¸s (structured), (ii) yarı-yapılandırılmı¸s (semi-structured) ve (iii) yapılandırılmamı¸s (unstructured). Yapılandırılmı¸s veri tipi, belirli kurallar ve sistemler do˘grultusunda depolandıkları için kolay eri¸silebilir, düzenlenebilir, kategorize edilebilir vb. yapıdadır. Bu veri tipi, tablolar üzerinde satır ve sütunlar halinde düzenlenmi¸s verilerdir. Veri tabanı yönetim sistemlerinde yapısı gere˘gi belirli bir düzen dâhilinde depolanan veriler, yapılandırılmı¸s verilerdir. Yaygın olarak yapılandırılmı¸s verilerden bahsedilirken, veri tabanı yönetim sistemlerinde depolanan veriler anla¸sılmaktadır.

Yapılandırılmamı¸s veriler ise özel metin verileri, kitap gibi ka˘gıt üzerinde bulunan veya e-mail, web sayfaları gibi elektronik ortam metinlerinden; uydu görüntüleri gibi dura˘gan ya da video gibi hareketli görüntülerden ve/veya seslerden olu¸sur. Yukarıdaki açıklamalara göre yapılandırılmı¸s veri ile yapılandırılmamı¸s veri arasındaki temel farkın, yapılandırılmı¸s verinin üzerinde her türlü i¸slem ve sorgulamanın yapılabilece˘gi, ili¸skilerinin kolaylıkla kurulabilece˘gi bir veri tabanı yönetim sistemi üzerinde bulundurulması oldu˘gu görülebilir.

Yarı-yapılandırılmı¸s veri, yapılandırılmı¸s ve yapılandırılmamı¸s veri türlerinin aynı kayıt içerisinde birlikte kullanılmasıyla ortaya çıkan bir veri türüdür. Yarı-yapısal veride, belli parametreler yapısal veri özelli˘ginde, belli parametreler ise yapısal olmayan veri özelli˘gindedir [40]. Harita verileri, uydu görüntü verileri, co˘grafi etiketli metin verileri, raster ve vektör verileri gibi yapılandırılmı¸s veya yapılandırılmamı¸s bu çe¸sitlilik; farklı verimli modeller, yapılar, indekslemeler ve veri yönetim stratejileri ve teknolojini gerektirmektedir [41].

Büyük veri üretimi her geçen gün hızlanmakta ve bu veriler saniyede devasa boyutlara ula¸smaktadır. Hızlı büyüyen veri, çe¸sitlili˘ginin de aynı hızda artması sonucunu ortaya çıkartmaktadır ve hem yazılımsal hem de donanımsal olarak bu yo˘gunlukla ilgilenilmelidir. Yüksek çözünürlüklerde çok sık aralıklarda elde edilen uydu görüntüleri, sürekli akı¸skan sensör gözlemleri gerçek zamanlı GNSS yürünge ve sosyal medya verileri gibi yüksek hızda üretilen veriler için; son kullanıcı veya otorite taleplerini kar¸sılamak yönelik veri üretim hızı ile i¸sleme hızını birbirine yakın tutan, gerçek zamanlı sistemlere ihtiyaç vardır. Analiz do˘grulu˘gunu etkileyen veri kalitesi, elde edilen büyük verilerde büyük ölçüde de˘gi¸sim gösterebilmektedir. Co˘grafi büyük verilerin ço˘gu do˘grulanmamı¸s veya az do˘grulanmı¸s kaynaklardan temin edilmektedir. Bu da kayna˘gın kalite de˘gerlendirmesi ve analiz sonuçlarının kalitesini geli¸stirme gibi konuları beraberinde getirir [42, 43]. En önemli unsurlardan bir tanesi de de˘ger özelli˘gidir. Veriler filtrelendikten sonra büyük verinin üretimi ve i¸slenmesi katmanlarında elde edilen verilerin fayda sa˘glıyor olması gerekmektedir.

Büyük veri birçok alanda popülerlik kazanmaktadır. Chen ve Zhang [44] veri yo˘gun hesaplama gerektiren farklı alanlarda büyük veri kullanımının avantaj ve dezavantajları üzerine bir inceleme yapmı¸stır. Büyük veri, çe¸sitli sorunların ele alınması için hem i¸s dünyası hem de bilimsel/akademik topluluklarda önemli bir yere sahiptir. ˙I¸s alanları büyürken tüketiciler, üreticiler, da˘gıtıcılar ve hizmetler arasındaki ili¸skileri yeniden tanımlayan yeni bir ekonomik sisteme gitme ihtiyacı vardır. Akademik dünyaya gelince

daha iyi karar vermek için hem sensör a˘gları hem de açık kaynak bilgiden de˘gerin elde edilmesi gerekmektedir. Büyük veri; bilim ve mühendislik, i¸s zekası, hükümetler, sanayi, bilimsel ara¸stırmalar gibi çe¸sitli alanlar için gereklidir. Spesifik örnek uygulama alanlarına takip eden paragrafta de˘ginilmi¸stir.

Büyük verilerin e˘gitim dünyasında büyük etkisi vardır. E˘gitim sistemindeki e-ö˘grenme çözümlerine katkıda bulunarak tek boyutlu her akademik modaya uygun bir çözüm sunabilmi¸stir. Örne˘gin herhangi bir blogdan derslerle ilgili bir takım metinlere, video veya görsellere ula¸sılabilmesinde büyük verinin katkısı vardır [45]. Ayrıca ki¸siselle¸stirilmi¸s e˘gitim uygulamaları bu sayede gerçekle¸smi¸stir [46]. Büyük verinin sa˘glık hizmetlerine farklı katkılar sa˘glamı¸stır. Salgın hastalık salgınlarını tahmin etmede yardımcı olur ve aynı zamanda etkilerini en aza indirmek için hangi önleyici tedbirlerin alınabilece˘gine karar verir. Önlenebilir hastalıkların, erken evrelerde hastalık tespit ederek önlenmesini sa˘glar, bu da daha kötüye gitmesini önlemeye yardımcı olur ve aynı zamanda tedavinin kolay ve etkili olmasını sa˘glar. Hastalara, geçmi¸s tıbbi sonuçlar ara¸stırması yapıldıktan sonra saptanan ve reçete edilen kanıta dayalı ilaç verilebilir [47].

Büyük verinin özel sektörlerde önemli bir rol oynadı˘gı gibi devlet sektörlerinde de geni¸s bir kullanım yelpazesine sahiptir [48]. Ayrıca büyük verinin haberle¸sme, medya ve reklam sektöründe uygulamaları da mevcuttur. ˙Iste˘ge ba˘glı bir müzik sa˘glama platformu olan Spotify, büyük veri analiti˘gi kullanır [49], dünyanın dört bir yanındaki tüm kullanıcılardan veri toplar ve daha sonra analiz edilen verileri kullanarak her bir kullanıcıya müzik önerileri sunar. Benzer ¸sekilde büyük veriden yararlanarak Amazon Prime video, müzik [50]; Kindle kitap önerisinde bulunur. Trafik kontrolü, rota planlama, akıllı ula¸sım sistemleri, tafik durumu gözetilerek sıkı¸sıklık tahmini gibi çe¸sitli konularda büyük veri ula¸sım sektöründe de çözüm sunar [51]. Daha birçok alanda büyük veri uygulaması görebilmek mümkündür. Takip eden alt bölümlerde yapılandırılmamı¸s veri kategorisine giren görüntülerin da˘gıtık mimaride i¸slenmesi ve daha özelde uydu görüntülerinin birle¸stirilmesi üzerine literatürde var olan çalı¸smalara de˘ginilecektir.