• Sonuç bulunamadı

B. İçerik Tartışması

I. Kontrol Edilemez Parametreler

İlk olarak, belli bir anonimleştirilmiş veri kümesine bakarak art niyetle hareket edecek kullanıcıların sahip olduğu veya erişebildiği dış verinin kapsamı ve ölçeği hakkında öncül tedbirler alabilmek mümkün değildir. Dış veri, basit Internet aramaları, tanıdıkların kişisel cihazlarından bilgi kaçırılması, yakın ilişkilere istinaden edinilen gizli bilgiler, ortak yaşam ve iş ortamlarını paylaşma sonucunda edinilen bilgiler, bilgisayar korsanlığı yoluyla çalınan bilgiler gibi sayılabilecek pek çok ihtimalle sağlanabilir. Dış verinin hangi yollarla sağlandığı ve ne ölçüde bilginin ele geçebileceği gibi problemler, sınırlandırılamayacak kadar çok ihtimali içinde barındırır. Bu sebeple, anonimleştirilmiş veri kümelerindeki anonimliği ölçen araştırmalar veya riski minimize etmeyi hedefleyen istatistik metotları her zaman “en kötü senaryoyu237” dikkate almaya çalışmaktadır. Ancak art niyetli kişinin erişim yetkileri ve sahip olduğu bilgi çeşitliliği kontrol edilemez bir parametredir. Ayrıca kişisel verinin veya kimliğin tam olarak saptanmasına gerek kalmadan, edinilecek varsayımlarla bile ihlal gerçekleşeceğinden ötürü, anonimleştirme metotları her daim tam bir koruma sağlayamayacaktır. Bu yüzdendir ki art niyetli kullanıcılar yerine ifşa edilen veya paylaşılan veri kümelerinin içeriğine ve ölçeğine bağlı olarak önlemler almak veya metotlar geliştirmek daha etkilidir. Aksi takdirde dış verinin zenginliği gibi kontrol edilemez bir parametre açısından, her anonimleştirme metotu bir açık içerecektir. İkinci olarak, Yakowitz’in vurguladığı anonimliği bozmanın maliyeti, özellikle de belli tedbirler alınmış veri kümeleri için caydırıcılık unsuru yaratmaktadır. Özellikle de kişilerin kendileri hakkında pek çok kişisel veriyi kendi rızaları ile yayınladıkları sosyal medya ortamlarına erişim kolaylığı dururken, art niyetli kullanıcıların anonimleştirilmiş veri kümelerinde, özellikle de yukarıda incelediğimiz araştırmacıların ilgilendiği detayda, anonimliği bozacak çalışmalar yapması kesin olmamakla beraber olası gözükmemektedir. Ancak, bu parametre için de kesin yargılar üretmek mümkün değildir. Anonimliği bozmak her veri kümesi için aynı maliyeti gerektirmeyebilir. Koot’un çalışmasında dikkate aldığı 237 K-anonimlik sonrasında l-çeşitlilik ve t-yakınlık metotlarının geliştirilmesi bu en kötü senaryo

ihtimallerinin bir sonucudur. Aynı şekilde Koot’un yürüttüğü çalışmalar veya Netflix ifşası hakkında yapılan çalışmalarda da art niyetli kullanıcının, hedef kişiler hakkında dış veriye sahip olduğu ve hedef kişinin ifşa edilmiş veri kümesi içinde yer aldığının bilindiği varsayılır.

belediye kayıtlarında herhangi bir dış veri kullanılmadan basit kombinasyonlarla veri kümesindeki kayıtların %99’unu tespit edebilmek mümkün olabilmiştir. Ancak aynı durum Netflix çalışması için söylenemez. Burada belli bir dış verinin varlığı söz konusudur ve entropik hesaplamalar yapılmıştır. Özellikle iki veri kümesinin birleştirilmesiyle sağlanan bozulmalarda veri kümelerinin kayıt sayılarına bağlı olarak doğru eşleşmeler yaratacak bir veri kümesi oluşturabilmek, yatırım ve zaman gerektirir. Bu durumda art niyetli kullanıcının hangi veri kümelerini hedef alacağı, korsan yazılımlar kullanarak mı yoksa anonimliği bozacak algoritmalar geliştirerek mi saldırılar düzenleyeceği kontrol edilemez parametrelerden biri olarak kalmaktadır.

Üçünü olarak, Wu’nun kapsamlı şekilde incelediği içerik kavramı bir diğer kontrol edilemez parametre olarak karşımıza çıkar. Gizlilik ve faydanın içeriğinin yaratacağı farklı sonuçlar her durumda farklı bir anlayış geliştirmeyi gerektirir. Ayrıca hem gizliliğin hem de faydanın içeriği direk olarak verinin içeriğiyle ilişkilidir. Bu sebepledir ki yasal mevzuatlarda da kişisel veri yanı sıra “hassas veri238” kavramına da raslamaktayız. Wu’nun ifade ettiği üzere arkadaş ve akrabalarımızın hakkımızda yapacağı basit tahminler de tahmin edilen verinin içeriğine bağlı olarak kişinin güvenliğini veya haysiyetini zedeleyecek ciddi tehditler yaratabilir. İçinde yaşadığı kültürel yapıya bağlı olarak cinsel tercihlerini açıklamayan bir kişinin ailsinin veya yakınlarının bu durumu açığa çıkarak varsayımlar yapabiliyor olması, kişinin hayatında kayda değer zarar yaratacaktır. Diğer taraftan da ilişki içinde bulunduğumuz tüm çevremizin bildiklerinden sakınabileceğimiz gizlilik politikaları geliştirmek de bilginin serbest dolaşımını imkansız hale getirecektir. Olasılıklar, veri kümelerindeki çeşitliliğe ve kombinasyonlara bağlı olarak farklı içeriklerle karşımıza çıkacaktır. Örneğin, Yakowitz tezini yalnızca araştırma verisi üzerine geliştirmekte ve saptanan gizlilik risklerini araştırma verisini etkilemeyeceğini savunmaktadır. Ancak büyük veri yalnızca araştırma verisinden oluşmamaktadır veya yalnızca araştırma amacıyla kullanılmamaktadır. Pek çok ticari ve politik amaçla başlatılan çalışma da büyük

23895/46/AT sayılı Yönerge, m. 8

veriden faydalanmakta ve gerek bireyin gerek toplumun hareketlerini büyük veri sayesinde modellemeye çalışmaktadır. Daha da önemlisi, ticari ve politik amaçlar güden kurumlar da, yapılan araştırmaların sonuçlarında ifşa edilen veya paylaşılan veri kümelerinden faydalanabilmektedir. Bir veri kümesi, belli bir araştırmaya konu edildikten sonra sadece o araştırmayla ilişkilendirilecek amaçlar çevresinde kullanılacaktır gibi bir sınırlama getirilemez. Örneğin, hükümetlerin sırf kendi amaçlarına hizmet edecek araştırma enstitüleri kurması veya bu tip merkezleri desteklemesi araştırmacılara sağlanacak ek imkanlar, kişisel verilere ve özel alan gizliliğine tehdit oluşturabilecektir.

Son olarak, zamanla değişen veri kümeleri kontrol edilemez birer parametredir. Bu durumda da verinin içeriği beirleyicidir. Ek olarak, verinin hangi yöntemlerle, ne periyotta güncellendiği, tarihsel olarak ifşa edilip edilmediği gibi detaylar da pek çok farklı sonuçlar doğurabilir. Zaman verinin değerini kaybetmesine sebep olabildiği gibi daha anlamlı hale gelmesine de sebep olabilir. Adres bilgilerine istinaden tıbbi kayıtların yer aldığı bir veri kümesinde eğer kişi hala aynı adreste ikamet etmiyorsa olası bir anonimliğin bozulması durumunda tehdit altında olmayacaktır. Ama diğer taraftan, arama motorlarında yapılan sorgu cümlecikleri gibi bilgiler zaman içinde anlamlı bir özellik gösterir. Ya da lokasyon bazlı uygulamaların gelişmesi ile önemli bir hale gelen ve ticari bir algı kazanan lokasyon bilgisi de zaman içinde değeri artan veri türüdür. Veri türünün zaman içinde kazandığı veya kaybettiği değere benzer şekilde, anonimleştirilmiş veri kümesindeki anonimliğin derecesinin değişimi de zaman içinde farklı yönlere kayabilir. Belediyelerdeki kayıtlara ait veri kümelerinin ihlal riski yalnızca kayıtların toplandığı yıl için geçerli olabilir. Kişilerin hayatlarındaki doğum, ölüm, taşınma, boşanma gibi değişiklikler belediyedeki kayıtların sürekli güncellenmesine sebep olacağından zaman içinde anonimliğin bozulmasından doğacak riskin, kayıtlardaki kişilere etkisi azalacaktır. Ancak etnik köken ve din gibi zamanla ilişkilendirilemeyen değişkenlere dair yapılabilecek ihlaller zaman içinde bile değerini kaybetmez. Sonuç olarak, zaman, veri içeriğinde ve anonimlik derecesinde kontrol edilemez bir parametre durumundadır.