• Sonuç bulunamadı

3. BAĞLANTI TAHMİNİ

3.2. Bağlantı Tahmini ile İlgili Yapılan Çalışmalar

3.2.4. Diğer Yaklaşımlar

Benzerlik tabanlı ve olasılıksal yöntemler hariç, literatürde farklı kuramsal temellerden pek çok değişik yaklaşım daha vardır. Bunlardan bazıları sık örüntü madenciliği, rasgele yürüyüş ve yayma yöntemleridir. Bu bölümde kısaca bu yöntemlere değinilecektir.

Lin ve diğ. [67] seyreklik analizine dayalı denetimsiz bir bağlantı keşfi yöntemi önermiştir. Çalışmalarında ikili ilişkilerin kümesiyle bağlantılı düğümlerin ve ilginç yolların keşfine odaklanmışlardır. Veri kümesindeki her bir nesne ayrı bir varlık olarak ele alınmış ve bu varlıkları bağlayan ikili ilişkilerin farklı tiplerde olabileceği sonucu çıkarılmıştır. Bu çeşit bir veri seviyelenmiş çizgelerle temsil edilebilir. Burada düğümler varlıkların, bağlantılarda ikili ilişkilerin yerini alır. Bu çalışmanın anahtar kabulü verinin zengin bir ilişki sözlüğü kullanmasıdır. Farklı veri bağlantı tipleri farklı semantik ilişkileri temsil eder. Yani, benzer yapılı farklı çizgeler bağlantı tiplerine bağımlı olarak farklı anlamlara sahip olabilir. Bu kabullere dayanarak bağlantı keşfi probleminin 3 farklı sınıfı tanımlanabilir. Bunlar, yeni yol keşfi, yeni döngü keşfi ve önemli düğüm keşfidir. Yeni yol keşfi, çizgede varlıkların bir çifti verildikten sonra onlar arasında en ilginç veya yeni yollar

29

keşfetmektir. Yeni döngü keşfi, çizgede rasgele bir varlık verildikten sonra onunla başlayıp yine onunla biten en ilginç ve yeni döngüleri bulmaktır. Önemli düğüm keşfi ise, çizgede rasgele bir varlık verildikten sonra ona bağlı en önemli diğer varlıkları belirlemektir.

Kashima ve diğ. [68] “bağlantı yayılma” olarak adlandırılan yarı denetimli bir algoritma sundular. Bu seviye yayılma prensibine benzerdir. Yani eğer iki düğüm birbirlerine benzer ise muhtemelen aynı seviyedirler. Burada, iki düğüm çifti birbirine benzer ise muhtemelen aynı bağlantı tipine sahiptir çıkar. Çalışmalarında seviye yayılma yöntemini çoklu bağlantı tipli düğüm çiftlerine uyguladılar ve düğümler arasındaki ilişkileri tahmin ettiler.

Sosyal ağlarda bilgi yayılması bağlantı gelişimi için temel bir faktördür. Özellikle Twitter gibi bilgi değişimi veya paylaşımı için adanmış sosyal ağların gelişimi önemlidir. Cha ve diğ. [69] Twitter sosyal ağında sosyal ağ gelişimi için bilgi yayılmasının önemini vurgulayan deneysel çalışmalar yürütmüşlerdir. Çalışmalarında Flickr sosyal ağındaki bilgi dağılımının geniş ölçekli izlerini toplayıp analiz ettiler. Analizleri 11 milyon fotoğraf üzerinde 2,5 milyon kullanıcının favori işaretlerinin izlenmesine dayalıdır.

Bağlantı tahmini için rasgele yürüyüş tabanlı yaklaşımlar son yıllarda çok popülerdir. En son araştırmalarda yaygın bir şekilde kullanılmıştır. Backstrom ve diğ. [70] bağlantı tahmini için topolojik ve düğüm/kenar özelliklerini birleştiren denetimli rasgele yürüyüş tabanlı bir yöntem önermiştir. Bu yöntem birleştirilmiş bağlantı tahmini algoritması içinde ağın düğüm ve kenarlarının karakteristikleriyle (nitelikler, özellikler) ağın yapısını birleştirir. Yöntemde rasgele yürüyücü, diğerlerinden ziyade verilen düğümleri (pozitif eğitme örnekleri) ziyaret edecek şekilde bir PageRank benzeri rasgele yürüyüşü nasıl etkileyeceğini öğrenir. Bunu düğüm ve kenarın özelliklerini kullanarak başarır. Ağırlıklı ağlar üzerinde rasgele yürüyüş negatiflerden daha çok pozitif düğümleri ziyaret etme eğilimi gösterir. Bağlantı tahmini kapsamında pozitif düğümler gelecekte yeni kenarların oluşturulacağı düğümlerdir, negatifler ise bütün diğer düğümlerdir. Denetimli öğrenme o zaman: “eğer bir s kaynak düğümü ve düğümler hakkında eğitme örnekleri verilirse, s’nin gelecekte linkleri oluşturma” işi olarak biçimlendirilir.

Lichtenwalter ve diğ. [67] ağlar üzerinde PropFlow olarak adlandırılan yeni bir denetimsiz bağlantı tahmini algoritması önerir. Buna göre 𝑣𝑖 düğümünden başlayan sınırlı bir rasgele yürüyüş geçiş olasılıkları olarak bağlantı ağırlıklarını kullanarak l veya daha az adımda 𝑣𝑗 ye ulaşır. Sınırlamalar, yürüyüşün hedef düğüm olan 𝑣𝑗’ye eriştiğinde veya başlangıç düğüm olan 𝑣𝑖’de içeren herhangi bir düğüm yeniden ziyaret edildiğinde

30

sonlanmasıdır. Yürüyüş bağlantıları ağırlıklarına göre seçer. Yeni bağlantıların olasılık tahmini olarak hizmet edecek bir 𝑠𝑖𝑗 skoru üretir. PropFlow, Köklü PageRank’e benzerdir. Fakat yayılmanın daha yerel bir ölçüsüne sahiptir ve kaynak düğümden uzaktaki gürültülerden etkilenmez. Köklü PageRank’den farklı olarak PropFlow’un hesaplanması yürüyüşlerin yeniden başlamasına veya yakınsamaya gerek duymaz. Bunun yerine l yüksekliğiyle sınırlı değiştirilmiş bir ilk önce enine aramayı kullanır. Böylece hesaplanması çok daha hızlıdır. Ağırlıklı, ağırlıksız, yönlü veya yönsüz ağlarda kullanılabilir.

Bağlantı tahmini araştırmasında üzerinde tartışılan en önemli problemlerden biri de bir ağda gözlenen bağlantıları kurmak için hangi nitelik alt kümelerinin önemli olduğunu belirlemektir. Bu durum doğru bağlantı tahmini için çok önemlidir. Bu maksatla Scripps ve diğ. [71] bağlantı tahminiyle en iyi şekilde hizalanmış ilgili nitelikleri veya topolojik özellikleri tanımlamaya izin veren esnek bir çerçeve tanımlamıştır. Bu çalışma matris hizalama yaklaşımına dayalı bağlantı tahmini için yeni bir ayrık öğrenme tekniğini ifade eder. Algoritma otomatik olarak düğüm nitelikleri ve komşuluk topolojik özelliklerinden hesaplanan ağırlıklı benzerlik matrisleriyle bir ağın komşuluk matrisini hizalayarak bağlantı yapısının en ayırt edici özelliklerini belirler.

Arkadaşlık fikrinin sosyolojik çalışmalarda göz önüne alınandan daha geniş olan online sosyal ağlarda arkadaşlık bağlantıları daha yoğundur fakat bağlantılar daha gürültülü bilgi içerir (Yani daha zayıf ilişkiler). Buna karşın ağlar gerçek sosyal ağı oluşturan varlıklar arasında ek hareketsel olaylar içerir (Yorumlama, sohbet etme, etiketleme, bağlantı kurma vb.). Bu nedenle Kahanda ve diğ. [72] hareketsel bilgiden bağlantı gücünü tahmin etmek için denetimli bir öğrenme yaklaşımı önermiştir. Bu yaklaşımın yeniliği hareketsel özelliği kullanmaktır. Bu özelliğin önemi büyüktür çünkü oluşan online sosyal ağlar çoklu ilişkilerdir. Bundan dolayı ilişkinin her bir tipi ile oluşan hareketlerin etkililiğini çalışmak değerlidir. Hareketsel özellikler kullanıcılar arasında hareketsel bilgiyi göz önüne alır. Bu yaklaşım Purdue üniversitesinin Facebook ağından kullanıcıya açık verisi üzerinden değerlendirilmiş, güçlü ilişkileri doğru bir şekilde tahmin edebildiği gösterilmiştir.

En yaygın kullanılan ve en başarılı tavsiye etme algoritmalarından biri de işbirliğiyle filtrelemedir. Bu yöntem kullanıcının ilgi ve tercihlerini çıkarmak için kullanıcı-nesne etkileşimi içindeki korelasyonları keşfeder. İşbirliğiyle filtreleme yaklaşımlarının tavsiye etme kalitesi çoğunlukla veri seyreklik problemiyle sınırlıdır. Bu problemin üstesinden gelmek için Huang ve diğ. [73] işbirliğiyle filtreleme tavsiyelerini yapmak için ağ

31

modelleme literatüründe en son önerilen bağlantı tahmini yaklaşımları kullanarak ve çizgeler olarak kullanıcı-nesne etkileşimlerini temsil ederek çizge tabanlı bir algoritma önermiştir. Bu çalışmada tavsiyeler yapmak için bağlantı ölçülerinin geniş bir aralığını önermişlerdir. Kitap tavsiye veri tabanı üzerinde yapılan ilk deneysel sonuçlar bu ölçülerin bazılarının standart işbirliğiyle filtreleme algoritmalarından önemli bir şekilde daha iyi performans sergilediğini göstermiştir.

Benzer Belgeler