Kaynak Araştırması - Karmaşık ağlardaki modül yapılarının ve anlamlı alt-ağların tespiti

Bu bölümde, tez çalışmasında ele alınan konularla ilgili literatür araştırması yapılmıştır. Gerçek dünya sistemlerinin modellendiği karmaşık ağ yapıları, içerisinde ortaya çıkarılabilecek önemli bilgiler barındırmaktadırlar. Bu bilgilerin farklı ağ analiz teknikleriyle keşfedilebilmesi için son zamanlarda çeşitli çalışmalar yapılmakta ve birçok yöntem önerilmektedir. Bu çalışmanın temelini oluşturan konulardan ilki olan ağ modüllerinin veya topluluklarının ortaya çıkarılması problemi özellikle son yıllarda oldukça dikkat çeken bir konu haline gelmiştir. Bu konuda son zamanlarda birçok çalışma yapılmış olup halen de yeni araştırmalar ve çalışmalar yapılmaktadır. Bunlardan dikkate değer olan çalışmaların özet bilgileri literatüre sunulma tarihlerine göre bu bölümde verilmektedir.

Ağlardaki modüllerle veya topluluk yapılarıyla ilgili çalışmaların geçmişi çizge teorisinin çeşitli bilim dallarında fark edilir bir şekilde kullanıldığı tarihlere dayanmaktadır. Bu konudaki çalışmaların hızla yaygınlaşması ise 2002 yılında Girvan

ve Newman tarafından sunulan "Community structure in social and biological

networks" isimli makale ile başlamıştır (Girvan ve Newman 2002). Bu makalede,

topluluk yapısının çeşitli tanımlamaları ve bu yapıların tespitinde önerilen klasik yaklaşımlar özetlenmiştir. Aynı zamanda, toplulukların tespiti için çizge teorisinde merkezilik (centrality) özelliğini referans alan yeni bir yöntem sunulmuştur. Bu yöntem

GN (Girvan ve Newman) olarak isimlendirilmiştir (Newman 2004 (a)). GN algoritması,

test verisi olarak alınan giriş ağından bağlı bileşenlerin elde edilmesine kadar düğümler arasındaki bağlantıları adım adım kaldırarak nihai toplulukları tespit eden ayırıcı (divisive) bir kümeleme algoritmasıdır. Algoritmanın dört temel adımı bulunmaktadır. Bunlar: (a) Ağdaki tüm bağlantılar için arasındalık (betweenness) değeri hesaplanır, (b) En yüksek arasındalık değerine sahip bağlantı veya bağlantılar ağdan silinir, (c) Seçilen bağlantıların ağdan silinmesinden sonra mevcut tüm bağlantılar için arasındalık değerleri yeniden hesaplanır, (d) Bağlı bileşenlerin elde edilmesine kadarki süreçte ağda hiçbir bağlantı kalmayana dek b ve c adımları tekrar edilir. Yazarlar önerdikleri algoritmayı rastsal olarak üretilmiş ağlarda, futbol ağında (American College Football) (Girvan ve Newman 2002), bilinen sosyal bir ağda (Zachary's Karate Club) (Zachary 1977) ve diğer çeşitli ağlarda test etmiş ve elde edilen sonuçları ilgili makalede ayrıntılarıyla sunmuşlardır (Girvan ve Newman 2002).

Newman ve Girvan tarafından önerilen modülerlik―modularity (Newman ve

Girvan 2004 (b)) fonksiyonu ağdaki toplulukların/modüllerin tespitinde en fazla bilinen ve diğer çalışmalara kaynak teşkil eden bir amaç fonksiyonudur. Bu fonksiyon orijinal

GN algoritmasında bir sonlandırma kriteri olarak sunulmuştur (Newman ve Girvan

2004 (b)). Çeşitli kümeleme yöntemleri, aç gözlü yaklaşımlar ve optimizasyon teknikleri gibi birçok yöntem bu fonksiyonun en iyilenmesi üzerine modellenmiştir. Bu şekilde maksimum modülerlik skoru ağdaki en uygun modülerliğin sağlanması için gerekli şart haline gelmiştir. İlgili çalışmada modülerlik fonksiyonu en temel hali ile sunulmuştur. Ayrıca bu çalışmada yazarlar, önerdikleri çeşitli yöntemlerin başarılarını, yapay ve gerçek dünya ağları üzerinde test ederek göstermişlerdir.

Literatürdeki klasik birçok algoritma büyük ve karmaşık ağlarda, küçük ağlarda elde edilen başarılı kümelemeleri sağlayamamışlardır (Newman 2004 (a)). Örneğin, GN algoritması küçük ağlar için uygun alt grupları doğru bir şekilde sağlasa da büyük ağlarda benzer başarıyı gösterememiştir. Newman tarafından önerilen diğer bir yeni algoritma (Fast Newman―FN) ise yukarıda bahsedilen probleme çözüm önermektedir. Buna ek olarak, FN algoritmasının ağdaki modüllerin tespitinde önceki yöntemlerden

neredeyse binlerce kez daha hızlı olduğu ilgili çalışmada (Newman 2004 (a)) vurgulanmıştır. Önerilen algoritmanın test çalışmaları klasik gerçek dünya ağlarında ve bilgisayar tarafından üretilen ağlarda gerçekleştirilmiştir. Buradaki sonuçlar GN algoritmasının sonuçları ile karşılaştırılmıştır. Verilen tüm test ağlarından elde edilen kümeleme sonuçlarının değerlendirilmesi konusunda ilgili çalışmada (Newman 2004 (a)) önerilen yaklaşıma göre modülerlik değeri yaklaşık olarak 0.3 ve üzeri olan kümelemeler, anlamlı ağ modüllerini (güçlü ağ topluluklarını) önermektedirler. Diğer bir çalışmada (Newman ve Girvan 2004 (b)) ise en güçlü topluluk yapısı için modülerlik değeri 1 ile, en zayıf topluluk yapısı ve rastgeleliği temsil eden değer 0 ile gösterilirken, bu değerin 0.3 ile 0.7 arasında olması normal anlamlılık düzeyinin sağlandığını gösterir. 2005 yılında Duch ve Arenas (Duch ve Arenas 2005), ekstremal optimizasyon algoritmasına dayanan sezgisel bir arama kullanarak modülerlik fonksiyonunu optimize eden ayırıcı bir algoritma önermişlerdir. Önerilen algoritmanın bilgisayar simülasyonlu ve gerçek dünya ağlarında gerçekleştirilen deney sonuçları mevcut yaklaşımların sonuçlarıyla karşılaştırılmıştır. Yazarlar, diğer algoritmalar tarafından bulunan optimal modülerlikten daha iyi sonuçların üretildiğini belirtmişlerdir.

Tasgin tarafından sunulan tez çalışmasında (Tasgin 2005) modülerlik amaç

fonksiyonu, GA temelli yaklaşımla karmaşık ağlardaki alt-toplulukların bulunması amacıyla kullanılmıştır. Bu çalışmada GN (Girvan ve Newman 2002), FN (Newman 2004 (a)) ve Extremal Optimization (Duch ve Arenas 2005) gibi algoritmalara değinilmiş ve topluluk tespitinde karşılaşılan çeşitli problemlerden bahsedilmiştir. Gerçek hayattan modellenen birçok ağ yapısı, binlerce veya daha fazla düğüme sahip olacak kadar karmaşık ve büyük olabilmektedir. Ancak çoğu klasik yöntem oldukça yüksek zaman karmaşıklığına sahiptir. Bu yöntemler daha karmaşık ağlarda uygun çözümler üretemediklerinden ve ağa veya ortaya çıkarılacak topluluklara ait ön bilgilere ihtiyaç duyduklarından ağ topluluklarının tespitinde yeterli olmamaktadırlar (Tasgin 2005). Bahsi geçen problemlerin çözümü amacıyla ağdaki global özelliği (network

modularity (Newman ve Girvan 2004 (b))) optimize eden GA temelli bir yaklaşım

(GACD―Genetic Algorithm in Community Detection) önerilmiştir. GACD algoritması gerçek dünya verilerinden Zachary karate kulübü ve Enron e-posta ağı gibi karmaşık ağlarda test edilmiştir. Önerilen algoritmanın hem ağ topluluklarının tespitindeki başarısı hem de düşük zaman karmaşıklığına [O(n) time-complexity] sahip olması gibi avantajları ilgili çalışmada (Tasgin 2005) yazar tarafından vurgulanmıştır.

Ağlardaki alt-grupları keşfetme yöntemleriyle ilgili geçmişteki çalışmalar

Newman tarafından (Newman 2006 (a)) iki ana alt başlıkta sınıflandırılmıştır. İlk başlık

çizge bölümlemedir ve bu konuda özellikle bilgisayar bilimleri ve ilgili alanlarda paralel hesaplama, tümleşik devrelerin tasarımı gibi uygulama alanlarında çalışılmaktadır. İkincisi ise blok modelleme, hiyerarşik kümeleme veya topluluk yapısının tanımlanması gibi isimlerle tanımlanmıştır. Bu alanda, sosyologlar ve daha yakın zamanda fizikçiler ve uygulamalı matematikçiler tarafından özellikle sosyal ve biyolojik ağlarda uygulamalar gerçekleştirilmiştir. Bu çalışmada yukarıda verilen iki alt başlıkla ilgili benzer ve farklı özellikler hakkında bilgiler verilmiştir. Ayrıca, modülerlik amaç fonksiyonunun yeniden formülize edildiği de belirtilmiştir (Newman 2006 (a)).

2006 yılında Gunes tarafından yazılım ajanları kullanılarak karmaşık ağlarda alt- toplulukların bulunması konusunda tez çalışması yapılmıştır (Gunes 2006 (a)). Yazılım ajanları ilgili çalışmada genel olarak bilgisayar bilimlerinde kullanıcılar adına çeşitli görevleri yerine getirmek için belirli bir özerkliğe sahip olan karmaşık bir yazılımın varlığı tanımlanmıştır. Aynı şekilde ağ topluluğu terimi de kendi üyeleri aralarında yoğun olarak bağlı olan; ancak diğer gruplardaki üyelerle seyrek olarak bağlı olan alt- gruplar olarak tarif edilmiştir. Bu alt-grupların tespiti amacıyla modülerliği temel alan yeni bir algoritma önerilmiştir. Algoritmanın hem sonuçlarının doğruluğu hem de karmaşıklığı-ölçeklenebilirliği sırasıyla; Zachary karate kulübü ve Reuters ağlarında test edilmiştir. Yazar, algoritmanın kabul edilebilir sürede optimal çözüme yakın alt- toplulukların tespit edildiğini belirtmiştir (Gunes 2006 (a)). Tez çalışmasında çeşitli gerçek dünya ağları hakkında kısa bilgiler verilmiş ve ağlar hakkında bazı özellikler de sunulmuştur. Buna ek olarak, Gunes ve Bingol tarafından aynı tez çalışmasıyla ilgili bilimsel bir çalışma da yayımlanmıştır (Gunes ve Bingol 2006 (b)).

Ağ modülerliğini optimal hale getirmeye dayanan GA yaklaşımı karmaşık ağlarda toplulukları tespit etmek amacıyla Tasgin ve diğerleri tarafından sunulmuştur (Tasgin ve ark 2007). Bu çalışmada, ağlardaki toplulukların tespiti problemine genetik algoritmanın adapte edilmesi açıklanmış ve gerekli algoritma adımları ayrıntılarıyla verilmiştir. Önerilen yaklaşım; (i) üretilmiş kromozomlara uygunluk fonksiyonunun uygulanması, (ii) popülasyondaki kromozomların uygunluklarına göre sıralanması ve en uygun kromozomların belirlenmesi, (iii) daha sonrası için tüm popülasyondaki en iyi belli sayıdaki kromozomların sonraki nesile aktarılması, (iv) uygunluk değerlerine göre sıralanmış kromozomların eşleştirilmesi ve çaprazlama işleminin seçilen çiftlere uygulanması, (v) mutasyon işlemi ile popülasyondaki çeşitliliğin arttırılması, (vi)

çaprazlama ve mutasyon işlemleri sonrası oluşturulan yeni kromozomlar ile popülasyondaki mevcut kromozomların birleştirilmesi ve bu işlemin maksimum nesil sayısına ulaşılıncaya kadar devam etmesi şeklinde çalışma adımlarından oluşur (Tasgin ve ark 2007).

Büyük ağların topluluk yapısını ortaya çıkarmak amacıyla modülerlik amaç fonksiyonunu kullanan ve daha hızlı çalışan yeni bir hiyerarşik optimizasyon algoritması Blondel ve diğerleri tarafından önerilmiştir (Blondel ve ark 2008). Önerilen algoritma 2.6 milyon müşteriden oluşan bir Belçika cep telefonu ağındaki dil topluluklarının belirlenmesi işleminde ve 118 milyon düğümden oluşan bir web ağının analiz edilmesinde kullanılmıştır. Burada önerilen algoritmanın elde ettiği başarılar geçici modüler ağlarla (ad-hoc modular networks) da doğrulanmıştır.

Ağ modüllerinin tespiti konusunda sıklıkla önerilen metasezgisel yaklaşımlardan biri GA’dır. Bu algoritma çeşitli ayrık problemlere kolayca uygulanabilmesi, tatmin edici sonuçlar vermesi ve diğer algoritmalar için örnek teşkil etmesi sebebiyle bu konuda literatürde oldukça fazla tercih edilmektedir (Tasgin ve ark 2007, Fortunato 2010, Li ve ark 2013 (c), Atay ve Kodaz 2016). Pizzuti tarafından sunulan bir çalışmada

GA temelli yeni bir yöntem önerilmiştir (Pizzuti 2008). Bu çalışmada, topluluk skoru

(community score) isimli yeni bir uygunluk fonksiyonu önerilmiştir. Bu çalışmada, ağlar çizgelerle modellenmiş ve popülasyondaki genotiplerin dizi yapısına uygun bir şekilde temsil edilebilmesi için LAR gösterimi tercih edilmiştir (Park ve Song 1998, Pizzuti 2008).

Yudong tarafından sunulan doktora tez çalışmasında, karmaşık ağların dinamiği

ve yapısı ile ilgili çeşitli optimizasyon problemlerine odaklanılmıştır. Ayrıca karmaşıklık analizi, çeşitli optimizasyon algoritmalarının açıklamaları, ortaya çıkarılan ağ topluluklarından biyolojik çıkarım yapma gibi konularda ek bilgiler verilmiştir. Bu tez çalışmasında (Sun 2009) ele alınan optimizasyon problemlerinden biri ağdaki fonksiyonel toplulukların bulunmasıdır. Bu problemle ilgili önerilmiş mevcut klasik algoritmaların birçoğu ağdaki modülleri yinelemeli bir şekilde tüm ağı bölme yoluyla tespit ederler. Bu durum modüllerin boyutlarında bir yanlılığa/sapmaya (bias) yol açar ve algoritmaların etkinliğini kısıtlar. Bu çalışmada bahsi geçen kısıtlamalarla ilgili problemleri çözen yeni bir algoritma önerilmiştir. Önerilen modül algılama algoritması gen ekspresyon profillerinden oluşturulmuş etkileşim ağlarında fonksiyonel modülleri bulmak amacıyla kullanılmıştır. Deneyler sonucu elde edilen toplulukların Gen

Ontolojisi (GO) ile karşılaştırıldığında istatistiksel olarak anlamlı bir şekilde biyolojik olarak ilişkili olduğu gösterilmiştir (Sun 2009).

Ağ modülerliğini optimize ederek topluluk yapılarını tespit etmeye çalışan diğer bir metasezgisel yaklaşım PSO’dur. Bununla ilgili sunulan bir çalışmada (Shi ve ark 2009), önerilen algoritma iki temel özelliğe sahiptir. Birincisi, toplulukların sayısı otomatik olarak belirlenir. İkincisi ise popülasyondaki parçacıklar öz vektörün ifade ettiği bileşenleri kullanarak topluluk merkezlerini belirleyen düşük boyutlu yapılara sahiptirler. Algoritmanın test sonuçları GN (Girvan ve Newman 2002) ve FN (Newman 2004 (a)) gibi diğer metotların sonuçlarıyla karşılaştırılmış ve PSO temelli algoritmanın daha iyi performansa ulaştığı vurgulanmıştır.

Modüllerin veya topluluk yapılarının tespit edilmesi biyoloji, fizik ve sosyal bilimlerdeki karmaşık ağların temel özelliklerinin anlaşılması açısından önemlidir. Ağın topolojik özelliklerinin bir ölçümü olarak modülerlik fonksiyonunun önerilmesinden itibaren bu fonksiyonun maksimize edilmesine dayanan çeşitli metodolojiler geliştirilmiştir. Ancak gerçek ağlardaki karmaşıklığın büyüklüğü düşünüldüğünde, ilgili optimizasyon probleminin NP-zor olması sebebiyle özellikle her bir ağ için en uygun çözüme ulaşmak oldukça zordur. Xu ve diğerleri (Xu ve ark 2010) belirtilen problemleri dikkate alan karışık tam sayılı optimizasyon algoritmasını daha büyük ağlarda modüllerin algılanması amacıyla kullanmışlardır.

“Community detection in graphs” (Fortunato 2010) isimli makalede, ağdaki

modüllerin veya topluluk yapılarının ortaya çıkarılması konusunda ayrıntılı bir literatür araştırması ve kapsamlı bir çalışma yapılmıştır. Bu bilimsel makale önerdiğimiz tez çalışmasına da oldukça önemli katkılar sağlamıştır. Bu makalede gerçek ağlardaki toplulukların özelliklerinden, topluluk tespitindeki temel elemanlardan, literatürdeki topluluk bulma yöntemlerinden, anlamlılık analizinden, bu alandaki gerçek dünya uygulamalarından, karmaşıklığın değerlendirilmesinden ve temel çizge teorisi gibi benzer birçok konudan oluşan temel ve gerekli bilgiler verilmiştir.

Leskovec ve diğerleri ağ topluluk tespitinde yaklaşım algoritmalarını ve sezgisel

yöntemleri karşılaştırmak, tanımladıkları alt kümelerin göreceli performanslarını değerlendirmek ve bu kümelerdeki sistematik eğilimleri anlamlandırmak amacıyla karşılaştırmalı bir çalışma yapmışlardır (Leskovec ve ark 2010). Bu çalışmada, aynı zamanda tek ve çok kriterli ölçütler olmak üzere iki kategoride incelenen amaç fonksiyonlarının karşılaştırılması da yapılmıştır.

Ağdaki modülleri tanımlamak için Cytoscape (Shannon ve ark 2003, Cytoscape 2017) yazılımındaki Glay (Su ve ark 2010) eklentisi Su ve diğerleri tarafından önerilmiştir. Cytoscape, biyolojik ağların analizi ve görselleştirilmesi amacıyla gerçekleştirilmiş açık kaynak kodlu bir yazılım temelidir. Bu yazılımda sunulan Glay eklentisi Cytoscape kullanıcılarına ağ kümeleme ve yapısal görselleştirme için çok yönlü topluluk yapısı algoritmaları ve çizge yerleştirme fonksiyonları sunan çeşitli koleksiyonlara sahiptir. Bu eklentide çeşitli ağ topluluk tespiti algoritmalarının yanında kullanıcılar için zengin görselleştirme seçenekleri de sunulmaktadır (Su ve ark 2010).

Karmaşık ağlarda örüntü tanıma için büyük bir ilgi konusu olan topluluk algılama problemi pek çok gerçek dünya ağında var olan sıkıca bağlı alt grupların gözetimsiz keşfedilmesini temsil eder (Steinhaeuser ve Chawla 2010). İlgili çalışmada, ağlardaki topluluk yapısının tespiti için önerilen farklı ölçütler karşılaştırılmış ve sonuçlar değerlendirilmiştir. Bu amaçla bazı yöntemler incelenmiş, Zachary karate

kulübü (Zachary 1977) ve Amerikan Kolej Futbolu (Girvan ve Newman 2002) gibi

bilinen gerçek ağlar üzerinde testler gerçekleştirilmiştir. Testlerdeki algoritmaların toplam çalışma süreleri, performansları ve bunun gibi kriterleri temel alan karmaşıklık ve ölçeklenebilirlik analizleri de yapılmıştır (Steinhaeuser ve Chawla 2010).

Sadi ve diğerlerinin bilimsel çalışmasında (Sadi ve ark 2010 (b)) ve Sadi

tarafından sunulan tezde (Sadi 2010 (a)), güçlü bağlı alt-çizgeleri (klik―clique) arayan paralel karıncalar kullanılarak sosyal ağlardaki topluluk yapılarının tespiti konusuna odaklanılmıştır. Doğal esinli bir optimizasyon aracı olarak karınca kolonisi yöntemi seçilmiştir. Önerilen tez çalışmasındaki algoritma beş temel adımdan oluşmaktadır (Sadi 2010 (a)). Bunlar: (i) Ağın boyutuna bağlı olarak özellikle büyük ölçekli ağlardaki yüksek işlem maliyetini önlemek amacıyla temsil edilen çizge, daha küçük alt-çizgelere indirgenir ve oluşan her alt-çizge üzerinde sonraki adımlar için birbirleriyle paralel olacak şekilde iş parçacıkları çalıştırılır. (ii) Her iş parçacığında karınca kolonisi yöntemleri çalıştırılır. Popülasyondaki karıncalar her alt-çizgede en iyi yarı-bağlı alt- çizgeler listesini oluşturmaya çalışırlar. Çizgelerin tam bağlı olması amaçlanır, fakat önerilen bir eşik değer ile belli oranda ayrıtın eksik olmasına da izin verilir ve bu işlem boyunca yarı-bağlı alt-çizgeler de listeye dahil edilirler. Çözüm listesindeki alt- çizgelerin kalitesine bağlı olarak en fazla puana sahip üye en iyi karınca olarak işaretlenir. (iii) Bu karıncalar tarafından temin edilen listedeki alt-çizgelerde üstüste binme―overlapping olarak isimlendirilen ve bir düğümün paylaşılmasını ifade eden problemin düzeltilmesi gereklidir. Bu problem en fazla düğüme sahip olan ve örtüşen

düğümü (overlapping node) de barındıran bir alt-çizgeye, bu düğümün diğer alt- çizgelerden silinerek aktarılmasıyla düzeltilir. (iv) Düzeltilen alt-çizgeler (örn. cliques) tek bir düğüm haline dönüştürülür. Diğer düğüm grupları ve atanmamış düğümlerle birlikte çizge dönüştürme işleminde kullanılacak bu yeni düğüme çizge-düğüm adı verilir. Bu aşamada, indirgenmiş ana çizgedeki tüm bağlantılar silinir ve bağlantı- arasındalık (edge-betweenness) kavramından esinlenerek belirlenen ağırlık değeri ile çizge-düğüm ve atanamamış düğümler arasında yeni bağlantılar oluşturulur. (v) Son aşamada ise yeni indirgenmiş çizge topluluk tespiti yapan hızlı açgözlü bir algoritma ile işlenir ve elde edilen sonuçlar orijinal çizgenin sonuçları ile karşılaştırılır. Yukarıdaki adımları ortak olarak kullanan karınca kolonisi optimizasyonu yaklaşımının üç farklı tekniği, literatürdeki popüler orta ve büyük ölçekli sosyal ağlar üzerinde test edilmiş ve elde edilen sonuçlar ayrıntılı olarak tez çalışmasının deney sonuçları ve tartışma bölümlerinde değerlendirilmiştir (Sadi 2010 (a)).

Çeşitli gerçek dünya sistemlerini temsil eden karmaşık ağların analizi ve bu ağlardan anlamlı modüllerin ortaya çıkarılması gibi konularda son zamanlarda birçok çalışma yapılmıştır (Pereira-Leal ve ark 2004, Hutchings 2011, Jia ve ark 2012, Leung ve ark 2014, Bennett ve ark 2015, Ghiassian ve ark 2015, Lecca ve Re 2015, Cai ve ark 2016, Sporns ve Betzel 2016, Li ve ark 2016 (a), Khan ve Niazi 2017, Yan ve ark 2017, Zheng ve ark 2017, Atay ve ark 2017 (a), Atay ve ark 2017 (b)). Bununla ilgili Cerami tarafından önerilen doktora tezinde, insan biyolojik sistemlerinin etkileşim ağları ve yolak verilerinin ayrıntılı analizi ile ilgili bir çalışma yapılmıştır (Cerami 2011). Bu çalışmada, klinik kanser veri setleri üzerinde birtakım çalışmalar ve değerlendirmeler yapılmıştır. Ağ modüllerinin tespiti konusunda Cytoscape ve gen ontolojisi zenginleştirme aracı gibi yazılımlar kullanılarak analizler gerçekleştirilmiştir.

Karmaşık ağlardaki topluluk yapılarının ortaya çıkarılması için tek bir fonksiyonunun optimize edilmesi genel olarak uygulanan bir yaklaşım olsa da bu alanda çok amaçlı optimizasyon yaklaşımı da özellikle son yıllarda önemli hale gelmiştir.

Pizzuti, önerdiği GA temelli yaklaşım (Pizzuti 2012) ile ağlardaki toplulukların

bulunması için iki farklı amaç fonksiyonunun optimizasyonuna odaklanmıştır. Burada, topluluk yapılarının tespiti çok amaçlı bir optimizasyon problemi olarak formüle edilmiş ve optimum Pareto yapısı ile amaç fonksiyonlarının optimize edilmesi için hedefler arasında en iyi uzlaşmaya karşılık gelen bir dizi çözüm önerilmiştir. Bununla ilgili ayrıntılı algoritma adımları bu çalışmada (Pizzuti 2012) sunulmuş olup, önerilen

yöntemin başarısı literatürde sıklıkla tercih edilen bir küme değerlendirme ölçütüyle (NMI) test edilmiştir.

Diğer bir çok amaçlı optimizasyon yaklaşımı Gong ve diğerleri tarafından sunulmuştur (Gong ve ark 2012). Bu çalışmada Negative-Ratio-Association ve Cut-

Ratio isimli amaç fonksiyonlarını uygunluk ölçütleri olarak kullanan ve birbirine zıt

amaçları optimize eden MOEA/D-Net isimli ayrıklaştırmaya dayalı çok amaçlı evrimsel bir algoritma ağdaki toplulukların tespiti amacıyla sunulmuştur.

Yang ve Leskovec dört farklı kategoride inceledikleri 13 adet topluluk puanlama

fonksiyonunu 230 tane farklı büyüklükteki sosyal, işbirliği ve bilgi ağları seti üzerinde test eden bir değerlendirme metodolojisi önermişlerdir (Yang ve Leskovec 2012 (a)). Bu çalışmada, farklı puanlama kriterleri kullanılarak bulunan topluluk yapıları, veri kümesi üzerinde öncesinden belirlenmiş olan referans ağ topluluk yapılarıyla (ground-

truth communities) (Arınık ve ark 2015) karşılaştırılmıştır. Tüm test sonuçlarına göre

topluluk puanlama işlevlerinin-fonksiyonlarının davranışlarında büyük farklılıklar olduğu vurgulanmıştır.

Sosyal ve biyolojik ağlar gibi bazı karmaşık sistemlerin temsil edildiği çizgelerin düğümleri arasındaki etkileşimlerin zamanla değişmesine izin veren bir ağ topolojisine sahip olması gerçek dünya sistemlerinin temsiline daha yakındır. Verilen bu ağların zaman bağımlılığının anlaşılması, zamana göre değişen ağın fonksiyonel özellikleri ve genel yapısı hakkında oldukça önemli bir bakış açısı sağlayabilir. Afsariardchi tarafından sunulan tezde, çeşitli statik ve dinamik kümeleme algoritmaları gözden geçirilmiş ve dinamik ağlarda örtüşen toplulukları ortaya çıkaran Bayes modeline dayanan yeni bir yöntem önerilmiştir (Afsariardchi 2013). İlgili tezde, önerilen yaklaşımın deneysel çalışmaları yapay ve gerçek ağlar üzerinde gerçekleştirilmiştir. Yazar, elde edilen sonuçlarla bu yaklaşımın son zamanlarda sunulmuş iyi bilinen algoritmalardan daha iyi performans sergilediğini belirtmiştir (Afsariardchi 2013).

GA temelli diğer bir yaklaşımda―MENSGA, düğümler arasında geçişi sağlayan

matris kodlama benimsenmiş ve başlangıç popülasyonunun üretilmesi için genotiplerin çeşitliliğini arttıran düğüm benzerliği seçilmiştir (Li ve ark 2013 (c)). Bu yaklaşımın

Belgede Karmaşık ağlardaki modül yapılarının ve anlamlı alt-ağların tespiti (sayfa 33-54)