Adamic Adar Jaccard Kaynak Tahsisli
43
Tablo 4.4. Ağrı kesici ilaçların bağlantı tahmini değerleri (Kaynak Tahsisli)
Kaynak Tahsisli
Panalgin Minoset Aspirin Vermidon Novalgin
1-Reflü Ġlaçları 0,71 0,05 0,00 0,73 0,00
2-Yüksek Tansiyon Ġlaçları 0,71 0,05 0,00 0,73 0,00
3-Migren Ġlaçları 0,05 0,71 0,00 0,83 0,00 4-Hemoroid Ġlaçları 0,00 0,00 0,83 0,00 0,76 5-Kolesterol Ġlaçları 0,00 0,00 0,80 0,00 0,09 6-Depresyon Ġlaçları 0,80 0,00 0,00 0,06 0,00 7-Sivilce Ġlaçları 0,00 0,00 0,00 0,00 0,00 8-Epilepsi Ġlaçları 0,00 0,00 0,00 0,00 0,00 9-Parkinson Ġlaçları 0,00 0,00 0,00 0,00 0,00 10-Prostat Ġlaçları 0,05 0,05 0,00 0,80 0,00
Kaynak Tahsisli Ġndeksleme ile yapılan hesaplamada Tablo 4.4’te oluĢan değerler gösteriyor ki; Reflü hastalığına en fazla Vermidon ilacı yazılmıĢtır. Minoset ilacı Reflü hastalığına hiç yazılmadığı halde ilerde yazılma ihtimali ortaya çıkmıĢtır. Aspirin ve
Novalgin’in Reflü hastalığına yazılma ihtimali ise yapılan hesaplamalarda yok gibi
görünmektedir. Kolesterol ve Hemoroid hastalıkları arasında bağlantı Aspirin ilacı üzerinden oluĢmuĢtu. Novalgin sadece Hemoroid hastalığına yazılmıĢtı. Tablo 4.4 ve ġekil 4.5’te 0,09 değeriyle Novalgin ilacının Kolesterol hastalığına yazılma ihtimali ortaya çıkmıĢtır.
44
ġekil 4.5. Ağrı kesici ilaçların bağlantı tahmini sonuçları (Kaynak Tahsisli)
ġekil 4.5’ten anlaĢıldığı üzere en yüksek değerleri Migren hastalığında Vermidon, Hemoroid hastalığında ise Aspirin elde etmiĢtir. Bu da en fazla bu hastalıklara yazılan ilaçların bunlar olduğunu göstermektedir.
AĢağıdaki Tablo 4.5 ve Tablo 4.6’da Adamic Adar ve Jaccard Ġndeksleme ile elde edilen değerler bulunmaktadır.
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9
Kaynak Tahsisli
Panalgin Minoset Aspirin Vermidon Novalgin45
Tablo 4.5. Ağrı kesici ilaçların bağlantı tahmini değerleri (Adamic Adar)
Adamic Adar
Panalgin Minoset Aspirin Vermidon Novalgin
1-Reflü Ġlaçları 2,56 0,32 0,00 2,59 0,00
2-Yüksek Tansiyon Ġlaçları 2,56 0,32 0,00 2,59 0,00
3-Migren Ġlaçları 0,32 2,56 0,00 2,79 0,00 4-Hemoroid Ġlaçları 0,00 0,00 2,79 0,00 2,65 5-Kolesterol Ġlaçları 0,00 0,00 2,49 0,00 0,42 6-Depresyon Ġlaçları 2,49 0,00 0,00 0,36 0,00 7-Sivilce Ġlaçları 0,00 0,00 0,00 0,00 0,00 8-Epilepsi Ġlaçları 0,00 0,00 0,00 0,00 0,00 9-Parkinson Ġlaçları 0,00 0,00 0,00 0,00 0,00 10-Prostat Ġlaçları 0,32 0,32 0,00 2,49 0,00
ġekil 4.6. Ağrı kesici ilaçların bağlantı tahmini sonuçları (Adamic Adar)
0 0,5 1 1,5 2 2,5 3
Adamic Adar
Panalgin Minoset Aspirin Vermidon Novalgin46
Tablo 4.6. Ağrı kesici ilaçların bağlantı tahmini değerleri (Jaccard)
Jaccard
Panalgin Minoset Aspirin Vermidon Novalgin
1-Reflü Ġlaçları 0,29 0,09 0,00 0,22 0,00
2-Yüksek Tansiyon Ġlaçları 0,29 0,09 0,00 0,22 0,00
3-Migren Ġlaçları 0,05 0,71 0,00 0,22 0,00 4-Hemoroid Ġlaçları 0,00 0,00 0,42 0,00 0,71 5-Kolesterol Ġlaçları 0,00 0,00 0,33 0,00 0,10 6-Depresyon Ġlaçları 0,24 0,00 0,00 0,04 0,00 7-Sivilce Ġlaçları 0,00 0,00 0,00 0,00 0,00 8-Epilepsi Ġlaçları 0,00 0,00 0,00 0,00 0,00 9-Parkinson Ġlaçları 0,00 0,00 0,00 0,00 0,00 10-Prostat Ġlaçları 0,05 0,10 0,00 0,17 0,00
Yapılan ölçümlerde Adamic Adar ve Kaynak Tahsisli yöntemlerinin verdiği ölçüm sonuçlarının birbirine yakın olduğu görülmektedir. Bazı ilaç türlerinde Jaccard indekslemenin sonuçlarının diğer iki yönteme göre bazı durumlarda değiĢkenlik gösterdiği belirlenmiĢtir. Mesela Migren hastalığına Kaynak Tahsisli ve Adamic Adar indekslemede
Minoset ve Vermidon yazılması ihtimali birbirine yakın iken Jaccard’da bu ihtimal Minoset
için yüksek olmasına rağmen Vermidon için daha düĢüktür. Hemoroid hastalığına Aspirin ilacının yazılma ihtimali Kaynak Tahsisli ve Adamic Adar indekslemede daha yüksek olmasına rağmen Jaccard indekslemede Novalgin’e göre daha düĢüktür. Reflü hastalığında Jaccard indekslemeye göre Panalgin ilacının yazılma ihtimali daha yüksek, diğerlerinde ise Vermidon çok fark olmasa da daha yüksek değerler vermektedir.
47
ġekil 4.7. Ağrı kesici ilaçların bağlantı tahmini sonuçları (Jaccard)
Bu değerlendirmelere bakıldığında Jaccard indekslemenin ağda daha farklı bir yaklaĢımla sonuçlar verdiği söylenebilir. Jaccard indekslemenin bazı değerlerinin farklı olduğu görülebilmektedir. ġekil 4.5, ġekil 4.6 ve ġekil 4.7 üzerinden yapılan kıyaslamalarda açıkça görülmektedir. Ağdaki verilerimizin büyüklüğü arttıkça bu değerler farklılaĢabilir. Kaynak Tahsisli ile Adamic Adar arasındaki benzerliklerde değiĢebilir.
OluĢturulan bu yapay veritabanı daha da büyütülebilir, ağın analizi daha da derinleĢtirilebilir. Ağın büyüklüğü arttıkça elde edilen sonuçların doğruluğunun tespiti zorlaĢır. Fakat mevcut veritabanının analizi, ağ küçük olduğu için sonuçları değerlendirme açısından daha doğru gözlemler yapmayı sağlamıĢtır. Sonuçların sağlamasının yapılması ve eksik noktalarının görülebilmesi açısından daha yararlı olmuĢtur.
Kullanılan yöntemler ortak komĢular üzerinden hesaplamalar yapmaktadır. Sonuçlara bakıldığında ortak komĢular yani iki düğüm arasındaki komĢuların kesiĢimi ve birleĢimi kullanılarak ağlar üzerinde önemli analizlerin yapılabileceği görülmektedir.
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8
Jaccard
Panalgin Minoset Aspirin Vermidon Novalgin48 5.SONUÇ
Veri kayıtlarının tamamıyla sayısal ortamlara aktarıldığı günümüzde veriler somutlaĢmıĢ ve ölçülebilir hale gelmiĢtir. Tıp, akademik, sosyoloji, iĢ ve sayılmayan birçok alanda oluĢan veri yığını üzerinde analizler yapılarak değerli bilgiler elde edilebilir. Günümüzde hastaneye giden hastaların bütün bilgileri kayıt altına alınmaktadır. Sayısal ortamlarda tutulan bu verilerin analiz edilmesi çok faydalı bilgilerin elde edilmesini sağlayacaktır. Sosyal ağlarda kullanılan analiz yöntemlerinden bağlantı tahmini yöntemleri bu verilerin analizi için kullanılabilmektedir.
Bağlantı tahmininin kaynağı veri madenciliği ve sosyal ağlardır. Bu yüzden tezde baĢlangıçta bu konular üzerinde duruldu. Bu alanda yapılmıĢ akademik çalıĢmalar incelendi. OluĢturulan veriler bir sosyal ağ verisiymiĢ gibi ele alındı.
Bu tez çalıĢmasında genel hatları ile farklı alanlarda kullanılan bu analiz yöntemlerinin hastalık-ilaç ağına uygulaması yapıldı. Hastalık ilaç ağlarının bağlantı tahmini yöntemleri kullanılarak analizi yapıldı. Özellikle yerel indeksleme yöntemlerinden Ortak KomĢu, Adamic Adar, Jaccard, Kaynak Tahsisli indekslemenin baĢarılı sonuçlar vereceği düĢünülerek, bu yöntemlerle analizler yapıldı. Düğümler arasındaki bağlantı ağrı kesici ilaçlar köprü olarak kullanıldığı için onlar üzerinden sağlandı. Çünkü bir hastalığın ilacı diğerine yazılmadı. Sadece ağrı kesici ilaçlar diğer hastalıklara yazıldı. Ġlaçlar ve hastalıklar arasındaki iliĢkilerin gerçekten iĢe yarar bilgiler barındırdığı ortaya çıktı. Nitekim hastanın hastalık ve bu hastalığa yazılan ilaçları üzerindeki verilerde yapılan analizler bize çok değerli bilgiler verdi. Mesela birbiriyle doğrudan iliĢkili olmayan 2 ilacın beraber yazılma ihtimali ortaya çıktı. Hastalıklar arasında bağlantı ihtimali ortaya çıktı. Bağlantıların skor değerleri sıralanıp, hastalıklara hangi ilacın yazılma ihtimalinin yüksek olacağı belirlendi. Bu sonuçlar hastalıklara ilaç önerilerinin bu yöntemlerle sunulabileceğini gösterdi.
Jaccard indekslemenin diğer yöntemlere göre daha farklı bir yaklaĢımla sonuçlar verdiği ortaya çıktı. Çünkü diğer yöntemler iki düğüm arasındaki ortak komĢular ve komĢuların dereceleriyle hesaplama yaparken, Jaccard ortak komĢuların birleĢimini de göz önüne aldı. Fakat genel olarak düğümlerin benzerlikleri birbirine yakın oranlarda ortaya çıktı.
49
Sosyal ağların barındırdıkları aktörlerin iliĢkilerine ait oldukça faydalı bilgiler ihtiva ettiği hastalık ilaç ağı üzerinden bir daha gösterildi. Bu yapı ve iliĢkilerin analiz edilmesi aracılığıyla yakınlıklar, benzerlikler, eğilimlere ulaĢılarak hastalık ilaç ağındaki iliĢkiler hakkında çeĢitli yorumlara ve tahminlere varıldı.
Bu tez çalıĢmasında komĢuluk iliĢkilerini kullanan yöntemler üzerinden hesaplamalar yapıldı. Hesaplamaların doğruluğu irdelendi. Uygulamada elde edilen bilgiler incelendiğinde yapılan tahminlerin gerçekçi sonuçlar verdiği görüldü.
Yapay veri yerine gerçek veriler kullanılarak uygulamanın kullanılırlığı daha da arttırılabilir. Sağlık uygulamalarında ve hastane otomasyonlarında bu algoritmalar kullanılarak kullanıcılara yönlendirmeler yaptırılabilir ve veriler üzerinde analizler yapılabilir. Nitekim bu uygulama ilerde daha büyük veriler üzerinde analiz yapmayı sağlayacak bir prototip niteliği taĢımaktadır.
Bu alandaki çalıĢmalar içinde zor problemler barındırmaktadır. Verilerin büyüklüğüne göre karmaĢıklık ve hesaplama zorluğu ortaya çıkmaktadır. Ama özellikle sosyal ağların geniĢ kesimler tarafından ilgi görmesi ve bu alandaki büyük verilerden kullanılabilecek iĢe yarar geniĢ analizlerin çıkma ihtimalinin olması sebebiyle son yıllarda üzerinde araĢtırmaların arttığı bir alandır.
Bağlantı tahmini açıklandığı üzere farklı alanlardaki birçok probleme çözüm sunacak ve birçok alanda uygulaması gerçekleĢtirilebilecek bir konudur. Özellikle sağlık alanı insanoğlunun ana hizmet alanlarından biridir. Bu alandaki hizmetler hataya sıfır tolerans göstermektedir. Bu alandaki hizmetler sürekli iyileĢtirilmeye çalıĢılmalıdır. Bu konuda yapılacak uygulamalarla geniĢ kesimleri ilgilendirecek çözümler üretilebilir. Sağlık çalıĢanlarının hizmet kalitesinin arttırılmasına yardımcı olunabilir.
50 KAYNAKLAR
[1] Hwang, S.Y., Wylie, B.N., Wei, C.P. ve Liao, Y.F., 2010. “Coauthorship
networks and academic literature recommendation”, Electronic Commerce Research and Applications, 9, 323–334.
[2] Barabasi, A. L. ve Albert, R., 1999. “Emergence of scaling in random networks”,
Science 286, 509–512.
[3] Hasan, M.A., Chaoji, V., Salem, S. ve Zaki, M.J., 2006. “Link prediction using
supervised learning”, SIAM 2006 Workshop on Link Analysis, Counterterrorism and Security, Bethesda, MD.
[4] Folino, F. ve Pizzuti, C., 2010. “A comorbidity-based recommendation engine for
disease prediction”, Proc of 23rd IEEE International Symposium on Computer- BasedMedical Systems (CBMS 2010), 6-12.
[5] Folino, F. ve Pizzuti, C., 2012. “Link Prediction Approaches for Disease
Networks”, ITBAM 2012, 99-108.
[6] Alpaydın, E., 2000. “Zeki Veri Madenciliği: Ham Veriden Altın Bilgiye UlaĢma Yöntemleri”, BiliĢim Semineri 2000, 1-5.
[7] Özçakır, F. C. ve Çamurcu, A. Y., 2007. “Birliktelik Kuralı Yöntemi Ġçin Bir Veri Madenciliği Yazılımı Tasarımı Ve Uygulaması”, Ġstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi, 12, 21-37.
[8] Öğüt, S., 2009. “Veri Madenciliği Kavramı ve GeliĢim Süreci”, Görsel ĠletiĢim Tasarımı Bölümü, ĠletiĢim Fakültesi, Yeditepe Üniversitesi, Ġstanbul.
[9] Travers, J. ve Milgram, S., 1969. "An Experimental Study of the Small World
Problem.", Sociometry, Vol. 32, No. 4, s. 425-443.
[10] Onat, F. ve Alikılıç Ö., 2008. “Sosyal ağ sitelerinin reklam ve halkla iliĢkiler ortamları olarak değerlendirilmesi”, Journal of Yasar University, 3(9), 1111-1143. [11] Özmen, ġ., 2009. “Ağ Teknolojisinde Yeni Ticaret Yolu: E-Ticaret”, Ġstanbul Bilgi
Üniversitesi Yayınları, Ġstanbul.
[12] Boyd, D.M. ve Ellison, N.B., 2007. “Social Network Sites: Definition, History and
51
[13] Carminati, B., Ferrari, E. ve Perego, A., 2006. “Rule-Based Access Control for
Social Networks”, Lecture Notes in Computer Science, 4278, s. 1734-1744.
[14] Pustylnick, I., 2011. “Patterns of Concealed Advertising in Social Network
Websites”, Social Science Research Network.
[15] Kara, Y. ve CoĢkun, A., 2012. “Sosyal Ağların Pazarlama Aracı Olarak
Kullanımı: Türkiye’deki Hazır Giyim Firmaları Örneği”, Afyon Kocatepe Üniversitesi ĠĠBF Dergisi, c.14, s. 2.
[16] Kuduğ, H., 2011. “Anlamsal Web Tabanlı Kurumsal ĠĢ Ağının Analizi”, Yüksek Lisans Tezi, Ege Üniversitesi Fen Bilimleri Enstitüsü, Ġzmir.
[17] http://techcrunch.com/2010/04/21/facebook-500-million-visitors-comscore/ Facebook kullanımı 15.03.2013.
[18] Karcı, A. ve Boy, O., 2011. “Sosyal ağların web madenciliği teknikleri ile analizi ve ortak atıf analizi ile benzerlik tahmini”, Elektrik-Elektronik ve Bilgisayar Sempozyumu, Fırat Üniversitesi.
[19] ġahin, B., 2009. “Sosyal Ağ Analizi Nedir?”, ISREF.
[20] Gastner, M.T., 2011. “Networks: Theory and Applications”, Imperial College.
[21] Bondy, J.A., Murty, U.S.R., 2008, “Graph Theory”, Springer.
[22] Huisman, M., ve van Duijn, M.A.J., 2011. “The SAGE Handbook of Social
Network Analysis”, s. 578-600.
[23] Huisman, M., ve van Duijn, M.A.J., 2004. “Software For Statistical Analysis Of
Social Networks”, University of Groningen.
[24] Ting, I.H., 2008. “Web Mining Techniques for On-line Social Network Analysis”,
IEEE, 696-700.
[25] Scott, J., 2000. “Social Network Analysis: A Handbook,” Sage Publications, 209s.
[26] Mika, P., 2007. “Social Networks and the Semantic Web, Semantic Web and
Beyond Computing for Human Experience”, Jain,R. and Sheth, A.(Eds.), New York, Springer Science and Business Media, 234s.
52
[27] Newman, M.E.J., 2008. “Mathematics of Networks”, 12pp., The New Palgrave
Dictionary of Economics, Durlauf, S.N. and Blume, L.E. (Eds.), Palgrave Macmillan.
[28] Schank, T. ve Wagner, D., 2005. “Approximating clustering-coefficient and
transitivity”, Journal of Graph Algorithms and Applications, 9: 265–275.
[29] Hanneman, R.A. ve Riddle M., 2005. “Introduction to social network methods”,
Riverside, CA: University of California, Riverside.
[30] Volkova, S., 2009. “Link Prediction in Social Networks”, KDD Lab Course
Project.
[31] Getoor, L. ve Diehl C.P., 2005. “Link Mining: A Survey”, SIGKDD Explorations,
7(2), 3-12.
[32] Menon, A.K. ve Elkan, C., 2011. “Link Prediction via Matrix Factorization”, ECML/PKDD 2, 437-452.
[33] Shibata, N., Kajikawa, Y., ve Sakata, I., 2012. “Link Prediction in Citation
Networks”, Journal of The American Society for Information Science and Technology, 63(1), 78-85.
[34] Seglen, P.O., 1994. “Casual Relationship Between Article Citedness and Journal
Impact”, Journal of the American Society for Information Science and Technology, 45(1), 1–11.
[35] Vinkler, P. ve Davidson, G.S., 2002. “Dynamic changes in the chance for
citedness”, Scientometrics, 54(3), 421–434.
[36] Liben-Nowell, D. ve Kleinberg, J., 2003. “The link prediction problem for social
networks”, Proceedings of the 12th International Conference on Information and Knowledge Management (CIKM), NewYork: ACM Press, s. 556–559.
[37] Popescul, A. ve Ungar, L.H., 2003. “Statistical relational learning for link
prediction”, Proceedings of the Workshop on Learning Statistical Models from Relational Data, IJCAI-2003.
[38] Hasan, M.A., ve Zaki, M.J., 2011. “A Survey of Link Prediction in Social
53
[39] Clauset. A, Moore, C. ve Newman, M.E.J., 2008. “Hierarchical structureand the
prediction of missing links in Networks”, Nature, 453, 98–101.
[40] Murata, T. ve Moriyasu, S., 2008. “Link Prediction based on Structural Properties
of Online Social Networks”, New Generation Computing, 26(3), 245–257.
[41] Caragea, D., Bahirwani, V., Aljandal, W. ve Hsu, W.H., 2009. “Ontology based
link prediction in the Live Journal Social Network” Proceedings of the Eighth Symposium on Abstraction, Reformulation, and Approximation(SARA2009).
[42] Lü, L., Jin, C.H. ve Zhou, T., 2009. “Similarity index based on local paths for link
prediction of complex Networks”, Physical Review E, 80, 046122.
[43] D. A. Davis et al., 2008. “Predicting individual disease risk based on medical
history”, In Proc. of the ACM Int. Conf. on Information and Knowledge Management(CIKM'08), 769-778.
[44] Davis D. A., Chawla N. V., Christakis N. A. ve Barabasi A. L., 2010. “Time to
CARE: a collaborative engine for practical disease prediction”, Data Mining and Knowledge Discovery, 20:388-415.
[45] Moody J., 2001. “Race, School Integration, and Friendship Segregation in
America”, American Journal of Sociology 107, 679–716 .
[46] Borgatti, Stephen P., Mehra A., Brass D.J. ve Labianca G., 2009. “Network
Analysis in the Social Sciences”, Science 323 (5916), 892–895.
[47] Gençer, M., 2013. “Sosyal Ağlar”, Ġstanbul Bilgi Üniversitesi.
[48] Galaskiewicz, Joseph, Wasserman S., Rauschenbach B., Bielefeld W., ve Mullaney P., 1985. “The Influence of Corporate Power, Social Status, and Market
Position on Corporate Interlocks in a Regional Network”, Social Forces 64 (2), 403–431.
[49] Vartak, S., 2008. “A survey on Link Prediction”, State University of New York.
[50] Lü, L., Zhou, T., 2011. “Link Prediction in Complex Networks: A survey”, Physica A 390, 1150-1170.
54
[51] Sağlık Bakanlığı, Birinci Basamakta Akılcı Reçete Yazımı, Hıfzıssıhha Mektebi Müdürlüğü, HMM Yayın No: HMM-2011-36, Ankara, 2011.
[52] WHO, Promoting Rational Use of Medicines: Core Components - WHO Policy
55
ÖZGEÇMĠġ
Adı Soyadı : Ġhsan TUĞAL
Doğum Yeri ve Tarihi : MuĢ - 10.10.1980
EĞĠTĠM BĠLGĠLERĠ
Fırat Üniversitesi-Bilgisayar Mühendisliği-Lisans (1997 - 2002)
Fırat Üniversitesi-Fen Bilimleri Enstitüsü-Bilgisayar Mühendisliği- Y.Lisans (2011- …..)
Ġġ DENEYĠMĠ
Bitlis Eren Üniversitesi-Tatvan MYO-Öğretim Görevlisi (2011-Devam Ediyor) MuĢ Alparslan Üniversitesi-Mühendis (2008 - 2011)