Sinerji skoru optimizasyonu - S˙INERJ˙I SKORU OPT˙IM˙IZASYONU

4. S˙INERJ˙I SKORU OPT˙IM˙IZASYONU

4.3 Sinerji skoru optimizasyonu

Yukarıda tezimizin ikinci a¸samasında kullanılan ilaç gösterimlerinden, bu ilaç gösterimle rini olu¸sturmak için kullandı˘gımız yöntemlerden ve ikinci a¸samada kullanmak için düzenledi˘gimiz veri kümesinden söz ettik. Bu bölümde ise ikinici a¸samadaki amacımız ve kullandı˘gımız birle¸senler detaylıca anlatıldı. Aynı zamanda bu bölümde amacımızı gerçekle¸stirmek için belirledi˘gimiz birle¸senleri ve olu¸sturdu˘gumuz veri kümelerini nasil biraraya getirdi˘gimiz açıklandı. Sinerji Skoru optimizasyonu için geli¸stirdi˘gimiz yöntem

¸Sekil 4.2’de görselle¸stirilmi¸stir.

4.3.1 Sinerji skoru optimizasyonu amacı, girdi ve çıktıları

Bu a¸samadaki amacımız,sinerji skoru tahmini için e˘gitilmi¸s bir yapay ö˘grenme modelinin tahminini en iyileyecek girdi vektörünü bulmaktır.

Sinerji skorunu en iyileyecek girdi vektörü olu¸sturulurken; 4.2 kısmında bahsedildi˘gi gibi yapay ö˘grenme modellerine verilen girdi vektörleri; birinci ilacın öznitelikleri- ikinci ilacın öznitelikleri-hücre hattı özniteliklerindan olu¸sur. Bu a¸samada yaptı˘gımız en iyileme i¸sleminde; birinci ilaç ve hücre hattı öznitelikleri sabit tutulup, sadece kombinasyondaki ikinci ilacın öznitelikleri güncellendi.

Dolayısıyla bu a¸samanın sonucunda, bir ilaç-hücre hattı ikilisi için; e˘gitilen yapay ö˘grenme modelinin tahmin etti˘gi skoru en iyileyen ikinci ilaçlar bulunmaktadır.

¸Sekil 4.2: JTVAE ˙Ilaç Gösterimleriyle Sinerji Skoru Optimizasyonu

4.3.2 Sinerji skoru optimizasyonu için izlenilen yöntem

Bu i¸s için ¸Sekil 4.2’da gösterilen akı¸s izlendi. Temel olarak uyguladı˘gımız yöntem; elimizde belirli ilaç gösterimleriyle e˘gitilmi¸s ve sinerji skoru tahmini yapan bir yapay ö˘grenme modeli bulunmaktadır. Bu modele, tezin ilk çalı¸smasında oldu˘gu gibi, birinci ilaç gösterimi-ikinci ilaç gösterimi-hücre hattı gen anlatımı öznitelikleri ¸seklinde bir girdi vektörü verildi. Bu vektördeki ikinci ilaç gösterimini, gradyan çıkı¸s yöntemiyle güncelleyerek yapay ö˘grenme modelinin verebilece˘gi maksimum çıktıya ula¸sılmaya çalı¸sıldı. Gradyan çıkı¸s i¸sleminden sonra elde edilen ilaç gösterimini verebilecek SMILES dizini belirlenilmeye çalı¸sıldı.

¸Sekil 4.2’da anla¸sılaca˘gı gibi gradyan çıktı sonunda olu¸san ilaç gösterimlerinin kolayca SMILES dizilerine çevrilebiliyor olması gerekmektedir. Bu sebepten, daha önce 4.2

bölümünde belirtildi˘gi gibi, ilk a¸samadan farklı olarak, bu a¸samadaki yapay ö˘grenme modelleri ile kullanılan veri kümesindeki ilaç gösterimleri JTVAE modeli kullanılarak elde edildi. Bu ilaç gösterimlerinin nasıl elde edildi˘gi 1a bölümünde anlatılmı¸stır. Bu a¸samada CD,Chem, GNN ilaç gösterimlerinin kullanılmamasının sebebi; bu ilaç gösterimlerinin özniteliklerinden olu¸san herhangi bir vektörün, hangi SMILES dizisine ait oldu˘gunu bulmak masraflı ve belirsiz (ambigous) bir i¸slemdir (Bir CD vektörünü veren SMILES dizini ancak [45]’da varsa bulunabilir e˘ger yoksa aranan ilaç için tüm laboratuvar deneyleri tekrarlanmalıdır. Chem gösterimindeki ECFP vektörleri ve GNN gösterimindeki molekül vektörleri, molekülün rastgele bir atomundan ba¸slanarak olu¸sturuldu˘gu için tekrar SMILES dizisine çevirmeye uygun öznitelikler de˘gildir.).Ancak herhangi bir JTVAE gizli vektörünü, JTVAE modelinin kod çözücülerine verdi˘gimizde %100 olasılıkla uygun bir SMILES dizini elde edilir.

Çalı¸smalarımızda kullanılan JTVAE modeli, [55]’daki ve [45]’den alınan, LINCS L1000 veri kümesine CD yöntemi uygulanarak çıkarılmı¸s gen imzaları veri kümelerindeki SMILES dizinleriyle e˘gitilmi¸stir.

Bu a¸samadaki yapay ö˘grenme modelleri için e˘gitim ve test verileri olu¸sturulurken; 3.2 bölümünün ba¸sında anlatıldı˘gı gibi [39]’daki veri kümesindeki ögeler birinci ilaç-ikinci ilaç-hücre hattı kombinasyonlarından olu¸suyordu. Bir ögedeki kombinasyonda, e˘ger her iki ilacın da CD gösterimi bulunuyorsa, bu öge e˘gitim verisine dahil edildi. Di˘ger taraftan, bir ögedeki kombinasyonda, e˘ger her iki ilacın da CD gösterimi bulunmuyorsa, bu öge test verisine dahil edildi. Test verisindeki herhangi bir ilacın, e˘gitim verisi tarafından görülmemesi için test ve e˘gitim verileri bu ¸sekilde olu¸sturuldu. ˙Iki veri de standardizasyon yöntemiyle normalize edilmi¸stir. Yapay ö˘grenme modellerinin parametre optimizasyonu için, e˘gitim verisinden rastgele seçilen ve e˘gitim verisinin %10’unu olu¸sturan ögeler de˘gerlendirme verileri olarak kullanıldı. Her bir yapay ö˘grenme modeli için test verisinden alınan ortalama karesel hata de˘gerine göre gradyan artırma, JTVAE ilaç gösterimleriyle olu¸sturulan veri kümesi için en iyi performans gösteren modeldir. Dolayısıyla gradyan çıkı¸s a¸samasında, çıktısını en iyileyece˘gimiz model gradyan artırmadır.

Gradyan çıkı¸s a¸saması için kullanılacak kombinasyonlar belirlenirken; test verisindeki gradyan artırma modelinin hatasının en az oldu˘gu ilk be¸s yüz öge tespit edilmi¸stir. ¸Sekil 4.2’te de gösterildi˘gi gibi, yapay ö˘grenme modelinin çıktısını en iyilemek amacıyla, kombinasyondaki sadece ikinci molekülü güncelledik. Daha kararlı bir sonuç elde etmek için, hatası en az olan ilk be¸s yüz kombinasyondan, sadece, ikinci molekülü, JTVAE tarafından %100 yeniden olu¸sturulabilen ögeler dikkate alındı. Belirlenen ilaç kombinasyonlarıyla deneyler yapılırken, çe¸sitli ba¸slangıç ilaç gösterimleri ve benzerlik fonksiyonları kullanıldı.

Gradyan çıkı¸s a¸samasında; e˘gitilmi¸s yapay ö˘grenme modellerinin çıktısını en iyileyecek, girdi molekülü bulunmaya çalı¸sılır. Dolayısıyla ikinci ilaç gösterimi de˘gi¸skendir. Bu gösterim, belirli de˘gerlerle ba¸slatıldı ve belirli sayıda iterasyon boyunca, gradyan adımlarla güncellendi. Çalı¸smamızdaki gradyan adımların nasıl hesaplandı˘gı 4.15. formülle verilmi¸stir.

z_gradyan=F(z(t) + ∆z) − F(z(t))

∆z (4.15)

Bu gradyanlarla kombinasyonlardaki ikinci ilaç gösterimlerinin nasıl güncellendi˘gi 4.16. formülle gösterilmi¸stir.

z(t + 1) = z(t) + αzgradyan (4.16)

Yukarıdaki formüllerde F gradyan artırma modelini gösterir. z(t) ikinci molekülün, güncellemeden önceki gösterimi, z(t + 1) aynı molekülün, güncellemeden sonraki gösterimidir. ∆z ; ilaç gösterimindeki de˘gi¸sim, α ise ö˘grenme katsayısıdır. Bu a¸samadan sonra güncellenen ilaç gösterimleri, JTVAE modelindeki kod çözücülere verilerek SMILES dizileri elde edilir.

Bu a¸samada, anlatılan ¸sekilde molekül olu¸sturarak, JTVAE, gradyan artırma ve gradyan çıkı¸s yöntemlerinin bu amacımız için uygun olup olma˘gı test edildi. Yaptı˘gımız bu sisteme göre, bir modelin çıktısını en iyileyen molekül ve bu molekülün analizi, (veya istenilen sinerji skorunu sa˘glayan molekül) JTVAE modelinin e˘gitildi˘gi SMILES dizilerine, gradyan çıkarma fonksiyonun parametreleri vs. gibi de˘gi¸skenlere göre çe¸sitlilik gösterebilir. Bu sebepten gradyan çıkı¸s a¸samasında, her iterasyondan sonra olu¸san ilaç gösterimi kaydedildi. Bu a¸samadaki sonuçlar, her a¸samada kaydedilen SMILES dizinlerine ve ilaç gösterimlerine göre analiz edildi.

Belgede Toplu öğrenme ile ilaç kombinasyonlarının sinerji skor tahmini (sayfa 55-59)