• Sonuç bulunamadı

Çalışmamızda, DEÇÜA ve AD veri artırma tekniklerinin yüz tanıma sistemlerinin doğruluk performansında etkisi gösterilmeye çalışılmıştır. Çalışma boyunca edindiğimiz tecrübe, DEÇÜA’ın temel gerçeğe benzer sentetik yüzler üretme kabiliyetine sahip olduğudur. Ancak bunun gerçekleşmesi, veri seti genişliği, kişiye ait görüntü sayısında denge ve ekran kartı performansı gibi etkenlere bağlıdır.

Doğruluk performansı söz konusu olduğunda, yüz tanıma sistemimizin performansında artış tespit edilmiştir. Ancak hedeflediğimiz oranda bir artış elde edemedik. Bunun temel nedeni DEÇÜA modeli ile üretilen sentetik yüzlerin bir bölümünün yüz tanıma sistemi tarafından doğru şekilde algılanabilecek düzeyde olmamasından kaynaklanmaktadır. Hedeflenen oranda bir artışın elde edilememesine rağmen DEÇÜA ve AD veri artırma tekniklerinin sistemin doğruluk performansına olumlu yansıması, pozitif gelişme olarak algılanmış ve ileride yapılacak ince ayar işlemleriyle bu oranın artabileceği kanaati oluşmuştur.

Genel anlamda DEÇÜA’da model oluşturma ve eğitim aşamalarında zorluklarla karşılaşılmıştır. Temel gerçeğe yakın örnek üretecek modeli oluştururken orijinal ve diğer çalışmalardaki tavsiyeler göz önünde bulundurulmalıdır. Aksi takdirde sonuçların kötü olması kaçınılmazdır. DEÇÜA’da hem üretici ağının hem de ayrımcı ağının aynı anda eğitilme zorunluluğun bulunması bu ağlarda eğitim sürecini zorlaştırmaktadır. Eğitim süreci, üretici ağ ve ayrımcı ağ arasında dengeli değilse problemler meydana gelecektir. Ayrımcı ağ, sentetik verileri kesin doğrulukla sınıflandırırsa, üretici ağı hızlandırabilir. Aynı şekilde üretici ağ, ayrımcı ağında bir takım zaaflar tespit ederse performansını düşürebilme ihtimali vardır. DEÇÜA iki derin öğrenme modeli içerdiğinden eğitim sürecinde yüksek miktarda hesaplama işlemi gerçekleşmektedir. Dolayısıyla hesaplama gücü yüksek ekran kartıyla bile eğitim süreci çok zaman alacaktır. Çalışmamızda yüksek hesaplama gücüne sahip ekran kartına sahip olmadığımızdan dolayı eğitim süreci tahminimizden çok daha uzun sürmüştür. Bu da DEÇÜA modelimize ince ayar yapma imkânını kısıtlamıştır.

57 6.2. Gelecekteki Çalışmalar

DEÇÜA modeli tasarlanmış, uygulanmış ve yuz tanima sisteminin performansında etkisi test edilmiştir. Test sonuçları, bu veri arttırma tekniğinin sistemin performansına olumlu yansıdığını göstermektedir. Hem elde edilen sonuçları iyileştirmek için hem de ÇÜA’ın farklı modellerini incelemek için gelecekte bazı çalışmaların yapılması öngörülmüştür. DEÇUA modelimizin daha geniş veri seti ile eğitildiği takdirde üretecegi sentetik yüz görüntülerinin kalitesinde iyileşme meydana geleceğini tahmin ediyoruz. Dolayısıyla ilk gerçekleştireceğimiz işlem, modelimize ince ayar yapmak olacaktır.

Gelecekte yapacağımız diğer bir çalışma ÇÜA’ın farklı modellerini incelemek olacaktır. ÇÜA'ın gelişimi halen devam etmektedir, bununla birlikte birçok ilgi çekici model tasarlanmaktadır. Araştırmacılar tarafından oldukça ilgi gören bir diğer model de Çift Yönlü Çekişmeli Üretici Ağlar (Bidirectional Generative Adversarial Networks- BiGAN) dır. Modeli tasarlayan araştırmacılar bilimsel çalışmalarında dengeli bir eğitim ve diğer ağlara göre daha kaliteli sentetik gorüntü üretimi vaad ediyorlar (Donahue, Krähenbühl ve Darrell, 2016). ÇÜA’ın farkli modellerini incelerken aynı zamanda yapacağımız bir başka bir işlem de Çift Yönlü Çekismeli Üretici Ağlar ve Derin Evrişimsel Çekismeli Üretici Ağların başarı performansını karşılaştırmak olacaktır.

58 Referanslar

AbdAlmageed, W., Wu, Y., Rawls, S., Harel, S., Hassner, T., Masi, I., ... & Nevatia, R. (2016, March). Face recognition using deep multi-pose representations. In 2016 IEEE Winter Conference on Applications of Computer Vision (WACV) (pp. 1-9).

IEEE.

Adini, Y., Moses, Y., & Ullman, S. (1997). Face recognition: The problem of compensating for changes in illumination direction. IEEE Transactions on Pattern Analysis & Machine Intelligence, (7), 721-732.

Agarwal, A., Singh, R., Vatsa, M., & Ratha, N. (2018, October). Are image-agnostic universal adversarial perturbations for face recognition difficult to detect?. In 2018 IEEE 9th International Conference on Biometrics Theory, Applications and Systems (BTAS) (pp. 1-7). IEEE.

Ahonen, T., Hadid, A., & Pietikainen, M. (2006). Face description with local binary patterns: Application to face recognition. IEEE Transactions on Pattern Analysis &

Machine Intelligence, (12), 2037-2041.

Amos, B., Ludwiczuk, B., & Satyanarayanan, M. (2016). Openface: A general-purpose face recognition library with mobile applications. CMU School of Computer Science, 6.

Antipov, G., Baccouche, M., & Dugelay, J. L. (2017, October). Boosting cross-age face verification via generative age normalization. In 2017 IEEE International Joint Conference on Biometrics (IJCB) (pp. 191-199). IEEE.

Antipov, G., Baccouche, M., & Dugelay, J. L. (2017, September). Face aging with conditional generative adversarial networks. In 2017 IEEE International Conference on Image Processing (ICIP) (pp. 2089-2093). IEEE.

Atienza, 2017 - https://towardsdatascience.com/gan-by-example-using-keras-on-tensorflow-backend-1a6d515a60d0

Belhumeur, P. N., Hespanha, J. P., & Kriegman, D. J. (1997). Eigenfaces vs.

fisherfaces: Recognition using class specific linear projection. IEEE Transactions on Pattern Analysis & Machine Intelligence, (7), 711-720.

Brunelli, R., & Poggio, T. (1992, May). Face recognition through geometrical features.

In European Conference on Computer Vision (pp. 792-800). Springer, Berlin, Heidelberg.

Castelluccio, M., Poggi, G., Sansone, C., & Verdoliva, L. (2015). Land use classification in remote sensing images by convolutional neural networks. arXiv preprint arXiv:1508.00092.

Chan, Y. J., & Ewins, D. J. (2011). The amplification of vibration response levels of mistuned bladed disks: its consequences and its distribution in specific situations. Journal of Engineering for Gas Turbines and Power, 133(10), 102502.

Chavdarova, T., & Fleuret, F. (2018). Sgan: An alternative training of generative adversarial networks. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (pp. 9407-9415).

59

Chen, X., Duan, Y., Houthooft, R., Schulman, J., Sutskever, I., & Abbeel, P. (2016).

Infogan: Interpretable representation learning by information maximizing generative adversarial nets. In Advances in neural information processing systems (pp. 2172-2180).

Chen, Zhimin, and Yuguang Tong. "Face super-resolution through wasserstein gans."

arXiv preprint arXiv:1705.02438 (2017).

Cox, I. J., Ghosn, J., & Yianilos, P. N. (1996, June). Feature-based face recognition using mixture-distance. In cvpr (Vol. 96, pp. 209-216).

Curtis, F. E., & Que, X. (2015). A quasi-Newton algorithm for nonconvex, nonsmooth optimization with global convergence guarantees. Mathematical Programming Computation, 7(4), 399-428.

Dalal, N., & Triggs, B. (2005, June). Histograms of oriented gradients for human detection.

Felzenszwalb, P. F., Girshick, R. B., McAllester, D., & Ramanan, D. (2009). Object detection with discriminatively trained part-based models. IEEE transactions on pattern analysis and machine intelligence, 32(9), 1627-1645.

Geitgey, 2017 - https://medium.com/@ageitgey/machine-learning-is-fun-part-4-modern-face-recognition-with-deep-learning-c3cffc121d78

Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., ...

& Bengio, Y. (2014). Generative adversarial nets. In Advances in neural information processing systems (pp. 2672-2680).

Haykin S., (2009). Neural Networks and Learning Machines (3rd ed.), Pearson. Upper Saddle River, NJ, USA.

Hines, J., Tsoukalas, L. H., & Uhrig, R. E. (1997). MATLAB supplement to fuzzy and neural approaches in engineering. John Wiley & Sons, Inc..

Hochreiter, S., Younger, A. S., & Conwell, P. R. (2001, August). Learning to learn using gradient descent. In International Conference on Artificial Neural Networks (pp.

87-94). Springer, Berlin, Heidelberg.

Hong W., S. Winkler. (2014).Proc. IEEE International Conference on Image Processing (ICIP), Paris, France, Oct. 27-30

Hopfield, J. J., & Tank, D. W. (1985). “Neural” computation of decisions in optimization problems. Biological cybernetics, 52(3), 141-152.

Howard, A. G. (2013). Some improvements on deep convolutional neural network based image classification. arXiv preprint arXiv:1312.5402.

Huang, G. B., Mattar, M., Berg, T., & Learned-Miller, E. (2008, October). Labeled faces in the wild: A database forstudying face recognition in unconstrained environments.

Huang, R. J. J. (1998). Detection strategies for face recognition using learning and evolution. George Mason University.

Ian G., Yoshua B., Aaron C. (2016). Deep Learning (1st ed.) MIT Press.

60

Ioffe, S., & Szegedy, C. (2015). Batch normalization: Accelerating deep network training by reducing internal covariate shift. arXiv preprint arXiv:1502.03167.

Jafri, R., & Arabnia, H. R. (2009). A survey of face recognition techniques. Jips, 5(2), 41-68.

Jiang, D., Hu, Y., Yan, S., Zhang, L., Zhang, H., & Gao, W. (2005). Efficient 3D reconstruction for face recognition. Pattern Recognition, 38(6), 787-798.

Kanade, T. (1974). Picture processing system by computer complex and recognition of human faces.

Kanede T. (1973). Picture processing system by computer complex and recognition of human faces, Doctoral dissertation Kyoto University, 83–97.

Karras, T., Aila, T., Laine, S., & Lehtinen, J. (2017). Progressive growing of gans for improved quality, stability, and variation. arXiv preprint arXiv:1710.10196.

Kriesel, (2009) - http://www.dkriesel.com/en/science/neural_networks

Krizhevsky, A., Sutskever, I., & Hinton, G. E. (2012). Imagenet classification with deep convolutional neural networks. In Advances in neural information processing systems (pp. 1097-1105).

Lawrence, S., Giles, C. L., Tsoi, A. C., & Back, A. D. (1997). Face recognition: A convolutional neural-network approach. IEEE transactions on neural networks, 8(1), 98-113.

Ledig, C., Theis, L., Huszár, F., Caballero, J., Cunningham, A., Acosta, A., ... & Shi, W. (2017). Photo-realistic single image super-resolution using a generative adversarial network. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 4681-4690).

Liu, Z., Luo, P., Wang, X., & Tang, X. (2015). Deep learning face attributes in the wild. In Proceedings of the IEEE International Conference on Computer Vision (pp.

3730-3738).

Lv, J. J., Shao, X. H., Huang, J. S., Zhou, X. D., & Zhou, X. (2017). Data augmentation for face recognition. Neurocomputing, 230, 184-196.

Mathieu, M., Couprie, C., & LeCun, Y. (2015). Deep multi-scale video prediction beyond mean square error. arXiv preprint arXiv:1511.05440.

Melin, P., Felix, C., & Castillo, O. (2005). Face recognition using modular neural networks and the fuzzy Sugeno integral for response integration. International Journal Of Intelligent Systems, 20(2), 275-291.

Mirza, M., & Osindero, S. (2014). Conditional generative adversarial nets. arXiv preprint arXiv:1411.1784.

Mohammadzade, H., & Hatzinakos, D. (2012). Projection into expression subspaces for face recognition from single sample per person. IEEE Transactions on Affective Computing, 4(1), 69-82.

Nag,( 2017) - https://medium.com/@devnag/generative-adversarial-networks-gans-in-50-lines-of-code-pytorch-e81b79659e3f

61

Parkhi et al., 2015] Parkhi, O. M., Vedaldi, A., and Zisserman, A. (2015). Deep face recognition. In British Machine Vision Conference.

Quesada,(2019)

https://www.neuraldesigner.com/blog/5_algorithms_to_train_a_neural_network Radford, A., Metz, L., & Chintala, S. (2015). Unsupervised representation learning with deep convolutional generative adversarial networks. arXiv preprint arXiv:1511.06434.

Reed, S., Akata, Z., Yan, X., Logeswaran, L., Schiele, B., & Lee, H. (2016).

Generative adversarial text to image synthesis. arXiv preprint arXiv:1605.05396.

Rosenblatt, F. (1958). The perceptron: a probabilistic model for information storage and organization in the brain. Psychological review, 65(6), 386.

Sagiroglu, S., Colak, I., & Bayindir, R. (2006). Power factor correction technique based on artificial neural networks. Energy Conversion and Management, 47(18-19), 3204-3215.

Schroff, F., Kalenichenko, D., & Philbin, J. (2015). Facenet: A unified embedding for face recognition and clustering. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 815-823).

Seyyedsalehi, S. Z., & Seyyedsalehi, S. A. (2014). Simultaneous learning of nonlinear manifolds based on the bottleneck neural network. Neural processing letters, 40(2), 191-209.

Sharma, B., & Venugopalan, K. (2014). Comparison of neural network training functions for hematoma classification in brain CT images. IOSR Journal of Computer Engineering, 16(1), 35.

Shashua, A., Gdalyahu, Y., & Hayun, G. (2004, June). Pedestrian detection for driving assistance systems: Single-frame classification and system level performance. In IEEE Intelligent Vehicles Symposium, 2004 (pp. 1-6). IEEE.

Simonyan, K., & Zisserman, A. (2014). Very deep convolutional networks for large-scale image recognition. arXiv preprint arXiv:1409.1556.

Sirovich, L., & Kirby, M. (1987). Low-dimensional procedure for the characterization of human faces. Josa a, 4(3), 519-524.

Springenberg, J. T., Dosovitskiy, A., Brox, T., & Riedmiller, M. (2014). Striving for simplicity: The all convolutional net. arXiv preprint arXiv:1412.6806.

Szegedy, C., Liu, W., Jia, Y., Sermanet, P., Reed, S., Anguelov, D., ... & Rabinovich, A. (2015). Going deeper with convolutions. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 1-9).

Taigman, Y., Yang, M., Ranzato, M. A., & Wolf, L. (2014). Deepface: Closing the gap to human-level performance in face verification. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 1701-1708).

62

Turk, M. A., & Pentland, A. P. (1991, June). Face recognition using eigenfaces.

In Proceedings. 1991 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (pp. 586-591). IEEE.

Turk, M., & Pentland, A. (1991). Eigenfaces for recognition. Journal of cognitive neuroscience, 3(1), 71-86.

Viola, P., & Jones, M. (2001). Robust real-time object detection. International journal of computer vision, 4(34-47), 4.

Xu, Y., Li, X., Yang, J., & Zhang, D. (2014). Integrate the original face image and its mirror image for face recognition. Neurocomputing, 131, 191-199.

Yi, D., Lei, Z., Liao, S., & Li, S. Z. (2014). Learning face representation from scratch. arXiv preprint arXiv:1411.7923.

Zeiler, M. D., & Fergus, R. (2014, September). Visualizing and understanding convolutional networks. In European conference on computer vision (pp. 818-833).

Springer, Cham.

63 ÖZGEÇMİŞ

Erdal ALİMOVSKİ İstanbul Sabahattin Zaim Üniversitesi Bilgisayar Bilimi ve Mühendisliği bölümünde yüksek lisans öğrencisidir. Üniversitenin bünyesinde bulunan “Gömüllü sistemler” laboratuvarında çalışmalarına ağırlıklı olarak Görüntü İşleme üzerinde devam etmektedir. Mevcut araştırma alanları arasında makine öğrenmesi, derin öğrenme, yapay sinir ağları bulunmaktadır.

Benzer Belgeler