EEG İşaretlerinin Çok-katmanlı Algılayıcı Yapay Sinir Ağı
Modeli ile Sınıflandırılmasında Ayrıklaştırma Yaklaşımı
Discretization Approach to EEG Signal Classification Using
Multilayer Perceptron Neural Network Model
Umut Orhan
1, Mahmut Hekim
1, Mahmut Özer
21. Elektronik-Bilgisayar Programı,
Gaziosmanpaşa Üniversitesi
{umutorhan,mhekim}@gop.edu.tr
2. Elektrik ve Elektronik Mühendisliği,
Karaelmas Üniversitesi
mahmutozer2002@yahoo.com
Özetçe
Epilepsi teşhisinde elektroensefalogram (EEG) kayıt sistemleri birçok araştırmacı tarafından bilgi kaynağı olarak sıklıkla kullanılmaktadır. Bu çalışmada, yeniden düzenlenen EEG işaretleri çok-katmanlı algılayıcı yapay sinir ağı (MLPNN) modeli ile sınıflandırılmıştır. Kullanılan EEG verisi her biri 100 adet EEG segmenti içeren beş gruptan (A, B, C, D ve E) oluşmaktadır. Bu çalışmada, genlik ekseni üzerinde eşit aralıklı merkez noktaları seçilmiştir ve her bir genlik değeri kendisine en yakın merkeze kaydırılarak EEG işaretleri yeniden düzenlenmiştir. Yeniden düzenleme işlemi için eşit genişlikli ayrıklaştırma (EWD) yöntemi kullanılmıştır. Düzenlenen EEG işaretlerinin her bir segmentinin dalgacık katsayıları ayrık dalgacık dönüşümü (DWT) kullanılarak hesaplanmıştır. Bu katsayıların ortalaması, standart sapması ve entropisi MLPNN modelinin girişi olarak kullanılmıştır. Model ezberden çapraz geçerlik testi kullanılarak korunmuştur. İki farklı sınıflandırma deneyi aynı MLPNN modeli kullanılarak gerçekleştirilmiştir: 1) sağlıklı bireyler, atak anındaki epilepsi hastaları ve atak anında olmayan epilepsi hastalarının sınıflandırılması, 2) atak anındaki epilepsi hastaları ve atak anında olmayan epilepsi hastalarının sınıflandırılması. MLPNN modeli EEG işaretlerini ilk deneyde %99.60, ikinci deneyde %100 doğrulukla sınıflandırmıştır. Genlik ekseninde yeniden düzenlenen EEG işaretlerinin MLPNN ile sınıflandırmasının daha iyi sonuçlar sağladığı görülmüştür.
Abstract
Electroencephalogram (EEG) recording systems have been frequently used as the sources of information in diagnosis of epilepsy by several researchers. In this study, rearranged EEG signals were classified by Multilayer Perceptron Neural Network (MLPNN) model. Used data consists of five groups (A, B, C, D, and E) each containing 100 EEG segments. In this study, center points with equal interval were selected on amplitude axis of each EEG segment. EEG signals were rearranged by way of that each amplitude value was shifted to the center point closest to itself. Equal width discretization
(EWD) method was used for rearrangement process. Wavelet coefficients of each segment of EEG signals were computed by using discrete wavelet transform (DWT). The mean, the standard deviation and the entropy of these coefficients was used as the inputs of MLPNN model. The model was protected from the overfitting by cross validation. Two different classification experiments were implemented by the same MLPNN model: 1) the classification of healthy volunteers, epilepsy patients during seizure and epilepsy patients during a seizure-free interval, 2) the classification of epilepsy patients during seizure and seizure-free interval. MLPNN model classified EEG signals with the accuracy of 99.60% in first experiment and 100% in second experiment. It is observed that MLPNN classification of EEG signals after rearrangement in amplitude axis provides better results.
1. Giriş
EEG kayıt sistemleri beyin fonksiyonu ve nörolojik bozuklukları incelemek için kullanılan en genel kaynaklardan biridir. Bu sistemler beyindeki elektriksel aktiviteleri sayısal veri olarak kaydeder. Son yıllarda, EEG işaretlerinden aktivite değişimlerini tanımak için otomatik sistemler üzerine ilgi artmıştır. Bu sistemlerin süreci segment tespiti, özellik çıkarma ve sınıflandırma gibi adımlardan oluşur. Otomatik sistemler genellikle nitel özellik içeren işaretleri nicel özellik sınıflandırma problemine dönüştürerek çalışır. Bu amaç için otokorelasyon fonksiyonu, frekans domeni özellikleri, zaman-frekans analizi ve ayrık dalgacık dönüşümü (DWT) gibi tekniklerden yararlanılır [1– 4].
DWT ilk olarak durağan olmayan işaretlerin analizi için geliştirilmiş olup dalgacık adı verilen sabit bloklara sahip bir zaman fonksiyonu içerir. Bu bloklar tek bir fonksiyondan kaydırma ve genişletme işlemleriyle elde edilen bir fonksiyonlar topluluğudur. DWT’nin ana avantajı düşük frekansta geniş ve yüksek frekansta dar pencere boyutuna sahip olmasıdır. Bu yüzden tüm frekans aralıklarında en uygun zaman-frekans çözümüne imkan tanır [5], [6]. DWT yöntemi ile elde edilen dalgacık katsayıları bir işaretin zaman domeninde görünmeyen karakteristiklerini tanımlayan özellik vektörleridir [2].
Authorized licensed use limited to: ULAKBIM UASL - Karaelmas Universitesi. Downloaded on August 14,2020 at 08:31:10 UTC from IEEE Xplore. Restrictions apply.
978-1-4244-6382-4/10/$26.00 ©2010 IEEE
Son yıllarda epileptik aktivitelerin tespiti için birçok farklı yapay sinir ağı modeli önerilmiştir. EEG işaretlerinin analizinde yapay sinir ağı modeli ve istatistiksel tanı metotlarının uygulanmasına odaklanılmıştır. Pradhan ve ark. [7] EEG işaretlerini analiz etmek için iki katmanlı öğrenen vektör parçalama ağını kullanmıştır. Birinci katman giriş vektörlerini sınıflandırmak için öğrenen bir katmandır. İkinci katman birinci katmanın çıkışlarını hedef sınıflara dönüştürür. Hazarika ve ark. [8] EEG işaretlerini üç çıkışlı (normal, şizofren ve obsesif kompulsif bozukluk) MLPNN kullanarak sınıflandırmıştır. Petrosian ve ark. [9] epileptik atak tahmini için istatistiksel özelliklerin yerine ham EEG işaretlerini yinelemeli sinir ağına uygulamıştır. Kıymık ve ark. [10] üç çıkışlı (uyanık, uyuşuk, uykuda) MLPNN ile güç spektral yoğunluğuna dayalı EEG işaretlerini sınıflandırmıştır. Subaşı [11] aynı sınıflandırma problemi için istatistiksel özellikleri MLPNN modeline giriş olarak kullanmıştır. Güler ve Übeyli [4] EEG işaretlerinin sınıflandırma doğruluğunu iyileştirmek için iki adet uyarlamalı sinirsel bulanık ağını birleştirmiştir. Srinivasan ve ark. [12] hem EEG işaretlerinin zaman domeni hem de frekans domeni özelliklerini kullanarak Elman ağını kullanmıştır. Subaşı ve Erçelebi [13] epileptik atak tespiti için hem MLPNN hem de lojistik regresyon modellerini kullanarak EEG işaretlerini analiz etmiştir. Subaşı [14] iki çıkışlı (normal ve epileptik) MLPNN ve dinamik dalgacık ağ modellerini karşılaştırmıştır. Alkan ve ark. [15] sınıflayıcıya giriş olarak ataksız hastanın güç spektrumunu kullanarak çoklu işaret sınıflama, otoregresif ve periyodogram metotlarını MLPNN modeli ile karşılaştırmıştır. Übeyli [3] eigen-vektör ve çok sınıflı destek vektör makine metodunu birleştirerek EEG işaretlerini sınıflandırmıştır. Übeyli [16] EEG işaretlerinin sınıflandırması için iki adet MLPNN modelini birleştirmiştir. İkinci seviyedeki ağ, birinci seviyedeki ağın sınıflandırma doğruluğunu iyileştirmek için kullanılmıştır.
Bu çalışmada, her bir EEG segmentinin genlik eksenindeki maksimum ve minimum değerleri arasında eşit aralıklı merkez noktaları seçilmiştir ve her bir genlik değeri kendisine en yakın merkez noktasına kaydırılarak EEG işaretleri yeniden düzenlenmiştir. Yeniden düzenlenen EEG işaretlerinin her bir segmentinin dalgacık katsayıları DWT yöntemi kullanılarak hesaplanmıştır. Bu katsayıların ortalaması, standart sapması ve entropisi MLPNN modelinin girişleri olarak kullanılmış ve EEG işaretleri sınıflandırılmıştır.
Bölüm 2’de, kullanılan EEG işaretleri, spektral analiz yöntemi ve EWD yöntemi tanımlanmaktadır. Bölüm 3’te uygulamanın nümerik analizleri verilmektedir. Son olarak, Bölüm 4’te sonuçlar yorumlanmaktadır.
2. Materyal ve Yöntem
Bu çalışmada, genel kullanıma açık EEG işaretleri üzerinde çalışılmıştır [17]. Veri, her biri 100 adet EEG segmenti içeren beş kümeden (A, B, C, D ve E) oluşmaktadır. Bu segmentler kas ve göz hareketleri yüzünden meydana gelen artefaktlardan temizlenmiş EEG kayıtlarından seçilmiştir. A (gözler açık) ve B (gözler kapalı) kümeleri beş sağlıklı insandan standart elektrot yerleştirme planına göre yüzey EEG kayıtlarından alınmıştır. C, D ve E kümeleri beş epilepsi hastasının girişimsel (içsel) EEG kayıtlarından sağlanmıştır. D kümesi epileptik bölgeyi içeren yarıküreden ve C kümesi beynin diğer yarıküresinden kaydedilmiştir. C ve D kümeleri atak olmayan aralıklar süresince ölçülen aktiviteyi, E verisi atak aktivitelerini içermektedir.
2.1. Ayrık Dalgacık Dönüşümü
Ayrık dalgacık dönüşümü bir fonksiyonun sonsuz dalgacıklar serisi olarak gösterilmesini sağlayan bir spektral analiz tekniğidir ve işaretlerin alçak geçiren ve yüksek geçiren filtreler yardımıyla ayrıştırma işlemidir. Alçak geçiren filtre ile işaretin düşük frekansa sahip yaklaşık katsayısı ve yüksek geçiren filtreyle de işaretin yüksek frekansa sahip detay katsayısı bulunur. İşaretin en uygun yapısını elde etmek için yeterli sayıda katsayı hesaplanmalıdır. Bir x[n] işaretinin ayrıştırma prosedürü Şekil 1’de gösterilmektedir [5] ve [6].
Şekil 1: DWT ile alt-bantlara ayrıştırma (g[n]: yüksek geçiren
filtre, h[n]: alçak geçiren filtre)
DWT’nin avantajı iyi bir frekans lokalizasyonu için uzun zaman pencereleri (düşük frekans), ve iyi bir zaman lokalizasyonu için kısa zaman pencereleri (yüksek frekans) üretmesidir [11], [13] ve [14].
2.2. Eşit Genişlikli Ayrıklaştırma
Ayrıklaştırma yaklaşımı genellikle Naive Bayes sınıflayıcı yönteminde nicel veriyi niteliksel hale getirmek için kullanılmaktadır [18], [19]. En çok kullanılan ayrıklaştırma yaklaşımı olan EWD yöntemi EEG işaretleri için ilk kez bu çalışmada kullanılmıştır. Ayrıklaştırma sayısı K’nın 3 ve 20 değerleri için düzenlenen bir EEG işaret örneği Şekil 2’de gösterilmektedir.
Şekil 2: EWD ile ayrıklaştırılan bir EEG işaret örneği
Yöntemin başarısı K değerinin uygun seçilmesine bağlıdır. Bu çalışmada, EEG işaretleri genlik ekseni üzerinde
vmin ve vmax arasında K adet birbirine eşit uzaklıkta merkez noktalarına ayrıklaştırılarak düzenlenmiştir. Bu aralıklar,
K v v W =( max− min)/ (1) 1 4 7 10 -30 -15 0 15 30 gerçek i aret ayrıkla tırılmı i aret (k=3) ayrıkla tırılmı i aret (k=20) zaman (sn) genlik (uV)
genişliğine sahiptir ve kesme noktaları aşağıdaki gibidir:
vmin+W, vmin+2W , . . . , vmin+(K −1)W (2)
2.3. Entropi
Entropi, durağan olmayan bir işaretin düzensizliğinin derecesini ölçmek için kullanılan yöntemlerden biridir. İşaret işlemede shannon, norm, eşik, logaritmik enerji ve approximate entropi hesaplama yöntemleri yaygın olarak kullanılır [1]. Bu yöntemlerin işaret işlemedeki başarıları uygulama alanlarına göre değişir. Bir işaretin shannon entropisi aşağıdaki gibi tanımlanır:
∑
− = i i i p p H log2( ) (3)burada, p işaretin inci değerinin olasılığını ve H işaretin i
entropisini ifade eder. Bu çalışmada EEG işaretlerinin entropisi shannon yöntemiyle bulunmuştur.
2.4. Çok Katmanlı Algılayıcı Sinir Ağı (MLPNN)
Son yıllarda klasik tekniklerle çözülemeyen problemler için sinir ağları uygulamasına ilgi artmıştır ve birçok medikal uygulamalarda başarıyla kullanılmıştır [3], [4], [11], [13], [14] ve [16]. Geleneksel spektral analiz yöntemlerinin aksine yapay sinir ağları işaretleri modellemek ile kalmaz aynı zamanda işaretin sınıflandırmasına ilişkin çözüm de üretir. Biyomedikal işaretlerin analizi için var olan yöntemlere göre yapay sinir ağlarının diğer bir avantajı da yeteri kadar eğitildikten sonra diğer işlemlerinin çok hızlı oluşudur.
MLPNN birçok tespit ve tahmin işlemlerini yerine getiren parametrik olmayan bir yapay sinir ağı tekniğidir. MLPNN’de gizli katmandaki her bir j nöronu, wji bağlantı ağırlığıyla giriş işaretlerinin çarpımlarının toplamını alır ve yj çıkışını bu toplamın bir fonksiyonu olarak hesaplar:
yj = f(
∑
wjixi) (4)burada f bir nörona etki eden işaretlerin ağırlıklı toplamını çıkış değerine dönüştüren bir aktivasyon fonksiyonudur. Aktivasyon fonksiyonu basit bir eşik fonksiyonu, sigmoidal veya hiperbolik tanjant fonksiyonu olabilir. Bu çalışmada, aktivasyon fonksiyonu olarak hiperbolik tanjant fonksiyonu kullanılmıştır.
Çıkış nöronlarının hesaplanan ve istenen değerleri arasındaki karesel farkların toplamı aşağıdaki gibi tanımlanır:
∑
− = j j j y y e ( * )2 2 1 (5)burada yj* ve yj sırasıyla jnci çıkış nöronunun hesaplanan ve istenen değerleridir. Her bir wji ağırlığı olabildiğince hızlı bir şekilde e değerini azaltmak için ayarlanır. wji değerinin nasıl ayarlanacağı eğitim algoritmalarına bağlıdır.
Bu çalışmada kullanılan model 12 giriş, 5 nörona sahip tek gizli katman ve 1 (veya 3) çıkış içermektedir. Modelin eğitiminde Levenberg-Marquardt algoritması kullanılmıştır.
3. Nümerik Analiz
Bu çalışmada, EEG işaretlerinin değişimlerini saptamak için 4 seviyeli ikinci dereceden Daubechies dalgacığı (Db2)
kullanılmıştır. Her bir EEG segmenti için D1 (2049), D2 (1026), D3 (514), D4 (258) detay katsayıları ve A4 (258) yaklaşık katsayısı hesaplanmıştır. Buna göre her bir segment için 4097 uzunluklu işaretten toplam 4105 dalgacık katsayısı
elde edilmiştir. D1 katsayılarının MLPNN modelinin
başarısına etkisi olmadığı için göz ardı edilmiştir. Bu durumda, toplam dalgacık sayısı 2056’ya ve dolayısıyla MLPNN modelinin giriş sayısı da 15’ten 12’ye düşmüştür.
Uygulanan MLPNN modelinin sınıflandırma doğruluğu gizli nöron sayılarına göre araştırılmış ve en iyi sonucu veren minimum nöron sayısı 5 olarak saptanmıştır. Modelde, gizli katman ve çıkış katmanındaki aktivasyon fonksiyonu olarak hiperbolik tanjant fonksiyonu kullanılmıştır. Ayrıca, ayrıklaştırma sayısı K, DWT’nin tipi ve seviyesi en yüksek sınıflandırma doğruluğu hesaba katılarak araştırılmıştır. Tasarlanan model için Db2 tipinde 4 seviyeli ayrık dalgacık dönüşümü kullanıldığı zaman en iyi sonucu verdiği gözlemlenmiştir. K parametresinin başarıya etkisi Şekil 3’te gösterilmektedir.
Şekil 3: K parametresinin toplam doğru sınıflandırma
başarısına etkisi
Çapraz geçerlik, bir modelin ezberlemeye başlamadan önce eğitimini durdurmak için önerilen iyi bir yöntemdir. Çapraz geçerlik hatası artmaya başladığı an en iyi genel çözüm bulunduğu için eğitim durdurulur. Bu çalışmada, MLPNN modelinin başarısının güvenilirliği sağlamak için çapraz geçerlik kullanılmıştır. Bunun için, eğitim, test ve geçerlik kümelerinde toplam verinin sırasıyla %40’ı, %50’si ve %10’u olmak üzere 200, 250 ve 50 vektör vardır.
Bu çalışmada, aynı MLPNN modeli kullanılarak iki farklı sınıflandırma deneyi yapılmıştır.
Deney 1: Üç veri kümesi (B, D ve E) kullanılmıştır. Test
kümesinde 50 B (sağlıklı) sınıfına, 45 D (atak geçirmeyen epilepsi) sınıfına ve 55 E (atak geçiren epilepsi) sınıfına ait vektör bulunmaktadır. En yüksek sınıflandırma başarısını sağlayan K değeri deneysel olarak 29 bulunmuştur. Modelin karşılaştırma matrisi Tablo 1’de verilmektedir.
Tablo 1: Deney 1’in karşılaştırma matrisi
B D E 5 1 1 2 2 3 3 0 1 2 3 4 5 6 7 8 9 10 K parametresi ba arı (%)
B 50 0 0
D 0 45 0
E 0 0 55
Deney 2: Beş veri kümesi (A, B, C, D ve E) kullanılmıştır.
Test kümesinde 202 adet ABCD (sağlıklı bireyler ve atak geçirmeyen epilepsi hastaları) sınıfına ait vektör ve 48 adet E (atak geçiren epilepsi hastaları) sınıfına ait vektör bulunmaktadır. En yüksek sınıflandırma başarısını sağlayan K değeri deneysel olarak 33 bulunmuştur. Karşılaştırma matrisi Tablo 2’de verilmektedir.
Tablo 2: Deney 2’nin karşılaştırma matrisi
ABCD E
ABCD 202 0
E 1 47
Aynı sınıflandırma deneyleri için EWD yöntemi kullanılmadığı zaman modelin toplam doğru sınıflandırma başarısı düşmektedir. Sonuçlar Tablo 3’te gösterilmektedir.
Tablo 3: EWD yönteminin başarıya etkisi
EWD’li MLPNN EWD’siz MLPNN
Deney 1 100 99.20
Deney 2 99.60 98.80
Sonuçlar
Bu çalışmada, EWD ile düzenlenen EEG işaretleri MLPNN modeliyle sınıflandırılmıştır. Yeniden düzenlenen EEG işaretlerinin D1-D4 detay katsayıları ve A4 yaklaşık katsayısı DWT yöntemiyle hesaplanmıştır. Dalgacık katsayılarının ortalaması, standart sapması ve entropisi modelin özellik vektörleri olarak kullanılmıştır. 5 nöron içeren tek gizli katmanlı ileri beslemeli 12 girişe sahip MLPNN modeli iki sınıflandırma deneyi için Levenberg-Marquardt öğrenme algoritması ile eğitilmiştir. MLPNN modelinin başarısının güvenilirliği için çapraz geçerlik kullanılmıştır ve modelin ezberlemesi önlenmiştir. EEG işaretlerinin sınıflandırılması için önerilen EWD yöntemine dayalı modelin doğru sınıflandırma başarısı EWD yöntemini kullanmayan modelin başarısından daha yüksek bulunmuştur. Sonuç olarak; durağan olmayan biyomedikal işaretlerin analizinde EWD yöntemi, sınıflandırma modellerinin başarısına katkı sağlayacaktır.
4. Kaynakça
[1] H., Ocak, “Automatic detection of epileptic seizures in EEG using discrete wavelet transform and approximate entropy”, Expert Systems with Applications, vol. 36, pp. 2027–2036, 2009.
[2] J. G., Proakis, D. K., Manolakis, Digital Signal
Processing- Principlesi Algorithms and Applications (4th
ed.), Prentice Hall, 2006.
[3] E. D., Übeyli, “Analysis of EEG signals by combining eigenvector methods and multiclass support vector machines”, Comput. Biol. Med. vol. 38, no. 1, pp. 14–22, 2008.
[4] İ., Güler, E. D., Übeyli, “Adaptive neuro-fuzzy inference system for classification”, Journal of Neurosciense
Methods, vol. 148, pp. 113–121, 2005.
[5] M., Akay, “Wavelet applications in medicine”, IEEE
Spectrum, vol. 34, no. 5, pp. 50–56, 1997.
[6] I., Daubechies, “The wavelet transform, time–frequency localization and signal analysis”, IEEE Trans. Inform.
Theory, vol. 36, no. 5, pp. 961–1005, 1990.
[7] N., Pradhan, P. K., Sadasivan, G. R., Arunodaya, “Detection of seizure activity in EEG by an artificial neural network: A preliminary study”, Computers and
Biomedical Research, no.29, pp. 303–313, 1996.
[8] N., Hazarika, J. Z., Chen, A. C., Tsoi, A., Sergejew, “Classification of EEG signals using the wavelet transform”, Signal Processing, vol.59, no.1, pp. 61–72, 1997.
[9] A., Petrosian, D., Prokhorov, R., Homan, R., Dashei, D., Wunsch, “Recurrent neural network based prediction of epileptic seizures in intra and extracranial EEG”,
Neurocomputing, vol.30, pp. 201–218, 2000.
[10] M. K., Kıymık, M., Akın, A., Subaşı, “Automatic recognition of alertness level by using wavelet transform and artificial neural network”, Journal of Neuroscience
Methods, vol. 139, pp. 231–240, 2004.
[11] A., Subaşı, “Automatic recognition of alertness level from EEG by using neural network and wavelet coefficients”, Expert Systems with Applications, vol. 28, pp. 701–711, 2005.
[12] V., Srinivasan, C., Eswaran, N., Sriraam, “Artificial neural network based epileptic detection using time-domain and frequency-time-domain features”, Journal of
Medical Systems, vol. 29, no.6, pp. 647–660, 2005.
[13] A., Subaşı, E., Erçelebi, “Classification of EEG signals using neural network and logistic regression”, Computer
Methods and Programs in Biomedicine, vol. 78, pp. 87–
99, 2005.
[14] A., Subaşı, “Epileptic seizure detection using dynamic wavelet network”, Expert Systems with Applications, vol. 29, pp. 343–355, 2005.
[15] A., Alkan, E., Köklükaya, A., Subaşı, “Automatic seizure detection in EEG using logistic regression and artificial neural network”, Journal of Neuroscience Methods, vol. 148, pp. 167–176, 2005.
[16] E. D., Übeyli, “Combined neural network model employing wavelet coefficients for EEG signals clasification”, Digital Signal Processing, vol. 19, pp. 297–308, 2009.
[17] R. G., Andrzejak, K., Lehnertz, F., Mormann, C., Rieke, P., David, C. E., Elger, “Indications of nonlinear deterministic and finite-dimensional structures in time series of brain electrical activity: Dependence on recording region and brain state”, Phys. Rev. E, vol. 64 061907, 2001.
[18] J., Dougherty, R., Kohavi, M., Sahami, “Supervised and unsupervised discretization of continuous features” In
Proceedings of the 12th international conference on machine learning, pp. 194–202, 1995.
[19] C. N., Hsu, H., J., Huang, T. T., Wong, “Implications of the Dirichlet assumption for discretization of continuous variables in naive Bayesian classifiers”, Machine
Learning, vol. 53, no. 3, pp. 235–263, 2003.