• Sonuç bulunamadı

MATEMATİKSEL MODELLEME ARAÇLARI 1 ANA BİLEŞENLERİN ANALİZİ YÖNTEMİ

Ana Bileşenlerin Analizi-ABA (Principle Component Analysis-PCA), birbiriyle ilişkili bir gurup verinin, belirli optimal koşulları sağlayacak şekilde, lineer dönüşümünü gerçekleştiren, bir veri analiz tekniğidir. Bu koşullardan en önemlisi dönüştürülmüş değişkenlerin birbiriyle ilişkisiz oluşudur. Bu bölümde ABA yönteminin nasıl uygulanacağını ve uygulama sonuçlarının nasıl değerlendirileceği açıklanacaktır, [28].

Çok boyutlu analizin amacı birbiriyle bağlantılı iki ya da daha fazla değişkeni tek bir eleman gibi düşünerek, bileşenler arasındaki bağlantıyı göz önünde bulundurmak üzere, genel bir sonuç elde etmektir. Çok boyutlu bir analiz tekniği olan ABA yöntemi verilerin çok boyutlu yapısını inceler. ABA yöntemi ile birbiriyle bağlantılı çok sayıda değişken, birbiriyle ilişkisiz ve veri kümesinin karakterini yansıtan, daha az sayıda değişkene indirgenebilir. Böylece gereksiz, tekrar eden fazla bilgi ortadan kalkmakta, veri kümesi daha kolay yorumlanır ve farklı diğer işlemler için kullanılması daha kolay hale getirilmiş olmaktadır.

Bir veri kümesine ait ana bileşenleri bulmak için önce değişkenler kümesine ait matrisin kovaryansı (veya korelasyonu) oluşturulur ve ardından kovaryans matris uzayını dönüştüren minimal ortogonal vektörler kümesi bulunur. Bu taban küme bulunduğunda herhangi bir vektörü bu uzayda taban bileşenlerin bir lineer kombinasyonu biçiminde ifade etmek mümkün olacaktır. Lineer kombinasyondaki her skaler değer, ilgili taban vektörünün önem derecesini, ağırlığını ifade eder. Taban vektörleri yapının karakterini oluşturan vektörler gibi düşünülebilir. Bunların lineer kombinasyonları ise yapıları oluşturmak için kullanılır, [29].

Şimdi ABA yöntemi’ni gerçek bir probleme uygulanmış olarak ele alalım: Bir deney sonucunda elde edilen verilerin x1, x2,..., xp gibi p tane rasgele değişken vektör ile tanımlanmış olduğunu varsayalım. Ana bileşenler, x1, x2,..., xp

koordinat eksenli orijinal sistemin uygun bir biçimde dönüşümüyle elde edilen yeni koordinat sistemini oluşturur. Yeni eksenler, yönleri maksimum çeşitlilikle ifade eder ve kovaryans yapısının daha basit bir biçimde tanımlanmasını sağlar.

4.1.1 ABA Yöntemi için Teorik Modelin Kurulması

X1, X2,..., Xn , p tane bağımsız değişken ile belirlenen, n boyutlu bir uzayda, deney sonucu elde edilmiş olduğumuz örnek vektörleri temsil ediyor olsun. Bu vektörlerin oluşturduğu her satır bir örneği, sütunlar ise değişkenleri ifade edecek şekilde (nxp) boyutlu bir X matrisi tanımlanır.

               np n n p p x x x x x x x x x ... ... ... ... 2 1 2 22 21 1 12 11 X (4.1)

X matrisinde örneklerin ortalaması olan vektörü, μ={ μi}, i= 1,2,...,p ; kovaryans matrisini S = {su,v}, u,v=1,2,...,p ve bu matrisin özdeğerlerini de λ1≥λ2≥...≥λp≥0 olacak şekilde tanımlanır. Şimdi

z1j = Xj l1= xj1 l11 + xj2 l21 + ... + xjp lp1

z2j = Xj l2= xj1 l12 + xj2 l22 + ... + xjp lp2

... (4.2)

znj = Xj ln= xj1 l1n + xj2 l2n + ... + xjp lpn, j= 1,2,...,n

biçiminde bir denklem sistemi ele alınsın. Burada lji (i=1,2,...,p) değişkenleri ağırlıklar olarak adlandırılır ve sistem değişkenlerinin birbirleriyle ilişkilerini ifade eder. L ağırlıklar matrisi ve Z, sistem değişkenlerinin lineer kombinasyonu şeklinde yazılan yeni sistem değişkenleri matrisi olmak üzere, (2) denklem sistemi kompakt formda,

Z(nxn)=X(nxp)*L(pxn) (4.3)

şeklinde verilebilir. Bu ifadede yer alan Xj l1 vektörü μTl1 ortalamasına ve l1TS l1

varyansına sahiptir. Aynı biçimde (Xj l1, Xj l2) çiftleri için kovaryans l1TS l2 dir. Ana bileşenler, örnek varyansını maksimum yapan lineer kombinasyonlar olarak tanımlanmaktadır.

li vektörlerini liTli=1 şartını sağlayacak biçimde sınırlandırsın ve burada ana bileşenleri elde edilmeye çalışılsın;

Birinci ana bileşen; Xj l1 -nin örnek varyansını, l1Tl1=1 iken, maksimum yapan (Xj l1) lineer kombinasyonu,

İkinci ana bileşen; Xj l2 -nin örnek varyansını, l2Tl2=1 ve (Xj l1, Xj l2) çiftleri için örnek kovaryansı sıfır iken, maksimum yapan (Xj l2) lineer kombinasyonu

...

i-inci ana bileşen; Xj li -nin örnek varyansını, liTli=1 ve bütün (Xj lk, Xj ll) , k,l <i çiftleri için örnek kovaryansı sıfır iken, maksimum yapan (Xj li) lineer kombinasyonu,

olarak tanımlanır.

Görüldüğü gibi birinci ana bileşen, l1TS l1 varyansını ya da başka bir deyişle (l1TS l1 / 1Tl1) değerini maksimum yapar. Maksimum değer, S matrisinin, en büyük özdeğerine karşı gelen, e1 özvektörüdür ki bu özvektör de l1 ağırlığına karşı gelmektedir. (l1= e1). Diğer taraftan, liTS li/liTli ifadesini maksimum yapan li

vektörleri 0= liT S ek = li λk ek denklemini sağlarlar. Başka bir deyişle li, ek ’ye ortogonaldir. Bir S matrisi için birbirine ortogonal ve yukarıdaki şartları sağlayan vektörler kümesi ancak matrisin özvektörler kümesi olabilir. Bu durumda denilebilir ki minimum değer, S matrisinin en küçük özdeğere sahip, ep özvektörüdür ve diğer özvektörler de bu ikisi arasında özdeğerlerinin büyüklük sırasına göre dizilmiş olarak elde edilirler.

Sonuçlar

X deney kümesinin p tane rasgele değişken vektörünü (sütun vektörleri) x1,x2,...,xp

ile tanımlansın.

1. Bu deneye ait S, (pxp) kovaryans matrisi, (λ1,e1), (λ2,e2),..., (λp,ep) özdeğer-özvektör çiftlerini oluştursun. e1, e2,...,ep özvektörlerinin her birine “Ana Bileşen” denir.

2. λ1≥λ2≥...≥λp≥0 olmak üzere, x1, x2,...,xp değişkenleri ile verilmiş p tane birbiriyle ilişkili vektör, z1, z2,..., zp ile verilen yeni p tane ilişkisiz değişken

zi = X ei , (i= 1,2,...,p) (4.4) eşitliğiyle verilir.

4.1.2 Veri Matrisinin Standartlaştırılması

Veri matrisinin farklı birimlere sahip değişkenlerden oluşmuş olabileceğini gözönünde bulundurarak matrisin standartlaştırılması gerekir. X = {aj}, j=1,2,...,n , örnek matrisinde aj vektörleri, μ ortalamaları çıkarılarak ortalama merkezli yani sıfır ortalamaya sahip hale getirilir.

yj = aj – μ (4.5)

Değişkenlerin ölçümü farklı skalalarda gerçekleştirilmiş veya aynı skalada fakat büyük ölçüde farklı aralıklarla elde edilmişse veriyi ortalama merkezli hale getirmek yeterli olmaz. Bu durumda veriyi standartlaştırmak gerekir. Standartlaştırma her yj–nin kendi varyansına bölünmesi ile gerçekleştirilir. Böylelikle dönüştürülmüş örnekler birim varyanslı hale gelir.

ii i ji ji s μ y x   (4.6)

Ana bileşenler, aslında “yapay” değişkenler olduğundan, veri analizi için çok kullanışlı olan birim varyanslı örnekler, kontrol aşamasında kolaylık sağlamaktadır.

4.1.3 ABA Yönteminin Uygulanması

Şimdi ABA modelinin konu ile ilgili probleme nasıl uygulandığı incelecektir. Bu çalışma kapsamında sekiz adet benzer saç kurutma makinesi sesleri örnek olarak seçilmiş, saç kurutma makinelerinin ses sinyallerinin frekans analizi yapılarak 1/3 oktav bant değerleri ele alınmıştır. Ölçüm yapılan ortamın akustik özellikleri ve insan kulağının işitme aralığı göz önünde bulundurularak 125 Hz – 16 kHz aralığında 22 tane 1/3 oktav bantı ses basınç değerleri değişkenler olarak belirlenmiştir.

Mo matrisi, satırları örneklere, sütunları değişkenlere karşılık gelen (nxp) boyutlarında bir veri matrisi olsun. 8 örnek ve 22 değişken olduğuna göre Mo matrisi (8x22) boyutundadır. (Veri tablosu Ek 1 ‘de verilmiştir.)

Aşağıda ABA yöntemi adım adım ele alınmıştır, [30]:

1. Mo matrisi (4.6) denklemi kullanılarak standartlaştırılır ve standartlaştırılmış

Benzer Belgeler