• Sonuç bulunamadı

X X x X X X X CovXCovXCovXEXXi (/)(/)() ()() , 1,2  Σ

N/A
N/A
Protected

Academic year: 2021

Share "X X x X X X X CovXCovXCovXEXXi (/)(/)() ()() , 1,2  Σ"

Copied!
7
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

9. HAFTA

DİSKRİMİNANT ANALİZİ

Diskriminant analizi önceden bilinen farklı kitlelerden(gruplardan, sınıflardan, kümelerden) birine, üzerinde ölçüm yapılan yeni bir birimin(bireyin) atanması(sınıflandırılması) biçiminde tanımlanan istatistiksel bir tekniktir.

İki Kitle İçin Fisher Sınıflandırma Yöntemi

Genel düşünce gözlemleri, bilinen iki kitleden veya sınıftan birine dağıtmak ya da yeni bir gözlemi sınıflardan birine atamaktır.  ve 1  sınıfları veya kitleleri göstersin. 2

1 2

( , ,..., p)

X  X X X birey (birim) üzerinden alınacak ölçümlere karşılık gelen p boyutlu rasgele vektör olsun. X ’in gözlem değeri kitleden kitleye (gruptan gruba) değişecektir. X rasgele vektörüne ilişkin gözlem değeri, x ,  ‘ de ise X ’in olasılık yoğunluk fonksiyonu 1

1( )

f x ve  ’de ise X ’in olasılık yoğunluk fonksiyonu 2 f x dir. 2( )

1 E X( / 1)

   :  ‘e ait X rasgele vektörünün beklene değeri 1

2 E X( / 2)

   :  ‘ye ait X rasgele vektörünün beklene değeri 2 ve iki kitle için varyans-kovaryans matrislerinin eşit olduğu kabul edilirse

1 2

( / ) ( / ) ( )

( i)( i) , 1, 2

Cov X Cov X Cov X

E X  X  i          Σ olmak üzere, 1 1 px px Y  l X

doğrusal bileşimi göz önüne alınsın. Buradan,

(2)

2 2 2 2 ( / ) ( / ) Y E Y E l X l          ve 2 1 2 ( / , ) ( ) ( ) Y Var Y Var l X l Cov X l l l           Σ

dir. En iyi doğrusal birleşim iki kitle için Y ‘ nin ortalamaları arası kare uzaklığının, Y’ nin varyansına oranlanarak bulunan ifadeyi maksimum yapacak şekilde elde edilmiştir. Yani en iyi doğrusal birleşim 2 2 1 2 1 2 2 1 2 1 2 2 ( ) ( ) ( )( ) ( ) Y Y Y l l l l l l l l l l l                        

oranından elde edilir, burada  ( 12)iki kitle ortalama vektörlerinin farkıdır. pxp tipindeki  matrisi,  ve 1  kitlelerinin ortalamaları arası fark bileşenlerinin kareler ve 2 çapraz çarpımlar toplamı matrisidir.

2

(l ) l l

 ifadesi her c için 0 l c 1 c 1( 1 2)

 

     ’ nin seçilmesiyle maksimum olur. c 1 alınmasıyla elde edilen

1 1 1 1 1 ( ) px px Y l X X         

Lineer birleşimine Fisher’in Lineer Diskriminant Fonksiyonu (LDF) denir. Oranın maksimumu

(3)

Lineer diskriminant fonksiyonu, çok değişkenli  ve 1  kitlelerini öyle tek değişkenli 2 kitlelere dönüştürür ki, bu tek değişkenli kitlelerin ortalamaları arası fark, kitle varyansına göre mümkün olduğunca büyük olsun.

Yeni bir x gözlemi için diskriminant fonksiyonun değeri 0 1

0 1 2 0

y (  )x biçiminde tanımlansın ve bu lineer birleşime göre oluşan iki tek değişkenli kitlenin ortalamalarının orta noktası 1 2 1 2 1 2 1 1 2 1 2 1 ( ) 2 1 ( ) 2 1 ( ( )) 2 1 ( ) ( ) 2 Y Y m l l l                          dır. Buradan, 0 1 ( / ) 0 E Y    m ve 0 2 ( / ) 0 E Y    m

dır. Yani eğer yeni birim X , 0  ’den ise 1 Y ’ ın beklenen değeri orta noktadan büyük, 0 X , 0

2

 ’den ise Y ’ ın beklenen değeri orta noktadan küçük olacaktır. Böylece sınıflandırma kuralı: 0

1 0 1 2 0 y (  )x  ise m 0 x ,  ’ e atanır 1 1 0 1 2 0 y (  )x  ise m 0 x ,  ’ ye atanır 2 biçimindedir. Ayrıca aynı sınıflandırma kuralı

0

y   ise m 0 x , 0  ’ e atanır 1

0

(4)

Burada verilen diskriminant fonksiyonunda kitle parametreleri  1  ve2  kitle parametreleri bilinmektedir. Kitle parametreleri bilinmiyorsa, ilgili kitlelerden alınan örneklemlerden parametreler tahmin edilir. Her bir kitleden alınan n ve 1 n birimlik örneklemlerden sırasıyla 2 kitle parametrelerinin tahmin edicileri ˆ1 X1, ˆ2  X2 ve  ˆ Spooled olmak üzere Fisher’in Örneklem Lineer Diskriminant Fonksiyonu

1 1 2 ˆ ( ) pooled Y l X X X S X     

olarak elde edilir. Burada Spooled iki kitle için birleştirilmiş örneklem varyans kovaryans

matrisidir ve Spooled S alınacaktır.

Böylece iki tek değişkenli kitlenin örneklem ortalama değerleri y1 l ˆ x1 ve y2  l ˆ x2 arasındaki orta nokta

1 2 1 1 2 1 2 1 ˆ ( ) 2 1 (x x ) S (x x ) 2 m y y       

dir ve örneklemler bağlı sınıflandırma kuralı

(5)

Ayrıştırma ve sınıflandırma problemi için Fisher çözümü p2 için aşağıdaki şekilde gösterilmiştir.

Örnek 19 : A tipi Hemophilia hastalığını taşıyan potansiyelin ortaya çıkarılması için kan örnekleri iki kadın grubu için analiz edilmiş ve iki değişken üzerinden

1 10 2 10 :log ( ) :log ( ) X AHF aktivitesi X AHF ayniantijen

(6)

Ölçümlerden elde edilen örneklem değerleri; 1 1 2 0.0065 0.2483 131.158 90.423 , 0.0390 0.0262 pooled 90.423 108.147 x   x   ve S             

Buna göre Fisher’in örneklem lineer diskriminant fonksiyonunu, iki tek değişkenli örneklem ortalamalarını ve bunlar arasındaki orta noktayı bulunuz. x1 0.210, x2  0.044 ölçümlerine sahip bir kadın normal gruba mı, zorunlu taşıyıcılar grubuna mı sınıflandırılır? Her iki normalleştirme metodunu kullanarak orta noktaları elde edip sonucu tekrar yorumlayınız. Çözüm19:

1

 : Hastalığı taşımayan grup (bu gruptan alınan örneklemn130)

2

 : Hastalığı taşıyan grup (bu gruptan alınan örneklem n2 22) Fisher’in örneklem lineer diskriminant fonksiyonu :

1 1 2 1 2 1 2 ˆ ' ' 131.158 90.423 0.2418 0.0652 90.423 108.147 37.61 28.92 pooled y l x x x S x x x x x                      

olarak elde edilir. İki tek değişkenli örneklem ortalamaları

1 1 0.0065 ˆ ' 37.61 28.92 0.88 0.0390 y l x       

2 2 0.2483 ˆ ' 37.61 28.92 10.10 0.0262 y l x       

Bu ortalamalar arasındaki orta nokta:

1 2

ˆ 4.61

2 y y

m    .

Fisher’in örneklem lineer diskriminant fonksiyonuna bağlı atama kuralına göre: Eğer y0 l xˆ' 0   mˆ 4.61 ise x ,0  ’e atanır. 1

(7)

Soruya dönecek olursak

0 0 0.210 ˆ ' 37.61 28.92 6.62 4.61 0.044 y l x          

Referanslar

Benzer Belgeler

Bu da, f nin bilinen ∂f ∂y kısmi t¨ urevi ile

(Cevabınızın do˘ gru oldu˘ gunu da g¨ oster- meniz gerekiyor).. (Cevabınızın do˘ gru oldu˘ gunu da g¨

Kullandı˘ gınız teorem(ler)in ko¸sullarının sa˘ glandı˘ gını kontrol edin.. (˙Ipucu: ¨ Once f nin 1 de s¨ urekli olması i¸cin sa˘ glanması gereken

[r]

Ancak; buradan gelecek teğetlerin kesim noktası, sadece, geometrik yere ait bir nokta olurdu... Teğetler birbirine dik olacağına göre, bu denklemin köklerinin

Dik prizmaları tanır, temel elemanlarını belirler, inşa eder ve açınımını çizerX. Dik dairesel silindirin temel elemanlarını belirler, inşa eder ve

11. 52 yafl›ndaki bir baban›n üç çocu¤undan iki tanesi ikizdir. Di¤er çocuk, ikizlerden 5 yafl büyüktür. Bir baba ve iki çocu¤unun yafllar› toplam› 49 dur. Bir anne

[r]