  nn  3      

(1)

12. HAFTA

Örnek 23 :  ve ₁  kitlelerinden alınan p=2 için, ₂ n₁n₂  birimlik rasgele örneklemler 3 ve betimsel istatistikler aşağıda verilmiştir. Eşit prior ve eşit hatalı sınıflandırma maliyetleri için hata oranı tahminlerini elde ediniz.

1 2 4 3 12 10 8 X _{ } _   , 1 3 x 10        , 1 1 1 1 4 S _{ }  _    2 5 3 4 7 9 5 X _{ } _   , 2 4 x 7        , 2 1 1 1 4 S _{ }  _   

Çözüm 23 : Hata oranı tahmini 12 21 1 2 n n APER n n  

 formülü ile elde edilir. Burada

12

n :  deki birimlerden ₁  ye hatalı sınıflandırılanların sayısı ₂

21

n :  deki birimlerden ₂  e hatalı sınıflandırılanların sayısı ₁

biçiminde tanımlıdırlar. O halde hatalı sınıflandırılan birim sayılarını tespit etmeliyiz. Bunun için öncelikle sınıflandırma bölgelerini belirleyelim. Bu bölgeler





' 1

1 2 x y    ifadesi yardımıyla



 





 



' ₁ 1 1 2 1 2 ' ₁ 2 1 2 1 2 1 ( ): 2 1 ( ): 2 R y y R y y                  

biçiminde elde edilmektedir. Bu formüllerin örneklem değerlerini bulalım:

(2)









1 1 2 1 2 1 2 ˆ x x x x 4 1 1 1 3 1 1 3 2 3 3 pooled y l S x x x x            _ __{ }        Buradan ˆ 1



1 2



3 l   olduğu açıktır. Diğer yandan,

















1 1 2 1 2 1 ˆ x x x x 2 4 1 7 1 1 1 3 1 1 17 2 3 7 1 1 2 17 6 4.5 pooled m  S        _ _{  }         _{ }   

elde edilir. Buradan bölgeler 1 2 : 4.5 : 4.5 R y R y  

olarak elde edilir. Şimdi bu örneklemlerdeki birimlerden yanlış sınıflandırılanları bulalım:

(3)

X ₀₂₂ 1



1 2



3 5 4.5 ₁ 9 3 y    _{ }      halbuki 2 3 9          ₀₂₃ 1



1 2



4 2 4.5 ₂ 5 3 y    _{ }      Sınıflandırılan Kitle 1   ₂ Doğru Kitle 1  2 1 2  1 2 12 21 1 2 1 1 2 0.33 3 3 6 n n APER n n         elde edilir.

Şimdi  kitlesinden birinci gözlem ₁ '





11 2 12 x  atılsın. Bu durumda 1 4 3 10 8 H X _{ } _   , 1 3.5 x 9 H        , 2.5 1 1 1 10 3 H pooled S _{ }  _    , 1 , 10 1 1 1 2.5 8 H pooled S       





1 1 2 , ˆ ˆ HxH x H x H pooledxH y l_ _ _ _ S





1





1 2 , 1 2 1 ˆ x x x x 2 H H H pooled H m   S 

Kare uzaklığı x₁_H e göre

(4)

Kare uzaklığı x e göre ₂













' ₁ 2 2 , 2 x x x x x 10 1 2 4 1 2 4 12 7 1 2.5 12 7 8 10.3 H SH pooled H             _ _{ } _      

x_H den x₁_H’ e uzaklık, x₁_H den x ’ e uzaklıktan daha küçük olduğundan x₂ _H,  ’e 1 sınıflandırılır. Bu durumda doğru sınıflandırma yapılmıştır. Benzer biçimde,





















' 2 ' 2 ' 2 ' 1 ' 2 x 4 10 x 3 8 x 5 7 x 3 9 x 4 5 H H H H H               

sınıflandırma yapılır. Buradan n₁₂  ve 2 n₂₁  elde edilir. Böylece beklenen gerçek hata 1 oranının tahmini





12 21 1 2 2 1 ˆ _0.5 3 3 n n E AER n n     

  olarak elde edilir. Daha önce elde edilen

0.33

APER değeri, performansın iyimser ölçüsüdür. Örneklemin hacmi geniş olduğunda

APER ile E AERˆ





arasındaki fark çok büyük olmaz.

Örnek 24 : Bir hava yolu firmasını tercih eden yerli ( Kitlesi) ve yabancı (₁  Kitlesi) ₂ yolcuların iki özelliğine ilişkin kitle ortalama vektörleri ve ortak varyans-kovaryans matrisi

1 2 5 2 2 1 , 1 1 ve 1 1   _{ }   _{ }  _ _      

(5)

Çözüm 24 :

Prior olasılıklar verilmediğinden eşit kabul edilebilir.

Hatalı sınıflandırma maliyetleri verilmediğinden eşit kabul edilebilir.

Aynı varyans-kovaryans matrisine sahip iki normal kitle, eşit prior olasılık ve eşit hatalı sınıflandırma maliyetine sahip ise Minimum ECM kuralı Fisher sınıflandırma kuralına eşdeğerdir.

1

 : Yerli yolcu

2

 : Yabancı yolcu

Öncelikle sınıflandırma kuralını belirleyelim. Bu bölgeler





' 1 1 2

Y _  _ _ X _ifadesi yardımıyla aşağıdaki gibi elde edilir:









' 1 1 2 1 2 1 2 ' 1 1 3 0 1 2 3 3 Y l X X X X X X              _ __ _       



₁ ₂







3.5 1 1 15 ' 3 3 1 2 2 4 m l     _ _   Sınıflandırma kuralı : 0 01 02 15 3 3 4 y  x  x  ise x0 



x01 x02



'  e atanır. 1 0 01 02 15 3 3 4 y  x  x  ise x₀ 



x₀₁ x₀₂



'  ye atanır. ₂

 

0 4 3 '

x  için atama kuralından:

(6)

2 2 _' _{[3 3]} 2 1 3 ₉ 1 1 3 Y l l        _   _{  }      3 min 0.0668 2 2 OER TPM  __ _ _

    dir. (Teori dersinde elde edilmişti)

Örnek 25 :  ve ₁  sırasıyla ₂ N₂



₁,₁



ve N₂



₂,₂



kitleleri olsun. Kitle parametreleri

1 2 1 2 10 10 18 12 20 7 , , 15 25 12 32 ve 7 5   _{ }   _{ }  _ _  _  _         

şeklinde verilmiş olsun. c

 

1| 2 10 , c

 

2 |1 73 ve p₁ p₂ olduğu bilinmektedir. Sınıflandırma bölgelerini bulunuz ve x0'



30 35



gözlemi için atama yapınız. Çözüm 25 :    olduğundan sınıflandırma bölgeleri ₁ ₂









 

_{ }









 

_{ }

1 1 1 1 2 1 1 2 ₁ 1 ₂ 2 1 1 1 1 1 2 2 1 2 ₁ 1 ₂ 2 1 1| 2 1 : ' ' ' ln 2 2 |1 1| 2 1 : ' ' ' ln 2 2 |1 c p R x x x k c p c p R x x x k c p                          _ _                    _ _      





1 1 1 1 1 ₁ 2 2 ₂ 2 1 1 ln ' ' 2 2 k  _  _          

ile elde edilir.

(7)









1 2 -0.0240 -0.1650 1 : ' -4.0877 -10.8292 -158.4598 -0.1650 -0.3505 2 -0.0240 -0.1650 1 : ' -4.0877 -10.8292 -158.4598 -0.1650 -0.3505 2 R x x x R x x x    _ _        _ _    

eşitsizlikleri ile elde edilir.





0 0 0 -0.0240 -0.1650 1 ' -4.0877 -10.8292 -102.9105 -158.4598 -0.1650 -0.3505 2x x x    _ _     

olduğundan  ’e atanır. ₁

Örnek 26:  : üzerine binilerek kesme yapan araca sahip olanların grubunu ve ₁  : böyle ₂ araca sahip olmayanların grubunu göstersin. Bir satış kampanyasında en iyi satış profilini belirlemek için bu tür aleti üreten firmalar, x gelir₁ : ve x sahipolduguarazibüyüklügü₂ : verilerine bağlı bu tür araca sahip olan ve olmayan ailelerin sınıfıyla ilgilenmektedir. Her bir kitleden 12 birimlik rasgele örneklemler alınmış ve elde edilen değerler aşağıdadır:

(8)

1 31.6585 -1.0432 0.0328 0.0378 -1.0432 0.9071 0.0378 1.1458 pooled pooled S _ _ ve S _ _    

olsun. Buna göre x0'



27 10



için atama yapınız. Çözüm 26 :









' 1 1 2 1 2 1 2 0.0328 0.0378 8.23 0.92 0.0378 1.1458 0.3049x +1.3649x pooled y l x x x S x x x          _ __{ }           Buradan _l'_



_0.3049 _1.3649



 olduğu açıktır. Diğer yandan,













1 1 2 1 2 1 ˆ 2 46.55 1 0.3049 1.3649 19.2 2 20.2005 pooled m_ x _x S x _x    _ _       

elde edilir. Buradan bölgeler 1 2 : 20.2005 : 20.2005 R y R y   olarak elde edilir.





' 0 0 27 0.3049 1.3649 21.8824 20.2005 10 y l x   _{ }   

(9)

Örnek 27 :

Aşağıda verilen değerlere göre minimum ECM yöntemini kullanarak x gözlemini ₀ sınıflandırınız. Doğru kitle 1   ₂ Sınıflandırılankitle 1  0 c

 

1| 2 6 2  c

_{ }

2 |1 5 0 1 0.3 p  p₂ 0.7

 

0 1 0.8 f x  f x2

 

0 0.5 Çözüm 27 : k=1 için p f x c2 2

   

0 1| 2 0.7*0.5*6 2.1 k=2 için p f x c_{1 1}

   

₀ 2 |1 0.3*0.8*5 1.2

En küçük değer k=2 için karşımıza çıktığından x , ₀  ’ye atanır. ₂

Örnek 28:  ve 1  kitleleri 2 Uniform(0,1) ve Uniform(1,2) olmak üzere, bu iki gruptan birer gözlem alınsın ve sırasıylaX ,₁ X ile gösterilsin. Prior olasılıklar ₂ p₁  p₂ olsun. Sınıflandırma kuralı ve bölgeler aşağıdaki gibi tanımlansın:

1 R : 1 2 2 X X X   2 R : 1 2 2 X X X  

Bu durumda AER (actual error rate) ve E AER





’i hesaplayınız.

Çözüm 28: 1 2

2

X X

(10)



1





2



1 1 | | 2 2 (1 ) _, ₁ 2 ( 1) _, ₁ 2 1 1 2 AER P X C X P X C X C _C C _C C         _    _     

elde edilir. Buradan 1 ₁ 1 1 2 ₁

2 2 2

X X

AER C    bir rasgele değişkendir.

Bu rasgele değişkeni GAER ile gösterelim. G rasgele değişkeninin olasılık yoğunluk fonksiyonu





1 8 1 4 , 0 ( ) 4 0 , . . G g g f g d y  _ _{ }    

olup buradan E G

 

E AER





1/ 12 bulunur.

Örnek 29 :  ve ₁  sırasıyla ₂ N₂



₁,



ve N₂



₂,



kitleleri olsun. Kitle parametreleri

1 2 2 0 1 0 , 5 0 ve 0 5   _{ }   _{ }  _ _      

şeklinde verilmiş olsun. (ÖDEV) .Buna göre

a) Fisher’in lineer diskriminant fonksiyonunun elde ediniz.









1 1 1 1 2 1 2 ' ' 1 0 2 5 0 1/ 5 2 Y l X X X X X X             _ __ _      

b) Y’nin iki grup için ortalamalarını bulunuz.