12. HAFTA
Örnek 23 : ve 1 kitlelerinden alınan p=2 için, 2 n1n2 birimlik rasgele örneklemler 3 ve betimsel istatistikler aşağıda verilmiştir. Eşit prior ve eşit hatalı sınıflandırma maliyetleri için hata oranı tahminlerini elde ediniz.
1 2 4 3 12 10 8 X , 1 3 x 10 , 1 1 1 1 4 S 2 5 3 4 7 9 5 X , 2 4 x 7 , 2 1 1 1 4 S
Çözüm 23 : Hata oranı tahmini 12 21 1 2 n n APER n n
formülü ile elde edilir. Burada
12
n : deki birimlerden 1 ye hatalı sınıflandırılanların sayısı 2
21
n : deki birimlerden 2 e hatalı sınıflandırılanların sayısı 1
biçiminde tanımlıdırlar. O halde hatalı sınıflandırılan birim sayılarını tespit etmeliyiz. Bunun için öncelikle sınıflandırma bölgelerini belirleyelim. Bu bölgeler
' 11 2 x y ifadesi yardımıyla
' 1 1 1 2 1 2 ' 1 2 1 2 1 2 1 ( ): 2 1 ( ): 2 R y y R y y biçiminde elde edilmektedir. Bu formüllerin örneklem değerlerini bulalım:
1 1 2 1 2 1 2 ˆ x x x x 4 1 1 1 3 1 1 3 2 3 3 pooled y l S x x x x Buradan ˆ 1
1 2
3 l olduğu açıktır. Diğer yandan,
1 1 2 1 2 1 ˆ x x x x 2 4 1 7 1 1 1 3 1 1 17 2 3 7 1 1 2 17 6 4.5 pooled m S elde edilir. Buradan bölgeler 1 2 : 4.5 : 4.5 R y R y
olarak elde edilir. Şimdi bu örneklemlerdeki birimlerden yanlış sınıflandırılanları bulalım:
X 022 1
1 2
3 5 4.5 1 9 3 y halbuki 2 3 9 023 1
1 2
4 2 4.5 2 5 3 y Sınıflandırılan Kitle 1 2 Doğru Kitle 1 2 1 2 1 2 12 21 1 2 1 1 2 0.33 3 3 6 n n APER n n elde edilir.Şimdi kitlesinden birinci gözlem 1 '
11 2 12 x atılsın. Bu durumda 1 4 3 10 8 H X , 1 3.5 x 9 H , 2.5 1 1 1 10 3 H pooled S , 1 , 10 1 1 1 2.5 8 H pooled S
1 1 2 , ˆ ˆ HxH x H x H pooledxH y l S
1
1 2 , 1 2 1 ˆ x x x x 2 H H H pooled H m S Kare uzaklığı x1H e göre
Kare uzaklığı x e göre 2
' 1 2 2 , 2 x x x x x 10 1 2 4 1 2 4 12 7 1 2.5 12 7 8 10.3 H SH pooled H xH den x1H’ e uzaklık, x1H den x ’ e uzaklıktan daha küçük olduğundan x2 H, ’e 1 sınıflandırılır. Bu durumda doğru sınıflandırma yapılmıştır. Benzer biçimde,
' 2 ' 2 ' 2 ' 1 ' 2 x 4 10 x 3 8 x 5 7 x 3 9 x 4 5 H H H H H sınıflandırma yapılır. Buradan n12 ve 2 n21 elde edilir. Böylece beklenen gerçek hata 1 oranının tahmini
12 21 1 2 2 1 ˆ 0.5 3 3 n n E AER n n olarak elde edilir. Daha önce elde edilen
0.33
APER değeri, performansın iyimser ölçüsüdür. Örneklemin hacmi geniş olduğunda
APER ile E AERˆ
arasındaki fark çok büyük olmaz.Örnek 24 : Bir hava yolu firmasını tercih eden yerli ( Kitlesi) ve yabancı (1 Kitlesi) 2 yolcuların iki özelliğine ilişkin kitle ortalama vektörleri ve ortak varyans-kovaryans matrisi
1 2 5 2 2 1 , 1 1 ve 1 1
Çözüm 24 :
Prior olasılıklar verilmediğinden eşit kabul edilebilir.
Hatalı sınıflandırma maliyetleri verilmediğinden eşit kabul edilebilir.
Aynı varyans-kovaryans matrisine sahip iki normal kitle, eşit prior olasılık ve eşit hatalı sınıflandırma maliyetine sahip ise Minimum ECM kuralı Fisher sınıflandırma kuralına eşdeğerdir.
1
: Yerli yolcu
2
: Yabancı yolcu
Öncelikle sınıflandırma kuralını belirleyelim. Bu bölgeler
' 1 1 2Y X ifadesi yardımıyla aşağıdaki gibi elde edilir:
' 1 1 2 1 2 1 2 ' 1 1 3 0 1 2 3 3 Y l X X X X X X
1 2
3.5 1 1 15 ' 3 3 1 2 2 4 m l Sınıflandırma kuralı : 0 01 02 15 3 3 4 y x x ise x0
x01 x02
' e atanır. 1 0 01 02 15 3 3 4 y x x ise x0
x01 x02
' ye atanır. 2
0 4 3 'x için atama kuralından:
2 2 ' [3 3] 2 1 3 9 1 1 3 Y l l 3 min 0.0668 2 2 OER TPM
dir. (Teori dersinde elde edilmişti)
Örnek 25 : ve 1 sırasıyla 2 N2
1,1
ve N2
2,2
kitleleri olsun. Kitle parametreleri1 2 1 2 10 10 18 12 20 7 , , 15 25 12 32 ve 7 5
şeklinde verilmiş olsun. c
1| 2 10 , c
2 |1 73 ve p1 p2 olduğu bilinmektedir. Sınıflandırma bölgelerini bulunuz ve x0'
30 35
gözlemi için atama yapınız. Çözüm 25 : olduğundan sınıflandırma bölgeleri 1 2
1 1 1 1 2 1 1 2 1 1 2 2 1 1 1 1 1 2 2 1 2 1 1 2 2 1 1| 2 1 : ' ' ' ln 2 2 |1 1| 2 1 : ' ' ' ln 2 2 |1 c p R x x x k c p c p R x x x k c p
1 1 1 1 1 1 2 2 2 2 1 1 ln ' ' 2 2 k ile elde edilir.
1 2 -0.0240 -0.1650 1 : ' -4.0877 -10.8292 -158.4598 -0.1650 -0.3505 2 -0.0240 -0.1650 1 : ' -4.0877 -10.8292 -158.4598 -0.1650 -0.3505 2 R x x x R x x x eşitsizlikleri ile elde edilir.
0 0 0 -0.0240 -0.1650 1 ' -4.0877 -10.8292 -102.9105 -158.4598 -0.1650 -0.3505 2x x x olduğundan ’e atanır. 1
Örnek 26: : üzerine binilerek kesme yapan araca sahip olanların grubunu ve 1 : böyle 2 araca sahip olmayanların grubunu göstersin. Bir satış kampanyasında en iyi satış profilini belirlemek için bu tür aleti üreten firmalar, x gelir1 : ve x sahipolduguarazibüyüklügü2 : verilerine bağlı bu tür araca sahip olan ve olmayan ailelerin sınıfıyla ilgilenmektedir. Her bir kitleden 12 birimlik rasgele örneklemler alınmış ve elde edilen değerler aşağıdadır:
1 31.6585 -1.0432 0.0328 0.0378 -1.0432 0.9071 0.0378 1.1458 pooled pooled S ve S
olsun. Buna göre x0'
27 10
için atama yapınız. Çözüm 26 :
' 1 1 2 1 2 1 2 0.0328 0.0378 8.23 0.92 0.0378 1.1458 0.3049x +1.3649x pooled y l x x x S x x x Buradan l'
0.3049 1.3649
olduğu açıktır. Diğer yandan,
1 1 2 1 2 1 ˆ 2 46.55 1 0.3049 1.3649 19.2 2 20.2005 pooled m x x S x x elde edilir. Buradan bölgeler 1 2 : 20.2005 : 20.2005 R y R y olarak elde edilir.
' 0 0 27 0.3049 1.3649 21.8824 20.2005 10 y l x Örnek 27 :
Aşağıda verilen değerlere göre minimum ECM yöntemini kullanarak x gözlemini 0 sınıflandırınız. Doğru kitle 1 2 Sınıflandırılankitle 1 0 c
1| 2 6 2 c
2 |1 5 0 1 0.3 p p2 0.7
0 1 0.8 f x f x2
0 0.5 Çözüm 27 : k=1 için p f x c2 2
0 1| 2 0.7*0.5*6 2.1 k=2 için p f x c1 1
0 2 |1 0.3*0.8*5 1.2En küçük değer k=2 için karşımıza çıktığından x , 0 ’ye atanır. 2
Örnek 28: ve 1 kitleleri 2 Uniform(0,1) ve Uniform(1,2) olmak üzere, bu iki gruptan birer gözlem alınsın ve sırasıylaX ,1 X ile gösterilsin. Prior olasılıklar 2 p1 p2 olsun. Sınıflandırma kuralı ve bölgeler aşağıdaki gibi tanımlansın:
1 R : 1 2 2 X X X 2 R : 1 2 2 X X X
Bu durumda AER (actual error rate) ve E AER
’i hesaplayınız.Çözüm 28: 1 2
2
X X
1
2
1 1 | | 2 2 (1 ) , 1 2 ( 1) , 1 2 1 1 2 AER P X C X P X C X C C C C C elde edilir. Buradan 1 1 1 1 2 1
2 2 2
X X
AER C bir rasgele değişkendir.
Bu rasgele değişkeni GAER ile gösterelim. G rasgele değişkeninin olasılık yoğunluk fonksiyonu
1 8 1 4 , 0 ( ) 4 0 , . . G g g f g d y olup buradan E G
E AER
1/ 12 bulunur.Örnek 29 : ve 1 sırasıyla 2 N2
1,
ve N2
2,
kitleleri olsun. Kitle parametreleri1 2 2 0 1 0 , 5 0 ve 0 5
şeklinde verilmiş olsun. (ÖDEV) .Buna göre
a) Fisher’in lineer diskriminant fonksiyonunun elde ediniz.
1 1 1 1 2 1 2 ' ' 1 0 2 5 0 1/ 5 2 Y l X X X X X X b) Y’nin iki grup için ortalamalarını bulunuz.