• Sonuç bulunamadı

REGRESYONDA GİZLENMİŞ DIŞ DEĞER BULMA

N/A
N/A
Protected

Academic year: 2021

Share "REGRESYONDA GİZLENMİŞ DIŞ DEĞER BULMA "

Copied!
7
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

REGRESYONDA GİZLENMİŞ DIŞ DEĞER BULMA

n sayıda orijinal x

i1

, x

i2

,..., x

ik

( i  1, 2,..., ) n veri noktalarının tümünü içeren en küçük dış bükey kümesi, bağımsız değişken kabuğu (RVH) olarak tanımlansın.

( ' )

1

'

HX X X

X matrisinin köşegen elemanları h , gizlenmiş dış değer bulmanın

ii

saptanmasında oldukça kullanışlıdır.

h 'nin en büyük değerine sahip olan nokta

ii

h

max

olmak üzere x noktalar kümesi aşağıdaki eşitsizliği sağlar.

 

1 max

' '

x X X

xh

Bu eşitsizlik, RVH'ın içindeki tüm noktaları kapsayan bir elipsoittir.

Eğer x

0

'   1, x

01

, x

02

,..., x

0k

 noktasının kestirimi ya da ön kestirimi ile ilgileniliyorsa bu noktanın RVH'daki yeri aşağıda verilen eşitlikte elde edilen noktadır :

 

1

00 0

' '

0

hx X X

x

h

00

h

max

olan noktalar RVH'yi kapsayan noktalar dışındadır ve dış değer bulma noktalarıdır.

h

00

h

max

ise bu noktalar elipsoidin ve büyük olasılıkla RVH'nin içindedir.

Genel olarak h 'ın çok küçük değerinde,

00

x noktası

0

x uzayının merkezine yaklaşır.

Örnek 2.12 Gizlenmiş Dış Değer Bulma - Teslim Süresi Verileri

TABLO 2.7 Teslim Süresi Verileri İçin h Değerleri

ii

(2)

Gözlem, i Teslim hacmi, x

i1

Mesafe, x

i2

h

ii

1 7 560 0.10180 2 3 220 0.07070 3 3 340 0.09874 4 4 80 0.08538 5 6 150 0.07501 6 7 330 0.04287 7 2 110 0.08180 8 7 210 0.06373 9 30 1460 0.49829 = h

max

10 5 605 0.19630 11 16 688 0.08613 12 10 215 0.11366 13 4 255 0.06113 14 6 462 0.07824 15 9 448 0.04111 16 10 776 0.16594 17 6 200 0.05943 18 7 132 0.09626 19 3 36 0.09645 20 17 770 0.10169 21 10 140 0.16528 22 26 810 0.39158 23 9 450 0.04126 24 8 635 0.12061 25 4 150 0.06664

9. gözlem en büyük h değerine sahip olduğundan bu gözlemin incelenmesi gerekmektedir.

ii

Aşağıdaki dört noktada kestirim ve ön kestirimin ele almak istenildiği varsayılsın:

TABLO 2.8 Dış Değer Bulma Noktalarının Belirlenmesi

Nokta x

10

x

20

h

00

a 8 275 0.05346

b 20 250 0.58917

c 28 500 0.89874

d 8 1200 0.86736

(3)

a noktası için h

00

 0.05346  h

max

 0.49829 olduğundan bu nokta bir ara değer bulma noktasıdır. Geriye kalan b , c ve d noktalarının tümü dış değer bulma noktalarıdır.

( h

00

h

max

)

STANDARTLAŞTIRILMIŞ REGRESYON KATSAYILARI

Genellikle regresyon katsayılarını doğrudan karşılaştırmak 

j

'nin büyüklüğünün x bağımsız

j

değişkeninin ölçüm birimini yansıtması sebebiyle zordur.

j

regresyon katsayısının birimi, " y 'nin birimi / x 'nin birimi"dir. Bu nedenle zaman zaman

j

bağımsız ya da yanıt değişkenleri ölçeklendirerek "birimsiz regresyon katsayıları" oluşturulur.

Birimsiz regresyon katsayıları çoğunlukla "standartlaştırılmış regresyon katsayıları" olarak adlandırılır.

 Birim Normal Ölçekleme

ij ij j

, 1, 2,..., , 1, 2,...,

j

x x

z i n j k

s

    (2.35)

ve

i* i

, 1, 2,...,

y

y y

y i n

s

   (2.36)

olmak üzere x bağımsız değişkeninin varyansı,

j

2

2 1

( )

1

n

ij j

i j

x x

s n

 

olup yanıt değişkeninin örneklem varyansı ise

2

2 1

( )

1

n i i y

y y

s n

 

olarak kullanılır.

Bu yeni değişkenler kullanılarak regresyon modeli,

y

i*

b z

1 1i

b z

2 2i

  ... b z

k ik

 

i

, i  1, 2,...., n (2.37)

olup bağımsız ve yanıt değişkenlerinin x ve y 'den çıkartılarak merkezileştirilmesi, kesim

j

noktasını modelden kaldırır. ( b 'ın en küçük kareler kestirimi,

0

b ˆ  y

*

 'dır) 0

(4)

b vektörünün en küçük kareler kestiricisi,

b ˆ Z Z '

1

Z y '

*

(2.38)

 Birim Uzunlukta Ölçekleme Bu ölçekleme,

 , 1, 2,..., , 1, 2,...,

ij j

 

ij

jj

x x

w i n j k

s (2.39)

ve

i0 i

, 1, 2,...,

T

y y

y i n

SS

   (2.40)

olarak verilir.

Burada,

2

1

( )

n

jj ij j

i

S x x

   toplamı, x bağımsız değişkenleri için düzeltilmiş kareler

j

toplamıdır. Bu ölçeklendirmede, her bir yeni w bağımsız değişkeni,

j

w

j

 ortalamaya 0

ve  

2

1

1

n

ij j

i

w w

 

 uzunluğuna sahiptir.

Bu değişkenler ile oluşturulan regresyon modeli,

0 1 1 2 2

... , 1, 2,...,

i i i k ik i

yb wb w   b w   in olup en küçük kareler regresyon vektörü,

b ˆ W W '

1

W y '

0

(2.41) olarak kullanılır.

Birim uzunluk ölçeklemesinde, W W ' matrisi bir korelasyon matrisidir.

(5)

...

...

...

'

... ... ... ... ...

...

k k k

k k k

r r r

r r r

r r r

W W

r r r

 

 

 

 

  

 

 

 

12 13 1

12 23 2

13 23 3

1 2 3

1 1

1

1

Burada,

( )( )

n

ui i uj j

i ij ij

ii jj ii jj

x x x x

r S

S S S S

 

  

1

x ve

i

x bağımsız değişkenleri arasındaki basit korelasyondur. Benzer şekilde

j

W y '

0

,

1 2 0

'

3

...

 

 

 

 

  

 

 

 

 

y y y

ky

r r

W y r

r

olup burada,

1

( )( )

n

uj j u

u jy iy

jj T jj T

x x y y

r S

S SS S SS

 

  

x bağımsız değişkeni ve

j

y yanıt değişkeni arasındaki basit korelasyondur.

*** Eğer birim normal ölçekleme kullanılırsa ' Z Z matrisi, W W matrisiyle, '

' ( ) '

Z Zn  1 W W biçiminde yakından ilişkilidir.

Her iki yöntem de aynı birimsiz ˆb regresyon katsayıları kümesini verir. ˆb regresyon katsayıları çoğunlukla standartlaştırılmış regresyon katsayıları olarak adlandırılır.

Orijinal ve standartlaştırılmış regresyon katsayıları arasındaki ilişki,

ˆ

j

ˆ

j T

, , ,...,

jj

b SS j k

  S  1 2 (2.42)

(6)

olup ayrıca ˆ

k

ˆ

j j j

y x

 

  

0

1

olarak kullanılır.

Birçok bilgisayar programı, ( ' ) X X

1

matrisindeki yuvarlama hatalarından kaynaklanan problemleri azaltmak için bu ölçeklendirmeyi kullanır. b , diğer

j

x , i

i

 bağımsız değişkenleri j modelde iken x , bağımsız değişkenin etkisini ölçtüğünden bağımsız değişkenin değer

j

aralığından etkilenmektedir.

Sonuç olarak, x bağımsız değişkeninin göreli öneminin bir ölçüsü olarak

j

b 'nin büyüklüğünü

j

kullanmak yanıltıcı olabilir.

Örnek 2.13 Teslim Süresi Verileri

5784.5426

T

SS S

11

 1136.5600 S

1y

 2473.3440 S

22

 2,537,935.0330

2y

108, 038.6019

S S

12

 44, 266.6800 olmak üzere birim uzunlukta ölçekleme kullanılarak,

12 12

11 22

44, 266.6800

0.824215 (1136.5600)(2,537,935.0303)

r S

S S

  

1 1

11

2473.3440

0.964615 (1136.5600)(5784.53426)

y y

T

r S

S SS  

2 2

22

108,038.6019

0.891670 (2,537,935.0303)(5784.5426)

y y

T

r S

S SS  

elde edilir.

Korelasyon matrisi,

1 0.824215

' 0.824215 1

W W  

  

 

olup standartlaştırılmış regresyon katsayıları,

(7)

1 1

2

ˆ 1 0.824215 0.964615 0.716267

ˆ 0.824215 1 0.891670 0.301311

b b

    

  

 

       

       

 

olarak bulunur.

Kestirim modeli, y ˆ

0

 0.716267 w

1

 0.301311 w

2

olup standartlaştırılmış w bir birim arttığında

1

standartlaştırılmış ˆy süre değeri 0.716267 birim artar. Standartlaştırılmış

0

w , bir birim arttığında

2

ise standartlaştırılmış ˆy süre değeri 0.301311 birim artar.

0

Standartlaştırılmış değişkenler yoluyla teslim süresi üzerinde, teslim edilen ürün miktarının mesafeden çok daha önemli bir etkiye sahip olduğu görülmektedir. Eğer teslim miktarı ve mesafe değerlerinin farklı bir aralığı ile başka bir örneklem kullanılsaydı bu bağımsız değişkenlerin önemleri ile ilgili farklı sonuçlar elde edilebilirdi.

 

Referanslar

Benzer Belgeler

Bu noktada bazı doğal kaynakların bedavalık dolayısıyla aşırı kullanılması, ekonomik faaliyetler sonucu ortaya çıkan negatif dışsallıklar, tekel sahiplerinin

Yapay sinir a˘gları modeli en ba¸sarılı performan- sını F1 öznitelik kümesi kullanılarak e˘gitildi˘ginde verirken, Lineer Regresyon ve Destekçi Vektör Makinesi modelleri F2

sahip olduğu öğrenilmiş şey değil, çoğu zaman delilik sınırlarında gezinen doğal bir yaratıcılık biçimidir.. Marcel Duchamp, Çeşme (1917)

Eğer kaynak değişken değilse ve  yeteri kadar uzun bir süre ise, bu iki Fourier katsayısı (yani genlik) birbirine eşit olmalıdır ancak genellikle A(  )

• “Taşıma ödenmiş olarak….” terimi, satıcının malları bizzat kendisinin seçtiği ve anlaşma yaptığı taşıyıcıya, malların, ihracı ile ilgili gümrük

At the narrowest intra-row spacing (5 cm) and widest intra-row spacing (12.5 cm) statistically similar and significantly highest TSS was recorded from Adama Red, Melkam

«Dil devrimi, çağdaş bir millet olma ve halkçı bir devlet kurma çabalarımızın en başarılısı sayı­ labilir. Bu devrim bir dil yerine başka bir dil

ABSTRACT: In this study, effects of different yarn structures and properties, produced with ring, compact, open-end rotor and vortex spinning systems, on the color efficiency