• Sonuç bulunamadı

Regresyon ve Korelasyon Analizi

N/A
N/A
Protected

Academic year: 2022

Share "Regresyon ve Korelasyon Analizi"

Copied!
24
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

Analizi

(2)

Regresyon Analizi

(3)

Regresyon analizi, aralarında sebep-sonuç ilişkisi bulunan iki veya daha fazla değişken arasındaki ilişkiyi belirlemek ve bu ilişkiyi kullanarak o konu ile ilgili tahminler (estimation) ya da kestirimler (prediction) yapabilmek amacıyla yapılır. Doğada birçok olayda sebep-sonuç ilişkisine rastlamak mümkündür.

Örnek: Sebep Sonuç

Gelir Harcama

Yaş Boy

Gübre Verim

Yem miktarı Süt miktarı

Çalışma süresi Alınan not

Bu analiz tekniğinde iki (basit regresyon) veya daha fazla değişken (çoklu

regresyon) arasındaki ilişki açıklamak için matematiksel bir model kullanılır ve bu model regresyon modeli olarak adlandırılır.

Bu kısımda anlaşılması daha kolay olduğu için basit regresyon analizi anlatılmıştır.

(4)

Basit regresyon modeli

Y=a+bX+e

şeklinde bir bağımlı ve bir de bağımsız değişken içeren bir modeldir. Burada Y; bağımlı (sonuç) değişken olup belli bir hataya sahip olduğu varsayılır.

X; bağımsız (sebep) değişkeni olup hatasız ölçüldüğü varsayılır.

a; sabit olup X=0 olduğunda Y’nin aldığı değerdir.

b ise regresyon katsayısı olup, X’in kendi birimi cinsinden 1 birim değişmesine karşılık Y’de kendi birimi cinsinden meydana gelecek değişme miktarını ifade eder.

e; tesadüfi hata terimi olup ortalaması sıfır varyansı s2 olan normal dağılış gösterdiği varsayılır. Bu varsayım parametre tahminleri için değil

katsayıların önem kontrolleri için gereklidir.

(5)

Parametrelerin (Katsayıların) Tahmini

Bir regresyon modeli oluşturulurken genelde en-küçük kareler ve en büyük olabilirlik (maximum likelihood) teknikleri olarak bilinen iki yaklaşımdan birisi kullanılır. Eğer hata teriminin normal dağılım göstermesi şeklinde bir

varsayım varsa en büyük olabilirlik, hata teriminin dağılışı ile ilgili herhangi bir varsayım söz konusu değilse en-küçük kareler tekniği kullanılarak

parametreler tahmin edilir.

En-küçük kareler tekniği kullanılarak parametrelerin nasıl tahmin edildiğini örnek bir veri grubu üzerinde kısaca özetleyelim.

Boy(cm) (X) Çevre(cm) (Y)

9 5

15 6

6 4

24 12

32 19

(6)

Tabloda verilen X ve Y değişkenlerine ait beş gözlem çifti, koordinat eksenlerine yerleştirildiğinde elde edilen serpme diyagramının Şekil (a)’daki grafik elde edilir.

0 4 8 12 16 20

0 5 10 15 20 25 30 35

X Y

0 4 8 12 16 20

0 5 10 15 20 25 30 35

X Y

(a) (b)

Şekil (a)‘da verilen noktaları temsil eden regresyon doğrusu

oluşturulursa Şekil (b) elde edilir. Uydurulan regresyon doğrusu ile gözlem noktaları arasındaki fark hata (e) olarak isimlendirilir.

Regresyon doğrusuna ait parametreler öyle tahmin edilmelidir ki;

doğru ile gözlem noktaları arasındaki fark (hata) en az olsun. Bunu

sağlayacak teknik ise en-küçük kareler tekniğidir

(7)

Yukarıda verilen basit regresyon modelinden e çekilirse yani;

i

i

Y X

X

Y  a  b  e  e   a  b

olur. Burada hata teriminin tüm gözlemler için kareleri alınır ve toplanırsa (Hata Kareler Toplamı (HKT);

2 1

1

2

(

i

)

n

i

i n

i

i

Y a b X

e    

olur.

En-küçük kareler tekniğinde, HKT’nı en küçük yapabilmek için yukarıdaki ifadenin önce a‘ya göre türevini alıp sıfıra eşitleyerek

0 )

(

0

1

2 1

2

 

 

  

a b a a

e

n

i

i n

i

i

Y X

  

n

i i n

i

i

Y

X n

1 1

ˆ b ˆ

a

(Normal denklem 1)

(8)

daha sonra da b’ya göre türevini alıp sıfıra eşitleyerek

şeklinde normal denklemler olarak isimlendirilen iki bilinmeyenli iki denklem elde edilir. Normal denklemlerin iki bilinmeyenli denklerin çözümünde kullanılan

değişik yöntemlerden birisi kullanılarak çözümü yapıldığında;

0 )

(

0

1

2 1

2

 

 

  

b b a b

e

n

i

i n

i

i

Y X

   

n

i

i i n

i

i n

i

i

X X Y

X

1 1

2 1

ˆ b ˆ

a

(Normal denklem 2)

Sxx Sxy n

X X

n Y X

Y X

n

i

n

i

i i

n

i

n

i

n

i i i

i i

  

  

1 1

2 2

1 1 1

/ ) (

/ ) )(

ˆ (

b

(9)

ve

eşitlikleri elde edilir. Bu eşitlikler ile regresyon doğrusu denkleminde yer alan ve HKT’nı en az yapacak parametreler tahmin edilir. Böylece, en-küçük kareler

regresyon doğrusu denklemi

X n Y

X n

Y

n

i

i n

i

i

b b

a ˆ  

1

ˆ

1

  ˆ

X i

Y ˆ  a ˆ  b ˆ

(10)

Regresyon Katsayısının Önem Testi:

Hipotezler Ho:

b

=0

Hı :

b

≠0

Kullanılacak test istatistiği

/2 2, - n ˆ

t

~ ˆ

a b

b b

tS  olup burada;

xx xx xy

yy xx

x y

S

n S

S S

S

S S

2.

[ ( )

2

/ ] /( 2 )

ˆ

 

b

(11)

Örnek: Bir balık türü için balığın boyu(cm) ve vücut çevresine (cm) ait değerler aşağıdaki gibidir. Balığın boyu ile vücut çevresi

arasındaki ilişkinin doğrusal bir ilişki olduğunu varsayarak

Bu ilişkiyi açıklayan regresyon modelini oluşturunuz ve regresyonun önem testini yapınız

Boy(cm) (X) Çevre(cm) (Y) XY X

2

Y

2

9 5 45 81 25

15 6 90 225 36

6 4 24 36 16

24 12 288 576 144

32 19 608 1024 361

(12)

Çözüm:

Boy(cm) (X) Çevre(cm) (Y) XY X

2

Y

2

9 5 45 81 25

15 6 90 225 36

6 4 24 36 16

24 12 288 576 144

32 19 608 1024 361

86 46 1055 1942 582

57 . 8 0 . 462

8 . 263 5

/ 86 1942

5 / 46

* 86 1055 /

) (

/ ) )(

ˆ (

2

1 1

2 2

1 1 1

 

 

  

  

n

i

n

i i i

n

i

n

i

n

i i i

i i

xx xy

n X

X

n Y X

Y X S

b S

604 . 5 0

* 86 57 . 5 0

ˆ 46

ˆ

Y

b

X    

a

Böylece, en-küçük kareler regresyon doğrusu;

ˆ

(13)

Regresyon Katsayısının Önem Testi:

Hipotezler Ho:

b

=0

Hı :

b

≠0

a=0.01

31 . 0779 7

. 0

0 57 . ˆ 0

ˆ

 

 

b

b b t S

0779 .

8 0 . 462

) 2 5 /(

] 8 . 462 /

) 8 . 263 ( 8 . 158 ) [

2 /(

] /

) (

[

2 2

ˆ

  

 

 

xx xx xy

yy

S

n S

S S

b

S

8 . 158 5

/ 46 582

/

2

1

2

1

2

   

 

 

  

n

i

n

i i i

yy

Y Y n

S

> t

5-2,0.01/2

=t

3,0.005

=5.841 olduğundan Ho

RED edilir.

(14)

Korelasyon Analizi

İki değişken arasındaki ilişkinin derecesini ve yönünü belirlemek amacıyla kullanılan istatistik yöntemlerden birisidir. Değişkenlerin bağımlı veya bağımsız olması dikkate alınmaz. Değişik şekillerde hesaplanan ve değişik amaçlar için kullanılan Pearson korelasyon

katsayısı, Canonical korelasyon katsayısı, kısmi korelasyon katsayısı gibi farklı isimler alan korelasyon katsayıları vardır. Bunlardan Pearson

korelasyon katsayısı, r ile gösterilir ve

formülü ile hesaplanır. Korelasyon katsayısı -1 ile +1 arasında değişen değerler alır (-1≤ r ≤+1). . Katsayı, ilişkinin olmadığı

durumda 0, tam ve kuvvetli bir ilişki varsa 1, ters yönlü ve tam bir ilişki varsa -1 değerini alır.





 

 







 

 



 

 

  

n

i

n

i i i

n

i

n

i i i

n

i

n

i

n

i i i

i i

n Y

Y n

X X

n Y X

Y X r

1

2

1 2

1

2

1 2

1 ! 1

/ /

/ ) )(

(

YY XX

XY

S S

= S

(15)

Aralarındaki ilişkinin derecesi araştırılan değişkenlere ait gözlemler serpme diyagramında incelendiğinde, noktaların dağılımına göre korelasyon

katsayısının alabileceği değerler Şekilde gösterilmiştir.

(16)

Korelasyon katsayısının yorumunu, tam değerler dışında ara değerler için yapmak oldukça güçtür. Ara değerler için katsayı değerlendirirken, örnek gözlem sayısı (n) oldukça önemlidir. Çok fazla gözleme dayanan değerlendirmelerde 0.25'e kadar düşmüş bir korelasyon katsayısı bile anlamlı sayılabilmektedir. Fakat az sayıda, 10-15 gözleme dayanan değerlendirmelerde korelasyon katsayısının 0.71 üstünde olması beklenir. Populasyona göre normal sayılacak kadar bir gözlem sayısı alınarak bakılmış gözlem grupları için

genellikle, 0-0.49 arasında ise korelasyon zayıf, 0.5-0.74 arasında ise orta derecede, 0.75-1 arasında ise kuvvetli ilişki vardır

denilmektedir. Basit korelasyon analizinden söz edilebileceği gibi,

çoklu korelasyon analizi yapmak da mümkündür.

(17)

Korelasyon Katsayısının Önem Testi:

Hipotezler Ho:

r

=0

Hı :

r

≠0

Kullanılacak test istatistiği

/2 2, -

t

n

~

a

r S

r

tr  olup burada;

2 1

2

 

n

S

r

r

(18)

Örnek: Bir balık türü için balığın boyu(cm) ve vücut çevresine (cm) ait değerler aşağıdaki gibidir. Balığın boyu ile vücut çevresi

arasındaki ilişkinin doğrusal bir ilişki olduğunu varsayarak Korelasyon katsayısını hesaplayarak önem testini yapınız.

Boy(cm) (X) Çevre(cm) (Y) XY X

2

Y

2

9 5 45 81 25

15 6 90 225 36

6 4 24 36 16

24 12 288 576 144

32 19 608 1024 361

86 46 1055 1942 582

(19)

Çözüm

Korelasyon katsayısı;

973 .

8 0 . 158

* 8 . 462

8 .

263 

YY XX

XY

S S

r S

Balığın boyu ile çevresi arasında % 97.3’lük pozitif bir ilişki vardır. Bir diğer ifade ile balığın boyu arttıkça, çevresi de artmaktadır.

Korelasyon Katsayısının Önem Testi:

Hipotezler Ho: r=0 Hı : r≠0

a=0.01

299 .

1333 7 .

0

973 .

0 973

. 0 1

0 973 .

0

2

 

 

  S

r

t r r > t

5-2,0.01/2

=t

3,0.005

=5.841

olduğundan Ho RED edilir.

(20)

Örnek: İneğin günlük yediği yem(kg) ile verdiği süt(kg) arasında bir ilişki olup olmadığını araştırmak amacıyla yapılan bir denemeden elde edilen veriler aşağıdaki gibidir.

a) Bu ilişkiyi açıklayan regresyon modelini oluşturunuz ve regresyonun önem testini yapınız

b) Korelasyon katsayısını hesaplayarak önem testini yapınız.

Yem

Miktarı.(kg) Verdiği Süt Miktarı (kg)

5 12

7 18

9 19

10 22

8 20

6 13

11 25

(21)

Yem

Miktarı.(kg) Verdiği Süt

Miktarı (kg) XY X

2

Y

2

5 12 60 25 144

7 18 126 49 324

9 19 171 81 361

10 22 220 100 484

8 20 160 64 400

6 13 78 36 169

11 25 275 121 625

56 129 1090 476 2507

071 . 28 2 58 7

/ 56 476

7 / 129

* 56 1090 /

) (

/ ) )(

ˆ (

2

1 1

2 2

1 1 1

 

 

  

  

n

i

n

i i i

n

i

n

i

n

i i i

i i

xx xy

n X

X

n Y X

Y X S

b S

86 . 1 568 . 16 429 . 7 18

* 56 071 . 7 2

ˆ 129

ˆ

Y

b

X     

a

Böylece, en-küçük kareler regresyon doğrusu;

X

Y ˆ  1 . 86  2 . 071

(22)

Regresyon Katsayısının Önem Testi:

Hipotezler Ho:

b

=0

Hı :

b

≠0

a=0.01

965 . 26 7

. 0

0 071 . ˆ 2

ˆ

 

 

b

b b t S

26 . 28 0

) 2 7 /(

] 28 / ) 58 ( 71 . 129 ) [

2 /(

] /

) (

[

2 2

ˆ

  

 

 

xx xx xy

yy

S

n S

S S

b

S

71 . 129 7

/ 129 2507

/

2

2

2

   

 

 

 

n i

n i

yy

Y Y n

S

> t

7-2,0.01/2

=t

5,0.005

=4.032 olduğundan Ho

RED edilir.

(23)

Çözüm

Korelasyon katsayısı;

96 . 265 0

. 60

58 71

. 129

* 28

58  

YY XX

XY

S S

r S

İneğin yediği yem (kg) ile verdiği süt miktarı (kg) arasında % 96’lık pozitif bir ilişki vardır. Bir diğer ifade ile İneğin yediği yem arttıkça, verdiği süt miktarı artmaktadır.

Korelasyon Katsayısının Önem Testi:

Hipotezler Ho: r=0 Hı : r≠0

a=0.01

68 . 125 7

. 0

96 . 0 96

. 0 1

0 96 . 0

2

 

 

  S

r

t r r > t

7-2,0.01/2

=t

5,0.005

=4.032

olduğundan Ho RED edilir.

(24)

Örnek: Sera içi sıcaklığı (

o

C) ile birim alandan elde edilen domates verimi arasında bir ilişki olup olmadığını araştırmak amacıyla yapılan bir denemeden elde edilen veriler aşağıdaki gibidir.

a) Bu ilişkiyi açıklayan regresyon modelini oluşturunuz ve regresyonun önem testini yapınız

b) Korelasyon katsayısını hesaplayarak önem testini yapınız.

Sera içi

Sıcaklığı (

o

C) Domates Verimi (kg)

5 12

8 18

15 25

18 30

20 40

12 18

11 15

Referanslar

Benzer Belgeler

TUİK tarafından bildirilen yazıda her ay Gümrük ve Ticaret Bakanlığı’ndan ilgili ay verileri ile birlikte firmaların daha önceki aylarda gerçekleştirdikleri ihracat ve

Negatif doğrusal ilişki Doğrusal olmayan ilişki..  Regresyon doğrusu ile gözlem arasındaki farklar hata terimi denir..  Sapma kareler toplamı, regresyon kareler. toplamı

[r]

The highest match victories by superiority The highest technical points scored The fewest technical points given The lowest seeds number (if applicable) The lowest draw number..

Yıl *Tekirdağ Altınova *Edirne Merkez * Edirne Uzunköprü *İzmir Buca Yıldız *İzmir Buca Kozağaç *İzmir Şemikler *İzmit Tütünçiftlik *Kadırga. *Büyükçekmece

(BU MİKTARLARIN YETERLİ OLMAMASI HALİNDE AYRICA TAHSİL EDİLECEKTİR.) AKSİ HALDE DAVA AÇILMASI DURUMUNDA FAZLAYA DAİR HAKLAR DA SAKLI OLMAK ŞARTIYLA İDARENİN UĞRADIĞI HER

• Dengeli bir besleme ve iyi bir rumen (işkembe) sağlığı için, konsantre yemin (fabrika yemi, tahıl kırması vb.) toplam rasyona sağlamış olduğu kuru

Genel olarak lezzet; koku- ağza alınan bir gıda maddesinden çıkan uçucu bileşenlerin koklama yoluyla algılanması, tat- ağızda çözünen maddelerin tatma