• Sonuç bulunamadı

Biyoistatistik (Ders 9: Korelasyon ve Regresyon Analizi)

N/A
N/A
Protected

Academic year: 2022

Share "Biyoistatistik (Ders 9: Korelasyon ve Regresyon Analizi)"

Copied!
37
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

KORELASYON ve REGRESYON ANALİZLERİ

Yrd. Doç. Dr. Ünal ERKORKMAZ Sakarya Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

uerkorkmaz@sakarya.edu.tr

SİSTEM, ALT SİSTEM ve SİSTEM DİNAMİKLERİ

Doğa bir ana sistemdir. Bu sistemin altsistemleri vardır. Biyolojik, Sosyo-ekonomik vb. sistemler. İNSAN yaşamı da bir sistemdir, Anatomik ve Fizyolojik (Kas- İskelet, Sinir, Dolaşım, Solunum, Boşaltım, Üregenital) Sistemler olarak alt sistemlere ayrılır.

Sistemler denge içinde çalışır. Dinamik sistemde bir takım girdiler (INPUT) ve Çıktılar (OUTPUT) vardır.

Girdilerin ve Çıktıların iç ve dış dinamikleri sistemin olumlu (sağlıklı) ya da olumsuz (hastalıklı) davranmasını sağlar. Doğada bir çok değişken birbirlerini etkileyerek değer alırlar. Doğada denge bir etkileşimler zinciri içinde gerçekleşir. Sistemler Dengeli ise Sağlıklı, değilse Hastadır.

SİSTEM MODELLEMESİ

Sistemler matematiksel, istatistiksel ya da benzeşimsel olarak modellenebilir.

Bu modelde sonuç/sonuçlar (cevap, response) çıktı, faktörler (faktor, predictor) girdi olarak yer alır.Girdilerin modeldeki etkileri, modelin dinamiğini belirler.

Neden-Sonuç (Girdi-Çıktı) ilişkilerini matematiksel olarak tanımlamak sistemin izlenmesi bakımından önemlidir. Doğada her oluşum bir sistem olarak ele alınarak modellenebilir, incelenebilir.

(2)

Modelleme, Regresyon ve Korelasyon

Değişkenler bazı faktör/faktörlerden pozitif ya da negatif yönde etkilenirler. Faktörlerin bazılarının etkisi çok yüksek iken (majör, birincil faktörler), bazılarının etkileri çok düşük düzeydedir (minör, ikincil faktörler).

Cevap değişkenleri etkileyen faktörlerin ortaya konması ve faktörlerin etki düzeylerinin belirlenmesi Regresyon ve Korelasyon yöntemleri aracılığı ile yapılır.

Regresyon, iki ve daha fazla değişken arasındaki

matematiksel bağıntıyı denklemlerle ifade etmek ve değişkenlerin birbirlerinden etkilenme biçimini ve büyüklüğünü ortaya koymak için yararlanılan bir istatistiksel yöntemdir.

Korelasyon, değişkenler arasındaki ilişkinin yönünü, derecesini ve önemini ortaya koyan istatistiksel yöntemdir.

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 4 / 111

TERİM ve TANIMLAR

Faktör:Bir hastalığın ortaya çıkmasında az ya da çok kesin etkisinin (neden, etken, sebep) bilindiği değişkenlerdir

Risk faktörü: Bir hastalığın ortaya çıkmasında katkısının olduğu bilinen, fakat bu faktörün mutlaka hastalığa yol açmasının söz konusu olmadığı faktörlerdir. Sigara, Yaş, Cins, Irk, Kimyasal ajanlar kanser’in birer risk faktörleridir.

Bağımlı değişken: Değeri başka değişkenlerin etkileri ile oluşan değişkenlerdir (dependent variable, response variable).

Bağımsız değişken: Değeri rasgele koşullar altında oluşan değişkenlerdir (Independent variable, Explanatory variable, Factor variable, Predictor variable). Bağımsız değişken, bağımlı değişkenin değişimi üzerinde az ya da çok etkili olan değişkendir.

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 5 / 111

Gözlem Sayısı

Gözlem sayısı (n), bağımsız değişken sayısının en az 10 katı olmalıdır.

İdeali ise, gözlem sayısının bağımsız değişken sayısının 20 katı olmasıdır.

Bazı çalışmalarda sayı 40 katına kadar çıkmaktadır.

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 6 / 111

(3)

Model ve Değişkenlerarası Bağıntının Formulasyonu

Model : Bir problemin çözümünde ya da bir olayın açıklanmasında yararlanılan matematiksel ya da benzetimsel sembolik yaklaşımlara model adı verilir.

Model, genelde bir matematiksel eşitlik ya da eşitsizlik biçiminde belirlenir.

) ( X f

YY  

0

 

1

X

p p

X X

X

Y  

0

 

1

 

2 2

...  

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 7 / 111

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 8 / 111

KORELASYON ve ÇEŞİTLERİ

Korelasyon (Correlation), değişkenler arasındaki ilişkinin yönünü, derecesini ve önemini ortaya koyan istatistiksel yöntemdir. Değişkenlerin sayısına ve hesaplama biçimine göre;

İkili (Bivariate) Korelasyon

Kısmi (Partial) Korelasyon

Çoklu (Multiple) Korelasyon

Setlerarası (Canonical) Korelasyon isimleri ile anılır.

(4)

BASİT KORELASYON ANALİZİ (PEARSON KORELASYON ANALİZİ)

İki değişken arasındaki ilişkiyi, önemini, yönünü inceleyen korelasyon yöntemidir. Korelasyon, korelasyon katsayısı ile ölçülür. rXY ile gösterilir.

Önemlilik t testi ile belirlenir.

















 

 

  

n

i n

i i i n

i n

i i i n

i

n

i i n

i i i i XY

n Y n Y

X X

n Y X Y X r

1

2

1 2 1

2

1 2

1

1 1

2 1

) 2 (

2  

  sd n

r n t r

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 10 / 111

Korelasyon Katsayısının Hesaplanması

*

*

* 001 . 0 , 8 ,

27 . 7

27 . 7 ) 932 . 0 ( 1

) 2 10 (

* 932 . 0

2

 

 

p sd

t t

932 . 03 0 . 1836

4 . 1711 4

. 2188

* 4 . 1540

4 .

1711  

r

4 .

2188 KT

Y

10 ) 774 62096 (

2 Y

KT

4 .

1540 KT

x

4 .

1711 CT

xy

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 11 / 111

SPSS’de KORELASYON ANALİZİ

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 12 / 111

(5)

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 13 / 111

Correlations

1.000 .932**

. .000

10 10

.932** 1.000

.000 .

10 10

Pearson Correlation Sig. (2-tailed) N

Pearson Correlation Sig. (2-tailed) N MAT_PUAN

ZEKA_P

MAT_PUAN ZEKA_P

Correlation is significant at the 0.01 level (2-tailed).

**.

Verilere basit doğrusal regresyon uygulanıyor ise korelasyon analizi sonuçları da regresyon çıktısı içinde yer alır.

Mat_P ve Zeka_P verileri Örneğimize regresyon uygulaması tekrarlanırsa sonuçlar aşağıdaki gibi elde edilir.

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 14 / 111

Correlations

1.000 .932**

. .000

10 10

.932** 1.000

.000 .

10 10

Pearson Correlation Sig. (2-tailed) N

Pearson Correlation Sig. (2-tailed) N MAT_PUAN

ZEKA_P

MAT_PUAN ZEKA_P

Correlation is significant at the 0.01 level (2-tailed).

**.

Model Summary

.932a .869 .852 5.9898

Model 1

R R Square

Adjusted R Square

Std. Error of the Estimate Predictors: (Constant), ZEKA_P

a.

Coefficientsa

-11.925 12.415 -.961 .365

1.111 .153 .932 7.280 .000

(Constant) ZEKA_P Model

1 B Std. Error

Unstandardized Coefficients

Beta Standardi

zed Coefficien

ts

t Sig.

(6)

REGRESYON ÇÖZÜMLEMESİ

İki değişken arasındaki korelasyon katsayısı yeterince büyükse, kolay elde edilen bir x değişkeni değeri yardımıyla elde edilmesi zor olan bir y değişkeni değeri kestirilebilir.

Bu kestirim regresyon çözümlemesi yardımıyla yapılır.

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 16 / 111

REGRESYON YÖNTEMLERİ

Regresyon yöntemleri, modeldeki değişken sayısına, değişkenin ölçüm tekniğine göre farklı şekillerde sınıflandırılmaktadır.

1. Modeldeki değişkenler sürekli ve değişken sayısı k=2 ise (bir bağımlı (q=1), bir bağımsız değişken(p=1)) kurulacak regresyon modelleri

Basit Doğrusal Regresyon

Polinomiyal regresyon

Geometrik Regresyon

Üssel Regresyon

Basit doğrusal olmayan Regresyon (Nonlinear regresyon)

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 17 / 111

2.Modeldeki değişkenler sürekli (interval/orantılı) ve sayısı k>2 ise (bir bağımlı(q=1), iki ve daha fazla bağımsız değişken(p>2))

Çoklu (Multiple) Doğrusal Regresyon

Çoklu Doğrusal Olmayan (Multiple Nonlinear) Regresyon 3.Modeldeki bağımlı değişken nominal/ordinal/

nominalize interval ölçekli, bağımsız değişkenler orantılı/interval/ordinal/nominal ölçekli ve enaz iki kategorili iseler q=1 p=>1 ise ;

Lojistik Regresyon

Ordinal Regresyon

Robust Regresyon

Poisson Regresyon

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 18 / 111

(7)

BASİT DOĞRUSAL REGRESYON

Y bağımlı (response, dependent) değişken ve X bağımsız (belirleyici, predictor) değişken olmak üzere iki değişken arasındaki sebep-sonuç ilişkisini doğrusal bir model ile ortaya koyan yönteme basit doğrusal regresyon denir.

Basit doğrusal regresyon, iki değişken (Y, X) arasındaki neden-sonuç ilişkisini Y=a+bX biçiminde bir denklem (model) ile ortaya koyar.

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 19 / 111

BASİT DOĞRUSAL REGRESYON

Basit doğrusal regresyon uygulamak için;

1. n birimden Y ve X değişkenleri için veriler toplanır.

(Xi,Yi). Verilerin aralıklı ya da orantılı ölçekli olması gerekir.

2. Verilerin XY ilişki grafiği çizilir. Grafikteki xy noktaları bir çember ya da elips içine alınır.

3. Eğer noktaları sınırlayan çerçeve bir elips ve elipsin asal (ana) ekseni ikincil (yan) ekseninden daha büyük ise veriler arasında basit doğrusal bir bağıntı olabileceği varsayılır.

4. Verileri temsil eden Y=a+bX doğrusunun denklemi hesaplanır.

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 20 / 111

BASİT DOĞRUSAL REGRESYON

(8)

a ve b Katsayılarının Hesaplanması

 

  



 



 





 

n

i

n

i i i

n

i

n

i i n

i i i

i

n X X

n Y X

Y X b

1

2

1 2 1

1 1

2 2 2

)

(

i

i

i i i i i

X X

n

Y X X Y a X

  aYb X

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 22 / 111

a ve b Katsayılarının Hesaplanması a ve b Katsayılarının Hesaplanması

n Y Y X

X

CT

xy

 

i i

(

i

)(

i

)

n X X

KT

x i i

2

2

( )

n Y Y

KT

y i i

2 2

( )

x

xy

KT

ÇT b/

X n

X /

Y n

Y /

X b Y a  

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 23 / 111

Modelin Önemliliği

Y=a+bX modelinin geçerliliğini belirlemek için Regresyon Analizi yönteminden yararlanılır.

Modelin önemliliği, belirlenen model ile Y’nin değişiminin X tarafından ne kadar açıklanabildiğinin kontrolu yapılır.

Modelin önemliliği aynı zamanda eğimin regresyon katsayısının önemliliğini ve iki değişken arasındaki korelasyonun da önemliliğini verir.

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 24 / 111

(9)

Tahminin Varyansı, b’nin Varyansı

2 )) (

(

2

2 . 2

 

n

bX a S Y

S

Y X i i

 

 

 

 

X XY

y

KT

KT CT s n

2

2

( )

2 1

Y x

XY y

b

KT

KT KT CT

s n ( ) /

2

1

2

2

 

 

 

 

 

 

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 25 / 111

b’nin Önemliliği

H0: b=0

Sd=n-2 t<t0.05,sd P>0.05 n.s.

t>t0.05,sd P<0.05 * t>t0.01,sd P<0.01 **

t>t0.001,sd P<0.001***

2

S

b

Tb  

Y x

XY y

b

KT

KT KT CT

s n ( ) /

2

1

2

2

 

 

 

 

 

 

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 26 / 111

Modelin Önemliliğinin Regresyon Analizi İle Belirlenmesi

Genel KT=Regresyon KT+Artık KT GKT=RKT+AKT

rsd=1

asd=n-2 X

XY

KT

CT RKT( ) 2 /

RKT KT

AKT

Y

KT

Y

GKT

(10)

DK sd KT KO F p

Regresyon 1 RKT RKO RKO/AKO

Artık n-2 AKT AKO - -

Genel n-1 GKY - - -

Regresyon Analizi Tablosu

F(rsd, asd)<F(0.05,rsd,asd)     P>0.05 ns.     Model önemsiz F(rsd, asd)>F(0.05,rsd,asd)     P<0.05 *        Model önemli.

F(rsd, asd)<F(0.01,rsd,asd)     P<0.01 **      Model önemli.

F(rsd, asd)<F(0.001,rsd,asd)   P<0.001 ***  Model önemli.

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 28 / 111

10 Lise Öğrencisinin Matematik ve Zeka Puanları Öğr. No Mat_P (Y) Zeka_P (X)

1 86 75

2 67 70

3 90 94

4 94 98

5 53 63

6 61 68

7 86 86

8 76 82

9 98 98

10 63 70

T 774       804

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 29 / 111

Şekil: 10 Orta Okul Öğrencisinin Matematik ve Zeka Puanları İlişki Grafiği

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 30 / 111

(11)

Öğr.No Mat_P(Y) Zeka_P(X) Y2 X2 XY

1 86 75 7396 5625 6450

2 67 70 4489 4900 4690

3 90 94 8100 8836 8460

4 94 98 8836 9604 9212

5 53 63 2809 3969 3339

6 61 68 3721 4624 4148

7 86 86 7396 7396 7396

8 76 82 5776 6724 6232

9 98 98 9604 9604 9604

10 63 70 3969 4900 4410

T 774       804 62096 66182 63941 Tablo: 10 Lise Öğrencisinin Matematik, Zeka Puanları ve Gerekli Hesaplamalar

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 31 / 111

n Y Y X

X

CTxy i i (i)(i)

4 . 10 1711

) 774 )(

804

63941(

xyCT

n X X

KTx i i

2

2 ( )

4 . 10 1540

) 804 66182 (

2

xKT

x

xy KT

ÇT

b/

4 . 1540 / 4 .

1711 b

111 .

1 b

4 . 80 10 /

804

X

4 . 77 10 /

774

Y

X b Y a  

4 . 80

* 11 . 1 4 . 77

a

92 .

11

a

X Y 11 . 92 1 . 111 *

Denklemi Regresyon

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 32 / 111

SPSS’de REGRESYON

SPSS veri sayfasında X ve Y verilerini farklı sütunlara giriniz

Analyze > Regression >Linearseçeneklerini tıklayınız.

İşlem penceresinde X ve Y değişkenlerini doğru tanımlayarak alanlara taşıyınız.

OK tıklayınız.

(12)

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 34 / 111

SPSS’de REGRESYON

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 35 / 111

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 36 / 111

(13)

ANOVAb

1901.383 1 1901.383 52.997 .000a

287.017 8 35.877

2188.400 9

Regression Residual Total Model 1

Sum of

Squares df Mean Square F Sig.

Predictors: (Constant), ZEKA_P a.

Dependent Variable: MAT_PUAN b.

Coefficientsa

-11.925 12.415 -.961 .365

1.111 .153 .932 7.280 .000

(Constan ZEKA_P Model 1

B Std. Error Unstandardized

Coefficients

Beta Standardized

Coefficients

t Sig.

Dependent Variable: MAT_PUAN a.

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 37 / 111

ÇOKLU DOĞRUSAL REGRESYON ÇÖZÜMLEMESİ

Amaçlar

Kolay elde edilebilir bağımsız değişkenler yardımıyla zor elde edilen bağımlı değişken değerini kestirmek.

Bağımsız değişkenlerden hangisi ya da hangilerinin bağımlı değişkeni daha çok etkilediğini belirlemek.

Bağımlı değişken ile bağımsız değişkenler arasındaki karmaşık yapıyı tanımlamak.

Diğer değişkenlerin varlığında katsayı kestiriminde bulunmak.

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 38 / 111

ÇOKLU DOĞRUSAL REGRESYON ANALİZİ

Y bağımlı değişken ve X1, X2, ..., Xp bağımsız değişkenler olmak üzere değişkenler arasındaki sebep- sonuç ilişkisini matematiksel bir model olarak ortaya koyan yöntemeçoklu regresyon analiziadı verilir.

Bir bağımlı değişken ile bu değişkenin değişimi üzerinde etkide bulunan p sayıda bağımsız değişken arasındaki ilişkinin düzeyini belirleyen yönteme iseçoklu korelasyon analizidenilmektedir.

Genellikle çoklu regresyon ve korelasyon analizi birlikte ele alınan ve hesaplamaları birlikte yapılan karma yöntemlerdir.

(14)

ÇOKLU DOĞRUSAL REGRESYON

Çoklu Doğrusal Regresyon Analizi, Y ile iki ve daha fazla açıklayıcı değişken arasındaki ilişkiyi

biçiminde inceler.

Verilere uyan modelin açıklayıcılık yüzdesi belirtme katsayısı R2ile belirlenir.

Regresyon analizi, modelin tutarlılığını; tahmin gücünü ve her bir değişkenin Y üzerindeki açıklayıcılığını test eder. Modelin belirleyicilik gücünü ifade eden R2, aşağıdaki gibi hesaplanır.

p px b x b x b x b b

yˆ01 12 23 3...

Toplamı Kareler Genel

lamı KarelerTop gresyon

KT R RKT

Y

2 Re

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 40 / 111

ÇOKLU DOĞRUSAL REGRESYON

Çoklu belirtme katsayısı (R2) modele yeni bir değişken eklendiğinde artış gösterir. Modele yeni bir değişken eklenmesine rağmen paydanın değeri değişmezken payın değeri artar. Bu nedenle R2 hesaplanırken değişken sayısına göre düzeltme yapılması gerekir.

Düzeltilmiş R2değeri (R2düz), ya da

biçiminde hesaplanır





 

 

) 1 /(

) 1 2/(

2 2

N k N

y R

duz

e

1 ) 1 )(

1 1 (

2 2

 

N k

N

R

duz R

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 41 / 111

1. BETA(Standartlaştırılmış regresyon katsayıları):

Modele katkısı daha fazla olan değişkenin BETA katsayısı daha büyük olur.

2. VIF: Çoklubağlantı olduğunda 15’in üzerindedir.

3. Çoklu korelasyon katsayısı (R): Bağımlı değişken ile bağımsız değişkenler arasındaki ilişkinin derecesini verir. 0 ile 1 arasında değişir.

4. Çoklu Açıklayıcılık Katsayısı (R2): Çoklu karelasyon katsayısının karesidir. Bağımsız değişkenlerin bağımlı değişkeni açıklama miktarını verir.

DÖRT ÖNEMLİ İSTATİSTİK

Yrd. Doç. Dr. Ünal ERKORKMAZ 42

(15)

Uyarılar

Bağımsız değişkenler arasındaki korelasyon katsayıları yüksek olmamalıdır.Yüksek ilişki çoklubağlantıya neden olur.

Büyük R2ya da F istatistiğinin anlamlı olması modelin yeterliği ve geçerliği konusunda ayrıntılı bilgi vermez.

Artıkların incelenmesi gereklidir. Aykırı, uzak, etkili gözlemler dikkatle incelenmeli, kestirime yönelik çalışmalarda modelin geçerliği

incelenmelidir.

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 43 / 111

Çoklu Regresyon Yöntemleri

Tüm değişkenlerin modelde olduğu yöntem

Değişkenlerin belli bir sırada modele eklendiği yöntem (hiyerarşik regresyon)

Adımsal Regresyon (istatistiksel regresyon) yöntemleri

İleriye doğru seçim (forward selection)

geriye doğru çıkartma (backward elemination)

Adım-adım regresyon (step-wise)

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 44 / 111

y x1 x2

2940 38 1

3130 38 0

2420 36 1

2450 34 0

, , ,

2841 36 0

y : Çocuğun Doğum ağırlığı (gr) x1 : Gebelik haftası

x2: Annenin sigara içme durumu (1:içen, 0: İçmeyen)

ÖRNEK

(16)

Model Summary

,947a ,896 ,889 115,53024

Model

1 R R Square

Adjusted R Square

Std. Error of the Estimate

Predictors: (Constant), X2, X1 a.

Çoklu Korelasyon katsayısı (R):

Bağımlı değişken ile bağımsız değişkenler arasındaki ilişkinin derecesini verir. 0 ile 1 arasında değişir.

Çoklu Açıklayıcılık Katsayısı (R2):

Çoklu karelasyon katsayısının karesidir. Bağımsız değişkenlerin bağımlı değişkeni açıklama miktarını verir. 0 ile 1 arasında değişir.

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 46 / 111

ANOVAb

3348720 2 1674359,837 125,446 ,000a

387069,8 29 13347,235

3735790 31

Regression Residual Total Model 1

Sum of

Squares df Mean Square F Sig.

Predictors: (Constant), X2, X1 a.

Dependent Variable: Y b.

Regresyon modelinin anlamlılığına ilişkin tümel F istatistiği. Buna göre y değişkenindeki değişim iki bağımsız değişken tarafından açıklanabilmektedir.

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 47 / 111

Değişken bj S(bj) Beta t p

Sabit ‐2389,573 349,206 ‐6,843 0,000 x1 143,100 9,128 0,963 15,677 0,000 x2 ‐244,544 41,982 ‐0,358 ‐5,825 0,000

Regresyon katsayıları

2 1

244 , 544 100

, 143 573 ,

ˆ 2389 x x

y    

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 48 / 111

(17)

Gebelik haftasındaki 1 haftalık artış çocuk doğum ağırlığında 143 gramlık artışa neden olmaktadır.

Sigara içen annelerin çocuk doğum ağırlığı içmeyenlere göre 244,5 gram daha düşüktür.

^

2 1

244 , 544 100

, 143 573 ,

ˆ 2389 x x

y    

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 49 / 111

x1 : Gebelik haftası = 34

x2: Sigara içen bir anne için (1:içen, 0: İçmeyen):

olarak kestirilirken sigara içmeyen bir anne için:

olarak kestirilir.

y= 2475.83 gr

^ y= 2231 gr

^ KESTİRİM

2 1

244 , 544 100

, 143 573 ,

ˆ 2389 x x

y    

1 544 , 244 34 100 , 143 573 ,

ˆ   2389    

y

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 50 / 111

ÇOKLU DOĞRUSAL REGRESYON

Örnek: Rasgele seçilen 16 bireyin Günlük İçtiği Sigara Sayısı, YAŞ, BOY, AĞIRLIK ve SKB değerleri aşağıdaki tabloda verilmiştir

GİSS YAS (yil) BOY (cm) AGIRLIK (Kg) SKB (mm/Hg) 10

15 20 25 0 30 12 40 0 10 18 20 45 27 30

51 64 46 39 58 54 31 67 48 78 39 51 73 53 56

166 165 174 168 162 178 171 173 165 152 177 166 178 174 169

67.0 61.0 83.0 78.9 67.0 90.0 77.7 89.3 70.0 58.0 82.5 63.0 93.1 89.0 72.0

115 122 130 126 110 141 124 150 110 119 130 120 149 125 125

(18)

ÇOKLU DOĞRUSAL REGRESYON

SPSS’de çoklu regresyon analizi uygulamak için SKB, YAS, BOY, KILO ve GISS değerleri ayrı sütunlara girilir. Çoklu regresyon analizi uygulamak için Statistics>Regression>Linearseçenekleri tıklanır. Açılan ekranda Dependent alanına SKB değişkeni, Independent(s) alanına ise diğer dört değişken taşınır. OK tıklanır.

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 52 / 111

ÇOKLU DOĞRUSAL REGRESYON

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 53 / 111

ÇOKLU DOĞRUSAL REGRESYON

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 54 / 111

(19)

ÇOKLU DOĞRUSAL REGRESYON

Variables Entered/Removed b

GISS, YAS, AGIRLIK, BOYa

, Enter Model

1

Variables Entered

Variables

Removed Method

All requested variables entered.

a.

Dependent Variable: SKB b.

Model Summary

,942a ,887 ,846 4,7942

Model 1

R R Square

Adjusted R Square

Std. Error of the Estimate Predictors: (Constant), GISS, YAS, AGIRLIK, BOY a.

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 55 / 111

ÇOKLU DOĞRUSAL REGRESYON

ANOVAb

1990,918 4 497,729 21,655 ,000a

252,832 11 22,985

2243,750 15

Regression Residual Total Model 1

Sum of

Squares df Mean Square F Sig.

Predictors: (Constant), GISS, YAS, AGIRLIK, BOY a.

Dependent Variable: SKB b.

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 56 / 111

Coefficientsa

53,292 65,883 ,809 ,436

,161 ,139 ,166 1,162 ,270

,170 ,448 ,100 ,379 ,712

,333 ,260 ,315 1,281 ,226

,521 ,182 ,562 2,872 ,015

(Constant) YAS BOY AGIRLIK GISS Model 1

B Std. Error Unstandardized

Coefficients

Beta Standardi

zed Coefficien

ts

t Sig.

Dependent Variable: SKB a.

ÇOKLU DOĞRUSAL REGRESYON

(20)

x1 : Gebelik haftası = 34

x2: Sigara içen bir anne için (1:içen, 0: İçmeyen):

olarak kestirilirken sigara içmeyen bir anne için:

olarak kestirilir.

y= 2475.83 gr

^ y= 2231 gr

^ KESTİRİM

2 1

244 , 544 100

, 143 573 ,

ˆ 2389 x x

y    

1 544 , 244 34 100 , 143 573 ,

ˆ   2389    

y

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 58 / 111

DOĞRUSAL OLMAYAN İLİŞKİLER

0,000 10 20 30 40

0,5 1,0 1,5

DOĞRUSALLAŞTIRILABİLEN BAZI DOĞRUSAL OLMAYAN İLİŞKİLER

b

x

b y

0 1

y

x

1

0

log

log

log ybx b

Üstel Denklem

Doğrusal Denklem

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 60 / 111

(21)

0,000 10 20 30 40

0,500 1.000 1,500

b

x

b y

0 1

y

x Üstel Denklem

Doğrusal Denklem

1

0

log

log

log ybx b

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 61 / 111

* **

* *

*

*

*

*

*

* * *

* *

*

*

*

* * *

* * * *

*

* *

**

**

*

1

0

x b

b y

Üstel Denklem

x b b

y log log log

0

1

Doğrusal Denklem

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 62 / 111

ÖRNEK

Hastane gelişmişlik indeksi‐birim başına maliyet ilişkisi Hastane Gel. İndexi (x) BB Maliyet (y) log (y)

6 2,812 0,449

7 1,882 0,275

8 1,130 0,053

9 0,738 -0,132

10 0,425 -0,372

11 0,261 -0,583

12 0,181 -0,742

13 0,125 -0,903

14 0,079 -1,102

15 0,052 -1,284

16 0,029 -1,538

(22)

X- GELİŞMİŞLİK İNDEKSİ

18 16 14 12 10 8 6 4

Y- BİRİM BAŞINA MALİYET

3,0

2,5 2,0 1,5

1,0 ,5 0,0

b

x

b y

0 1

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 64 / 111

X (BBM)

18 16 14 12 10 8 6 4

LOGY

,5

0,0

-,5

-1,0

-1,5

-2,0

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 65 / 111

x ile logy arasındaki doğrusal denklem:

logy= 1,6203-0,1959x

Antilog(1,6203) = 41,7157 Antilog(0,1959) = 1,57

x ile y arasındaki üstel denklem:

y   41 , 7157 ( 1 , 57 )

x İstenirse buradan üstel denkleme geçiş yapılabilir:

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 66 / 111

(23)

Her iki yöntemle elde edilen kestirimler aynı sonucu verecektir.

Örneğin, x=11.5 için

logy= 1,6203-0,1959(11.5)= -0,63255

=Antilog(-0,63255)= 0,233

y41 , 7157 ( 1 , 57 )

x

= 41,7157(1,57) -11,5

= 0,233

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 67 / 111

POLİNOMİYAL REGRESYON y=b

0

+b

1

x+b

2

x

2

+b

3

x

3

+...+b

k

x

k

x y x y x y x y x y

1,0 5,0 3,0 130 5,1 17,0 6,6 17,0 8,2 13,1 1,5 7,1 3,4 13,6 5,4 17,3 6,7 17,1 8,4 12,6 1,8 8,0 3,6 14,3 5,5 17,4 7,0 16,3

2,1 10,2 3,9 14,9 5,9 17,3 7,2 16,0 2,3 11,0 4,2 16,0 6 18,0 7,4 15,2 2,7 11,8 4,6 16,3 6,2 17,4 7,9 14,2

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 68 / 111

X

10 8 6 4 2 0

Y

20 18 16 14 12 10 8 6 4

(24)

Y

X

10 8 6 4 2 0 20

18

16 14

12

10

8 6 4

Observed Linear Quadratic

5862

2

, 0 6446 , 6 5828 ,

ˆ 1 x x

y    

F=1046,24 p<0,01

R2=0,989

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 70 / 111

LOJİSTİK REGRESYON

Lojistik regresyon; cevap değişkenin kategorik, ikili (binary, dichotomous), üçlü ve çoklu kategorilerde gözlendiği durumlarda açıklayıcı değişkenlerle neden sonuç ilişkisini belirlemede yararlanılan bir yöntemdir.

Açıklayıcı değişkenlere göre cevap değişkenin beklenen değerleri olasılık olarak elde edildiği bir regresyon yöntemidir.

Basit ve çoklu regresyon yönteminde bağımlı değişkenin normal dağılım göstermesi, bağımsız değişkenlerin normal dağılım göstermesi ve hata varyansının N(0,2) parametreli normal dağılım göstermesi gerekmektedir. Bu koşulları içermeyen veri setlerine basit ya da çoklu regresyon analizleri uygulanamaz.

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 71 / 111

LOJİSTİK REGRESYON

Lojistik regresyon analizi, sınıflama ve atama işlemi yapmaya yardımcı olan bir regresyon yöntemidir. Normal dağılım varsayımı, süreklilik varsayımı ön koşulu yoktur.

Bağımlı değişken üzerinde açıklayıcı değişkenlerin etkileri olasılık olarak elde edilerek risk faktörlerinin olasılık olarak belirlenmesi sağlanır.

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 72 / 111

(25)

LOJİSTİK REGRESYON

Doğada gözlenen fenomenlerin bazıları var‐yok, başarılı‐

başarısız gibi ikili biçimde sonuçlanırlar. Bazı sonuçlar ise yok‐

orta‐çok, hiç‐az‐çok, olumsuz‐olumlu‐çok olumlu biçiminde üçlü gözlem sonuçları olarak belirlenirler. Bazı sonuçlar ise çok sınıflı kategorik ya da sıralı ölçekli değerler olarak belirlenebilirler.

Bu sonuçların ortaya çıkmasında bir çok etken (faktör) rol oynar. Acaba faktörlerin değişimleri ve farklı kombinasyonları, sonucun görülmesi ya da görülmemesinde, oluşumun derecelendirilmesinde nasıl etkide bulunmaktadır?

Normal dağılım varsayımı kurulamayan durumlarda sonucun ortaya çıkması‐çıkmaması, hafif‐orta‐ağır olarak belirlenmesine açıklayıcı değişkenlerin etkileri nasıl ortaya konabilir?

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 73 / 111

LOJİSTİK REGRESYON

Toplumda bazı kişilerde kalp hastalığı görülürken bazılarında görülmemektedir. Toplumda birçok yönden benzer özellik gösteren bireylerin bazılarında X hastalığı görülürken diğerlerinde görülmemektedir. Niçin? Hangi etken ya da etkenler ne düzeyde bu sonuçların ortaya çıkmasına etki etmektedirler? Bir olayın ortaya çıkmasında bu etkenlerin bir risk faktörü olduğu ve bu etkenlerden hangilerinin önemli risk faktörleri olduğu nasıl belirlenebilir?

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 74 / 111

LOJİSTİK REGRESYON

Yukarıda sayılan sorulara cevap vermek için verilerin Lojistik Regresyon Analizi ile analiz edilmesi gerekir.

Lojistik regresyon, bağımlı değişkenin tahmini değerlerini olasılık olarak hesaplayarak, olasılık kurallarına uygun sınıflama yapma imkanı veren bir istatistiksel yöntemdir. Lojistik regresyon tablolaştırılmış ya da ham veri setlerini analiz eden bir yöntemdir.

(26)

) (0 1 1

0 1 0

1 1 ) 1

( X X

X

e e

Y e

P

 

 

LOJİSTİK REGRESYON

Veri yapılarına göre kurulan lojistik modeller aşağıdaki gibi belirlenir.

İki değişkenli lojistik regresyon modeli;

Çok değişkenli lojistik regresyon modeli;

Z Z

Z

e e

Y e

P

 

 

1 1 ) 1

(

Burada Z, bağımsız değişkenlerin doğrusal kombinasyonudur.

p p

X X

X

Z  

0

 

1 1

 

2 2

...  

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 76 / 111

Regresyon katsayılarının hesaplanması aşağıdaki gibi yapılır.

Burada Q(Y), Q(Y)=1-P(Y) olarak hesaplanır. Odds Ratio’nun P(Y)/Q(Y) olarak hesaplandığını hatırlayacak olursak her bir parametrenin Exp() değerleri OR değerleri olarak ele alınırlar. Böylece Exp(p), Y değişkeninin Xpdeğişkeninin etkisi ile kaç kat daha fazla ya da yüzde kaç oranda fazla gözlenme olasılığına sahip olduğunu belirtir. p katsayısının önemliliği aynı zamanda ORp=Exp(p)’nın da önemliliği olarak değerlendirilir.

p pX X

Y X Q

Y

P 

 

 

...

) (

)

ln ( 0 1 1 2 2

p p p

pX X X X

X

X e e e e

Y e Q

Y

P

) ...

( )

(0 1 1 2 2...0 1 1 2 2

LOJİSTİK REGRESYON

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 77 / 111

Lojistik regresyon analizinde üç temel yöntem vardır.

İkili (Binary) Lojistik Regresyon (BLOGREG, Binary Logistic Regression)

Sıralı (Ordinal) Lojistik Regresyon (OLOGREG, Ordinal Logistic Regression)

İsimsel Lojistik Regresyon (NLOGREG, Multinomial Logistic Regression)

LOJİSTİK REGRESYON

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 78 / 111

(27)

İkili Lojistik Regresyon  (BLOGREG) Analizi

İkili cevap içeren bağımlı değişkenlerle yapılan lojistik regresyon analizidir. Bir ya da daha fazla açıklayıcı değişken ile ikili cevap değişken arasındaki bağıntıyı ortaya koyar.

Açıklayıcı değişkenler ya faktör değişkenlerdir ya da ortak değişkendir (covariate). Faktör değişkenler kategorik isimsel ölçeklidirler, ortak değişkenler ise sürekli değişken olmalıdır.

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 79 / 111

50 hasta üzerinde yapılan bir çalışmada, hastanın yaşı, cinsiyeti, yoğun bakımda kalış süresi ve önceden antibiyotik kullanımı değişkenleri kullanılarak yoğun bakım ünitesinde edinilmiş enfeksiyon belirlenmek istenmektedir.

ÖRNEK

Yrd. Doç. Dr. Ünal ERKORKMAZ Slayt 80 / 111

Enfeksiy on (y)

Cinsiyet Yaş Kalış Sür.

(gün)

Önceden Antibiyoti

k K.

1 1 65 3 0

0 2 58 4 1

0 1 46 7 1

1 1 73 11 0

. . . . .

. . . . .

1:var 1:E 0: + 0:yok (Ref. Kat.) 2:B 1: -

Referanslar

Benzer Belgeler

Diskiriminant analizi ile kurulan başka bir modelde 835 adet gözlem ile analiz yapılmıştır ve tahmin gücü %73,7 olarak belirlenmiştir.(Vincent,Warner, Dauten, 1974)

“İlkokul, ilköğretim, ortaokul” eğitim grubundaki kadınların “bir okul bitirmeyen” eğitim grubuna göre işgücünde olma bahis oranları 1,345 kat daha fazladır.. değeri

Sıralı Lojistik regresyon (OLOGREG) yöntemi, cevap değiĢkenin üç ve daha fazla kategori içerdiği ve değerlerin sıralı ölçekle elde edildiği durumlarda; cevap

Sosyal Güvenlik Kurumu tarafından çıkartılan 2016/21 sayılı Genelge’ye göre ise bir olayın iş kazası sayılabilmesi için; kazayı geçiren kişinin sigortalı olması,

 Enterpolasyon yapılabilmesi için çizilmiş eğri, gerçek f(x) fonksiyonunun değişimine çok yakın olmalıdır.. Aksi taktirde arada bir fark meydana gelir ve yi

 S12 (Hayvansal yağ içeren(kuyruk yağı, tereyağı vb)yiyecekleri tüketirim): Hayvansal yağ içeren gıdaları her gün tüketen kişilere göre hiçbir zaman

ABD’nin Iowa Üniversitesi araş- tırmacıları da bu olasılığı gözönünde tutarak ateşli bağırsak hastalığı çeken bazı hastalarına, olgunlaşıp

Nazal steroid ve an- tihistaminik kombinasyonu ciddi mevsimsel allerjik riniti olan hastalarda, ve semptomlarý nazal steroidle kontrol altýna alýnamayan, orta derecede