Doğrusal regresyon analizi, bağımlı değişken ile bir veya daha fazla
bağımsız değişken arasında bir ilişki kurar.
Doğrusal model, bağımlı değişkeni bağımsız değişkenin aldığı değerin doğrudan oranı olarak gösterir.
Basit Doğrusal regresyon analizinde sadece bir bağımsız değişken bulunur.
BASİT DOĞRUSAL REGRESYON
Bağımlı değişken (y) ; regresyon
modelinde açıklanan veya tahmin edilecek olan değişkendir. Bu
değişkenin bağımsız değişkenle fonksiyonel bir ilişkide olduğu
varsayılır.
Bağımsız değişken (x) regresyon modelinde bağımlı değişken ile ilişkili değişkendir. Bağımsız değişken,
regresyon modelinde bağımlı
değişkenin değerini tahmin etmek için
kullanılır.
BASİT DOĞRUSAL REGRESYON MODELİ
(POPULASYON MODELİ)y = + βx + ε
y= bağımlı değişken x= bağımsız değişken
= sabit (y-eksenini kestiği nokta) β= regresyon doğrusunun eğimi ε= hata terimi veya artık
Regresyon Parametreleri
= sabit
doğrunun y eksenini kestiği nokta.
Bağımsız değişkenin değerinin = 0 olduğu durumda bağımlı değişkenin aldığı
değerdir.
β = eğim
Bağımsız değişkendeki değişime dayalı olarak bağımlı değişkende görülen
değişimdir.
Eğimin alacağı katsayının işareti iki
değişken arasındaki ilişkiye bağlı olarak pozitif veya negatif olabilir.
yˆ
= Tahmin edilen y değeri (bağımlı değişken) a = regresyon sabit değerinin yansız tahmini b = regresyon eğiminin yansız tahminix = bağımsız değişken değeri
bx a
yˆ
TAHMİN EDİLEN REGRESYON MODELİ
(ÖRNEKLEM MODELİ)
Basit doğrusal regresyon modelin bazı varsayımları bulunmaktadır:
I hata terimlerinin her biri istatistiksel olarak bir diğerinden bağımsızdır.
hata terimlerinin aldığı değerler normal dağılım özelliği göstermelidir.
Hata varyansı sabittir ve veriler arasında hiç değişmediği varsayılır. Buna
otokorelasyon veya serisel korelasyon bulunmaması varsayımı adı verilir.
Bağımsız değişken hatasızdır. Eğer bağımsız değişkende hata bulunduğu varsayılırsa özel bir yöntem şekli olan değişkenler-içinde-hata modeli teknikler kullanılarak model kurulmalıdır.
ε = Hata terimi (artık)
Regresyon modelleri tam (%100) doğru tahmin yapma özeliğine sahip değillerdir.
Hata terimi (artık), gözlenen değer ile model tarafından tahmin edilen değer arasındaki farktır.
yˆ y
Artık terminin (hata) grafiksel gösterimi
X Y
4
30020 0 100 400
390 4
* 60 150
x 60 150
yˆ
390
312
ε= Artık = 312 - 390 = -78
Regresyon Parametrelerinin Tahmini
b ve a katsayıları aşağıdaki eşitlikler kullanılarak hesaplanır :
n x x
n
y xy x
x x
y y
x
b x 2
2
2 ( )
) (
) )(
(
x b y
a
En küçük kareler (EKK) yöntemi kullanılarak
modeldeki artık kareler toplamı minimize edilerek parametre tahminleri yapılır.
Örnek: Gebelik haftası ile hemoglobin düzeyi arasında anlamlı bir ilişki bulunmakta mıdır? Basit doğrusal
regresyon modelini oluşturarak eğim parametresinin anlamlılığını test ediniz.
No Hafta Hemoglobin No Hafta Hemoglobin
1 33 10.8 11 33 10.5
2 33 9.5 12 30 11.0
3 23 14.2 13 35 10.9
4 34 9.7 14 25 14.0
5 32 11.2 15 22 13.8
6 35 9.7 16 28 12.9
7 30 12.1 17 27 12.8
8 23 13.0 18 29 11.0
9 28 12.0 19 24 13.5
10 26 13.2 20 31 10.8
No Hafta (x) Hemo.
(y) x2 xy
1 33 10.8 1089 356.4
2 33 9.5 1089 313.5
3 23 14.2 529 326.6
4 34 9.7 1156 329.8
. . . . .
. . . . .
. . . . .
17 27 12.8 729 345.6
18 29 11.0 841 319.0
19 24 13.5 576 324.0
20 31 10.8 961 334.8
Total 581 236.6 17215 6761.6
331 .
0 20
) 581 17215 (
20
6 . 236
* 6 581
. 6761 )
( 2 2
2
n x x
n
y xy x
b
4 . 20 21
) 581 331
. 0 20 (
6 .
236
y bx a
x y 21.4 0.331
Regresyon parametrelerinin tahmini
Eğim parametresinin (b) anlamlılığının testi
tα, n-(p+1)= t(0.05, 18)= 2.1, t= 10.1 > t(0.05, 18)= 2.1, red H0; eğim sıfır değildir.
(n= örneklem genişliği, p= bağımsız değişken sayısı)
033 .
0 Sb
0 :
0 :
1 0
H
H 10.1
033 . 0
331 . 0 S
t b
b
ARALIK TAHMİNİ
Tahminler çekilen örnekten örneğe değişeceğinden regresyon katsayılarını standart hataları ile vermek yerinde olacaktır , . Tahminlerin standart hataları çoğu istatistik paket programının çıktılarında
confidence interval (güven aralığı) CI olarak gösterilir ve β’nın içinde bulunduğu aralık ile birlikte
verilir:
(1-α)% CI for β
95% güven aralığında β: (-4.000, -0.263) (t(0.05, 18)= 2.1).
Sb
033 .
0
* 1 . 2 331
. 0
S t
b ,n (p 1) b
Belirtme katsayısı (determinasyon katsayısı)
Belirtme katsayısı, doğrusal modelin uyum iyiliğinin en iyi ölçüsüdür. Bağımlı
değişkendeki değişimin ne kadarının bağımsız değişken (ler) tarafından açıklandığını ifade eder. Bu durum,
regresyon modelinin açıklayıcılık gücünün iyi bir göstergesidir. ( R2 )
Örneğimizde, hemoglobin düzeyindeki değişimin
%85’nin gebeliğin bulunduğu hafta ile
açıklanabileceği hesaplanmıştır. (R2= 0.85).
Örnek: SPSS ile yaş ile %yağ değişkenleri arasındaki ilişkiyi Person ve Spearman’s korelasyon katsayıları kullanarak hesaplayınız. Değişkenler arasında anlamlı bir ilişki varsa regresyon modelini oluşturarak modelin anlamlılığını test ediniz.
No Yaş Rank %Yağ Rank No Yaş Rank %Yağ Rank
1 23 1.5 9.5 2 10 53 10.5 34.7 16
2 23 1.5 27.9 7 11 53 10.5 42.0 18
3 27 3.5 7.8 1 12 54 12.0 29.1 8
4 27 3.5 17.8 3 13 56 13.0 32.5 12
5 29 5.0 31.4 11 14 57 14.0 30.3 9
6 41 6.0 25.9 5 15 58 15.5 33.0 13
7 45 7.0 27.4 6 16 58 15.5 33.8 14
8 49 8.0 25.2 4 17 60 17.0 41.1 17
9 50 9.0 31.1 10 18 61 18.0 34.5 15
AGE
70 60
50 40
30 20
FATPERC
50
40
30
20
10
FAT % 0
Correlations
1 ,749**
. ,000
18 18
,749** 1
,000 .
18 18
Pearson Correlation Sig. (2-tailed)
N
Pearson Correlation Sig. (2-tailed)
N AGE
FATPERC
AGE FATPERC
Correlation is significant at the 0.01 level (2-tailed).
**.
Correlations
1,000 ,754**
. ,000
18 18
,754** 1,000
,000 .
18 18
Correlation Coefficient Sig. (2-tailed)
N
Correlation Coefficient Sig. (2-tailed)
N AGE
FATPERC Spearman's rho
AGE FATPERC
Correlation is significant at the 0.01 level (2-tailed).
**.
SPSS ÇIKTISI
Coefficientsa
5,806 5,258 1,104 ,286 -5,340 16,953
,498 ,110 ,749 4,518 ,000 ,264 ,732
(Constant) AGE Model
1
B Std. Error Unstandardized
Coefficients
Beta Standardized
Coefficients
t Sig. Lower Bound Upper Bound 95% Confidence Interval for B
Dependent Variable: FATPERC a.
Model Summary
,749a ,561 ,533 6,2483
Model 1
R R Square
Adjusted R Square
Std. Error of the Estimate Predictors: (Constant), AGE
a.
ANOVAb
796,878 1 796,878 20,411 ,000a
624,660 16 39,041
1421,538 17
Regression Residual Total Model
1
Sum of
Squares df Mean Square F Sig.
Predictors: (Constant), AGE a.
Dependent Variable: FATPERC b.