BASİT REGRESYON

(1)

BASİT REGRESYON

Yrd. Doç. Dr. C. Deha DOĞAN

(2)

(3)

• Masabaşı çalışan birini ayık tutmak için kafasına belli zaman aralıklarında su damlatan su dolu bir huni içeren,gumption reviver adını verdiği bir düzenek icat etmiş.

• Uzman olmayan ki$ilerin fikirlerinin hiç bir önemi olmadığını savunur.

• ingiliz bilim adamı..darwin'in kuzenidir. 1909'da "sir" unvanı almı$tır.

• insanda yasami boyunca parmak izlerinin, degismedigini belirten ilkantropolog

• idam mahkumlarını asmak için gerekli olan ipin kalınlığını ve uzunluğunun tam ölçüsünü bulmuş.

• insanların sofra arkadaşlarına doğru ne kadar eğildiğini anlamak için sandalye ayaklarındaki basıncı ölçen bir aleti icat etmiştir. ayrıca kadınların vücut ölçülerini uzaktan belirleyen aleti de icat etmiştir.

• ilk (psikoloji) test merkezi 1882 yilinda kendisi tarafindan kurulmustur. ayrica, zekayi olcmeye calisan ilk kisidir.

•

• Galton’un duyumlar ve zeka arasında bir bağlantı olduğu düşüncesini Amerika’ya götüren J. Cattell’dir. Bellek, imge, görme ve işitme keskinliği, ses ve ağırlık algıları, zaman algısı, renk tercihleri alanlarındaki testleri çok sayıda üniversite öğrencisine uygulayarak onların zihinsel güçlerini ölçmeye çalışmıştır. Bu ölçmelerde daha çok, bireylerin belli uyarıcılara gösterdikleri tepkinin hızı saptanmaya çalışılmış, bireysel farkların bu alanda kendini gösterdiğine inanılmıştır. (Toker 1968:18-21)

(4)

(5)

• 19.yy.ın sonlarına doğruysa günümüz zeka testlerinin temelleri atılmaya başlanıyor.

O yıllarda Francis Galton kişilerin zeka kapasitelerini duyumsal ayrım yapabilme yetileri ve motor koordinasyonlarıyla ölçmeye çalışıyor. Her ne kadar öne sürdüğü yetiler zekayı ayırt eden ölçümler olmasa da, bireysel psikolojiye yol açtığı ve zekayı onunla ilişkilendirilen etmenler üzerinden nesnel olarak betimlemeye çalıştığı için tarihte önemli bir yeri var.

• Galton hep bir şeyleri sayar gibi gözükürdü. Konferanslarda veya tiyatroda sıkılmanın bir ölçüsü olarak gördüğü izleyici kıpırdanışlarını ve esnemelerini sayardı. Bir portresi olduğunda ise, resme vurulan fırça darbelerini saymıştı- yaklaşık 20.000 tane. Bir defasında sayılar yerine kokularla saymayı denemeye karar vermişti. 1,2,3 rakamlarının ne olduğunu unutmak için kendini eğitimden geçirmiş ve kısa bir süre içerisinde, sayı değerlerini kafur ve nane gibi kokulara tahsis etmişti. Sayılar yerine kokuları düşünerek toplama ve çıkarma yapmayı öğrenmişti. Bu zihinsel alıştırmanın ardından “Kokular Yoluyla Aritmetik” başlıklı bir yazısı Amerikan dergisiPsikoloji Eleştirileri’nin ilk sayısında yayımlanmıştır.

• http://www.varoluscuterapi.com/sir-francis-galton-1822-1911/772

(6)

(7)

(8)

(9)

(10)

• A Saçılım grafiği iki değişken arasındaki ilişkiyi grafik olarak gösteren yardımcı bir araçtır. X-y grafiği

olarak da adlandırılır.

Saçılım Grafiği

(11)

İki değişken arasındaki ilişki

X Y

(a) Doğrusal

(12)

X Y

(b) Doğrusal

(13)

(c) Eğrisel

X Y

(14)

(d) İlişki yok

X Y

(15)

• Basit doğrusal regresyondaki basit kelimesi iki değişken arasındaki ilişkiyi açıklamak için

kullanılmasından, doğrusal kelimesi ise kurulan modelin parametreleri açısından doğrusal bir model olmasındandır

x y

(16)

BASİT DOĞRUSAL REGRESYON MODELİ

(POPULASYON MODELİ)

y =  + βx + ε y_i = a + bx_i + e_i

y= bağımlı değişken x= bağımsız değişken

a= sabit (y-eksenini kestiği nokta)

b = regresyon doğrusunun eğimi (regresyon katsayısı) ε= hata terimi veya artık

(17)

b (eğim): X deki 1 birim değişmenin Y’de yolaçtğı ortalama değişim miktarıdır.

b

(18)

a (sabit): X =0 iken Y’nin alacağı ortalama değeri gösterir. Doğrunun Y eksenini kestiği noktadır.

b

a

(19)

Basit Doğrusal Regresyon Eşitliği

bx a

yˆ  

(20)

X= 2 - 4 - 1 - 5

y= 3 - 5 - 1 - 3

(21)

X= 2 - 4 - 1 - 5

y= 3 - 5 - 1 - 3

(22)

(23)

(24)

(25)

yaş-bakım harcaması grafiği

10000 20003000 40005000 60007000 80009000 10000 11000 12000

0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 yaş

bakım harcaması

(26)

10000 20003000 40005000 60007000 80009000 10000 11000 12000

0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 yaş

bakım harcaması

(27)

10000 20003000 40005000 60007000 80009000 10000 11000 12000

0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 yaş

bakım harcaması

(28)

Eğim (b) nasıl hesaplanır?

 

 

  



  ₂

2

) )(

(

X X

n

Y X

XY b n

 



  ₂

) (

) ).(

(

X X

Y Y X b X

(29)

X= 2 - 4 - 1 - 5

y= 3 - 5 - 1 - 3

(30)

Başlangıç noktası (a) sabit değer nasıl hesaplanır?

bx a

y ˆ  

bx y

a  ˆ 

(31)

X= 2 - 4 - 1 - 5

y= 3 - 5 - 1 - 3

(32)

• Verilen örnek için b(eğim):0.6

a(sabit): 1.2

Hesapl90anan bu katsayılar regresyon eşitliğinde yerlerine konulduğunda;

X

y ˆ  1 . 2  0 . 6

(33)

(34)

(35)

(36)

(37)

(38)

(39)

(40)

(41)

(42)

 

 

  



  ₂

2

) )(

ˆ (

X X

n

Y X

XY b n

(43)

(44)

) 43 )(

217 (

10 ) 102 )(

43 (

) 476 (

ˆ 10

2

  b

1849 2170

4386 ˆ 4760



  b

165 ,

1 321 ˆ 374



b 

(45)

bx y

a  ˆ 

) 3 , 4 ( 165 ,

1 2

,

 10  a

19 ,

 5

a

(46)

r

²

Nasıl Hesaplanır?

• r² (açıklanan varyans) değişkenlerin birindeki değişimin ne kadarının diğer değişkenler tarafından açıklandığını yüzde olarak eden bir değerdir.

• Determinasyon katsayısı olarak da isimlendirilir.

(47)

Tahmini “Y” değeri hesaplama

X1= 5,195+1,165*1=6,36 X2= 5,195+1,165*2=7,53 X3= 5,195+1,165*3=8,69 X4= 5,195+1,165*4=9,86 X4= 5,195+1,165*4=9,86 X5= 5,195+1,165*5=11,02 X5= 5,195+1,165*5=11,02 X6=5,195+1,165*6=12,19 X6=5,195+1,165*6=12,19 X7=5,195+1,165*7=13,35

(48)

(49)

81 ,

6 0 , 53

57 ,

2  43 

r

(50)

(51)

 



 

)

2

(

) ).(

(

X X

Y Y

X b X

5 , 110

5 ,

 625

b b  5 , 66

bx y

a  ˆ 

(52)

5 ,

5 .

66 ,

5 5

,

50 

 a

bx y

a  ˆ 

37 ,

 19 a

X

y ˆ  19 , 37  5 , 66

(53)

(54)

(55)

82 ,

5 0 , 4300

93 ,

2  3539 

r

(56)

2 ˆ )

( ²



  

n

Y S _YX Y

1 r 2

S

S _YX  _y 

(57)

Tahminin Standart Hatası

Gözlenen ve tahmin edilen değerlerin

arasındaki fark puanlarının standart sapmasıdır.

2 ˆ )

( ²



  

n

Y

S _YX Y

(58)

Tahminin Standart Hatası

• Fark puanlarına dayalı standart hata tan sayılı küçük gruplar için kolay olmakla beraber

büyük gruplar için korelasyona dayalı şu formül kullanılır.

) 1

2 (

1

₂

n r Sy n

S

_YX



 

(59)

1 r 2

S

S _YX  _y 

(60)

(61)

2 10

774 ,

759   S

YX

2 ˆ )

(

²



   n

Y S

_YX

Y

2 10

774 ,

759  

S

YX

S

YX

^ ⁹⁴ ^, ⁹⁷

745 ,

 9 S

YX

Bağımlı değişkenin regresyon eğrisi etrafındaki değişkenliğinin ölçüsü

(62)

(63)

2 ˆ )

(

²



  

n

Y S

_YX

Y

119 ,

8 1

213 ,

10 

YX



S

(64)

1 r 2

S

S _YX  _y 

81 ,

0 1

44 ,

2 

YX  S

19 ,

0 44

,

 2 S YX

061 ,

1 )

435 ,

0 ( 44 ,

2 

YX 

S

(65)

ISTATISTİK II Regresyon

Yrd. Doç. C. Deha DOĞAN

(66)

ANLAM ÇIKARICI İSTATİSTİK ve İLGİLİ KAVRAMLAR

(67)

Anlam Çıkarıcı İstatistik

• Anlam çıkarıcı istatistiğin amacı örneklemin karakterlerinden evrenin karakterlerini tanımak, kestirmek, ya da ilgilenilen

değişkenler bakımından gözlenen değerler arasındaki ilişkiye dayanarak evrendeki ilişki hakkında kestirim yapmaktır.

Bir araştırmada değişkenler arasındaki farklar ya da ilişkiler arasında tahmin yapmak ve olayları açıklamak için iki tür hipotez kullanılır.

(68)

Hipotez Nedir?

• Denenebilen (doğrulanabilir/ yanlışlanabilir) yargılardır.

• Araştırmanın olası sonucuna dair yapılan tahminlerin ifadesidir.

• Değişkenler arasındaki ilişkileri/farkı belirlemeye yönelik bilimsel önermelerdir.

(69)

Örnekler

– Yabancı dil öğrenmede yaşın etkisi vardır.

– Öğrencilerin ÖSS puanları, yükseköğretimdeki akademik başarılarını etkiler.

– X ilacı soğuk algınlığının tedavisinde Y ilacından daha etkilidir.

(70)

(71)

Hipotezler ikiye ayrılır;

• Sıfır Hipotezi ^(H⁰) (Yokluk/Null hipotezi)

• Araştırma hipotezi ^(H¹)(Alternatif hipotez)

(72)

Sıfır ve Araştırma Hipotezleri

• Sıfır (yokluk) hipotezi değişkenler arasında farkın ya da ilişkinin olmadığını belirtir. İstatistiksel hipotez olarak da isimlendirilir ve sembolü H₀ olarak gösterilir.

• Araştırma hipotezi ise değişkenler arasındaki farkın veya ilişkinin var olduğunu belirtir. Genellikle H₁ sembolü ile gösterilir.

(73)

Örnekler H

₀

Hipotezi:

– Öğrencilerin matematik ve fen bilgisi dersi başarıları arasında bir ilişki yoktur. (H_{0 :}r_{mat- fen}=0)

– Drama yöntemi veya geleneksel yöntem ile öğretim yapılan

öğrencilerin başarıları puanları arasında fark yoktur. (H_{0 :}µ_drm- µ_gln =0)

(H_{0 :}µ_drm = µ_gln )

(74)

Örnekler H

₁

Hipotezi

– Öğrencilerin matematik ve fen bilgisi dersi başarıları arasında bir ilişki vardır. (H_{1 :}r_mat - r_fen≠0) – çift yönlü

– Öğrencilerin matematik dersi başarıları arttıkça Fen Bilgisi dersindeki başarıları da artar. ^(H_{1 :}^r_mat^{– r}_fen>0) – tek yönlü

(75)

Örnekler H

₁

Hipotezi

– Drama yöntemi veya geleneksel yöntem ile öğretim yapılan

öğrencilerin başarıları puanları arasında fark vardır (H_{1 :}µ_drm- µ_gln ≠ 0) (H_{1 :}µ_drm ≠ µ_gln ) – Çift yönlü

– Drama yöntemi ile öğretim yapılan öğrencilerin başarı puanları

geleneksel yöntem ile öğretim yapılan öğrencilerden yüksektir (H_{1 :}µ_drm- µ_gln> 0) (H_{1 :}µ_drm > µ_gln) – Tek yönlü

(76)

Önemli Hatırlatma

• Yaptığımız araştırma sonuçlarına göre HO hipotezini reddederiz ya da reddedemeyiz.

• İstatistik jargonunda H1 hipotezi veya H0 hipotezi kabul edildi şeklinde bir anlatım kullanılmaz. Örneğin H1 hipotezinin kabul edildiği durum “ H0 hipotezi reddedildi”

şeklinde ifade edilir.

(77)

(78)

(79)

Hipotez testine karar verirken 2 tür hata yapabiliriz;

Gruplar arasında gerçekte bir farklılık yokken farklılık var diyebiliriz. Örneğin kızların ve erkeklerin zeka puan ortalamaları arasında gerçekte fark yokken yaptığımız çalışmada bir farklılık olduğu sonucuna ulaşabiliriz. Bu 1. tür hata olarak adlandırılır (alfa).

Başka bir deyişle H0 (yokluk) hipotezini kabul etmemiz (reddetmememiz) gerekirken reddederiz.

1. TÜR HATA (ALFA)

(80)

Hipotez testine karar verirken 2 tür hata yapabiliriz;

Gruplar arasında gerçekte bir farklılık varken farklılık yok diyebiliriz. Örneğin kızların ve erkeklerin boy uzunluğu ortalamaları arasında gerçekte fark varken yaptığımız çalışmada bir farklılık olmadığı sonucuna ulaşabiliriz. Bu 2. tür hata olarak adlandırılır (beta).

Başka bir deyişle H0 (yokluk) hipotezini (reddetmemiz) gerekirken reddederiz.

2. TÜR HATA (BETA)

(81)

(82)

Olasılık Düzeyi (alfa)

Olasılık düzeyi başka bir ifade ile “p” değeri araştırmanın başında karşılaştırılır. Genellikle bu düzey 0,05 olarak belirlenir.

Bu değer doğru olan bir yokluk hipotezinin reddedilme olasılığını gösterir.

Örneğin kız ve erkeklerin zeka düzeyleri arasında fark yokken araştırma sonucunda fark var deme olasılığının %5 olduğu anlamına gelir.

Eğer p değeri (p<0,05) 0,05’ten küçük ise yani gruplar arasında fark yokken hata ile fark var deme olasılığı %5’ten az ise, bulguların istatistiksel olarak manidar olduğu kabul edilir. Bu değer (0,05) araştırmanın türüne, amacına göre başka değerler de alabilir (ör: 0,01).

(83)

Serbestlik Derecesi

• Serbestlik derecesi bir değişkene ilişkin elde edilen puanların değişiklik gösterebilme serbestliği olarak ifade edilebilir.

• Serbestlik derecesi toplam gözlem sayısından serbestçe

değişiklik göstermeyen puan sayısının çıkartılması ise bulunur.

• Örneğin örneklem ortalamasına dayalı olarak evren

ortalamasını tahmin edildiği durumlarda serbestlik derecesi n-1 yani örneklem büyüklüğünden 1 çıkarılarak bulunur.

(84)

Örneğin 7 öğrenciden her birinin sırayla aşağıdaki balonlardan bir tanesini seçmesi isteniyor.İlk öğrenci istediği renkteki balonu seçebilir.

İkinci öğrenci geri kalan balonlardan istediğini seçebilir. Bu ta ki 8. öğrenciye kadar devam eder. Çünkü sıra 7. öğrenciye geldiğinde seçebileceği tek renk bir balon

kalmıştır ve değişkenlik serbestliği yoktur.

Bu nedenle böyle bir durumda serbestlik derecesi 7 (toplam gözlem sayısı) – 1 ( değişkenlik gösterebilme serbestliği olmayan gözlem sayısı) =6 olur

.

(85)

Bir Örnek

• Benzer şekilde toplamları 100 olan 5 sayı söylemeniz

istendiğinde ilk 4 sayıyı seçme konusunda özgür olursunuz.

Seçeceğiniz sayının değişkenlik gösterme serbestliği yüksektir.

Ancak en son söyleyeceğiniz sayı mutlaka önceki söylenen 4 sayıyı 100’e tamamlamak zorundadır.

• 25+30+35+7+? = 100 Soru işareti bulunan kısım bu durumda mutlaka 3 olmalıdır ve değişkenlik gösterme serbestliği yoktur.

Yani bu durumda serbestlik derecesi 5 -1 =4 olur.

(86)

T TESTİ: ORTALAMALAR ARASI FARKLARIN TEST EDİLMESİ

(87)

(88)

(89)

• Gruplara ait ortalamalar elde edildiğinde ,

farklı olup olmadıkları ilk bakışta belirlenemez.

• Ortalamalar arsında bulunan 3 puanlık bir fark bazı durumlarda istatistiksel olarak anlamlı

bulunurken bazı durumlarda bulunmayabilir.

(90)

(91)

T Dağılımının özellikleri

• t ortalaması 0 olan bir dağılımdır.

• t ortalamaya göre simetrik dağılır

• t varyansı 1’den büyük olan bir dağılımdır;

ancak örneklem büyüklüğü arttıkça, varyans 1’e yaklaşır.

(92)

T-TESTİ

1. Tek örneklem için t testi

2. Bağımsız örneklem için t testi 3. Bağımlı örneklem için t testi

(93)

Tek örneklem t testi için hipotezler

• Tek örneklem t testinde hipotezler, örneklemden elde edilen ortalama ile evren ortalaması arasında fark

olup olmamasına göre oluşturulur.

sembolü evrene ait ortalamayı ifade eder.

sembolü örnekleme ait ortalamayı ifade eder

0

:  X 

H  H

₁

:   X  0



X

(94)

Tek örneklem T testi

• Örneklem ortalamasının anlamlılığını test etmek üzere kullanılan parametrik bir

tekniktir. 2 varsayımı mevcuttur;

– Bağımlı değişkene ait puanlar eşit aralıklı ya da eşit oranlı ölçek düzeyindedir.

– Bağımlı değişkene ait puanlar evrende normal dağılım gösterir

(95)

EVREN

A Fakültesindeki öğrenciler N:1000

Üniversite olanaklarından memnuniyet düzeyi ortalaması ( ) :75

Bu gruptan seçkisiz (yansız)

olarak 50 kişi seçilir.

ÖRNEKLEM

Seçkisiz seçilen 50 kişi.

Üniversiteden memnuniyet düzey ortalaması: 80 Standart sapması:5,6 Acaba örneklem ve

evren

ortalamalarında meydana gelen fark

gerçekte var mı?

Yoksa şansla mı oluşmuş?

(96)

Evren ortalaması ya da örneklem ortalaması arasında fark yoktur ya da bu fark tesadüfen oluşmuştur ve sıfır kabul edilebilir.

Evren ortalaması ya da örneklem ortalaması arasındaki fark tesadüfen oluşmamıştır, gerçekte vardır ve sıfır kabul edilemez.

0

:

_memnuniyet

 X

^memnuniyet

 H 

0

1

:

_memnuniyet

 X

^memnuniyet



H 

(97)

Tek Örneklem T-Testi Formülü

evrene ait ortalama

örnekleme ait ortalama

S: Örnekleme ait standart sapma

n S

t  X 



Ortalamanın Tahmini Standart Hatası



X

(98)

ÖRNEK

• X üniversitesindeki öğrencilerin IQ (zeka) puan ortalaması 100’dür.

Yeni geliştirdiğim bu sıvıyı içen öğrencilerin zeka seviyelerinde bir farklılık oluşacaktır.

Daha sonra iksir içen öğrencilerden 30’u yansız olarak seçiliyor ve zeka düzeyleri ölçülüyor. Ölçümler sonucunda

örneklem ortalaması: 110 ve standart sapması 20 olarak hesaplanıyor

(99)

Evren ortalaması ve örneklem ortalaması arasındaki bu farkın gerçekten var olduğunu nerden bilebilirim? Ya bu fark şans eseri

ortaya çıkmışsa? Bana bunu kanıtlamalısın!

Bunun için tek örneklem t testi hesaplamalıyım. Ama öncelikle hipotezlerimi ve kabul edeceğim alfa düzeyini belirlemeliyim

Alfa değeri: 0,05

100

0 :   H

100

1 :  

H

(100)

Bunun için ihtiyacım olan bilgiler şunlar:

Evren ortalaması: 100 Örneklem Ortalaması: 110 Örneklem standart sapması: 20

n: 30

Serbestlik derecesi: 30-1= 29

n S

t _ X ^



(101)

30 20

100 110 

t 

738 ,

651 2 ,

3 10 



t

(102)

29 serbestlik derecesi için 0,05 düzeyinde kritik değer ne acaba? T tablosundan bakmalıyım

738 ,

2 699

,

1 

(103)

Bulduğumuz t değeri tablo değerinden yüksek olduğu için H0 hipotezini reddeder yani örneklemin

ortalamasının grup ortalamasından farklı olduğunu belirtiriz.

(104)

(105)

(106)

(107)

(108)

7 ,

 4

 _X _ ₅_,₀

1

)

( ²









n

X S X

 22 N

21 5 ,

 4 S

46 ,

 0 S

(109)

Hipotezler

7 , 4

0 :   H

7 , 4

1 :  

H

(110)

7 ,

 4

 X  5,0

46 ,

 0 S

 22

N SD  21

n S

t _ X ^



22 46 ,

0

7 , 4 0

,

5 

 t

721 ,

1 058

, 098 3

, 0

3 ,

0  

 t

(111)

(112)

(113)

ÖRNEKLER

• Şimdi Ziraat Bankası gibi 24.000 kişinin çalıştığı büyük bir kuruluşta anket çalışması yapmak istediğinizi düşünün. Herkese anket uygulamanız maliyetli olacaktır. Bunun için kaçınılmaz olarak örnekleme yaptınız ve rastgele 400 kişi seçtiniz. Ancak içinize bir kurt düştü ve bu seçtiğiniz örneklemin ana kütlenin özelliklerini yansıtıp

yansıtmadığını test etmek istiyorsunuz. İşte Tek Örneklem t – Testi burada yardımınıza yetişiyor.

•

Bunun yanında bir konuya ilişkin tahminlerinizin doğru olup olmadığını da Tek Örneklem t – Testini kullanarak test edebilirsiniz. Örneğin bir şehirdeki insanların yaş ortalamasının 40 olarak tahmin ediyorsunuz. Daha sonra rastgele 100 kişi

seçtiniz ve bunların yaş ortalamasını hesapladınız. Fakat örnekleminizin ortalaması 42 çıktı. Tahmininiz hatalı mıydı? Tek Örneklem t – Testini kullanmadan böyle bir sonuca gidemezsiniz. Çünkü hata örneklemden de kaynaklanabilir. Diğer bir ifade ile başka bir 100’lük grup seçseniz bu grubun yaş ortalaması 38 çıkabilir. En sağlamı herkesi hesaplamaya dahi ederek bu tartışmayı bitirmek gibi gözüküyor. Ancak

buna ne zaman ne kaynak yetmez. Ayrıca pratikte herkese de ulaşamazsınız. İşte bu yüzden istatistik hesaplamaları yapıyoruz.

(114)

(115)

Kızların zeka puan ortalaması

= 80

Ortalama Puanlar arsındaki fark gerçekten var mı?

X

Erkeklerin zeka puan

ortalaması

X = 75

(116)

Hipnoz yöntemi hafıza üzerinde etkili mi?

Hafif hipnoz uygulanan

grup (20 kişi)

Ağır hipnoz uygulanan

grup (20 kişi) Her iki gruba 25

önemli detay içeren bir hikaye

dinlettirilir.

Ortalama hatırlanan detay sayısı

Ortalama hatırlanan detay sayısı Gruplar asında

gözüken fark anlamlı mı?

(117)

BAĞIMSIZ ÖRNEKLEMLER İÇİN T-TESTİ

• Bu test iki bağımsız örneklemden elde edilen ortalamalar arasındaki farkın anlamlılığını test etmek için için kullanılan parametrik bir testtir.

EVREN A (KIZLAR)

EVREN B (ERKEKLER)

Örneklem Örneklem

Ortalama Puanlar arsındaki farkın anlamlılığını test

etmek

(118)

Varsayımlar

1. İki örneklem grubu birbirinden bağımsızdır.

2. Bağımlı değişken aralıklı veya oranlı ölçek düzeyinde ölçülmüş olmalıdır.

3. Her örneklemin temsil ettiği evrenin evrenin ham puanları normal dağılım göstermektedir.

4. Örneklemler tarafından temsil edilen evrenlerin varyansları homojendir.

(119)

Hipotezler

ALTERNATİF HİPOTEZLER

0 :

₁ ₂

1

   

H

2 1

1

:   

H

^{ÇİFT YÖNLÜ}

2 1

1

:   

H

0 :

₁ ₂

1

   

H

^{TEK YÖNLÜ}

(120)

Hipotezler

YOKLUK (NULL) HİPOTEZİ

0 :

₁ ₂

0

   

H H

₀

: 

₁

 

₂

İki grup da aynı ortalama puana sahip evrenleri temsil etmektedir.

İki evrene ait ortalama puanları arasındaki fark anlamlıdır

(121)

2

1

X

X 

Grup ortalamaları arasındaki

fark

) 1 (

2 1

2 2 2

2 1 2 1









 

n n

S n

S

S ^ortak n varyanslarının ağırlıklı ^Örneklem

ortalaması

2 1

2 2

1

1 ) 1

(S n n

Sx _x  ortak  Farkın standart hatası

(122)

Bağımsız Örneklemler için T Testi Formülü

İki grup ortalaması arasındaki fark

Farkın Standart

Hatası



 



 



 















 

2 1

2 2 2

2 1 1

2 1

1 1

) 1 (

n n

S n

X t X

(123)

 

 



 

 

 















 

2 1

2 2 2

2 1 1

2 1

1 1

) 1 (

n n

S n

X

t X

(124)

ÖRNEKLER

56 ,

1  100 X

70 ,

1  7 S

1  9 N

22 ,

2  94 X

61 ,

2  5 S

2  9 N

(125)

56 ,

1  100 X

70 ,

1  7 S

1  9 N

22 ,

2  94 X

61 ,

2  5 S

2  9 N

29 ,

2 59

1 

S

47 ,

31

22  S

2 1

1

:   

H

2 1

0

:   

H



 



 



 















 

2 1

2 2 2

2 1 1

2 1

1 1

) 2 (

) 1 (

n n

S n

X t X

(126)

(127)

00 ,

 2

t sd  16   0 , 05 22

, 16 0

08 ,

726 34 ,

 6

t

(128)

(129)

BAĞIMLI ÖRNEKLEMLER İÇİN T-TESTİ

DÖNEM BAŞI 3-A Sınıfı

Matematik Dersi Başarı Puanı

DÖNEM SONU 3-A Sınıfı

Matematik Dersi Başarı Puanı

Aynı örnekleme ait farklı zamanlarda aynı

özelliğin ölçüm sonuçları arasında anlamlı bir farklılık

var mıdır?

İlişkili (bağımlı) t testi ilişkili iki örneklemden elde edilen 2 ortalama arasındaki farkın anlamlılığını test etmek üzere kullanılan parametrik bir tekniktir.

(130)

Varsayımlar

1. Bağımlı değişken aralık ya da oranlı ölçek düzeyindedir.

2. Her bir örneklemin temsil ettiği evrende puanlar normal dağılım gösterir.

3. Örneklemler ile gösterilen evrenlerin varyansları homojendir.

(131)

Hipotezler

ALTERNATİF HİPOTEZLER

0

1

:

_d



H 

^{ÇİFT YÖNLÜ}

0

1

:

_d

 H 

0

1

:

_d



H 

^{TEK YÖNLÜ}

(132)

Hipotezler

YOKLUK (NULL) HİPOTEZİ

0

:

_d

 H 

Fark puanlarının ortalaması sıfıra eşittir.

(133)

FORMÜL

  ^



 





 





1 ) 1

( )

(

² ²

D n D

n

t D

(134)

ÖRNEK

(135)

0 1 : _d  H 

ön son

ortalama ortalama

H

₁

: 

0 0 : _d 

H 

(136)

  _



 



 



9 ) 1

49 (

) 83 (

10 t 7

 

^



 





 





1 ) 1

( )

( ² ²

D n D

n t D

(137)

 ⁸³⁰ ^ ⁷ ⁴⁹   ⁰ ^, ¹¹ 

 t

91 ,

85  7 t

751 ,

 0

t

(138)

05 ,

 0

 _sd _ ₉

833 ,

 1 kd

883 ,

1 751

,

0 

t 

(139)

(140)

Etki Büyüklüğü

• Örneklem ortalaması arasındaki farkın anlamlı olması bağımlı ve bağımsız değişken arasında güçlü bir ilişki olduğunun göstergesi değildir.

• Örneklem büyüklüğü arttıkça gerçekte küçük olan farklar anlamlı çıkar. Çünkü örneklem

büyüyünce farkın standart hatası küçülür.

Küçük standart hata büyük t değeri ütretir.

(141)

PARAMETRİK OLMAYAN TESTLER

Yrd. Doç. Dr. C. Deha DOĞAN

(142)

Kİ- KARE BAĞIMSIZLIK TESTİ

• İki değişken için ki-kare testi iki sınıflamalı değişkenin birbirinden bağımsız olup olmadığını test eder.

• Ki-kare bağımsızlık testi iki veya daha fazla değişken

grubu arasında ilişki bulunup bulunmadığını incelemek için kullanılır. Yani değişkenler arasında bağımsızlık

olup olmadığı araştırılır.

(143)

• Biri sınıflamalı diğeri sıralamalı olan iki değişkenin birbirinden

bağımsızlığını başka bir ifade ile aralarında manidar bir ilişki olup olmadığını test etme amacıyla kullanılır.

(144)

(145)

2 X 2’LİK ÇAPRAZ TABLO

(146)

2 X 3’LÜK ÇAPRAZ TABLO

Başarı durumu

Beslenme İyi Orta Zayıf

Yeterli 60 30 10

Yetersiz 30 30 40

(147)

4 X 3’LÜK ÇAPRAZ TABLO

Partilere oy verme durumu

Eğitim düzeyi A Partisi B partisi C partisi

İlkokul 50 30 20

Ortaokul 10 30 60

Lise 25 25 50

Üniversite 90 5 5

(148)

FORMÜL

b

b g

f

f ²

2 ( _ )

 

(149)

f

_{g =}

Gözlenen Değer

f

_{b =}

Beklenen Değer

Beklenen Değer, satır ve sütun kenar toplamlarının çarpımının toplam sayıya bölünmesiyle elde edilir.

b b g

f f

f

²

2

(

_

)

 

(150)

Serbestlik Derecesi

• Ki kare testinde serbestlik derecesi şu formül ile hesaplanır;

Sd= (satır düzeyi-1)(sütun düzeyi-1)

(151)

(152)

ÖRNEK

(153)

Hioptezler

H0: Cinsiyet ve kandaki kolestrol düzeyi arasında bir ilişki yoktur.

H1: Cinsiyet ve kandaki kolestrol düzeyi arasında

manidar bir ilişki vardır.

(154)

BEKLENEN DEĞERLER (Kadın) Kadın – Normalden Düşük Değer = 60*100\200 = 30 Kadın – Normal Değer = 100*100/200 =50

Kadın Normalden Yüksek Değer = 40*100/200= 20

(155)

BEKLENEN DEĞERLER (Erkek) Erkek – Normalden Düşük Değer = 60*100\200 = 30 Erkek – Normal Değer = 100*100/200 =50

Erkek- Normalden Yüksek Değer = 40*100/200= 20

(156)

(157)

3 , 30 13

) 30 10

(

²

2

 

 

5 , 50 0

) 50 55

(

²

2

  



25 . 20 11

) 20 35

(

²

2

 

 

3 , 30 13

) 30 50

(

²

2

 

 

5 , 50 0

) 50 45

(

²

2

 

 

25 . 20 11

) 20 5

(

²

2

 

 

(158)

1 ,

2

 50



^pdüzeyi ^ ⁰^.⁰¹ ^kd ^ ⁹^,²¹⁰ ^ ⁵⁰^,¹

HO HİPOTEZİ REDEDİLİR

CİNSİYET VE KANDAKİ KOLSTROL ARASINDA

BİR İLİŞKİ VARDIR

(159)

CİNSİYET İZLENEN PROGRAMLAR

Evlenme Belgesel Magazin

Kız 18 43 14

Erkek 39 23 18

(160)

(161)

(162)

(163)

(164)

MANN-WHITNEY U TESTİ

• İki bağımsız ortalama puan arasındaki farkın test edilmesi sürecinde, eğer gerekli varsayımlar karşılanmamış ise bağımsız örneklem için t- testi’ne alternatif olarak kullanılır.

• Başka bir ifade ile bağımsız örneklem t-testinin parametrik olmayan karşılığıdır.

(165)

Hangi durumlarda kullanılır?

• Veriler eşit aralıklı ya da eşit oranlı ölçek düzeyinde elde edilmiş olmakla beraber dağılımın normallik varsayımın karşılanmadığı

• Değişkenlerin miktar olarak ölçülmeyip, nesne ya da bireylere ilişkin yargıların doğrudan sıra değerleri ile gösterildiği durumlarda kullanılır

(166)

Varsayımları

•İki grup örneklem birbirinden bağımsızdır.

• Bağımlı değişken en az sıralamalı ölçek

düzeyinde ölçülmüştür

^.

(167)

Formül



 



 ₁ ₂ ¹ ¹ ₁

1 2

) 1

( n R

n n n

U



 



 ₂ ₁ ² ² ₂

2 2

) 1

( n R

n n n

U

(168)



 



 ₁ ₂ ¹ ¹ ₁

1 2

) 1

( n R

n n n

U

n₁: Birinci gruptaki birey sayısı n₂: İkinci gruptaki birey sayısı

R₁:Birinci gruptaki değerlerin sıra numaraları toplamı R₂: İkinci gruptaki değerlerin sıra numaraları toplamı

(169)

İşlem Aşamaları

(170)

(171)

(172)

22 10

6 3

2 1     

 ^R

^e



69 13

12 11

9 8

7 5

4        

 ^R

^k



(173)

22 10

6 3

2 1     

 ^R

^e



69 13

12 11

9 8

7 5

4        

 ^R

^k



 5 n

e

 8 n

e



 



 ₁ ₂ ¹ ¹ ₁

1 2

) 1

( n R

n n n

U

(174)

22 10

6 3

2 1     

 ^R

^e



69 13

12 11

9 8

7 5

4        

 ^R

^k



 5 n

e

 8 n

e

33 2 22

) 1 5

( 8 5

.

5   



e 

U

(175)

22 10

6 3

2 1     

 ^R

^e



69 13

12 11

9 8

7 5

4        

 ^R

^k



 5 n

e

 8 n

e

7 2 69

) 1 8

( 5 8

.

8   



k 

U

(176)

• Hesaplanan 2 U değerinden her zaman küçük olan dikkate alınır ve tablo değeri ile karşılaştırılır.

H0: Kızlarla erkeklerin ortalama puanları arasında bir farklılık yoktur.

H1: Kızlarla erkeklerin ortalama puanları arasında bir farklılık vardır.

Çift yönlü bir hipotez için 0,05 alfa düzeyi için kritik değer 6<7(u

değeri) olduğundan gruplar arasında fark olmadığına karar verilir ve H0 reddedilemez . Başka bir ifade ile H0 kabul edilir.

(177)

ÖNEMLİ NOT

Parametrik t testlerinin aksine Mann Whitney U

testinde elde ettiğimiz u değeri kritik değerden büyük ise H0 hipotezini kabul eder yani gruplar arasındaki

manidar bir fark olmadığını belirtiriz.

(178)

(179)

(180)