BASİT REGRESYON
Yrd. Doç. Dr. C. Deha DOĞAN
• Masabaşı çalışan birini ayık tutmak için kafasına belli zaman aralıklarında su damlatan su dolu bir huni içeren,gumption reviver adını verdiği bir düzenek icat etmiş.
• Uzman olmayan ki$ilerin fikirlerinin hiç bir önemi olmadığını savunur.
• ingiliz bilim adamı..darwin'in kuzenidir. 1909'da "sir" unvanı almı$tır.
• insanda yasami boyunca parmak izlerinin, degismedigini belirten ilkantropolog
• idam mahkumlarını asmak için gerekli olan ipin kalınlığını ve uzunluğunun tam ölçüsünü bulmuş.
• insanların sofra arkadaşlarına doğru ne kadar eğildiğini anlamak için sandalye ayaklarındaki basıncı ölçen bir aleti icat etmiştir. ayrıca kadınların vücut ölçülerini uzaktan belirleyen aleti de icat etmiştir.
• ilk (psikoloji) test merkezi 1882 yilinda kendisi tarafindan kurulmustur. ayrica, zekayi olcmeye calisan ilk kisidir.
•
• Galton’un duyumlar ve zeka arasında bir bağlantı olduğu düşüncesini Amerika’ya götüren J. Cattell’dir. Bellek, imge, görme ve işitme keskinliği, ses ve ağırlık algıları, zaman algısı, renk tercihleri alanlarındaki testleri çok sayıda üniversite öğrencisine uygulayarak onların zihinsel güçlerini ölçmeye çalışmıştır. Bu ölçmelerde daha çok, bireylerin belli uyarıcılara gösterdikleri tepkinin hızı saptanmaya çalışılmış, bireysel farkların bu alanda kendini gösterdiğine inanılmıştır. (Toker 1968:18-21)
• 19.yy.ın sonlarına doğruysa günümüz zeka testlerinin temelleri atılmaya başlanıyor.
O yıllarda Francis Galton kişilerin zeka kapasitelerini duyumsal ayrım yapabilme yetileri ve motor koordinasyonlarıyla ölçmeye çalışıyor. Her ne kadar öne sürdüğü yetiler zekayı ayırt eden ölçümler olmasa da, bireysel psikolojiye yol açtığı ve zekayı onunla ilişkilendirilen etmenler üzerinden nesnel olarak betimlemeye çalıştığı için tarihte önemli bir yeri var.
• Galton hep bir şeyleri sayar gibi gözükürdü. Konferanslarda veya tiyatroda sıkılmanın bir ölçüsü olarak gördüğü izleyici kıpırdanışlarını ve esnemelerini sayardı. Bir portresi olduğunda ise, resme vurulan fırça darbelerini saymıştı- yaklaşık 20.000 tane. Bir defasında sayılar yerine kokularla saymayı denemeye karar vermişti. 1,2,3 rakamlarının ne olduğunu unutmak için kendini eğitimden geçirmiş ve kısa bir süre içerisinde, sayı değerlerini kafur ve nane gibi kokulara tahsis etmişti. Sayılar yerine kokuları düşünerek toplama ve çıkarma yapmayı öğrenmişti. Bu zihinsel alıştırmanın ardından “Kokular Yoluyla Aritmetik” başlıklı bir yazısı Amerikan dergisiPsikoloji Eleştirileri’nin ilk sayısında yayımlanmıştır.
• http://www.varoluscuterapi.com/sir-francis-galton-1822-1911/772
• A Saçılım grafiği iki değişken arasındaki ilişkiyi grafik olarak gösteren yardımcı bir araçtır. X-y grafiği
olarak da adlandırılır.
Saçılım Grafiği
İki değişken arasındaki ilişki
X Y
(a) Doğrusal
İki değişken arasındaki ilişki
X Y
(b) Doğrusal
İki değişken arasındaki ilişki
(c) Eğrisel
X Y
İki değişken arasındaki ilişki
(d) İlişki yok
X Y
• Basit doğrusal regresyondaki basit kelimesi iki değişken arasındaki ilişkiyi açıklamak için
kullanılmasından, doğrusal kelimesi ise kurulan modelin parametreleri açısından doğrusal bir model olmasındandır
x y
BASİT DOĞRUSAL REGRESYON MODELİ
(POPULASYON MODELİ)y = + βx + ε yi = a + bxi + ei
y= bağımlı değişken x= bağımsız değişken
a= sabit (y-eksenini kestiği nokta)
b = regresyon doğrusunun eğimi (regresyon katsayısı) ε= hata terimi veya artık
b (eğim): X deki 1 birim değişmenin Y’de yolaçtğı ortalama değişim miktarıdır.
b
a (sabit): X =0 iken Y’nin alacağı ortalama değeri gösterir. Doğrunun Y eksenini kestiği noktadır.
b
a
Basit Doğrusal Regresyon Eşitliği
bx a
yˆ
X= 2 - 4 - 1 - 5
y= 3 - 5 - 1 - 3
X= 2 - 4 - 1 - 5
y= 3 - 5 - 1 - 3
yaş-bakım harcaması grafiği
10000 20003000 40005000 60007000 80009000 10000 11000 12000
0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 yaş
bakım harcaması
yaş-bakım harcaması grafiği
10000 20003000 40005000 60007000 80009000 10000 11000 12000
0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 yaş
bakım harcaması
yaş-bakım harcaması grafiği
10000 20003000 40005000 60007000 80009000 10000 11000 12000
0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 yaş
bakım harcaması
Eğim (b) nasıl hesaplanır?
2
2
) )(
(
X X
n
Y X
XY b n
2
) (
) ).(
(
X X
Y Y X b X
X= 2 - 4 - 1 - 5
y= 3 - 5 - 1 - 3
Başlangıç noktası (a) sabit değer nasıl hesaplanır?
bx a
y ˆ
bx y
a ˆ
X= 2 - 4 - 1 - 5
y= 3 - 5 - 1 - 3
• Verilen örnek için b(eğim):0.6
a(sabit): 1.2
Hesapl90anan bu katsayılar regresyon eşitliğinde yerlerine konulduğunda;
X
y ˆ 1 . 2 0 . 6
2
2
) )(
ˆ (
X X
n
Y X
XY b n
) 43 )(
217 (
10
) 102 )(
43 (
) 476 (
ˆ 10
2
b
1849 2170
4386 ˆ 4760
b
165 ,
1
321 ˆ 374
b
bx y
a ˆ
) 3 , 4 ( 165 ,
1 2
,
10 a
19 ,
5
a
r
2Nasıl Hesaplanır?
• r2 (açıklanan varyans) değişkenlerin birindeki değişimin ne kadarının diğer değişkenler tarafından açıklandığını yüzde olarak eden bir değerdir.
• Determinasyon katsayısı olarak da isimlendirilir.
Tahmini “Y” değeri hesaplama
X1= 5,195+1,165*1=6,36 X2= 5,195+1,165*2=7,53 X3= 5,195+1,165*3=8,69 X4= 5,195+1,165*4=9,86 X4= 5,195+1,165*4=9,86 X5= 5,195+1,165*5=11,02 X5= 5,195+1,165*5=11,02 X6=5,195+1,165*6=12,19 X6=5,195+1,165*6=12,19 X7=5,195+1,165*7=13,35
81 ,
6 0 , 53
57 ,
2 43
r
)
2(
) ).(
(
X X
Y Y
X b X
5 , 110
5 ,
625
b b 5 , 66
bx y
a ˆ
5 ,
5 .
66 ,
5 5
,
50
a
bx y
a ˆ
37 ,
19 a
X
y ˆ 19 , 37 5 , 66
82 ,
5 0 , 4300
93 ,
2 3539
r
2 ˆ )
( 2
n
Y S YX Y
1 r 2
S
S YX y
Tahminin Standart Hatası
Gözlenen ve tahmin edilen değerlerin
arasındaki fark puanlarının standart sapmasıdır.
2 ˆ )
( 2
n
Y
S YX Y
Tahminin Standart Hatası
• Fark puanlarına dayalı standart hata tan sayılı küçük gruplar için kolay olmakla beraber
büyük gruplar için korelasyona dayalı şu formül kullanılır.
) 1
2 (
1
2n r Sy n
S
YX
1 r 2
S
S YX y
2 10
774 ,
759
S
YX2 ˆ )
(
2
n
Y S
YXY
2 10
774 ,
759
S
YXS
YX 94 , 97
745 ,
9 S
YXBağımlı değişkenin regresyon eğrisi etrafındaki değişkenliğinin ölçüsü
2 ˆ )
(
2
n
Y S
YXY
119 ,
8 1
213 ,
10
YX
S
1 r 2
S
S YX y
81 ,
0 1
44 ,
2
YX S
19 ,
0 44
,
2 S YX
061 ,
1 )
435 ,
0 ( 44 ,
2
YX
S
ISTATISTİK II Regresyon
Yrd. Doç. C. Deha DOĞAN
ANLAM ÇIKARICI İSTATİSTİK ve İLGİLİ KAVRAMLAR
Yrd. Doç. Dr. C. Deha DOĞAN
Anlam Çıkarıcı İstatistik
• Anlam çıkarıcı istatistiğin amacı örneklemin karakterlerinden evrenin karakterlerini tanımak, kestirmek, ya da ilgilenilen
değişkenler bakımından gözlenen değerler arasındaki ilişkiye dayanarak evrendeki ilişki hakkında kestirim yapmaktır.
Bir araştırmada değişkenler arasındaki farklar ya da ilişkiler arasında tahmin yapmak ve olayları açıklamak için iki tür hipotez kullanılır.
Hipotez Nedir?
• Denenebilen (doğrulanabilir/ yanlışlanabilir) yargılardır.
• Araştırmanın olası sonucuna dair yapılan tahminlerin ifadesidir.
• Değişkenler arasındaki ilişkileri/farkı belirlemeye yönelik bilimsel önermelerdir.
Örnekler
– Yabancı dil öğrenmede yaşın etkisi vardır.
– Öğrencilerin ÖSS puanları, yükseköğretimdeki akademik başarılarını etkiler.
– X ilacı soğuk algınlığının tedavisinde Y ilacından daha etkilidir.
Hipotezler ikiye ayrılır;
• Sıfır Hipotezi (H0) (Yokluk/Null hipotezi)
• Araştırma hipotezi (H1)(Alternatif hipotez)
Sıfır ve Araştırma Hipotezleri
• Sıfır (yokluk) hipotezi değişkenler arasında farkın ya da ilişkinin olmadığını belirtir. İstatistiksel hipotez olarak da isimlendirilir ve sembolü H0 olarak gösterilir.
• Araştırma hipotezi ise değişkenler arasındaki farkın veya ilişkinin var olduğunu belirtir. Genellikle H1 sembolü ile gösterilir.
Örnekler H
0Hipotezi:
– Öğrencilerin matematik ve fen bilgisi dersi başarıları arasında bir ilişki yoktur. (H0 :rmat- fen =0)
– Drama yöntemi veya geleneksel yöntem ile öğretim yapılan
öğrencilerin başarıları puanları arasında fark yoktur. (H0 : µdrm- µgln =0)
(H0 : µdrm = µgln )
Örnekler H
1Hipotezi
– Öğrencilerin matematik ve fen bilgisi dersi başarıları arasında bir ilişki vardır. (H1 :rmat - rfen≠0) – çift yönlü
– Öğrencilerin matematik dersi başarıları arttıkça Fen Bilgisi dersindeki başarıları da artar. (H1 :rmat– rfen>0) – tek yönlü
Örnekler H
1Hipotezi
– Drama yöntemi veya geleneksel yöntem ile öğretim yapılan
öğrencilerin başarıları puanları arasında fark vardır (H1 : µdrm- µgln ≠ 0) (H1 : µdrm ≠ µgln ) – Çift yönlü
– Drama yöntemi ile öğretim yapılan öğrencilerin başarı puanları
geleneksel yöntem ile öğretim yapılan öğrencilerden yüksektir (H1 : µdrm- µgln> 0) (H1 : µdrm > µgln) – Tek yönlü
Önemli Hatırlatma
• Yaptığımız araştırma sonuçlarına göre HO hipotezini reddederiz ya da reddedemeyiz.
• İstatistik jargonunda H1 hipotezi veya H0 hipotezi kabul edildi şeklinde bir anlatım kullanılmaz. Örneğin H1 hipotezinin kabul edildiği durum “ H0 hipotezi reddedildi”
şeklinde ifade edilir.
Hipotez testine karar verirken 2 tür hata yapabiliriz;
Gruplar arasında gerçekte bir farklılık yokken farklılık var diyebiliriz. Örneğin kızların ve erkeklerin zeka puan ortalamaları arasında gerçekte fark yokken yaptığımız çalışmada bir farklılık olduğu sonucuna ulaşabiliriz. Bu 1. tür hata olarak adlandırılır (alfa).
Başka bir deyişle H0 (yokluk) hipotezini kabul etmemiz (reddetmememiz) gerekirken reddederiz.
1. TÜR HATA (ALFA)
Hipotez testine karar verirken 2 tür hata yapabiliriz;
Gruplar arasında gerçekte bir farklılık varken farklılık yok diyebiliriz. Örneğin kızların ve erkeklerin boy uzunluğu ortalamaları arasında gerçekte fark varken yaptığımız çalışmada bir farklılık olmadığı sonucuna ulaşabiliriz. Bu 2. tür hata olarak adlandırılır (beta).
Başka bir deyişle H0 (yokluk) hipotezini (reddetmemiz) gerekirken reddederiz.
2. TÜR HATA (BETA)
Olasılık Düzeyi (alfa)
Olasılık düzeyi başka bir ifade ile “p” değeri araştırmanın başında karşılaştırılır. Genellikle bu düzey 0,05 olarak belirlenir.
Bu değer doğru olan bir yokluk hipotezinin reddedilme olasılığını gösterir.
Örneğin kız ve erkeklerin zeka düzeyleri arasında fark yokken araştırma sonucunda fark var deme olasılığının %5 olduğu anlamına gelir.
Eğer p değeri (p<0,05) 0,05’ten küçük ise yani gruplar arasında fark yokken hata ile fark var deme olasılığı %5’ten az ise, bulguların istatistiksel olarak manidar olduğu kabul edilir. Bu değer (0,05) araştırmanın türüne, amacına göre başka değerler de alabilir (ör: 0,01).
Serbestlik Derecesi
• Serbestlik derecesi bir değişkene ilişkin elde edilen puanların değişiklik gösterebilme serbestliği olarak ifade edilebilir.
• Serbestlik derecesi toplam gözlem sayısından serbestçe
değişiklik göstermeyen puan sayısının çıkartılması ise bulunur.
• Örneğin örneklem ortalamasına dayalı olarak evren
ortalamasını tahmin edildiği durumlarda serbestlik derecesi n-1 yani örneklem büyüklüğünden 1 çıkarılarak bulunur.
Örneğin 7 öğrenciden her birinin sırayla aşağıdaki balonlardan bir tanesini seçmesi isteniyor.İlk öğrenci istediği renkteki balonu seçebilir.
İkinci öğrenci geri kalan balonlardan istediğini seçebilir. Bu ta ki 8. öğrenciye kadar devam eder. Çünkü sıra 7. öğrenciye geldiğinde seçebileceği tek renk bir balon
kalmıştır ve değişkenlik serbestliği yoktur.
Bu nedenle böyle bir durumda serbestlik derecesi 7 (toplam gözlem sayısı) – 1 ( değişkenlik gösterebilme serbestliği olmayan gözlem sayısı) =6 olur
.
Bir Örnek
• Benzer şekilde toplamları 100 olan 5 sayı söylemeniz
istendiğinde ilk 4 sayıyı seçme konusunda özgür olursunuz.
Seçeceğiniz sayının değişkenlik gösterme serbestliği yüksektir.
Ancak en son söyleyeceğiniz sayı mutlaka önceki söylenen 4 sayıyı 100’e tamamlamak zorundadır.
• 25+30+35+7+? = 100 Soru işareti bulunan kısım bu durumda mutlaka 3 olmalıdır ve değişkenlik gösterme serbestliği yoktur.
Yani bu durumda serbestlik derecesi 5 -1 =4 olur.
T TESTİ: ORTALAMALAR ARASI FARKLARIN TEST EDİLMESİ
Yrd. Doç. Dr. C. Deha DOĞAN
• Gruplara ait ortalamalar elde edildiğinde ,
farklı olup olmadıkları ilk bakışta belirlenemez.
• Ortalamalar arsında bulunan 3 puanlık bir fark bazı durumlarda istatistiksel olarak anlamlı
bulunurken bazı durumlarda bulunmayabilir.
T Dağılımının özellikleri
• t ortalaması 0 olan bir dağılımdır.
• t ortalamaya göre simetrik dağılır
• t varyansı 1’den büyük olan bir dağılımdır;
ancak örneklem büyüklüğü arttıkça, varyans 1’e yaklaşır.
T-TESTİ
1. Tek örneklem için t testi
2. Bağımsız örneklem için t testi 3. Bağımlı örneklem için t testi
Tek örneklem t testi için hipotezler
• Tek örneklem t testinde hipotezler, örneklemden elde edilen ortalama ile evren ortalaması arasında fark
olup olmamasına göre oluşturulur.
sembolü evrene ait ortalamayı ifade eder.
sembolü örnekleme ait ortalamayı ifade eder
0
0
: X
H H
1: X 0
X
Tek örneklem T testi
• Örneklem ortalamasının anlamlılığını test etmek üzere kullanılan parametrik bir
tekniktir. 2 varsayımı mevcuttur;
– Bağımlı değişkene ait puanlar eşit aralıklı ya da eşit oranlı ölçek düzeyindedir.
– Bağımlı değişkene ait puanlar evrende normal dağılım gösterir
EVREN
A Fakültesindeki öğrenciler N:1000
Üniversite olanaklarından memnuniyet düzeyi ortalaması ( ) :75
Bu gruptan seçkisiz (yansız)
olarak 50 kişi seçilir.
ÖRNEKLEM
Seçkisiz seçilen 50 kişi.
Üniversiteden memnuniyet düzey ortalaması: 80 Standart sapması:5,6 Acaba örneklem ve
evren
ortalamalarında meydana gelen fark
gerçekte var mı?
Yoksa şansla mı oluşmuş?
Evren ortalaması ya da örneklem ortalaması arasında fark yoktur ya da bu fark tesadüfen oluşmuştur ve sıfır kabul edilebilir.
Evren ortalaması ya da örneklem ortalaması arasındaki fark tesadüfen oluşmamıştır, gerçekte vardır ve sıfır kabul edilemez.
0
0
:
memnuniyet X
memnuniyet H
0
1
:
memnuniyet X
memnuniyet
H
Tek Örneklem T-Testi Formülü
evrene ait ortalama
örnekleme ait ortalama
S: Örnekleme ait standart sapma
n S
t X
Ortalamanın Tahmini Standart Hatası
X
ÖRNEK
• X üniversitesindeki öğrencilerin IQ (zeka) puan ortalaması 100’dür.
Yeni geliştirdiğim bu sıvıyı içen öğrencilerin zeka seviyelerinde bir farklılık oluşacaktır.
Daha sonra iksir içen öğrencilerden 30’u yansız olarak seçiliyor ve zeka düzeyleri ölçülüyor. Ölçümler sonucunda
örneklem ortalaması: 110 ve standart sapması 20 olarak hesaplanıyor
Evren ortalaması ve örneklem ortalaması arasındaki bu farkın gerçekten var olduğunu nerden bilebilirim? Ya bu fark şans eseri
ortaya çıkmışsa? Bana bunu kanıtlamalısın!
Bunun için tek örneklem t testi hesaplamalıyım. Ama öncelikle hipotezlerimi ve kabul edeceğim alfa düzeyini belirlemeliyim
Alfa değeri: 0,05
100
0 : H
100
1 :
H
Bunun için ihtiyacım olan bilgiler şunlar:
Evren ortalaması: 100 Örneklem Ortalaması: 110 Örneklem standart sapması: 20
n: 30
Serbestlik derecesi: 30-1= 29
n S
t X
30 20
100 110
t
738 ,
651 2 ,
3 10
t
29 serbestlik derecesi için 0,05 düzeyinde kritik değer ne acaba? T tablosundan bakmalıyım
738 ,
2 699
,
1
Bulduğumuz t değeri tablo değerinden yüksek olduğu için H0 hipotezini reddeder yani örneklemin
ortalamasının grup ortalamasından farklı olduğunu belirtiriz.
7 ,
4
X 5,0
1
)
( 2
n
X S X
22 N
21 5 ,
4 S
46 ,
0 S
Hipotezler
7 , 4
0 : H
7 , 4
1 :
H
7 ,
4
X 5,0
46 ,
0 S
22
N SD 21
n S
t X
22 46 ,
0
7 , 4 0
,
5
t
721 ,
1 058
, 098 3
, 0
3 ,
0
t
ÖRNEKLER
• Şimdi Ziraat Bankası gibi 24.000 kişinin çalıştığı büyük bir kuruluşta anket çalışması yapmak istediğinizi düşünün. Herkese anket uygulamanız maliyetli olacaktır. Bunun için kaçınılmaz olarak örnekleme yaptınız ve rastgele 400 kişi seçtiniz. Ancak içinize bir kurt düştü ve bu seçtiğiniz örneklemin ana kütlenin özelliklerini yansıtıp
yansıtmadığını test etmek istiyorsunuz. İşte Tek Örneklem t – Testi burada yardımınıza yetişiyor.
•
Bunun yanında bir konuya ilişkin tahminlerinizin doğru olup olmadığını da Tek Örneklem t – Testini kullanarak test edebilirsiniz. Örneğin bir şehirdeki insanların yaş ortalamasının 40 olarak tahmin ediyorsunuz. Daha sonra rastgele 100 kişi
seçtiniz ve bunların yaş ortalamasını hesapladınız. Fakat örnekleminizin ortalaması 42 çıktı. Tahmininiz hatalı mıydı? Tek Örneklem t – Testini kullanmadan böyle bir sonuca gidemezsiniz. Çünkü hata örneklemden de kaynaklanabilir. Diğer bir ifade ile başka bir 100’lük grup seçseniz bu grubun yaş ortalaması 38 çıkabilir. En sağlamı herkesi hesaplamaya dahi ederek bu tartışmayı bitirmek gibi gözüküyor. Ancak
buna ne zaman ne kaynak yetmez. Ayrıca pratikte herkese de ulaşamazsınız. İşte bu yüzden istatistik hesaplamaları yapıyoruz.
Kızların zeka puan ortalaması
= 80
Ortalama Puanlar arsındaki fark gerçekten var mı?
X
Erkeklerin zeka puan
ortalaması
X = 75
Hipnoz yöntemi hafıza üzerinde etkili mi?
Hafif hipnoz uygulanan
grup (20 kişi)
Ağır hipnoz uygulanan
grup (20 kişi) Her iki gruba 25
önemli detay içeren bir hikaye
dinlettirilir.
Ortalama hatırlanan detay sayısı
Ortalama hatırlanan detay sayısı Gruplar asında
gözüken fark anlamlı mı?
BAĞIMSIZ ÖRNEKLEMLER İÇİN T-TESTİ
• Bu test iki bağımsız örneklemden elde edilen ortalamalar arasındaki farkın anlamlılığını test etmek için için kullanılan parametrik bir testtir.
EVREN A (KIZLAR)
EVREN B (ERKEKLER)
Örneklem Örneklem
Ortalama Puanlar arsındaki farkın anlamlılığını test
etmek
Varsayımlar
1. İki örneklem grubu birbirinden bağımsızdır.
2. Bağımlı değişken aralıklı veya oranlı ölçek düzeyinde ölçülmüş olmalıdır.
3. Her örneklemin temsil ettiği evrenin evrenin ham puanları normal dağılım göstermektedir.
4. Örneklemler tarafından temsil edilen evrenlerin varyansları homojendir.
Hipotezler
ALTERNATİF HİPOTEZLER
0 :
1 21
H
2 1
1
:
H
ÇİFT YÖNLÜ2 1
1
:
H
0 :
1 21
H
TEK YÖNLÜHipotezler
YOKLUK (NULL) HİPOTEZİ
0 :
1 20
H H
0:
1
2İki grup da aynı ortalama puana sahip evrenleri temsil etmektedir.
İki evrene ait ortalama puanları arasındaki fark anlamlıdır
2
1
X
X
Grup ortalamaları arasındakifark
) 1 (
) 1 (
) 1 (
) 1 (
2 1
2 2 2
2 1 2 1
n n
S n
S
S ortak n varyanslarının ağırlıklı Örneklem
ortalaması
2 1
2 2
1
1 ) 1
(S n n
Sx x ortak Farkın standart hatası
Bağımsız Örneklemler için T Testi Formülü
İki grup ortalaması arasındaki fark
Farkın Standart
Hatası
2 1
2 1
2 2 2
2 1 1
2 1
1 1
) 1 (
) 1 (
) 1 (
) 1 (
n n
n n
S n
S n
X t X
2 1
2 1
2 2 2
2 1 1
2 1
1 1
) 1 (
) 1 (
) 1 (
) 1 (
n n
n n
S n
S n
X
t X
ÖRNEKLER
56 ,
1 100 X
70 ,
1 7 S
1 9 N
22 ,
2 94 X
61 ,
2 5 S
2 9 N
56 ,
1 100 X
70 ,
1 7 S
1 9 N
22 ,
2 94 X
61 ,
2 5 S
2 9 N
29 ,
2 59
1
S
47 ,
31
22 S
2 1
1
:
H
2 1
0
:
H
2 1
2 1
2 2 2
2 1 1
2 1
1 1
) 2 (
) 1 (
) 1 (
) 1 (
n n
n n
S n
S n
X t X
00 ,
2
t sd 16 0 , 05 22
, 16 0
08 ,
726
34 ,
6
t
BAĞIMLI ÖRNEKLEMLER İÇİN T-TESTİ
DÖNEM BAŞI 3-A Sınıfı
Matematik Dersi Başarı Puanı
DÖNEM SONU 3-A Sınıfı
Matematik Dersi Başarı Puanı
Aynı örnekleme ait farklı zamanlarda aynı
özelliğin ölçüm sonuçları arasında anlamlı bir farklılık
var mıdır?
İlişkili (bağımlı) t testi ilişkili iki örneklemden elde edilen 2 ortalama arasındaki farkın anlamlılığını test etmek üzere kullanılan parametrik bir tekniktir.
Varsayımlar
1. Bağımlı değişken aralık ya da oranlı ölçek düzeyindedir.
2. Her bir örneklemin temsil ettiği evrende puanlar normal dağılım gösterir.
3. Örneklemler ile gösterilen evrenlerin varyansları homojendir.
Hipotezler
ALTERNATİF HİPOTEZLER
0
1
:
d
H
ÇİFT YÖNLÜ0
1
:
d H
0
1
:
d
H
TEK YÖNLÜHipotezler
YOKLUK (NULL) HİPOTEZİ
0
0
:
d H
Fark puanlarının ortalaması sıfıra eşittir.
FORMÜL
1 ) 1
( )
(
2 2D n D
n
t D
ÖRNEK
0
1 : d H
ön son
ortalama ortalama
H
1:
0
0 : d
H
9 ) 1
49 (
) 83 (
10 t 7
1 ) 1
( )
( 2 2
D n D
n t D
830 7 49 0 , 11
t
91 ,
85
7 t
751 ,
0
t
05 ,
0
sd 9
833 ,
1 kd
883 ,
1 751
,
0
t
Etki Büyüklüğü
• Örneklem ortalaması arasındaki farkın anlamlı olması bağımlı ve bağımsız değişken arasında güçlü bir ilişki olduğunun göstergesi değildir.
• Örneklem büyüklüğü arttıkça gerçekte küçük olan farklar anlamlı çıkar. Çünkü örneklem
büyüyünce farkın standart hatası küçülür.
Küçük standart hata büyük t değeri ütretir.
PARAMETRİK OLMAYAN TESTLER
Yrd. Doç. Dr. C. Deha DOĞAN
Kİ- KARE BAĞIMSIZLIK TESTİ
• İki değişken için ki-kare testi iki sınıflamalı değişkenin birbirinden bağımsız olup olmadığını test eder.
• Ki-kare bağımsızlık testi iki veya daha fazla değişken
grubu arasında ilişki bulunup bulunmadığını incelemek için kullanılır. Yani değişkenler arasında bağımsızlık
olup olmadığı araştırılır.
• Biri sınıflamalı diğeri sıralamalı olan iki değişkenin birbirinden
bağımsızlığını başka bir ifade ile aralarında manidar bir ilişki olup olmadığını test etme amacıyla kullanılır.
2 X 2’LİK ÇAPRAZ TABLO
2 X 3’LÜK ÇAPRAZ TABLO
Başarı durumu
Beslenme İyi Orta Zayıf
Yeterli 60 30 10
Yetersiz 30 30 40
4 X 3’LÜK ÇAPRAZ TABLO
Partilere oy verme durumu
Eğitim düzeyi A Partisi B partisi C partisi
İlkokul 50 30 20
Ortaokul 10 30 60
Lise 25 25 50
Üniversite 90 5 5
FORMÜL
b
b g
f
f
f 2
2 ( )
f
g =Gözlenen Değer
f
b =Beklenen Değer
Beklenen Değer, satır ve sütun kenar toplamlarının çarpımının toplam sayıya bölünmesiyle elde edilir.
b b g
f f
f
22
(
)
Serbestlik Derecesi
• Ki kare testinde serbestlik derecesi şu formül ile hesaplanır;
Sd= (satır düzeyi-1)(sütun düzeyi-1)
ÖRNEK
Hioptezler
H0: Cinsiyet ve kandaki kolestrol düzeyi arasında bir ilişki yoktur.
H1: Cinsiyet ve kandaki kolestrol düzeyi arasında
manidar bir ilişki vardır.
BEKLENEN DEĞERLER (Kadın) Kadın – Normalden Düşük Değer = 60*100\200 = 30 Kadın – Normal Değer = 100*100/200 =50
Kadın Normalden Yüksek Değer = 40*100/200= 20
BEKLENEN DEĞERLER (Erkek) Erkek – Normalden Düşük Değer = 60*100\200 = 30 Erkek – Normal Değer = 100*100/200 =50
Erkek- Normalden Yüksek Değer = 40*100/200= 20
3 , 30 13
) 30 10
(
22
5 , 50 0
) 50 55
(
22
25 . 20 11
) 20 35
(
22
3 , 30 13
) 30 50
(
22
5 , 50 0
) 50 45
(
22
25 . 20 11
) 20 5
(
22
1 ,
2
50
pdüzeyi 0.01 kd 9,210 50,1HO HİPOTEZİ REDEDİLİR
CİNSİYET VE KANDAKİ KOLSTROL ARASINDA
BİR İLİŞKİ VARDIR
CİNSİYET İZLENEN PROGRAMLAR
Evlenme Belgesel Magazin
Kız 18 43 14
Erkek 39 23 18
MANN-WHITNEY U TESTİ
• İki bağımsız ortalama puan arasındaki farkın test edilmesi sürecinde, eğer gerekli varsayımlar karşılanmamış ise bağımsız örneklem için t- testi’ne alternatif olarak kullanılır.
• Başka bir ifade ile bağımsız örneklem t-testinin parametrik olmayan karşılığıdır.
Hangi durumlarda kullanılır?
• Veriler eşit aralıklı ya da eşit oranlı ölçek düzeyinde elde edilmiş olmakla beraber dağılımın normallik varsayımın karşılanmadığı
• Değişkenlerin miktar olarak ölçülmeyip, nesne ya da bireylere ilişkin yargıların doğrudan sıra değerleri ile gösterildiği durumlarda kullanılır
Varsayımları
•İki grup örneklem birbirinden bağımsızdır.
• Bağımlı değişken en az sıralamalı ölçek
düzeyinde ölçülmüştür
.Formül
1 2 1 1 1
1 2
) 1
( n R
n n n
U
2 1 2 2 2
2 2
) 1
( n R
n n n
U
1 2 1 1 1
1 2
) 1
( n R
n n n
U
n1: Birinci gruptaki birey sayısı n2: İkinci gruptaki birey sayısı
R1:Birinci gruptaki değerlerin sıra numaraları toplamı R2: İkinci gruptaki değerlerin sıra numaraları toplamı
İşlem Aşamaları
22 10
6 3
2
1
R
e
69 13
12 11
9 8
7 5
4
R
k
22 10
6 3
2
1
R
e
69 13
12 11
9 8
7 5
4
R
k
5 n
e 8 n
e
1 2 1 1 1
1 2
) 1
( n R
n n n
U
22 10
6 3
2
1
R
e
69 13
12 11
9 8
7 5
4
R
k
5 n
e 8 n
e33 2 22
) 1 5
( 8 5
.
5
e
U
22 10
6 3
2
1
R
e
69 13
12 11
9 8
7 5
4
R
k
5 n
e 8 n
e7 2 69
) 1 8
( 5 8
.
8
k
U
• Hesaplanan 2 U değerinden her zaman küçük olan dikkate alınır ve tablo değeri ile karşılaştırılır.
H0: Kızlarla erkeklerin ortalama puanları arasında bir farklılık yoktur.
H1: Kızlarla erkeklerin ortalama puanları arasında bir farklılık vardır.
Çift yönlü bir hipotez için 0,05 alfa düzeyi için kritik değer 6<7(u
değeri) olduğundan gruplar arasında fark olmadığına karar verilir ve H0 reddedilemez . Başka bir ifade ile H0 kabul edilir.