Spearman Sıra Korelasyonu Kat Sayısında Tekrarlanan Değerler Ve Bir Uygulama

Tam metin

(1)

SPEARMAN SIRA KORELASYONU KATSAYISINDA

TEKRARLANAN DEGERLER VE

BİR

UYGULAMA

Doç. Dr. SelAhattln GÜRİŞ (•)

Değişkenler arasındaki ilişkinin derecesinin ölçülmesinde farklı ista-tiksel yöntemlerden yararlanılabilir. Değişkenler arasındaki ilişkinin dere-cesinin belirlenmesi sözkonusu olduğunda ilk akla gelen ve en çok kulla-nılan korelasyon katsayısıdır. Korelasyon katsayısı değişkenler arasındaki ilişkinin doğrusal veya eğrisel olması durumuna göre farklı şekillerde he-saplanmaktadır.

Korelasyon katsayısının değişkenler arasındaki ilişkinin derecesini ölç-mede kullanılabilmesi, değişkenlerin dağılımlarının normal dağılım olma-sına bağlıdır. Değişkenlerin dağılımlarının normal dağılım olmaması duru-munda korelasyon katsayısının ilişkinin derecesinin belirlenmesinde kul-lanılması doğru olmaz. Bazı durumlarda da değişkenlerin sayısal değerle­ ri, değişkenlerin ifade ettikleri olay ile ilgili gerçek değerleri yansıtmamak­ tadırlar. Böyle değişkenler için de korelasyon katsayısı ile yapılacak ana-lizler yanıltıcı sonuçlar verebilir(1 ).

Bazı değişkenlerin sayısal değerleri seriyi oluşturan birimlerin incele-nen karekterlerinin gerçek değirini belirlemeyebilir. Bu durumla daha çok niteliklerin nicelik olarak ifadesinde karşılaşılır(2). Örneğin bir zeka testi uy-gulandığını düşünelim. Test sonucu elde edilen sayısal değerler testin uy-gulandığı kişilerin zekalarını birbirleri ile orantılı olarak ölçmekte ise, bu pu-anlar korelasyon analizinde kullanılabilir. Fakat test sonuçları zekalarının birbirlerinden ne kadar farklı olduğunu kesin olarak belirleyemeyerek, sa-dece kimin zekasının kimden daha üstün olduğunu ortaya koyuyorsa bu durumda sıra korelasyonu katsayısının uygulanması uygun olmaktadır. 1- Spearman Sıra Korelasyonu Katsayısı

Özellikle yukarıda söz edilen iki durumda sıra korelasyonu katsayısı­ nın kullanılması uygundur. Spearman sıra korelasyonu katsayısının hesap-lanmasında, değişkenlerin aldıkları değerlere büyüklüklerine göre birden başlayarak sıra numaraları verilir. Sıralamaya en büyük veya en küçük de-ğere 1 verilerek başlanır ve birer birer arttırılarak n. değere kadar devam edilir. Sıralama küçükten büyüğe veya büyükten küçüğe doğru yapılabilir. Burada önemli olan sıralamanın her iki değişken için de aynı yönde yapıl­ masıdır(3).

(*) Marmara Üniversitesi İktisadi ve İdari Bilimler Fakültesi.

(2) HAYSLETT, H.T. Statistics Made Simple, W.H. Ailen, London 1967, s. 180.

KÖKSAL, Bilge Aloba, istatistik-Analiz Metodları, ikinci Baskı, Çağlayan Kitabevi, lstan-bul, 1980, s. 311.

(2) VURAN, Ateş, İstatistik 111, İ.İ.T.İ.A. Nihad Sayar Yayın ve Yardım Vakfı Yayınları No: 351/584, lstanbul, 1981, s. 121.

(3) GÜRTAN, Kenan, istatistik ve Araştırma Metodları, lstanbul Üniversitesi Yayınlarından No. 1941, lstanbul, 1974. s. 532. '

(2)

Sıralama yapıldıktan sonra katsayı; n

6x

l:

df

i= 1

r=---s n(n2-1)

formülü ile hesaplanmaktadır. Burada di sıra farklarını ifade etmektedir.

Yukarıda verilen sıra korelasyonu katsayısı formülü; n · .L >GYi-nxy I= 1 ,

r=--r::================-n -2 n -2 L (X;-X). L (Yi-Y) 1.= 1 1.=1

Doğrusal korelasyon katsayısı formülünden türetilmiştir. Sıralardan birini Xi, diğerini Yi ile ifade edersek, sıralar hem Xi hem de Yi için ilk n tam

sa-yıdan oluşacaktır. Yalnız Xi ve· Yi'nin ilk n. tam sayı olması için her iki

de-ğişkenin aldığı değerler sadece birer defa tekrarlanmalıdır. Bu durumda,

- - n+1

X=Y=--

2

-~

,

<Xi-Yl=

-~

<>G-Xi=

n (n2 -1) 1=1 1=1 . 12 olacaktır. Ayrıca, n 2 n _2 n 2 n n 2

i~1di =i~1

(Xj-X)

=i~1

Xj

-

2

i~1 Xj'fj+i~1 yi

olacağından;

~

v.y = n (n

+

1 )(2n

+

1) _

.:!.

~ d~

i= 1 "1 1 6 2 i= 1 1

olarak elde edilir. Daha önce verilen (1) numaralı formül, yukarıda verilen

eşitliklerin (2) numaralı formülde yerine konulması ile elde edilmiştir (4). (1) numaralı formül ile katsayının daha kolay hesaplanacağı açıkça gö-rülmektedir. Bu nedenle değişkenlerin aldığı değerlerde tekrarlar olmadı-(4) BAGIRKAN, Şemsettin, istatistiksel Analiz, Önsöz Basım ve Yayıncılık, lstanbul, 1982,

s.126-12'8.

MOSTELLER, Frederick; ROURKE, Robert E.K., Sturdy Statistics, Addison -Wesley Pub-lishing Com., Massachusetts, 1973, s. 120.

(3)

ğında (1) numaralı formül ile sıra korelasyonu katsayısı hesaplanabilir.

2- Tekrarlanan Değerler ve Spearman Sıra Korelasyonu Katsayısı Uygulamada sıra korelasyonu katsayısının hesaplanacağı her durum-da değişkenlerin alacağı değerlerin birer defa tekrar edileceği düşünüle­ mez. Değişkenlerin aldığı değerler tekrarlı ise, yani aynı değer birden faz-la tekrarfaz-lanıyorsa, bu durumda sıralama yapılırken tekrarlanan değerlerin sıralarının aritmatik ortalaması alımaktadır. Örneğin bir değişkenin k. ve (k

+

1 ). değerleri aynı ise, bu değerlerin her ikisinin de sırası;

k+(k+1) =k+~

2

'

2

olmaktadır. İkiden fazla tekrarlar içinde aynı işlem yapılmaktadır (5). Daha önce verilen (1) numaralı formül (2) numaralı formülden elde edi-lirken sıraların ilk n tam sa_yıdan_oluştuğu düşünülmüştü. Terarlanan c:je-ğerlerin sıraları nedeniyle X ve Y değişmeyecek, fakat hesaplanacak di-ğer dedi-ğerlerde sapmal~r olacaktır. Yine k. ve (k + 1 ). değerlerin aynı olma-sı durumunu düşünelim. Bu durumda olma-sıraların karelerinin toplamları ve ça-rpımlarının toplamları değişecektir. Tekrar yok ise k. ve (k

+

1 ). değerlerin kareleri toplamı,

k2 + (k + 1 )2 = 2k2 + 2k + 1

1

olacaktır. k. ve (k

+

1 ). değerler tekrarlanıyor ise sıraları

k+

2'

ve kareleri toplamı;

2 2

(

k+2 + k+2 =2k +2k+2

1) ( 1) 2 1

olacaktır. Görüldüğü gibi arada 1/2 birimlik bir fark oluşmaktadır. Aynı şe­ kilde, eşleşme durumlarına göre X ve Y çarpımlarında da bir fark oluşa­ caktır. Az sayıdaki tekrarlar sonuçta büyük sapmalara neden olsa bile, ar-tan tekrar sayıları ile fark büyüyecektir.

Değerlerin tekrarlanması durumunda sıraların kareleri toplamındaki

azalma; t (t2_ 1)

12

olarak genelleştirilebilir. Bu durumda sıraların· kareleri toplamı;

x,2

n(n

+

1) (2n + 1) _

l:[

t ( t

2 -1 )]

6 12

formülü ile hesaplanabilir. Formülde t tekrar sayılarını ifade etmektedir. _

Da-(5) MOSTELLER, ROURKE, age, s. 120.

(4)

ha önce belirtildiği gibi bir d~ğer iki kere tekrarlanıyorsa kareler toplamın­

daki azalma;

t ( t

2 - 1 ) 2 ( 22 - 1 ) 1

12

=

12

=2

olacaktır. Örneğin 15 birimden oluşan bir seride bir değer 4, bir değer 3 ve iki değer de 2 şer kaz tekrarlanıyorsa; v2 = 15 ( 15

+

1 (2 x 15

+

1) -[ 4 ( 4 2 - 1) 3(32 - 1) + 2(22 - 1) +

2(~

- 1) ]

"; 6 . 12 + 12 12 12

= 1240-8=1232 olacaktır.

3-Uygulama

Değişkenlerin aldığı değerlerde tekrarlar olduğunda Spearman sıra ko-relasyonu katsayısı ve doğrusal korelasyon katsayısı formülleri ile yapıla­

cak hesaplamalar sonucu farklı değerler elde edilecektir. Gerçek değeri

doğrusal korelasyon katsayısı formülü vereceğinden değişkenlerin değer­

leri tekrarlı olduğunda bu formülün veya aynı sonucu verecek

benzerleri-nin kullanılması gerekecektir. Fakat tekrar sayıları az ise Spearman sıra

korelasyonu katsayısı formülü ile yapılacak hesaplamalarda sapma az

ola-cağından bu formülün hesaplama kolaylığı nedeniyle, aradaki fark ihmal edilerek bu formül kullanılabilir.

3-Uygulama

Değişkenlerin değerlerinin tekrarlı olması halinde Spearman sıra

ko-relasyonu katsayısı formülü ile yapılacak hesaRlamaların gerçek değerin­

den sapacağını göstermek amacı ile bir uygulama yapılmıştır.

Yüksek öğrenimlerini İktisadi ve İdari Bilimler Fakültelerinde sürdü-ren öğrencilerin İstatistik derslerindeki başarılarının, orta öğretimde edin-dikleri Matematik ve Fen Bilimleri ile ilişkili olması beklenmektedir.

Mate-matik ve Fen derslerindeki başarının veya bilgi seviyesinin göstergesi ola--

-rak öğrencilerin üniversite giriş sınavı ikinci basamağında aldıkları Matematik-Fen ağırlıklı puanları alınabilir. Fakat bu puanları, bu konudaki

başarının kesin ölçüsü olarak kabul etmek güçtür. Puanı daha yüksek olan

öğrenci diğerinden daha başarılı olarak kabul edilebilir.

Burada matematik-fen ağırlıklı üniversite giriş sınavı puanlarının bu ko-nudaki başarının; İstatistik dersi sınavlarında alınan notlarda istatistik ders-lerindeki başarının kesin ölçüsü olmadığı, fakat puanı veya notu az da

ol-sa daha yüksek olan öğrencinin daha başarılı olduğu varsayımı ile,

Mar-mara Üniversitesi İktisadi ve İdari Bilimler Fakültesinin bir bölümünde İs­ tatistik dersi alan öğrencilerden küçük bir örnek alınmıştır. Öğrenciler

fa-külteye Matematik-Türkçe ağırlıklı puanlanna göre kaydedilmekte ve

ikin-ci sınıfta istatistik dersi almaktadırlar. İstatistik dersi final sınavında 50 ve

(5)

ÖSYS Matematik-Fen İstatistik Dersi sıra No. 1 2 3 4 5 6 7 8 9 10 Ağırhkh Puanlar 398,825 335,269 393,342 417,310 378,241 365,961 404,032 368,389 392,306 374,688 Sıralardan, Xı = 55 x2i

'=

385 Yi=55 y2i=378 X

=

5,5 XiYi

=

306,5 y = 5,5 d2i= 150 Final Notlan 85 50 55 65 50 65 50 70 50 65

olarak hesaplanmıştır. Bu değerlerle,

6

I.d?

1 r 5=1 - 2

=

0,0909 n ( n -1) r 5

=

:EXY-nxy

=

0,0506 ·

~

(tx2 _

n

~2)

('W2 _ ,,y2 ) Sıralar Xı 3 10 4 1 6 9 2 ş 5 7 · Yı 1 8,5 6 4 8,5 4 8,5 2 8.5 4

olarak bulunmuştur. Doğru sonuç 0,0506 dır.

İki yolla hesaplanan katsayılar arasında çok büyük fark olduğu

görül-mektedir. Değişkenlerin değerlerinin tekrarlanması durumunda Spearman

sıra korelasyonu katsayısı formülü ile yapılacak hesaplamaların yanıltıcı

so-nuçlar verebileceği uygulama sonuçlarından da görülmektedir. Katsayılar

test edildiğinde sonuç olumsuzdur. ·

4- Sonuç

Değişkenler arasındaki ilişkinin derecesi araştırılırkEm başlıca iki

se-bep Spearman sıra korelasyonu katsayısının kullanılmasını

gerektirmekte-dir. Değişkenlere sıra olarak ilk n tam sayı değerlerin verilmesi

durumun-da doğrusal korelasyon katsayısı formülünden türetilen ve işlem kolaylığı sağlayan Spearman sıra korelasyonu katsayısı formülü, değişkenlerin

de-ğerlerinin tekrarlı olması durumunda değişkenler arasındaki ilişkinin ger-çek değerini göstermemektedir. Bu durumda gerçek değerden sapma,

de-ğişkenlerin değerlerinin tekrarlarına bağlıdır. Tekrar sayısı az olduğunda

(6)

çok-luğu sübjektif bir kavramdır ve bu konuda kesin bir ölçü belirlemek çok

güç-tür. Bu ne<;Jenle ilişkinin gerçek değeri arandığında değişkenlere sıralar

ve-rildikten sonra sıralar arasındaki ilişkinin derecesi Spearman sıra

korelas-yonu katsayısı formülü yerine, doğrusal korelasyon katsayısı f9rmülü ile

bulunmalıdır. Yapılan uygulama da sapmanın önemli olabileceğini açıkça

göstermektedir.

YARARLANILAN KAYNAKLAR

BAGIRKAN,Şemsettin, İstatistiksel Analiz, Önsöz

Ba-sım ve Yayıncılık, lstanbul, 1982.

CHAO,Lincoln L., Statistics: Methods and

Analy-ses, McGraw-Hill, Book Com., New York, 1969

GÜRTAN, Kenan, İstatistik ve Arastırma Metodları,

lstanbul Üniversitesi

Yayınların­

dan No.1941,lstanbul, 1974.

HAYSLETT, H.T. Statics Made Simple,

W.H.Al-lan, Landon 1967.

HUNTSBERGER, David V. GROFT, D.James;BİLLİNGSLEY, Patric;

Statistical lnference tor Mana-gement And Economics, Se-cond Edition Allyn and Bucon ine. Bostan, 1980.

KÖKSAL, Bilge Aloba, İstatistik-Analiz Metodları, İkinci

Baskı, Çağlayan Kitabevi,

lstan-bul, 1980.

McCALL Robert B., Fundamental Statistics for

Psycholagy, Second Edition, Harcourt Brace Jovanovich ine. New

York, 1975 .

. MOSTELLER, Frederick, RROFKE, Robert E.K.,Sturdy

Statistics, Addison-Wesley Pub-lishing Com., Massachusetts, 1973.

SERPER, Özer, İstatistik, Filiz Kitabevi, lstanbul,

1980

VURAN.Ateş, İstatistik 111, İ.İ.T.İ.A. Nihad

Sa-yar Yayın ve yardım vakfı yayın­

ları No: 351/584, lstanbul 1981.

YAMANE,Taro, Statistics- An lntroductory

Analysis, Third Edition, Harper lnternational Edition, 1973

Şekil

Updating...

Referanslar

Updating...

Benzer konular :