SPEARMAN SIRA KORELASYONU KATSAYISINDA
TEKRARLANAN DEGERLER VE
BİR
UYGULAMA
Doç. Dr. SelAhattln GÜRİŞ (•)
Değişkenler arasındaki ilişkinin derecesinin ölçülmesinde farklı ista-tiksel yöntemlerden yararlanılabilir. Değişkenler arasındaki ilişkinin dere-cesinin belirlenmesi sözkonusu olduğunda ilk akla gelen ve en çok kulla-nılan korelasyon katsayısıdır. Korelasyon katsayısı değişkenler arasındaki ilişkinin doğrusal veya eğrisel olması durumuna göre farklı şekillerde he-saplanmaktadır.
Korelasyon katsayısının değişkenler arasındaki ilişkinin derecesini ölç-mede kullanılabilmesi, değişkenlerin dağılımlarının normal dağılım olma-sına bağlıdır. Değişkenlerin dağılımlarının normal dağılım olmaması duru-munda korelasyon katsayısının ilişkinin derecesinin belirlenmesinde kul-lanılması doğru olmaz. Bazı durumlarda da değişkenlerin sayısal değerle ri, değişkenlerin ifade ettikleri olay ile ilgili gerçek değerleri yansıtmamak tadırlar. Böyle değişkenler için de korelasyon katsayısı ile yapılacak ana-lizler yanıltıcı sonuçlar verebilir(1 ).
Bazı değişkenlerin sayısal değerleri seriyi oluşturan birimlerin incele-nen karekterlerinin gerçek değirini belirlemeyebilir. Bu durumla daha çok niteliklerin nicelik olarak ifadesinde karşılaşılır(2). Örneğin bir zeka testi uy-gulandığını düşünelim. Test sonucu elde edilen sayısal değerler testin uy-gulandığı kişilerin zekalarını birbirleri ile orantılı olarak ölçmekte ise, bu pu-anlar korelasyon analizinde kullanılabilir. Fakat test sonuçları zekalarının birbirlerinden ne kadar farklı olduğunu kesin olarak belirleyemeyerek, sa-dece kimin zekasının kimden daha üstün olduğunu ortaya koyuyorsa bu durumda sıra korelasyonu katsayısının uygulanması uygun olmaktadır. 1- Spearman Sıra Korelasyonu Katsayısı
Özellikle yukarıda söz edilen iki durumda sıra korelasyonu katsayısı nın kullanılması uygundur. Spearman sıra korelasyonu katsayısının hesap-lanmasında, değişkenlerin aldıkları değerlere büyüklüklerine göre birden başlayarak sıra numaraları verilir. Sıralamaya en büyük veya en küçük de-ğere 1 verilerek başlanır ve birer birer arttırılarak n. değere kadar devam edilir. Sıralama küçükten büyüğe veya büyükten küçüğe doğru yapılabilir. Burada önemli olan sıralamanın her iki değişken için de aynı yönde yapıl masıdır(3).
(*) Marmara Üniversitesi İktisadi ve İdari Bilimler Fakültesi.
(2) HAYSLETT, H.T. Statistics Made Simple, W.H. Ailen, London 1967, s. 180.
KÖKSAL, Bilge Aloba, istatistik-Analiz Metodları, ikinci Baskı, Çağlayan Kitabevi, lstan-bul, 1980, s. 311.
(2) VURAN, Ateş, İstatistik 111, İ.İ.T.İ.A. Nihad Sayar Yayın ve Yardım Vakfı Yayınları No: 351/584, lstanbul, 1981, s. 121.
(3) GÜRTAN, Kenan, istatistik ve Araştırma Metodları, lstanbul Üniversitesi Yayınlarından No. 1941, lstanbul, 1974. s. 532. '
Sıralama yapıldıktan sonra katsayı; n
6x
l:df
i= 1 r=---s n(n2-1)formülü ile hesaplanmaktadır. Burada di sıra farklarını ifade etmektedir.
Yukarıda verilen sıra korelasyonu katsayısı formülü; n · .L >GYi-nxy I= 1 ,
r=--r::================-n -2 n -2 L (X;-X). L (Yi-Y) 1.= 1 1.=1Doğrusal korelasyon katsayısı formülünden türetilmiştir. Sıralardan birini Xi, diğerini Yi ile ifade edersek, sıralar hem Xi hem de Yi için ilk n tam
sa-yıdan oluşacaktır. Yalnız Xi ve· Yi'nin ilk n. tam sayı olması için her iki
de-ğişkenin aldığı değerler sadece birer defa tekrarlanmalıdır. Bu durumda,
- - n+1
X=Y=--
2-~
,
<Xi-Yl=
-~
<>G-Xi=
n (n2 -1) 1=1 1=1 . 12 olacaktır. Ayrıca, n 2 n _2 n 2 n n 2i~1di =i~1
(Xj-X)=i~1
Xj
-
2i~1 Xj'fj+i~1 yi
olacağından;~
v.y = n (n+
1 )(2n+
1) _.:!.
~ d~
i= 1 "1 1 6 2 i= 1 1olarak elde edilir. Daha önce verilen (1) numaralı formül, yukarıda verilen
eşitliklerin (2) numaralı formülde yerine konulması ile elde edilmiştir (4). (1) numaralı formül ile katsayının daha kolay hesaplanacağı açıkça gö-rülmektedir. Bu nedenle değişkenlerin aldığı değerlerde tekrarlar olmadı-(4) BAGIRKAN, Şemsettin, istatistiksel Analiz, Önsöz Basım ve Yayıncılık, lstanbul, 1982,
s.126-12'8.
MOSTELLER, Frederick; ROURKE, Robert E.K., Sturdy Statistics, Addison -Wesley Pub-lishing Com., Massachusetts, 1973, s. 120.
ğında (1) numaralı formül ile sıra korelasyonu katsayısı hesaplanabilir.
2- Tekrarlanan Değerler ve Spearman Sıra Korelasyonu Katsayısı Uygulamada sıra korelasyonu katsayısının hesaplanacağı her durum-da değişkenlerin alacağı değerlerin birer defa tekrar edileceği düşünüle mez. Değişkenlerin aldığı değerler tekrarlı ise, yani aynı değer birden faz-la tekrarfaz-lanıyorsa, bu durumda sıralama yapılırken tekrarlanan değerlerin sıralarının aritmatik ortalaması alımaktadır. Örneğin bir değişkenin k. ve (k
+
1 ). değerleri aynı ise, bu değerlerin her ikisinin de sırası;k+(k+1) =k+~
2
'
2
olmaktadır. İkiden fazla tekrarlar içinde aynı işlem yapılmaktadır (5). Daha önce verilen (1) numaralı formül (2) numaralı formülden elde edi-lirken sıraların ilk n tam sa_yıdan_oluştuğu düşünülmüştü. Terarlanan c:je-ğerlerin sıraları nedeniyle X ve Y değişmeyecek, fakat hesaplanacak di-ğer dedi-ğerlerde sapmal~r olacaktır. Yine k. ve (k + 1 ). değerlerin aynı olma-sı durumunu düşünelim. Bu durumda olma-sıraların karelerinin toplamları ve ça-rpımlarının toplamları değişecektir. Tekrar yok ise k. ve (k
+
1 ). değerlerin kareleri toplamı,k2 + (k + 1 )2 = 2k2 + 2k + 1
1
olacaktır. k. ve (k
+
1 ). değerler tekrarlanıyor ise sıralarık+
2'
ve kareleri toplamı;2 2
(
k+2 + k+2 =2k +2k+2
1) ( 1) 2 1olacaktır. Görüldüğü gibi arada 1/2 birimlik bir fark oluşmaktadır. Aynı şe kilde, eşleşme durumlarına göre X ve Y çarpımlarında da bir fark oluşa caktır. Az sayıdaki tekrarlar sonuçta büyük sapmalara neden olsa bile, ar-tan tekrar sayıları ile fark büyüyecektir.
Değerlerin tekrarlanması durumunda sıraların kareleri toplamındaki
azalma; t (t2_ 1)
12
olarak genelleştirilebilir. Bu durumda sıraların· kareleri toplamı;
x,2
n(n+
1) (2n + 1) _l:[
t ( t
2 -1 )]6 12
formülü ile hesaplanabilir. Formülde t tekrar sayılarını ifade etmektedir. _
Da-(5) MOSTELLER, ROURKE, age, s. 120.
ha önce belirtildiği gibi bir d~ğer iki kere tekrarlanıyorsa kareler toplamın
daki azalma;
t ( t
2 - 1 ) 2 ( 22 - 1 ) 112
=
12=2
olacaktır. Örneğin 15 birimden oluşan bir seride bir değer 4, bir değer 3 ve iki değer de 2 şer kaz tekrarlanıyorsa; v2 = 15 ( 15
+
1 (2 x 15+
1) -[ 4 ( 4 2 - 1) 3(32 - 1) + 2(22 - 1) +2(~
- 1) ]"; 6 . 12 + 12 12 12
= 1240-8=1232 olacaktır.
3-Uygulama
Değişkenlerin aldığı değerlerde tekrarlar olduğunda Spearman sıra ko-relasyonu katsayısı ve doğrusal korelasyon katsayısı formülleri ile yapıla
cak hesaplamalar sonucu farklı değerler elde edilecektir. Gerçek değeri
doğrusal korelasyon katsayısı formülü vereceğinden değişkenlerin değer
leri tekrarlı olduğunda bu formülün veya aynı sonucu verecek
benzerleri-nin kullanılması gerekecektir. Fakat tekrar sayıları az ise Spearman sıra
korelasyonu katsayısı formülü ile yapılacak hesaplamalarda sapma az
ola-cağından bu formülün hesaplama kolaylığı nedeniyle, aradaki fark ihmal edilerek bu formül kullanılabilir.
3-Uygulama
Değişkenlerin değerlerinin tekrarlı olması halinde Spearman sıra
ko-relasyonu katsayısı formülü ile yapılacak hesaRlamaların gerçek değerin
den sapacağını göstermek amacı ile bir uygulama yapılmıştır.
Yüksek öğrenimlerini İktisadi ve İdari Bilimler Fakültelerinde sürdü-ren öğrencilerin İstatistik derslerindeki başarılarının, orta öğretimde edin-dikleri Matematik ve Fen Bilimleri ile ilişkili olması beklenmektedir.
Mate-matik ve Fen derslerindeki başarının veya bilgi seviyesinin göstergesi ola--
-rak öğrencilerin üniversite giriş sınavı ikinci basamağında aldıkları Matematik-Fen ağırlıklı puanları alınabilir. Fakat bu puanları, bu konudaki
başarının kesin ölçüsü olarak kabul etmek güçtür. Puanı daha yüksek olan
öğrenci diğerinden daha başarılı olarak kabul edilebilir.
Burada matematik-fen ağırlıklı üniversite giriş sınavı puanlarının bu ko-nudaki başarının; İstatistik dersi sınavlarında alınan notlarda istatistik ders-lerindeki başarının kesin ölçüsü olmadığı, fakat puanı veya notu az da
ol-sa daha yüksek olan öğrencinin daha başarılı olduğu varsayımı ile,
Mar-mara Üniversitesi İktisadi ve İdari Bilimler Fakültesinin bir bölümünde İs tatistik dersi alan öğrencilerden küçük bir örnek alınmıştır. Öğrenciler
fa-külteye Matematik-Türkçe ağırlıklı puanlanna göre kaydedilmekte ve
ikin-ci sınıfta istatistik dersi almaktadırlar. İstatistik dersi final sınavında 50 ve
ÖSYS Matematik-Fen İstatistik Dersi sıra No. 1 2 3 4 5 6 7 8 9 10 Ağırhkh Puanlar 398,825 335,269 393,342 417,310 378,241 365,961 404,032 368,389 392,306 374,688 Sıralardan, Xı = 55 x2i
'=
385 Yi=55 y2i=378 X=
5,5 XiYi=
306,5 y = 5,5 d2i= 150 Final Notlan 85 50 55 65 50 65 50 70 50 65olarak hesaplanmıştır. Bu değerlerle,
6
I.d?
1 r 5=1 - 2=
0,0909 n ( n -1) r 5=
:EXY-nxy=
0,0506 ·~
(tx2 _
n~2)
('W2 _ ,,y2 ) Sıralar Xı 3 10 4 1 6 9 2 ş 5 7 · Yı 1 8,5 6 4 8,5 4 8,5 2 8.5 4olarak bulunmuştur. Doğru sonuç 0,0506 dır.
İki yolla hesaplanan katsayılar arasında çok büyük fark olduğu
görül-mektedir. Değişkenlerin değerlerinin tekrarlanması durumunda Spearman
sıra korelasyonu katsayısı formülü ile yapılacak hesaplamaların yanıltıcı
so-nuçlar verebileceği uygulama sonuçlarından da görülmektedir. Katsayılar
test edildiğinde sonuç olumsuzdur. ·
4- Sonuç
Değişkenler arasındaki ilişkinin derecesi araştırılırkEm başlıca iki
se-bep Spearman sıra korelasyonu katsayısının kullanılmasını
gerektirmekte-dir. Değişkenlere sıra olarak ilk n tam sayı değerlerin verilmesi
durumun-da doğrusal korelasyon katsayısı formülünden türetilen ve işlem kolaylığı sağlayan Spearman sıra korelasyonu katsayısı formülü, değişkenlerin
de-ğerlerinin tekrarlı olması durumunda değişkenler arasındaki ilişkinin ger-çek değerini göstermemektedir. Bu durumda gerçek değerden sapma,
de-ğişkenlerin değerlerinin tekrarlarına bağlıdır. Tekrar sayısı az olduğunda
çok-luğu sübjektif bir kavramdır ve bu konuda kesin bir ölçü belirlemek çok
güç-tür. Bu ne<;Jenle ilişkinin gerçek değeri arandığında değişkenlere sıralar
ve-rildikten sonra sıralar arasındaki ilişkinin derecesi Spearman sıra
korelas-yonu katsayısı formülü yerine, doğrusal korelasyon katsayısı f9rmülü ile
bulunmalıdır. Yapılan uygulama da sapmanın önemli olabileceğini açıkça
göstermektedir.
YARARLANILAN KAYNAKLAR
BAGIRKAN,Şemsettin, İstatistiksel Analiz, Önsöz
Ba-sım ve Yayıncılık, lstanbul, 1982.
CHAO,Lincoln L., Statistics: Methods and
Analy-ses, McGraw-Hill, Book Com., New York, 1969
GÜRTAN, Kenan, İstatistik ve Arastırma Metodları,
lstanbul Üniversitesi
Yayınların
dan No.1941,lstanbul, 1974.
HAYSLETT, H.T. Statics Made Simple,
W.H.Al-lan, Landon 1967.
HUNTSBERGER, David V. GROFT, D.James;BİLLİNGSLEY, Patric;
Statistical lnference tor Mana-gement And Economics, Se-cond Edition Allyn and Bucon ine. Bostan, 1980.
KÖKSAL, Bilge Aloba, İstatistik-Analiz Metodları, İkinci
Baskı, Çağlayan Kitabevi,
lstan-bul, 1980.
McCALL Robert B., Fundamental Statistics for
Psycholagy, Second Edition, Harcourt Brace Jovanovich ine. New
York, 1975 .
. MOSTELLER, Frederick, RROFKE, Robert E.K.,Sturdy
Statistics, Addison-Wesley Pub-lishing Com., Massachusetts, 1973.
SERPER, Özer, İstatistik, Filiz Kitabevi, lstanbul,
1980
VURAN.Ateş, İstatistik 111, İ.İ.T.İ.A. Nihad
Sa-yar Yayın ve yardım vakfı yayın
ları No: 351/584, lstanbul 1981.
YAMANE,Taro, Statistics- An lntroductory
Analysis, Third Edition, Harper lnternational Edition, 1973