• Sonuç bulunamadı

KANONİK KORELASYON ANALİZİ PROF. DR. VEDAT CEYHAN

N/A
N/A
Protected

Academic year: 2022

Share "KANONİK KORELASYON ANALİZİ PROF. DR. VEDAT CEYHAN"

Copied!
52
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

PROF. DR. VEDAT CEYHAN

KANONİK

KORELASYON

ANALİZİ

(2)

KANONİK KORELASYON NEDİR?

(3)

•Kanonik Korelasyon Analizi çok

değişkenli bir istatistiksel yöntem olup, iki farklı değişkenler kümesi arasındaki en büyük ilişkiyi araştırmaya çalışır.

•Bu analiz çok sayıdaki değişkeni iki alt kümeye ayırıp az sayıda doğrusal

bileşenlere indirgeyerek, değişkenler arasındaki ilişkinin yorumlanmasında birçok kolaylık sağlar.

(4)

Kanonik Korelasyon analizi çoklu regresyon analizinin bir uzantısıdır. Çoklu regresyon

analizinde X değişken grubu q tane ve Y değişken grubu p=1 tane değişken içermekte iken, kanonik korelasyon analizinde ise X değişken grubu q tane

ve Y değişken grubu p adet (p>1) değişken içermektedir. Bu analizde X değişken grubu

içerisindeki değişkenlerin doğrusal

kombinasyonları ile Y değişken grubu içerisindeki değişkenlerin doğrusal kombinasyonları

arasındaki korelasyon katsayıları araştırılır.

(5)
(6)

Araştırmada incelenen özellikler üç ayrı küme(X,Y ve Z değişken kümesi)

oluşturuyor ise, kanonik korelasyon analizi yerine kısmi kanonik korelasyon

analizi kullanılmaktadır. Kısmi kanonik korelasyon analizinde, temel mantık

değişken kümelerinden birinin etkisi sabitlendiğinde, diğer iki değişken

kümesi arasındaki maksimum

korelasyonlu ve birim varyanslı bileşenler elde etmektir.

(7)

Anahtar Terimler

(8)

Kanonik Korelasyon ve Kanonik Değişken:

X değişken kümesinde p ve y değişken

kümesinde q adet (p < q ) değişken var ise, bu iki değişken kümesindeki değişkenlerin

doğrusal kombinasyonları alınarak, bunlar arasındaki korelasyon hesaplanabilir. Bu şekilde kombinasyonlar arasında karşılıklı

olarak hesaplanan katsayılarına kanonik korelasyon, en büyük korelasyona ilk kanonik

korelasyon, değişik kümelerinden oluşan doğrusal kombinasyonlara ise kanonik

değişken adı verilir.

(9)

Kanonik Fonksiyon: Doğrusal iki kanonik değişken arasındaki ilişkidir. Her bir kanonik fonksiyon bağımlı ve bağımsız

değişkenler setini oluşturan iki kanonik değişkene sahiptir. İlişkinin gücü

kanonik korelasyon tarafından belirlenir.

(10)

Kanonik Skor:

Herhangi bir durumda bir kanonik değişken üzerindeki değerlerdir, bu değerler

değişkenin kanonik katsayılarına dayanmaktadır. Analizlerde kanonik katsayılar durumun standart edilmiş skorları ile çarpılır ve her bir durumun

kanonik skor çıktısı ile toplanır.

(11)

Özdeğer(eigenvalues) ve Kanonik Kök:

Kanonik korelasyonların karelerinin alınması bağımlı ve bağımsız

değişkenlerin ilgili optimal ağırlıklı değişkenleri arasındaki paylaşılmış varyans miktarının tahmin edilmesini sağlar. Aynı zamanda özdeğer olarak

da bilinir.

(12)

Kanonik Ağırlık:

Kanonik ağırlık, kanonik fonksiyon

katsayısı veya kanonik katsayı olarakta adlandırılır: Standart kanonik ağırlıklar

bireysel değişkenlerin herhangi bir

kanonik korelasyona katılımının oransal önemini değerlendirmede kullanılır(

Kanonik ağırlığın bilinen verilişi standart edilmiş biçimdedir, buna göre ‘kanonik ağırlıklar’ karşılaştırıldığında genellikle

‘standart edilmiş terimi’ varsayılır)

(13)

Gereksizlik (redundancy) Katsayısı:

d, Rd olarakta adlandırılır. Orijinal bir değişken setinin diğer setten bir kanonik değişken(genellikle ilk) kullanılarak tahmin

edilmesinde varyansın % sini ölçer.

Gereksizlik katsayısını anlamı yüksek

tahmin kabiliyetidir. Özellikle araştırmacılar bağımsız kanonik değişkeninin bağımlı orijinal değişken değerlerini ne kadar iyi

tahmin ettiği ile ilgilenirler.

(14)

1.3. Kanonik Korelasyon Analizinin Amaçları

Kanonik Korelasyon analizinin amaçları aşağıdaki gibi sıralanabilir:

Aynı bireyden elde edilen iki değişken

kümesinin istatiksel olarak biribirinde bağımsız olup olmadığının test edilmesi,

Kümeler arası korelasyona en fazla katkıda bulunan her iki değişken kümesindeki

değişkenlerin belirlenmesi,

Bağımsız ve bağımlı değişken kümelerine ait değişkenler arasındaki korelasyou maksimum yapan doğrusal kombinasyonların

belirlenmesi,

(15)

Kanonik korelasyon analizi ayrıca aşağıda belirtilen amaçlar içinde kullanılabilir:

Bir değişken kümesinin diğer bir değişken kümesi tarafından ne ölçüde açıklanabildiğinin belirlenmesi,

Bir kanonik değişkenin dahil olduğu değişkenler kümesinin açıklayıcı gücüne ne ölçüde katkı

sağlayabildiğinin belirlenmesi,

Bir Kanonik değişenin dahil olmadığı değişkenler kümesinin açıklayıcı gücüne ne ölçüde katkı

sağlayabildiğinin belirlenmesi,

Farklı kanonik fonksiyonların ilişkileri açıklamak ya da tahmin etmedeki nispi(göreli) gücünün ne kadar oluğunun belirlenmesi.

(16)

1.4 Kanonik Korelasyon Analizinin Uygulanabilmesi için Gerekli

Varsayımlar

(17)

Değişken kümeleri arasındaki ilişki doğrusal olmalıdır.

Her iki değişken kümesinin çok değişkenli normal dağılış göstermesi gerekir.

İki grup değişken kümesinde yer alan değişkenlerin eşit sayıda olma zorunluluğu yoktur.

Stevens(1986) değişkenler arasındaki kanonik

korelasyon katsayısının 0,7 ve daha büyük tahmin edilmesi durumunda örnek büyüklüğünün 50,

katsayısının 0,50 olması durumunda 100, daha düşük olması durumunda ise örnek büyüklüğünün 200

olmasının uygun olacağını bildirmiştir.

Değişkenler arasındaki korelasyonu önemli düzeyde etkilemesi nedeni ile veri kümesinde aykırı değerlerin analiz öncesinde saptanarak gerekli düzeltme ya da elimine edilmesi gerekmektedir.

Her değişken kümesindeki değişkenler arasında çoklu bağlantı veya çoklu birlikte değişim(multicollinearty) bulunmamalıdır.

(18)

1.7 Kanonik Korelasyonların Elde Edilmesi

(19)

Kanonik korelasyon analizinin

uygulanmasında verilerin çok değişkenli normal dağılım göstermesi, ele alınan

özellikler arasında çoklu

bağlantı(multicolinearity) olmaması ve güvenilirlik bakımından örnek genişiliğinin

mümkün olduğunca büyük olması

(değişken sayısının 5 katı kadar) gerekir.

Değişkenlerin doğrusal

kombinasyonlarından oluşan yeni değişkenlere kanonik değişkenler adı

verilir.

(20)

Buna göre ilk setteki değişkenler X1, X2,……….., XP ve

ikinci setteki değişkenler

Y1, Y2,……….., Yq olarak belirtilirse

bunların doğrusal kombinasyonları;

Z= U1 X1+ U2 X2+………..+ UP XP (1) W= V1 Y1+ V2 Y2+………..+ VP YP (2) şeklindedir.

(21)

Katsayıların matrisleri ise;

U=[ U1, U2,……….., UP]

V = [V1, V2,……….., VP]

(22)

Katsayıların matrisleri ise;

U=[ U1, U2,……….., UP]

V = [V1, V2,……….., VP]

Olarak belirtildiğinde, iki doğrusal

kombinasyonu arasında en büyük U ve V nin bir fonksiyonu olarak rzv ifade edilir.

(23)

Analiz sonucu elde edilen

katsayıların hangilerinin önemli olup olmadığı test edilir.

(24)

1.6. Önem Testleri:

(25)

Kanonik korelasyon analizinin bir amacıda boyut indirgemedir. Bu nedenle bulunan kanonik değişken çiftlerinden kaç tanesinin

önemli olduğu, yani değişken grupları arasındaki ilişkinin (kovaryansın) kaç tanesi

ile büyük ölçüde açıklanabileceğine karar vermek gerekir. Bu amaçla geliştirilmiş birçok

yöntem bulunmaktadır. Bunlardan iki tanesi ele alınacaktır.

(26)

a)Wilks Lamda(Barlet Testi): Kanonik Korelasyon analizi sonucu elde edilen kanonik korelasyon katsayılarının kontrolü için en yaygın olarak kullanılan test yöntemi

Barlett tarafından 1941 yılında geliştirilen Wilks Lamda yada Barlett test istatistiğidir.

H0: p1=p2=p3=… =pp= 0 H1 : En az bir p2 ≠ 0

H0 hipotezinin reddedilmesi durumunda değeri en büyük olan katsayı hipotezden çıkartılacak ve işlemler H0 hipotezi kabul

edilinceye kadar tekrarlanacaktır.

(27)

Test için; r2 kitle değeri pi2’ nin kestirimini göstermek üzere, Wilks tarafından önerilmiş olan Λ katsayı

kullanılmaktadır.

(28)

Bu katsayı kullanılarak elde edilen χh2 test istatistik değeri,

(29)

p q serbestlik dereceli khi-kare

tablo değeri ile

karşılaştırılmaktadır. İlk denemede H0 hipotezinin reddedilmesi durumunda, j adım sayısını göstermek üzere yukarıdaki formüllere benzer biçimde olan

aşağıdaki formüller

kullanılmaktadır.

(30)
(31)

Özellikle, kümelerdeki değişken

sayılarının çok olması durumunda test için yukarıda verilen sürecin izlenmesi

işlem hacminin çok olması nedeniyle zaman kaybettiricidir. Bu nedenle elde

edilen kanonik korelasyon

katsayılarının sıralanarak aralarındaki en büyük aralığın (maximum gap)

belirlenmesi ve test işlemine bu aralığın üst değeri ile başlaması zamandan tasarruf açısından yararlı

olacaktır.

(32)

Örnek: p= 4, q= 6 olmak üzere 20 gözlemli bir örnekten kanonik korelasyon katsayılarının kareleri (ri2) büyükten küçüğe doğru 0.9, 0.8, 0.4, 0.3 biçiminde bulunmuş olsun. Yukarıda anlatılanlar ışığında bulunan katsayıların önem kontrolleri:

(33)

1. Adım:

H0: p1=p2=p3=p4= 0 H1 : En az bir p2 ≠ 0

Λ = ∏(1-ri2)= (1-0,9)(1-0,8)(1-0,4)(1- 0,3)=0,0084

Log(0,0084)=-4,779

(34)

χh2 = - [ (n-1)-(p+q+1)/2] log (Λ)= - (19-5,5)(-4,779)=64,52

χ2(pq;α) = χ2 (24;0,05)= 36,42 ; χh2=64,52>36,42

olduğundan, H0 hipotezi reddedilir.

Yani en az 1 tane pi değeri sıfırdan farklıdır, r2 =0,90 a karşılık gelen

r1=0,9487’dir.

(35)

2. Adım:

H0: p2=p3=p4= 0

H1 : En az bir p2 ≠ 0 i=2,…,4 ve j=2 iken Λ* = (1-ri2)= (1-0,8)(1-0,4)(1-0,3)=0,084;

log(0,084)=-2,48

χh2 = - [ (n-1)-(p+q+1)/2] log (Λ)= -(13,5)(- 2,48)=33,48; χ2(p-1)(q-1);α)=

χ215;0,05=25

33,48>25 olduğundan, H0 hipotezi reddedilir. En az bir tane pi değerinin sıfırdan farklı olduğuna ve test dışına

çıkarılmasına karar verilir.

(36)

3. Adım;

H0: p3=p4= 0

H1 : p2 yada p4 ≠ 0 ; j=3 iken Λ* = (1-ri2)= (1-0,4)(1-0,3)=0,42;

log(0,42)= -0,8675

χh2= -(1,35)(5-0,8675)=11,71; χ2(p-2)(q- 2);α)= χ28;0,05=15,51

χh2 =11,71<15,51 olduğundan H0 hipotezi kabul edilir.

(37)

Sonuç olarak, en büyük iki kanonik korelasyon katsayısının önemli, geriye kalan iki tanesinin önemsiz olduğu ve bu iki

değişken kümesi arasındaki mevcut

ilişkinin ilk iki kanonik korelasyon katsayısı ve kanonik değişken vektörü ile

açıklanabileceği söylenebilir.

Hesaplanan Λ katsayısının sıfıra yakın olması H0 hipotezinin reddedileceğini, 0,5

civarında yada daha büyük olması ise H0 hipotezinin kabul edileceği işaret

etmektedir.

(38)

b) Roy’un En Büyük Özdeğer Yaklaşımı:

Heck tarafından geliştirilmiş grafiklerden (Heck’s Charts) yararlanılan bu yöntemde

ri2 yi test emek için ilk olarak;

S= p+ 1-i

(39)

Eşitliklerinden s,m ve parametreleri hesaplanmakta ve parametrelere karşılık gelen α (s, m, ) tablo değerleri kritik değer

olarak kullanılmaktadır. Ele alınan ri2 > α (s, m, ) ise Ho hipotezi reddedilerek aynı

işlem i+ 1’inci kanonik korelasyon için sürüdürülmekte ve işlemler Ho hipotezi

kabul edilince sona ermektedir. Heck grafiklerinin her kaynakta bulunmaması ve

grafiklerden elde edilen kritik değerlerin kesiN değil yaklaşık değerler olması

nedeniyle bu yöntem yaygın olarak kullanılmamaktadır

(40)

UYGULAMA

ÖRNEK: Uygulamada kullanılan veriler, İstanbul

Üniversitesi İstanbul Tıp Fakültesi Hastanesine şişmanlık şikayeti ile başvuran hastalar arasında tesadüfi olarak elde

edilmiştir. Diğer bir anlatımla verilerin anakütlesi İstanbul Tıp Fakültesine şişmanlık şikayeti ile başvuran hastalar, kullanılan örnekleme tekniği basit tesadüfi bir örneklemedir.

Hastalar üzerinde toplam altı değişken ölçülmektedir:

X1: BOY(CM)

X2: BEDEN AĞIRLIĞI(KG) X3: BEDEN KÜTLE İNDEKSİ(KG/m2)

Y1: UYGLUK KEMİĞİNİN ÇEVRESİNİ UZUNLUĞU(CM) Y2: BELDEN YUKARI ÖLÇÜLEN KASALARIN

UZUNLUĞU(CM) Y3: DERİ ALANI (CM2)

(41)

X1 X2 X3 Y1 Y2 Y3 175,25 75,57 24,61 109,47 73,91 1,81 180,45 144,78 44,46 126,49 71,63 2,3

176,6 118,74 37,92 131,83 93,98 2,86 178,5 127,64 39,59 137,92 78,99 2,77 165,75 81,91 29,81 107,19 78,49 1,78 190,5 137,79 36,03 136,91 60,2 2,38 185,25 172,09 46,56 148,59 70,1 2,92 183,3 161,29 46,78 132,33 77,72 2,59 193,5 135,26 36,11 126,75 58,93 2,06 182,56 122,56 36,77 135,89 62,99 2,37 174,55 161,29 42,63 143,76 76,2 2,89 183,6 172,72 48,02 144,02 71,88 2,83 164,9 74,29 30,82 118,11 58,42 0,74 162,35 113,03 32,81 112,27 72,64 1,83 159,51 81,28 31,95 108,46 54,1 1,36 195,56 151,76 37,47 138,18 76,45 2,74 165,35 143,51 41,05 140,46 65,28 2,58 199,4 161,29 40,22 148,84 62,48 2,81 158,5 93,98 23,79 122,43 68,83 2,11 165,95 133,99 37,02 129,54 69,85 2,34

(42)

• 1. Adım

(43)

2. Adım

(44)

3. Adım

(45)

4. Adım

(46)

5. Adım

(47)

6. OUTPUT

(48)

SONUÇLARIN YORUMLANMSI Tablo1: Önem Testi

Test Adı Değer F Önem Seviyesi

Pillais 0,97952 0,016

Hotellings 5,50694 0

Wilks 0,13615 0

Roys 0,84259

(49)

• Tabloda çalışma için önem Pillais,

Hotellings, Wilk ve Roys testleri ile önem derecesi ölçülmüştür. Buna göre tüm testler kanonik fonksiyonun 0,01 önem

seviyesinde anlamlı olduğunu göstermektedir.

(50)

Tablo 2: Kanonik Korelasyon Katsayıları

Özdeğer Kanonik Korelasyon Kanonik R2

1 5,353 0,918 0,843

2 0,138 0,349 0,121

3 0,016 0,124 0,15

(51)

SONUÇ

• İncelenen değişken kümeleri arasındaki uyumu ifade eden özdeğerler birinci boyut için 5,353 olarak

hesaplanmıştır. Bu değerlerin karakökü olan kanonik korelasyon katsayıları birinci boyutta 0,918 dir. Bu değerler 1. boyutta ele alınan değişken kümeleri arasında pozitif yönde kuvvetli bir ilişki olduğunu

göstermektedir. Diğer boyutlardaki ilişki istatistiksel olarak anlamlı değildir.

• Bu durumda boy(x1) ile örneğin uyluk kemiği çevresinin uzunluğu(y1) arasında anlamlı bir ilişki varken diğer

değişkenler arasındaki ilişki analizde anlamlı çıkmamıştır.

(52)

TEŞEKKÜRLER

Referanslar

Benzer Belgeler

• Saçılma diyagramı, iki değişken arasındaki ilişkiyi görsel olarak betimlemede kullanılan bir grafik türüdür.. • Saçılma diyagramı, X-Y puanlarının her bir çiftinin

• En az eşit aralık düzeyinde olan ancak normallik varsayımının karşılanmadığı değişkenler var ise Spearman Brown Sıra. Farkları Korelasyon

“Etki etmez ama bu araçların içine yapay yerçekimi yapıldığını duymuştum.” [N6] numaralı öğrenci, yerçekiminin etki ettiğini ancak, bu kuvvetin sürtünmeye neden olan

Bilâhare Cenevre ve Londra se­ yahatlerinden sonra Hidiv Abbas Paşanın daveti üzerine Mısıra geç­ mişler ve Cenevrede bulundukları sırada serhafiye Ahmed

[r]

Ekip, deney- lerini, özel virüsün felcin hasara uğrattı- ğı beyin bölgesine girip NMDA almaç- larını bulacak ve bunların öldürücü bir biçimde uyarılmalarını

Verilerin analizinde SPSS 17.0 programı kullanılmıştır. Analiz yapılmadan önce anketin güvenilirliği için güvenilirlik analizi yapılmıştır. Cronbach alfa katsayısı

This study aims to clarify the underwater explosion phenomena and draw a way to simulate the response of any floating structure, such as a shock test platform or a