Y I L D IZ Ü N İV E R S İT E S İ G E N E L K İT A P L IĞ I
R 209
Kot ...
a a
...Alındığı Yer
...•Enait-.,
Tarih
2 6 / 5 / 1 9 0 7
Fatura Fiatı 1 0 0 0 T 1 . Ayniyat No Kayıt No U DC ... 1 / 6 ...44Ö22
...£ J 2 u S Z
Ek \-X
■ Y I L D I Z j& * St \
f
Y IL D I Z Ü N İ V E R S İ T E S İ
UÇ GİRİŞLİ VERİ TABLOLARININ
ANA BİLEŞENLİ FAKTÖR ANALİZİ YÖNTEMİYLE
İNCELENMESİ VE BİR UYGULAMA
"D O K T O R A T E Z İ"
Yük. Müh. Eyüp Sabri T Ü R K E R
Tezin Fen Bilimleri Enstitüsüne Verildiği Tarih Tezin Savunulduğu Tarih
11 Tem m uz 1984
16 Kasım 1984
Doktorayı Yöneten Ö ğretim Üyesi Diğer Jüri Üyeleri
Prof. Dr. Cevdet K O Ç A K Prof. Dr. M uzaffer İPEK D oç. Dr. Aziz B E N ER
l.T.Ü.
SA K A R Y A M Ü H EN D İSLİK F A K Ü L T E Sİ M A TBA ASI - 1984
İ Ç İ N D E K İ L E R SAYEA ö Z E T ... X S U M M A R Y ... IV S E M B O L L E R ... IX G î R î Ş ... 1 B Ö L Ü M I A N A B Î L E Ş E N L Î F A K T Ö R A N A L İ Z İ Y Ö N T E M İ 1.1. T e m e l K a v r a m l a r ve T a n ı m l a r ... 6 1.1.1. V e r i T a b l o l a r ı ... 6 1.1.2. Ç o k B o y u t l u V e k t ö r l e r i n M o m e n t l e r i ... 7 1.1.3. N o r m ... 1° 1.1.4. A n a E k s e n l e r ... ü 1.1.5. N o k t a B u l u t u n u n Y e r i ... 3 2 1.1.6. V a r y a n s l a r M a t r i s i ... 33 1.1.7. M e t r i k ... 14 1.1.8. B i r e y l e r B u l u t u ... 18 1.2. An a B i l e ş e n l e r i n ö z v e k t ö r l e r Y a r d ı m ı y l a E l d e E d i l m e s i ... 20 1.2.1. A n a B i l e ş e n l e r i n H e s a b ı ... 20 1.2.2. D e ğ i ş k e n l e r B u l u t u n u n Rn U z a y ı n d a İ n c e l e n m e s i ... 81 1.2.3. R*3 ve R n U z a y l a r ı A r a s ı n d a k i İlişki .. 32 1.2.4. Ana B i l e ş e n l e r e Geçiş F o r m ü l l e r i .... 83 1.2.5. Veri T a b l o s u n u n Ana B i l e ş e n l e r Y a r d ı m ı y l a Y e n i d e n K u r u l u ş u ... 84 1.2.6. G ö s t e r i l i m i n K a l i t e s i ... 86 1.2.7. K a t ı l m a P a y l a r ı ... 87 1.2.8. Ek E l e m a n l a r ... 38
1.3. N o r m l u A na B i l e ş e n l e r ... 40 1.3.1. N o r m l u B i r e y l e r i n B i l e ş e n l e r i ... 41 1.3.2. N o r m l u D e ğ i ş k e n l e r i n B i l e ş e n l e r i ... 42
1.4. Ço k D e ğ i ş k e n l i N o r m a l V e r i l e r için Ana
B i l e ş e n i ! F a k t ö r A n a l i z i ... ... 45 B Ö L Ü M 2 ÜÇ G İ R İ Ş L İ V E R İ T A B L O L A R I N I N F A K T Ö R ANALİZİ. 2.1. Uç G i r i ş l i V e r i T a b l o l a r ı ... 49 2.2. Uç G i r i ş l i T a b l o l a r İçin Y e n i d e n K u r u l u ş F o r m ü l ü ... ... 50 2.3. Y e n i d e n K u r u l u ş F o r m ü l ü n d e k i ö l ç ü m l e r i n İ n c e l e n m e s i ... B ö L U M 3 U Y G U L A M A 3.1. A n a l i z i Y a p ı l a c a k V e r i T a b l o l a r ı ... 57 3.2. A n a l i z P r o g r a m ı n ı n H a z ı r l a n m a s ı ... 3.3. U y g u l a n a c a k A n a l i z l e r d e - S e ç i m K r i t e r i ... 60 3.4. G r a f i k s e l Y o r u m T e k n i ğ i ... 61 B ö L U M 4 A R A Ş T I R M A S O N U Ç L A R I 4.1. V e r i T a b l o l a r ı n ı n A n a l i z i ... 66 4.2. İki G i r i ş l i k ^ j T a b l o s u n u n A n a l i z i ... 68 4.3. Uç G i r i ş l i k T T a b l o s u n u n A n a l i z i ve S o n u ç l a r ı n Y o r u m u ... ... 70 4.4. Uç G i r i ş l i k j j T T a b l o s u n u n Y e n i d e n K u r u l u ş F o r m ü l ü n ü n G r a f i k s e l S a ğ l a n m a s ı ... 73 B ö L U M 5 S 0 N U Ç L A R ... 75 EK B Ö L Ü M ... 78 R E F E R A N S L A R .’... 104 T E Ş E K K Ü R -Ö Z G E Ç M İ Ş
Ö Z E T
Çok d e ğ i ş k e n l i veri analizinde, d e ğ i ş k e n l e r a r a s ı n d a k i b a ğ ı m l ı l ı ğ ı n i n c e l e n m e s i r e g r e s y o n ve k o r e l a s y o n t e knikleri y a r d ı m ı y l a y a p ı l a b i l m e k t e d i r . Ancak, d e ğ i ş k e n l e r a r a s ı n d a k i b a ğ ı m l ı l ı ğ ı n söz konusu olmadığı, y ahut d e ğ i ş k e n l e r arası ilişki l e r i n y a p ı s ı h a k k ı n d a ön b i l g i l e r i n b u l u n m a d ı ğ ı h a l l e r de b a ş k a tekn i k l e r e g e r e k s i n i m vardır.
Bu çalışmada, çok b o y u t l u ver i a n a l i z i n i n ö n e m l i y ö n t emlerinden bir i o l a n ana b i l e ş e n l i faktör anal i z i ç e r ç e v e sinde, üç girişli veri tabloları incelenmiştir.
Ana b i l e ş e n l i faktör anal i z i y a r d ı m ı y l a üç giri ş l i veri tablolarının i n c e l e n m e s i o l d u k ç a yeni olup, u y g u l a n m a s ı n d a bazı g ü ç l ü k l e r l e k a r ş ı l a ş ı l m a k t a d ı r . Bu g ü ç l ü k l e r d e n en ö n e m
lisi, iki giri ş l i ver i t a b loları için v a r o l a n ve ana b i l e ş e n leri v e r i l e r e b a ğ l a y a n y e n i d e n kuru l u ş formülünün, üç g i r i ş li t a b l o l a r a g e n e l l e ş t i r i l m e s i n d e o r t a y a çıkmaktadır. B u ç a lışmada, bu tür tablolarda k u l l a n ı l m a k üzere, bir y e n i d e n k uruluş formülü öner i l m e k t e d i r . H e m ana b i l e ş e n l i faktör analizini u y g u l a m a k ve h e m de f o r mülün g e ç e r l i l i ğ i n i s a ğ l a mak amacıyla, üç giri ş l i tab l o l a r a model o l a r a k bir ekon o m i p r o b l e m i seçilmiştir.
Giriş Bölümünde: Çok b o y u t l u veri a n a l i z i n d e k i i s t a t i s tiksel y ö n t e m l e r d e n kıs a c a söz e d i l m i ş 've ana b i l e ş e n l i fak tör analizi y ö n t e m i y l e ilgili y a p ı l m ı ş a r a ş t ı r m a l a r d a n b a z ı ları tanıtılmıştır. Ayrıca, iki ve üç g i r i ş l i veri t a b l o l a r ında göz ö n ü n e a l ı n a n y e n i d e n k u r u l u ş f o r m ü l l e r i y l e ilgili son y ı l l a r a k a d a r y a p ı l a n b azı ç a l ı ş m a l a r a değinilmiştir.
B i r i n c i Bölümde: V e r i l e r i n çok b o y u t l u uzayda o l u ş t u r d u ğu n okta bulutunun, m ü m k ü n o l d u ğ u k a d a r az bilgi kaybı ile, d aha küçük b o y u t l u b i r alt uzayda göste r i l imine ç a l ı ş ı l m ı ş tır. Veri tabl o s u n u n s a t ı r l a r ı n ı o l u ş t u r a n b i r e y l e r ile,
ko-lortlarını o l u ş t u r a n d e ğ i ş k e n l e r yardım ı y l a , a r a ş t ı r ı l a n alt u z a y a ait a n a e k s e n l e r i n b u l u n m a s ı problemi, d e ğ i ş i k y ö n l e riyle ele a l ı n a r a k in c e l e n m i ş t i r . A y r ı c a bu y ö n t e m d e ; p r o b lemin ç ö z ü m ü n ü n üzdeğer-(3zvektör a r a ş t ı r ı l m a s ı p r o b l e m i n e d ö n ü ş t ü r ü l e b i l e c e ğ i g ö s t e r i l m i ş ve ö z v e k t ü r l e r d e n ana b i l e şenl e r e geçiş f o r m ü l l e r i ç ı k a r t ı l a r a k , b i l e ş e n l e r y a r d ı m ı y la asıl v e r i t a b l o s u n u n y e n i d e n k u r u l u ş u n u s a ğ l a y a n formül elde e dilmiştir.
İkinci Bölümde: İki g i r i ş l i v eri t a b l o l a r ı için var o l a n y e n i d e n k u r u l u ş formülü, üç g i r i ş l i t a b l o l a r içir: k u l l a n ı l a b i l e c e k d a h a genel b i r h a l d e v e r i l m i ş ve bu f o r m ü l ü n ana b i l e ş e n l e r l e o l a n ilişkisi g ö s t e r i l m i ş t i r . V a r l ı ğ ı ve tekliği son y ı l l a r d a i s p a t l a n m ı ş b u l u n a n söz k o n u s u formül, üç ü n c ü b a s a m a k t a n e t k i l e ş i m l e r i k a p s a m a k suret i y l e , üç b o y u t lu v e r i l e r i ana b i l e ş e n l e r c i n s i n d e n tam o l a r a k ifade e d e b i l m e ktedir. Y a l n ı z ikinci b a s a m a k t a n e t k i l e ş i m l e r i n a l ı n m a s ı h a l i n d e dahi, y e t e r l i bi r y a k l a ş ı m s a ğ l a y a b i l m e k t e d i r .
üçü n c ü Bölümde: Ana b i l e ş u n l l faktör a n a l i z i y ö n t e m i y le ilgili, F O R T R A N IV d i l i n d e g e l i ş t i r i l e n , o l d u k ç a g enel amaçlı bir p r o g r a m ı n a l g o r i t m a s ı t a n ı t ı l m ı ş ve p r o g r a m ç ı k ı ş l a r ı n ı n y o r u m u n d a k u l l a n ı l a n i s t a t i s t i k s e l k r i t e r l e r ö z e t l e n m i ş t i r . D ö r d ü n c ü B ö l ümde: ü l k e m i z i n e k o n o m i k y a p ı s ı n ı b e l i r l i ö l ç ü d e y a nsıtan, so n y ı l l a r d a k i i h r a c a t p r o b l e m i ele a l ı n a rak, bu p r o b l e m i n i s t a tistiksel a n a l i z i y a p ı l m ı ş t ı r . 1976/80 y ı l l a r ı arasında, ü l k e m i z ihracat ı ıııia önemi i rol o y n a y a n ü r ü n l e r "Değişken" ve i h r a c a t t a ö n e m l i payı o l a n ülke l e r "Birey" o l a r a k s e ç i l m i ş ve b ö y l e c e h e r yıl için o l u ş t u r u l a n (25 x 12) b o y u t l u v eri t a b l o l a r ı n ı n ana b i l e ş e n l i faktör a n a l i z i y a p ı l m ı ş t ı r . Ayrıca; iki ve Uç g i r i ş l i k a r ş ı l a ş t ı r m a tab l o l a r ı için ö n e r i l e n y e n i d e n k u r u l u ş f o r m ü l l e r i n d e n e lde e d i l e n s o n u ç l a r ile, b a ş l a n g ı ç tab l o l a r ı k a r ş ı l a ş t ı r ı l - m ı ş t ı r .
Son B ö l ü m s o n u ç l a r a ayrılmıştır. Burada, analiz s o n u ç larının genel bir d e ğ e r l e n d i r m e s i yapılmıştır.
Analiz s o n u c u n d a eld e ed i l e n tablo ve g r a f i k l e r E k 'te verilmiş t i r .
-S U M M A R Y
R e g r e s s i o n and C o r r e l a t i o n tech n i q u e s can be used in the investigati'on of d e p e n d e n c e in such s i t u a t i o n s w h e r e a v a r i a b l e of a m u l t i v a r i a t e s y s t e m depends on o t h e r variables. However, if a d i f f e r e n t i a t i o n b e t w e e n d e p e n d e n t and indepen- deni var i a b l e s is not a m a t L o r of iıııportaııce, in o t h e r w ords if ali the v a r i a b l e s c arry ecjual importaııce from the p oint of view of the p u r p o s e s of the investigation, then it is e s sential that o ther teclıniques will be used in the analysis of dependence. Th e t echniques included in this c a t egory are useful e s p e c i a l l y whe n there is not s u f f i c i e n t information ab o u t the str u c t u r e of the r e l a t i o n s h i p betw e e n the variables
S t a r t i n g w i t h the P r i n c i p a l C o m p o n e n t A n a l y s i s me t h o d and witlı the int r o d u c t i o n of formula m a i n t a i n i n g the reestab- lishment of the s t a r t i n g data table, an a n a l y s i s of an eco- nomical p r o b l e m cl o s e l y rela t e d to the recent export s t r u c ture of Tu r k e y was nıade to prove the c o n f o r m i t y of this fo r mula. .
In the i n t r o d u c t i o n chapter, the i n i t i a t i o n of mu l t i - di m e n s i o n a l dat a analysis meth o d s and its d e v e l o p m e n t has b e e n b r i e f l y g iven and the p r incipal c o m p o n e n t a n a l y s i s m e t ho d and its r e l a t i o n witlı the o t h e r m u l t i v a r i a t e m e t h o d s has been explained. Also, the wor k c a r r i e d out on the formula whiclı m a i n t a i n the reestâbl i.shıııent of the s t a r t i n g table witlı the uid ol' principal component has been suınmarised.
In the first section, the p r incipal c o m p o n e n t analysis m e t h o d and the b asic hypotlıesis on w h i c h it depe n d s has been i n t r o d u c e d and the r e l a t e d formula are given, also the
an a lysis has b e e n i n v e s t i g a t e d fro m the g e o m e t r i c a l point of v iew and the c a l c u l a t i o n s are e s t a b l i s h e d mor e clearly.
T h e a i m of p r i n c i p a l c o m p o n e n t a n a lysis m e t h o d is to reduce the number of d i m e n s i o n of the p r o b l e m by u s i n g v ari- ables r e l a t e d to the p r o b l e m and by creatiııg a few a r t i f i c i a l variables. In the m a i n t aining, soıııe i nformation in the data matriy. is n a t u r â l l y lost, stili the m e t h o d depe n d s o n the pr i ncipal of find i n g and o p t i m u m s o i u t i o n in such a way to m i n i m i z e the inform a t i o n loss. Iıı the ınost general sense,
the p r i ncipal c o m p o n e n t a n a l y s i s m e t h o d conslsts of looking for the liııear combinatioııs of the origiııal v a r i a b l e s by s u m m a r i s i n g the s t a r t i n g d ata table and w i t h the m i n i m u m in f o r m a t i o n loss possible.
Af ter cstabl isli i.ng the b asis ol' Life method, ali the d e f i n i t i o n s and the c a l c u l a t i o n ınethods r e g u i r e d for the an a lysis are given, at the end of the first s e c t i o n the g e o m e t r i c a l study of the p r i n c i p a l c o m p o n e n t is made and the p r i n c i p a l c o m p o n e n t u n d e r the h y p o t h e s i s normal dist r i - bu t i o n is i n v e s t i g a t e d as well.
In the s e c o n d section, s t a r t i n g wit h the p r i n c i p a l cdmponent, the formula w h i c h p r o v i d e d the r e e s t a b l i s h m e n t of the s t a r t i n g table are introduced. The v a l i d i t y of the two w a y c o n t i g e n c y tables of a formula is shown, follov/ed by an i n v e s t i g a t i o n o f a m o r e gene r a l formula w h i c h c a n be u £ed for the three w a y tables. E s p e c i a l l y in the s i t u a t i o n w h e r e the nu m b e r of the s e i e c t e d v a r i a b l e s is great, this
formula gives results c lose to the s t a r t i n g dat a table.
In t he Ilı iril sootioıı, the A l g o r i t h m of Lho general p u r p o s e p r o g r a m w h i c h can ıııake ali the r e g u i r e d c a l c u l a t i o n s a bout the p r i n c i p a l c o m p o n e n t a n a l y s i s m e t h o d and w h i c h is c o d e d in F O R T R A N IV l a n g u a g e is given. This p r o g r a m is p r e p a r e d to a n a l y s e (50 x 50) dat a m a t r i x and to give the results as ' a p p r o p r i a t e tables and g r a p h s . Th e a l g o r i t h m i c str u c t u r e of the p r o g r a m can be s u m m a r i s e d as follows;
-i. It reads the data table w i t h the r e q u i r e d FORMAT,
ii. S t a r t i n g w i t h the d ata table it c a l c u l a t e s the c o r r e l a t i o n (or covariance) Matrix,
Lii. LL calcu l a t e s Llıe e igen values and e i g e n vectors of the c o r r e l a t i o n (or covariance) ıııatrix w i t h the aid of iteration method,
iv. S t a r t i n g w i t h the e i g e n values and e i g e n vectors an d u s i n g the t r a n s f o r m a t i o n formula it c a l c u l a t e s the
c o f f i c i e n t s of p r i n c i p a l components,
v. S i n c e the c a l c u l a t e d e i g e n va l u e s are d e f i n e d as the v a r i a n c e of p r i n c i p a l components, it gives the eigen v alue percentages, a c c u m u l a t e d p e r c e n ^ a g e s an d the histo- grams o f the e i g e n values as a p p r o p r i a t e tables,
vi. If required, it prints the dat a table and its c o r r e l a t i o n ınatriq in an a p p r o p r i a t e way,
vii. It. gives the q u a l i t y of the figüre, the aver a g e a n d s t a n d a r t d e v i a t i o n of the v a r i a b l e s and the c a l c u l a t i o n s of the c o n t r i b u t i o n r atio and thus helps the d i s c u s s i o n of the results,
viii. It pri n t s the graphs of the c a l c u l a t e d p r i ncipal c o m p o n e n t s in the r e g u i r e d pianes.
İn Uıe forth s e c t i o n the resu l t s and d i s c u s s i o n ob- t a i n e d as a resuit of a p p l i c a t i o n of a p r o g r a m of pr i n c i p a l c o m p o n e n t a n a lysis m e t h o d to an e c o n o m i c a l p r o b l e m w h i c h is p o s s i b l e to be i n v e s t i g a t e d s t a t i s t i c a l l y is given. The r e sults o b t a i n e d by the a p p l i c a t i o n of the r e l a t e d p r o g r a m to the five (25x12) dat a m a t r i x c r e a t e d in a c c o r d a n c e w i t h the last five y ears e x p o r t s of T u r k e y can be s u m m a r i z e d as follows;
vıı
-i. As a result of a n a lysis made by e v a l u a t i n g the d ata m a t r i c e s in vari o u s ways, it is found that the first four c o m p o n e n t s are g e n e r a l l y meaningful. T h e p o s s i b i l i t y of e x p l a i n i n g the properties, w h i c h can be e x p i a i n e d w i t h 12 variables, by four e g u a t i o n s w h i c h are found as the İinear c o m p o n e n t s of these v a r i a b l e s shows that this a n a lysis is a very e f f e c t i v e d i m e n s i o n r e d u c i n g m e t h o d for the used data.
ii. iVlıeıı Lhe C i ve yeniri;* export guunt il Los botw e e n 1976/80 is aııalyzed by takiııg the time d i m e n s i o n into ac- count, it is o b s e r v e d that the types of p r o d u c t s that T u r k e y has e x p o r t e d to the n e i g h b o u r i n g couııtries are a c c u m u l a t e d at the same side of the p r i n c i p a l components. This can be c o n s i d e r e d as t here is no s i g n i f i c a n t clıange in the exp o r t s t r u c t u r e .
iii. When the c a l c u l a t e d c o m p o n e n t s of the cou n t r i e s and the r e l a t i v e p l a c e m e n t of these c o u n t r i e s are o b s e r v e d on the graphs, it is seen that the c o u n t r i e s h a v i n g the same g e o g r a p h i c a l c h a r a c t e r are a c c u m u l a t e d at the same place. Stili it is o b s e r v e d that some c o u n t r i e s are very cl o s e d to the c o m p o n e n t s and some are very far.
iv. A l t h o u g h the resu l t s o b t a i n e d fro m the analysis of the three wa y kjjrp tables c o n t a i n s the results of two way k tables, it is p o s s i b l e to see nıore c l e a r l y the
X J
g r o u p i n g of b oth the c o u n t r i e s and the p r o d u c t s in the an a l y s i s of the three wa y tables.
v. The reestablishınent formula p r o p o s e d for the data tables of c o r r e s p o n d a n c e a n a l y s i s c o n t a i n s d e n s i t y functions. Since İL is p o s s i b l e to puss from the c o r r e s p o n d a n c e a n a lysis to pri n c i p a l c o m p o n e n t a n a l y s i s w i t h the aid o f a p p r o p r i a t e t r ansformations, a form u l a w h i c h m a i n t a i n s the r e e s t a b l i s h - ment of the three way tables can be g iven in the pr i n c i p a l com p o n e n t analysis. In this study, a r e e s t a b i i s h m e n t formula
for three w a y c o n t i g e n c y tables is p r o p o s e d to be u s e d in the p r i n c i p a l c o m p o n e n t a n a lysis method.
vi. B y a n a l y s i n g the re s u l t o b t a i n e d from two and t h r e e w a y c o n t i g e n c y tables the s i m i l a r i t y w i t h the s t a r d i n g table is observed. T his m e a n s that, the form u l a p u t forw a r d are v e r y useful in the p r i n c i p a l c o m p o n e n t a n a l y s i s method.
T h e tables and graphs o b t a i n e d as a result o f the a p p l i c a t i o n of the p r o g r a m r e l a t e d to the a n a lysis are g iven in the appendix.
IX
-S E M B O L L E R
c : (p x p) k o r e l a s y o n matrisi. d(xl x j ) ,. yg x v e k t ö r l e r i a r a s ı n d a k i uzaklık. d İjt : k^j. ö l ç ü m ü n ü n ö l ç ü m l e r ç a r p ı m ı n a göre yoğunluğu. D X : K ö ş e g e n ü z e r i n d e k i e l e m a n l a r ı ö z d e ğ e r l e r o l a n (p x p) k ö ş e g e n matris.Si-
: r p u z a y ı n a ait b i r i m vektör.E (Xı) : x^ v e k t ö r ü n ü n b e k l e n e n değeri.
F (x^ ) : N o r m l u d e ğ i ş k e n l e r i n d a ğ ı l ı m fonksiyonu.
fIJ : İki g i r i ş l i freka n s l a r tablosu. f IJT : Uç g i r i ş l i f r e k a n s l a r tablosu. G (i) : Ana b i l e ş e n l e r i n d a ğ ı l ı m f o n k s i y o n u % : B i r e y l e r b u l u t u n u n a ğ ı r l ı k merkezi. h : D e ğ i ş k e n l e r b u l u t u n u n a ğ ı r l ı k merkezi. I P : (p x p) B i r i m matris. J : Jakobiyen.
k IJT : Uç g i r i ş l i v eri tablosu.
k IJ : İki g i r i ş l i veri tablosu.
k : V eri t a b l o s u n u n e l e m a n l a r toplamı. KI : İzafi k a t ı l m a payı. KM : M u t l a k k a t ı l m a payı. K o r U 1 , x j ) . ve x a r a s ı n d a k i k o r e l a s y o n katsayısı. K o v ( x \ X 3 ) : X 1 ve X 3 a r a s ı n d a k i kovaryans. M : S e ç i l e n u z a y a ait metrik. r 2 : G ö s t e r i l i m i n kalitesi.
Rn , RP : n ve p b o y u t l u reel uzaylar.
S j : N o r m l u d e ğ i ş k e n l e r i n b i l e ş e n l e r i n e ait Varyans
U : B i r e y l e r e ait « . ana e k s e n i n b i r i m vektörü. üt
u : (p x p) ö z v e k t ö r l e r matrisi.
V
- a : D e ğ i ş k e n l e r e ait a.ana e k s e n i n b i r i m vektörü. Var U 1 ) : X 1 d e ğ i ş k e n i n i n varyansı. X : (ıı x p) v e r i tablosu. X' : (p x n) ver i t a b l o s u n u n transpozesi. * X : (n x p) Veri t a b l o s u n u n y a k l a ş ı k değeri. *i : B i r e y l e r b u l u t u n u n elem a n ı (i“ 1, ... . n ) . K j : D e ğ i ş k e n l e r b u l u t u n u n e l e m a n ı (j = 1, ...., p) . c X 1 , ^ 3>m : X 1 ve x ^ ' n i n M ' y e göre sk a l e r çarpımı. İl*1 1 İM : X 1 v e k t ö r ü n ü n M normu. *o : Ek ol a r a k seçi l e n birey. O X : Ek o l a r a k seçi l e n değişken. Y : (n x p) M e r k e z i veri tablosu. A
u : B i r e y l e r e ait o ana eksen.
\ : D e ğ i ş k e n l e r e ait r. ana eksen. L : L a g r a n g e 'y e n .
A
u : Öz d e ğ e r l e r (u=l, ... . p) .
j. : N o r m l u b i r e y l e r e ail ana b i l e ş e n l e r vektörü.
: N o r m l u d e ğ i ş k e n l e r e ali ana b i l e ş e n l e r vektörü
pij : i. ve j. b i l e ş e n a r a s ı n d a k i k o r e l a s y o n katsayı
°ij : i. ve j. b i l e ş e n a r a s ı n d a k i kovaryans. £ : V a r y a n s - K o v a r y a n s matrisi.
: Ek b i r e y l e r e ait ana b i l e ş e n l e r vektörü.
T : B i r e y l e r e ait âna b i l e ş e n l e r vektörü.
f : D e ğ i ş k e n l e r e ait ana b i l e ş e n l e r vektörü. *
'f : Z a m a n ile ilgili ana b i l e ş e n l e r vektörü.
Np : p d e ğ i ş k e n l i normal dağılım. XI
-Çok d e ğ i ş k e n l i d a ğ ı l ı ş g ö s t e r e n h e r h a n g i bir s i s t e min d e ğ i ş k e n l e r i a r a s ı n d a k i b i r l i k t e d e ğ i ş i m i n y o r u m l a n m a sı g e r e k sinimi, ç e ş i t l i b oyut ind i r g e m e y ö n t e m l e r i n i n k u l l a n ı l m a s ı n d a en ö n e m l i n e d e n l e r d e n b i r i olmuştur. B u y ö n t e m lerin pek çoğu, veri t a b l o s u n d a n elde e d i l e n bazı ö z e l l i k leri k ullanarak, b i r e y l e r v e y a d e ğ i ş k e n l e r a r a s ı n d a k i i l i ş kileri, a n l a ş ı l m a s ı ve y o r u m u d aha k olay b i r şekle sokm a y ı amaçlarlar.
Günümüzde, F a k t ö r A n a l i z i (1 - 6), K a r ş ı l a ş t ı r m a A n a lizi (7 - lû), Çok B o y u t l u ö l ç e k l e m e (8, 11), K a n o n i k Analiz
( 1 2< 13) ve An a B i i e ş e n l i F a k t ö r A n a l i z i (14 - 16) gibi çok d e ğ i ş k e n l i i s t a t i s t i k s e l yönte m l e r , ö z e l l i k l e u y g u l a m a l ı b i l i m d a l l a r ı n d a y a y g ı n bir b i ç i m d e k u l l a n ı l m a k t a d ı r . Bu y ö n t e m l e r i n d a y a n d ı ğ ı temel i l k e l e r çok e s k i l e r e d a y a n m a k la birlikte, g e l i ş m e l e r i o l d u k ç a yenidir. Fa k t ö r e l y ö n t e m l e r i ç e r i s i n d e en e ski o l a r a k b i l i n e ni, p s i k o l o g l a r t a r a f ı n d a n o r t a y a a t ı l ı p g e l i ş t i r i l e n k l a sik F a k t ö r A n a l i z i olup, bu y ö n t e m i n ilk u y g u l a m a l a r ı p s i koloji a l a n ı n d a olmuştur. Faktör Analizi, bir d e ğ i ş k e n t a kımı a r a s ı n d a k i i l i ş k i l e r i n a n a l i z i a m a c ı y l a g e l i ş t i r i l m i ş yöntemlerin, genel a n l a m d a bi r a d l a n d ı r ı l m a s ı o l a r a k k u l l a nılmaktadır. Bu d e ğ i ş k e n l e r , test skorları, a n k e t y a n ı t l a n veya istatistikse) k e s t i r m e 1 er o l a b i l i r l e r . F a k t ö r A n a l i z i nin bazı y ö n t e mleri, z i h n i k a b i l i y e t l e r i n temel y a p ı s ı n ı konu ala n öze l h i p o t e z l e r i n a ç ı k l a n m a s ı için g e l i ş t i r i l m i ş tir.
B a ş l a n g ı ç t a C. S P E A R M A N (17), H. T H U R S T O N E (18) ve C. BUR T (19) t a r a f ı n d a n t e m e l l e r i a t ı l a n ve g e l i ş t i r i l e n bu y ö n t e m l e r y a r d ı m ı y l a , v e r i l e r d e n e l d e e d i l e n s o n u ç l a r d a n başka, d o ğ r u d a n d o ğ r u y a g ö z l e n e m e y e n v e y a g ö z l e m l e r i n d ı ş ı n
2
-da k a l a n b i r t a k ı m d e ğ i ş k e n l e r de o r t a y a çıkarı l m a k t a d ı r . Böylece, p s i k o l o j i k t e s t l e r e tabi t u t u l a n k i ş i l e r ü z e r i n d e elde e d i l e n sonuçlar, bellek, zekâ, ç a l ı ş m a gücü, .... g i bi çok az s a y ı d a k i b i r t a k ı m gizli f a k t ö r l e r l e a ç ı k l a n a b i l - m e k t e d i r (20, 21). P s i k o l o g l a r ı n k u r d u ğ u bu yöntemler, b i l g i s a y a r o l a n a k l a r ı n ı n da a r t m a s ı y l a kısa z a m a n d a gelişerek, çeşitli v a r s a y ı m l a r a ve m a t e m a t i k s e l k u r a l l a r a d a y a n a n daha d e ğ i ş i k analiz y ö n t e m l e r i n i n d o ğ m a s ı n a yol a ç m ı ş t ı r ( 2 2 - 2 8 ) . Bu nedenle, p s i k o l o g l a r ı çok b o y u t l u veri a n a l i z i d ü n y a s ı n ın k e ş f i n d e ilk ö n c ü l e r o l a r a k kabul edebiliriz.
V e r i a n a l i z l e r i n d e k i b a ş a r ı l ı ç a l ı ş m a l a r ı ile t a n ı nan J.D. C A K O L L , J.B. KRUSKAL, W . S. TORGE R S O N , G. YOUNG, R.N. SIIEPARU g ibi i s i m l e r e P s y c h o m e t r i k a adlı b ü l t e n d e r a s t lıyoruz. Bu i s t a t i s t i k ç i l e r , p s i k o l o j i k d e n e y v e y a g ö z l e m le r d e n e l d e e d i l e n veri t a b l o l a r ı n ı n g ö s t e r i l i m l e r i ile i l g i li olarak, çok b o y u t l u ö l ç e k l e m e adı a l t ı n d a g ü ç l ü ve b a ş a rılı t e k n i k l e r g e l i ş t i r m i ş l e r d i r ( 2 9 - 3 1 ) .
H. H O TELLING, y ine G. S P E A R M A N (17) ve K. P E A R S O N ( 3 2 ) 'm y a p t ı ğ ı ç a l ı ş m a l a r a d a y a n a r a k ilk o l a r a k 1 9 3 0 ' l a r d a A n a B i l e -
şenli F a k t ö r A n a l i z i y ö n t e m i n i ve 1 9 3 6 ' l a r d a d a y ine ilk o l a rak K a n o n i k Analiz y ö n t e m i n i o r t a y a k o y m u ş t u r (33).
Ço k d e ğ i ş k e n l i i s t a t i s t i k s e l y ö n t e m l e r içerisinde, k o v a r y a n s y a p ı s ı n ı n i n c e l e n m e s i n d e k u l l a n ı l a n en e tkin y ö n t e m l e r d e n birisi Ana B i l e ş e n l i Faktör A n a l i z i y ö n t e m i d i r (4G- 54). B a ş l a n g ı ç t a , p s i k o l o j i a l a n ı n d a k u l l a n ı l a n bu yöntem, zamanla e k o n o m i (34, 35), iktisat (3G, 37), zi r a a t ve h a y v a n c ı l ı k (38, 39), m a d e n c i l i k (40), e k o n o m e t r i (41) ve tıp (42 - 4 5 ) a l a n l a r ı n d a da y a y g ı n bi r b i ç i m d e k u l l a n ı l m a y a b a ş lanmıştır. A n a l i z o b j e k t i f olarak, b a ş l a n g ı ç d e ğ i ş k e n l e r i n i n m a k s i m u m v a r y a n s l ı l i n e e r k o m b i n e z o n l a r ı n ı n a r a ş t ı r ı l m a s ı e s a s ı n a dayanır, ö zellikle, a r a ş t ı r m a d a k u l l a n ı l a c a k d e ğ i ş k e n s a y ı s ı n ı n çok o l d u ğ u d u r u m l a r d a d e ğ i ş k e n l e r i n çok b o y u t lu ö r n e k i ç e r i s i n d e teker t eker i n c e l e n m e s i o l d u k ç a zor d u r ve y a n l ı ş k a r a r l a r v e r m e y e n e d e n o l m a k t a d ı r . Bu nedenle, b a ş l a n
-gıç d e ğ i ş k e n l e r i yerine, b u n l a r ı n li n e e r k o m b i n e z o n l a r ı n d a n ol u ş a n ve k e n d i a r a l a r ı n d a k o r e l a s y o n s u z yeni b i l e ş e n l e r İncelenmektedir. Metod, b ü y ü k v a r y a n s ı içeren lineer k o m b i n e z o n l a r ı n a r a ş t ı r ı l m a s ı e s a s ı n a dayandı ğ ı n d a n , k üçük var- yanslı lineer k o m b i n e z o n l a r ihmal edilm e k t e d i r . B u l u n a n y e ni d e ğ i ş k e n l e r tam a m i y l e y a p a y olup, bir anla m d a s i s temin
temelinde var o l a n esas fak t ö r l e r olarak kabul e d i l e b i l i r ler. Fak t ö r T e r h e r d e ğ i ş k e n i az veya çok e t k i l e d i k l e r i i ç i n dir ki, d e ğ i ş k e n l e r l e fak t ö r l e r a r a s ı n d a k i k o r e l a s y o n l a r o r taya çıkmaktadır. Fak t ö r A n a l i z i y ö n t e m l e r i n d e n o l a n K a r ş ı l a ş t ı r m a A n a lizi y ö n t e m i de 1 9 6 0 ' l a r d a n sonra J.P. B E N Z E C R I t a r a f ı n d a n g e l i ş t i r i l m i ş t i r ( 5 5 - 5 8 ) . A s l ı n d a y ö n t e m i n e s a s l a r ı n ı H.D. H I R S C H F E L D (29) ve R.A. F I S H E R ( 5 9 ) ’in 1935-1940 y ı l l a r ı arasında t e s a d ü f ta b l o l a r ı üzer i n e y a p t ı k l a r ı ç a l ı ş m a l a r a kadar g ö t ü r m e k mümk ü n d ü r . Ancak, o z aman y a p ı l a n çalışmalar, klasik i s t a t i s t i ğ i n çok dar ç e r ç e v e s i i ç e r i s i n d e kalıyordu. Konuyla ilgili olarak, son z a m a n l a r d a u y g u l a m a y a y ö n e l i k b a zı ç a l ı ş m a l a r ı n da y a p ı l d ı ğ ı g ö r ü l m e k t e d i r (60, 61).
J.P. B E N Z E C R I 'ni n ç a l ı ş m a l a r ı y l a veri a n a l i z i n i n e s a sını teşkil e d e n d e s k r i p t i f y a p ı y a ait c e b irsel ö z e l l i k l e r de k u l l a n ı l m a y a b a ş l a n d ı (55, 62). Aslında, u y g u n d e ğ i ş k e n dönüşümleri y a r d ı m ı y l a , b u y öntemden, Ana B i l e ş e n l i Faktör Analizi y ö n t e m i n e g e ç i l e b i l d i ğ i gibi, o n u D i s k r i m i n a n t A n a lizi' nin özel b i r h a l i saymak, h atta v e r i l e r i n a yrık k o d l a n ması halinde de K a n o n i k A n a l i z ' i n özel b i r h a l i n e i ndirgemek müm k ü n d ü r (59, 63, 64, 65). W . S. TORGERSON, M.O. IIILL ve L. GUTTMAN, Kaı ş l J a ş t ı r m a A n u i i z i ' n i bir ölçeklenıe y ö n t e m i o l a rak y o r u m l a m ı ş l a r d ı r (66).
İki g i r i ş l i t a b l o l a r ı n K a r ş ı l a ş t ı r m a Analizi'ni, çok girişli t a b l o l a r a g e n e l l e ş t i r m e k için b i r ç o k y ö n t e m vardır. Bu n l a r ı n ilk ö r nekleri, 1 9 6 4 ' t e J.P. B E N Z E C R I ve 1965'te de B. E S C O F I E R - C O R D I E R t a r a f ı n d a n v e r i l m i ş t i r (62, 67). Fakat
- A
-e n ö n -e m l i s i , 1972 y ı l ı n d a y in-e J.P. B E N Z E C R I t a r a f ı n d a n g -e l i ş t i r i l e n bi r y ö n t e m d i r ki, b u n u n da ana prensipleri, C. B U R T ' u n 1950 y ı l l a r ı n d a y a p t ı ğ ı ç a l ı ş m a l a r a d a y a n ı r (19). B u kon u ile ilgili olarak, ö z e l l i k l e J.D. C A R O L L (31) ve P. H O R S T (68)'ın y a p t ı ğ ı ve M. M A S S O N ( 6 9 ) ' m b u n l a r a d a y a n a rak g e r ç e k l e ş t i r d i ğ i ç a l ı ş maları, y a k ı n tarihilere k a d a r y a p ı l a n s o n ç a l ı ş m a l a r o l a r a k s ö y l e y e b i l i r i z . K a r ş ı l a ş t ı r m a A n a l i z i y öntemini, H. U O T E L L I N G ' i n K a n o n i k K o r e l a s y o n A n a lizi 'ııin öze l bir hali o l a r a k da d ü ş ü n e b i l i r i z (66).
C. E C K A R T ve G. Y O U N G v e r i l e n (ıı x n) b o y u t l u bir K IJ = j)| i, j € (1, n )) t a b l o s u n a karşılık, en küçük
k a r e l e r anlamında, p. b a s a m a k t a n y a k l a ş ı k bir tablo b u l m a p r o b l e m i ile ilgili o l a r a k b asit ve tek bir ç ö z ü m eld e e t m i ş l e r d i r (70). İki girişli t a b l o l a r için v e r i l e n bu f o r m ü lü, J.D. C A R O L L ve J.J. C H A N G üç g i r i ş l i t a b l o l a r a g e n e l l e ş tirmek i s t e m i ş l e r s e de, ç ö z ü m ü n t e k l i ğ i n i s a ğ l a y a m a m ı ş l a r d ı r
(30, 31, 55, 71).
İki giri ş l i v eri t a b l o l a r ı n a u y g u l a n a n k l a s i k Faktör A n a l i z i y ö n t e mleri, Uç g i r i ş l i t a b l o l a r için y e t e r s i z k a l maktadır. Bu nedenle, d a h a d e ğ i ş i k y ö n t e m l e r k u l l a n m a k g e rekir. B u k o n u d a g e l i ş t i r i l m i ş ilk ve forınel çalışma, Uç g i r i ş l i k a r ş ı l a ş t ı r m a tablolarının, Lojik t a b l o l a r a d ö n ü ş tü r ü l m e s i e s a s ı n a d a y a n ı r (55).
V e r i l e r i n A n a B i l e ş e n l e r y a r d ı m ı y l a ifade e d i l e b i l m e s inin zorluğu, üç g i r i ş l i veri t a b l o l a r ı n ı n analizinde, son z a m a n l a r a kadar, e n ö n e m l i p r o b l e m l e r d e n biri ola r a k kabul e d i l m e k t e y d i . Ancak, bu p r o b l e m 1 9 8 2 ' d e n beri, üçü n c ü b a s a m a k t a n e t k i l e ş i m l e r i de içer m e k suretiyle, üç b o y u t l u v e r i leri, A n a B i l e ş e n l e r c i n s i n d e n t a m ol a r a k ifade ede n b i r f o r m ü l ü n v e r i l m e s i y l e ç ö z ü l m ü ş b u l u n m a k t a d ı r . Sa d e c e ikinci b a s a m a k t a n e t k i l e ş i m l e r i n a l ı n m a s ı h a l i n d e bile, y e t e r l i bir y a k l a ş ı m e l d e e d i l e b i l m e k t e d i r (72).
airişli t a b l o l a r için y e n i d e n k u r u l u , formülü ma Analizi* nde u y g u l anarak, b a ş l a n g ı ç « « “ ta) osu.
Ç 3 y a k ı n s o n u ç l a r o r t a y a ç ı k a r m ı ş t ı r 0 2 ) .
B U çalışmada, varlığı ve tek lig i toorik o l a r a k k a tlanan en g e n e l a n l a m d a y e n i d e n kuruluş formülünün. An nıtianaıı l t er e k 1i düzol.tmeler
yapıl-- - - - - 5 L ‘; „
F o r m ü l ü n g e ç e r l i l ü j i n i o r t a y a k o y m a k b a k ı m ından. u y g ü l a m olarak. T ü r k i y e ’n i n 1916/80 yılları a r a s ı n d a k i ibraca
seç ilmiş t i r •
. I t ü ü i l q i İşlem Merke Analiz ile ilgili programlar. 1.1. •
2 İ .„ne nazırı. M ve tüm u y g u l a m a l a r bu m e r k e z d e k i El e k t r o n i k H e s a p Mak.inasr *ndn g e r ç e k l e ş t i r i l m i ş t i r .
B Ö L Ü M : I
ANA B1LESENLI FAKTÖR ANALİZİ YÖNTEMİ
I . I . T E MEL KAVRAMLAR VE T A N I ML A RGenel olarak p tane d e y i ş k e n a r a s ı n d a k i ilişki, bu d e ğ i ş k e n l e r i ana b i l e ş e n l e r adı v e r i l e n ve a r a l a r ı n d a k o r e l a s y o n b u l u n m a y a n yeni d e ğ i ş k e n t a k ı m ı n a d ö n ü ş t ü r e r e k i n c e lenir. Gerçekte, d e ğ i ş k e n l e r d e n ana b i l e ş e n l e r e y a p ı l a n d ö nüşüm, k o o r d i n a t eksen l e r i n i n , b i r ç o k ö z e l l i k l e r i o l a n yeni b i r k o o r d i n a t s i s t e m i n e d ö n ü ş ü m ü n d e n ibarettir. Eğer, veri t a b l o s u n d a k i i n f o r m a s y o n u n b ü y ü k b i r kısmı ilk iki ana b i l e şen t a r a f ı n d a n açıklanabilınişse, an a l i z gerçek a n l a m d a b a ş arılı o lmuş demektir. B u n u n l a birlikte, e y e r d e ğ i ş k e n l e r i n tümü k e n d i a r a l a r ı n d a k o r e l a s y o n s u z ise, Ana ü i l e ş e n l i F a k tör A n a l i z i y ö n t e m i n i u y g u l a m a n ı n pr a t i k ya r a r ı o l m a z (14).
Burada, ö n c e l i k l e çok b o y u t l u veri a n a l i z l e r i n d e k u l l a n ı l a n bazı temel tanım ve k a v r a m l a r ı vereceğiz.
1.1.1. VERİ T A B L O L A R I 6 -V e r i a n a l i z i n d e g e n e l l i k l e (nxp) tipinde
/■
X = ı ,1 C2 ıx
\
n
(1.1)b i r X t a b l o s u göz ö n ü n e alınır. Bu tablo, p d e ğ i ş k e n i n i n her b iri ü z e r i n d e y a p ı l m ı ş n tane ö l ç ü m ü n ü n son u ç l a r ı olarak y o rumlan a b i l i r . B u n a göre, tablo
X = (x) x? x p )
vey a
x = İ2SX < * 2 ' * J
olarak yazılabilir. B i r i n c i h a l d e Rn uzayına ait p d e ğ i ş k e nin, ikinci h a l d e de R P uzayına ait n bireyin, o l u ş t u r d u ğ u iki nokta b u l u t u e lde edilir.
1.1.2. ÇOK B O Y U T L U V E K T Ö R L E R İ N M O M E N T L E R İ B e k l e n e n D e ğ e r : H e r h a n g i bir şans v e k t ö r ü n ü n b e k lenen d e ğ e r i E (x^) ile g ö s t e r i l i r ve E ( x i ) = [ E (x ^ ) , E(x?) , ... E (xP ) J (1.2) o larak tanımlanır. B e n z e r şekilde, b e k l e n e n d e ğ e r l e r d e n o l u ş a n mat r i s t a n ı mlanabil i r . •j K o v a r y a n s : x^ v e k t ö r ü n ü n ve x^ gibi iki b i l e ş e n i n i n k o v a r y a n s ı Kov(x|, x^) = E{ [x| - E ( x ^ ) J [ x ^ - E (x^))} = E (x ■? x*) - |E(x]> J l E (x k: ) j (1.3) ı) ■ , Jk
formülü ile verilir.
Eğe r j = k ise (1.3) formülü x^ e l e m a n ı n ı n v a r y a n s ı n ı ifade eder. Yani,
V a r ( x ^ ) = E { | x | - E ( x | ) J 2 ) olur.
- 8
Genel olarak, p b i l e ş e n i i Xp şans v e k t ö r ü n ü n varyans k o v a r y a n s (veya varyanslar) m a t r i s i t a n ı m olarak,
E = E{ -
E <Xi}JlXi
-E
J
’ > form ü l ü v e y a açık olarak,0 12 ... ü lp ° 22 °2 p £ =- • • . I (1.4) o . a n ... o pl p2 pp m a t r i s i ile verilir.
Ayrıca, a^ e R (i = .1, 2, p) (Burada R Reel s a y ı l a r kümesidir) ve a' x. = a x + a 2 x ?. + + a p x^ o l m a k üzere P P j Var (a' x,) = y >• a. a . o . . = a ' l a
" - 1
i-1 i=l 1 3 13
-şe k l i n d e tanımlanır. B e n z e r olarak,
bj fe R (i = 1, p) ve b ‘ Xj = b. \ } + b., x? + ... ı b x? — — i 1 i 2 1 p ı için P P Kov(a' X; , b' x.) = E E a. b o . . = a'E b i=l i=l 1 J 13 yaz ı l a b i l i r .
A ve B s ı r a s ı y l a reel e l e manlı (r x p) ve (s x p) m a t r i s l e r o l m a k ü z e r e y u k a r ı d a k i kavramlar? Y = alınarak AX , Z = BX (1.5) Kov <Y, Y) = A >: A ’ Kov (Z, Z) = U >; U ' (1.6) Kov (Y, Z) = A l B* ş eklinde y a z ı l m a k suretiyle, m a t r i s n o t a s y o n u y l a g ö s t e r i l e b i l irler . İ k K o r e l a s y o n : v e k t ö r ü n ü n x^ ve x^ b i l e ş e n l e r i a r a sındaki k o r e l a s y o n katsayısı, ile verilir. Ko v (x^, x^) \ /V a r ( x 1 ) V a r ( x k ) (1.7) *1 k E ğ e r ve x^ b a ğ ı m s ı z iseler, K o v a r y a n s ve d o l a y ı sıyla k o r e l a s y o n k a t s a y ı s ı sıfırdır. Genel o l a r a k x^ v e k t ö r ü n ü n k o r e l a s y o n matr i s i 1 P 12 ... Pı 1 c - P i2 ’lp Jp (1 .8 ) ^Plp P 2 p ...
ile tanımlanır. Böylece, v a r y a n s - k o v a r y a n s m a t r i s i ile k o r e lasyon m a t r i s i n i b i r b i r i n e bağlayan,
10 C = D<— ) Z D(— ) o . o . 1 1 Z = D(0;L) C D (ai ) (1.9) (Burada D (cr ) matrisi, s t a n d a r t s a p m a l a r d a n o l u ş a n k ö ş e g e n m atristir) b a ğ ı n t ı l a r ı y a z ı l abilir. I. i.3. N O R M M, s i m e t r i k p o z i t i f d e f i n i t bir m a t r i s o l m a k üzere,
rP u z a y ı n a ait h e r h a n g i x^ ve xj e l e m a n l a r ı n ı n M'ye göre s k a l e r çarpımı t a n ı m olarak, ü j > M = - i M -j = M(-i' -j* (1.10) ş e k l i n d e verilir. R^ u z a y ı n d a k i h e r h a n g i bir x^ e l e m a n ı n ı n N o r m u ise || Xyll i-*-e g ö s t e r i l i r ve II J t j r = X[ M x i (1.11) o l a r a k tanımlanır. B ö y l e c e Rp vey a R n u z a y ı n d a s i m e t r i k p o z i t i f d e f i n i t b i r M m a t r i s i v e r i l m e k l e , bu u zaya E u k l i d y e n b i r yapı v e r i l m i ş olur. B u r a d a M 1ye, uz a y ı n m e t r i ğ i denir.
Uzaya ait iki e l e m a n a rasındaki açının kosiniisü,
•üi' ü i m
Cos Ü = ---J-- --- (1.12)
II *i Hm HüjiİM
ş e k l i n d e tanımlanır. Ayrıca, n o k t a b u l u t u n u n e l e m a n l a r ı a r a s ı n d a k i u z a k l ı k M m e t r i ğ i n e göre.
d2 (xA , X j ) (i£i - X j ) ' M ( X i - X j )
(1.13) formülü ile verilir.
I B i r i m ma t r i s olmak üzere M = I için,
2
(1.14)
d ' > = " i<j) ' ^ ~ x j >
yazılabilir.
1.1.4. A N A B K S B N L E K
Veri a n a l i z i n d e amaç, v e r i tablos o n d a n eld e edilen nokta b u l u t u n u dah a az boyutlu, ö z e l l i k l e iki boyutlu, u z a y da göstermektir. B u n u g e r ç e k l e ş t i r e b i l m e k için, ele alınan nokta bulutunun, söz k o n u s u alt uzay üzerine i z d üşümü a l ı nır. Öyleki, i z d ü ş ü m s o n u c u n d a n o k t a l a r a r a s ı n d a k i u z a k l ı k lar en az d ü z e y d e d e ğ i şmelidir. O halde, öyl e bir i ndirgenmiş alt uzay (izdüşüm düzlemi) b u l m a l ı y ı z ki, n o k t a l a r arasındaki, uzaklıkların, i z d ü ş ü m s o n u c u n d a k i d e ğ i ş i m i m i n i m u m olsun. Başka bir ifadeyle, n o k t a l a r ı n i n d i r genmiş alt uzay ü z e r i n deki dik iz d ü ş ü m l e r i a r a s ı n d a k i u z a k l ı k l a r ı n k a r e l e r i t o p lamı m a k s i m u m olmalıdır.
Ana d ü z l e m adını v e r e c e ğ i m i z i z d ü ş ü m d ü z l e m i n i b e l i r lemek için, bu d ü z l e m e ait A ; ve A , gibi Lk L d o ğ r u n u n b u l u n ma:: ı yeı er I i ol a o a k t ı r (!,‘ok il: 1.1).
Aı ve A2 d o ğ r u l a r ı dik iseler, b i r e y l e r b u l u t u n a ait h e r hangi xo ve Xj elem a n ı için,
d 2 (x î , x t ) = d ? ( a . , u •) + d 2 (h., B-)
* *
i z d ü ş ü m l e r i ve a^, oij ile g^, g^ 1er de s ı r a s ı y l a x^ ve x^. nin A ve A 2 e k s e n l e r i ü z e r i n d e k i i z d ü ş ü m l e r i d i r l e r . A ç ı k t ı r ki, n o k t a l a r a r a s ı n d a k i u z a k l ı k l a r ı n kareleri, a ' l a r a r a s ı n d a k i u z a k l ı k l a r ı n k a r e l e r i ile g ' lar a r a s ı n d a k i u z a k l ı k l a r ı n k a r e l e r i to p l a m ı n a eşittir. d 2 ( oı^, a j ) u z a k l ı k l a r ı n ı m a k s i m u m y a p a n A x d o ğ r u s u ile, d o ğ r u s u n a dik o l u p d ? (g^, g^) u z a k l ı k l a r ı n ı m a k s i m u m y a p a n A 2 d o ğ r u s u b u lunarak, söz k o n u s u i z d ü ş ü m d ü z l e m i elde edilir. Ancak, n o k t a b u l u t u n u ü z e r i n e i z d ü ş ü r e c e ğ i m i z alt u z a y ı n b o y u t u k ise, A^^ ve A-, d o ğ r u l a r ı n d a n başka, A-,, A ^ ,
...,Ak gibi (k-2) t ane d aha o r t o g o n a l e k s e n i n b e n z e r y o l la b u l u n m a s ı g e r e k m e k t e d i r . A r a ş t ı r ı l a c a k o l a n bu d o ğ r u l a r a aııa e k s e n l e r adı verilir.
1.1.5. N O K T A B U L U T U N U N Y E R İ
Analizde, n o k t a b u l u t u n u n o r i j i n e göre d u r u m u n d a n çok, u z a y d a k i ş e k l i y l e i l g i l e n d i ğ i m i z d e n , ana b i l e ş e n l e r i n o r i j i n den g e ç m e s i gerekmez. Ancak, pr a t i k b i r t a k ı m y a r a r l a r s a ğ l a m a s ı b a k ı m ından, söz k o n u s u b i l e ş e n l e r i n a ğ ı r l ı k m e r k e z i n d e n geçm e s i sağlanır.
B u l u t u n a ğ ı r l ı k m e r k e z i n e k a r ş ı l ı k g elen ve k t ö r ^ ile göst e r i l e c e k olursa, b i r e y l e r ve d e ğ i ş k e n l e r için
(xx , ^2' II)
- - (x , x , 1 — 2 — p,x l )
yazılabilir. B u r a d a ve x' 1er sırasıyla, b irey ve d e ğ i ş kenlere ait o r t a l a m a l a r d ı r .
B ö y l e c e her bir nokta b u l u t u için
= x i “ 3 b (Bireyler için)
(1.1 6) y J - X"* “ 3(3 (Değişkenler için)
dö n ü ş ü m l e r i yapılır. (1.16) formülleri y a r d ı m ı y l a X t a b l o sundan Y o r t a l a n m ı ş tablosuna geçilmiş olur.
B i r t a k ı m pratik k o l a y l ı k l a r g e t i r m e s i bakımından, b a ş langıç n o k t a s ı n ı a ğ ı r l ı k m e r k e z i n e taşıyarak, y ani 2 = Ç) k o nularak , Y = X (1.17) elde edilir. 1.1.6. V A R Y A N S L A R MATR İ S İ K ö ş e g e n e l e m a n l a r ı a ğ ı r l ı k l a r d a n o l u ş a n (n x n) köşe- gon mat r i s
,
-
(
V
\ ° Prolmak üzere, V a r y a n s l a r matrisi,
V = X ' D X (1.18)
P
R P u z a y ı n d a , x 2 , x n b i r e y l e r i n i n a ğ ı r l ı k ları için ana b i l e ş e n l i faktör a n a l i z i n d e
p = p_ = ... = p = 1 (1.19) *ı ^2 n alınır. Hu d u r u m d a I) ; ? 1 o l a c a ğ ı n d a n v a r y a n s l a r m a t r i s i V - X 'X (1.20) ol a r a k elde edilir. Y u k a r ı d a k i V m a t r i s i n i bir k u v a d r a t i k form o l a r a k d ü şünebiliriz. R*' u z a y ı n ı n ve ej b i r i m v e k t ö r l e r i g ö z ö n ü n e a l ı n ı r s a £ j ) = v £j = £] x 'x £j n (1.21) Y. x^ xj = Var (x*, x ^ ) k= 1 k k o l d u ğ u görülür, bu da g ö s t e r m e k t e d i r ki, V m a t r i s i n i n e l e m a n ları, d e ğ i ş k e n l e r a r a s ı n d a k i v a r y a n s - k o v a r y a n s o l a r a k o r t a y a ç ı k m a k t a d ı r . 1.1.7. METRİK Ana b i l e ş e n l i faktör a n a l i z i n d e k o l a y l ı k s a ğ l a m a s ı y ö n ü n d e n metrik o l a r a k 14 -ş e k l i n d e k i k ö -ş e g e n m a t r i s l e r kullanılır. B ö y l e bir m e t r i k verilince, d e ğ i ş k e n d ö n ü ş ü m l e r i y ardımıyla, adi E u c l i d m e t riğine kola y c a geçilebilir. B u n u n için her bir X 1 d e ğ i ş k e nine karşılık,
i'1 = v/a"^ X 1 (1.22)
d ö n ü ş ü m ü n ü y a p m a k y eterlidir. Bu sonucun, a ş a ğ ı d a k i (Teorem 1.1) ile, d aha yenel ha l l e r .için de g e ç e r l i olac a ğ ı g ö s t e r i lebilir.
T e o r e m 1 . 1 : C h o l e s k y D o o l i t t l e Teoremi.
p b o y u t l u R*’ uzayında, M E u k l i d y e n bir m e t r i k olmak üzere, d aima
M = T 1T (1.23)
o lacak şeki l d e (p x p) b o y u t l u T matr i s i vardır.
İ s p a t : p b o y u t l u RP uzayı, R (Reel sayılar) cismi ü z e rinde t a n ı m l a n m ı ş ve RP nin vektörleri, bu u z a y d a k i Ka- nonik B a z 'a göre ifade e d i l m i ş olsun. Ay r ı c a RP de (p x p) M m e t r i ğ i ile (p x p) I K a n o n i k E u c l i d m e t r i ğ i ta n ı m l a n m ı ş olsun. Bu h a l d e M'ye göre skaler çarpım,
B ütün V , V-, t M için <V , V-,>„ = M( V , V J = V ’ M V-,
— 1- — Z * — 1 — Z M — ı — z 1 z
ş e k linde tanımlanır. B u r a d a ve V2 s ı r a s ı y l a ve Vj vek törlerirıe k a r ş ı l ı k g elen m a t r islerdir.
M m a t r i s i için a ş a ğ ı d a k i ö z e l l i k l e r yazılabilir. i) M' = M (Simetrik) i i ) V M V -- 0 (Poz it İP) i i i ) V' M V = 0 V '0 (Defini t) K a n o n i k E u c l i d m e t r i ğ i n e göre sk a l e r ç a r p ı m ise, <V, , V 0> T = I (V , V 0 ) = V' I V 0 = V' V-. — 1 — 2 1 p — 1 — 1 p 2 1 2 p ^ r o larak tanımlanır.
D iğer t a r a f t a n R P 'nin kano n i k baz v e k t ö r l e r i n i M ' n i n ö z v e k t ö r l e r i n e k arşı geti r e n o r t o g o n a l o p e r a t ö r F olsun, böy- lece F ' = F _i -yazılır. Ve M ' n i n ö z d e ğ e r l e r i n d e n o l u ş a n k ö ş e g e n m a t r i s ise 0 ı
.
D. 16 -A A P ş eklindedir. M po z i t i f d e f i n i t o l d u ğ u n d a n t ü m ö z d e ğ e r l e r i pozitiftir. M m a t r i s i n i ö z d e ğ e r l e r m a t r i s i n e b a ğ l a y a n ifade M = F' D F (1.24) A şeklindedir. Böylece, Y 2 ) = V ı M V 2 = V i F ' D x F V 2 V 2 ) = (F V x ) ’ Dx (FV2 ) = D x (FVı , F V 2 ) (1.25)elde edilir. (1.25) e ş i t l i ğ i n d e n şu s o n u ç l a r ç ı k a r t ı l a b i l i r ;
i) İler V €. RF için FV vektörü, M ' n i n ö z v e k t ö r l e r i n e göre V nin bir ifadesidir,
ii) D (F V ) = AF V = M ( F V) dir,
iii) (ii) s o n u c u F ' ile so l d a n ç a r p ı l a r a k
F -1 D F V = AV (F' = F- 1 ) A
Şu halde; H > 1 V V, = V ‘ M V 0 = V 1 — 2 M ı 2 ı F' Da F V 2 yazılabilir.
DJ\ ' M nin özdeğerloriniıı kare k ö k l e r i n d e n ol u ş a n
köşegen matris olsun. Bu halde
ÜA = Ü /Â o l a c a ğ ı n d a n M = P ' D ’fx l P Df x l? y a z ı l a b i l i r . r , k a n o n i k m e t r i ğ e göre o r t o g o n a l bi r o p e r a t ö r olmak ü z e r e , T = r
şekli n d e bir m a t r i s tanımlayalım. Bu taktirde,
T ' T = p ' “ te r yazılabilir. T* r = I konularak, T ' T = F ' D 'fx Dr x F elde edilir. B ö y l e c e , T ' T = F' D F = M
bulun.ır.ık teorem i.spa 1 1 .mıııı ş olu r
A y r ı c a bu teoremden <- i ' ü j >M = *i M = - i T'T x. -3 = (T x i ) ' (T X j ) = (T x ! ) I (T x .) i P -3 = <T x ., T x . > T — ı -3 I P
so n u c u da yazı l a b i l i r . Şu halde 1^ metr i ğ i ile i ş l e m ya p m a k i s t e n d i ğ i n d e X t a b l o s u y e r i n e
Y = X ' T (1.26)
almak yeterlidir.
1.1.8. B İ R E Y L E R BU L U T U
x x , x 2 - ler veri t a b l o s u n d a n elde edi l e n d e ğ i ş k e n l e r i g ö s t e r m e k üzere ilk k o o r d i n a t sist e m i v e r i l m i ş olsun. x^ b i r e y i n i n b i l e ş e n l e r i açık olarak, b u e k s e n s i s t e m i ü z e r i n d e k i i z d ü ş ü m l e r d i r (Şekil: 1.2).
18
-Şekil: 1.2) B i r e y l e r b u l u t u n u n g ö s t e r i l i m i
Ş i m d i b i r e y l e r b u l u t u n a ait (i = 1, ... n) e l e manların, b a ş l a n g ı ç t a n g eçen h e r h a n g i bir A p d o ğ r u s u ü z e r i n d eki i z d ü ş ü m l e r i n i bulalım. B u n u n için, U^, A f ek s e n i ü z e rinde M-Noıımı I olan b i r i m v e k t ö r seçilirse, bu taktirde h e r h a n g i bir b i r e y i n i n 4\ d o ğ r u s u ü z e r i n d e k i i z d ü ş ü m ü n ü n cebir s e l ö l ç ü m ü ,
''i , £ ‘ — i ?M " üj M - (1-27)
şeklindedir. B ö y l e c e t ü m b i r e y l e r i n A^ ü z e r i n d e k i iz d ü ş ü m l e r i için
» l f * = < V — İ> M = ^ M *1
» 2 ,1 = < V — 2> M = ^ M — 2
(1.28)
» n ,t = < U t ' — n " M = ^ M — n
yazılabilir. M s i m e t r i k o l d u ğ u n d a n (i. 27) ifadesi
n , « ■ ' ™ d ' ü i (1.29) ve = M U - -t (1.30) k o n u l a r a k , Y . = (C*) ' x. = £ C* (i = 1 , ... n) 9 ^ j = l (1.31) şeklinde gösteril e b i l i r . B ö y l e c e T • b i l e ş e n l e r i n d e n ve k t ö r Yy o l m a k üzere, ol u ş a n - l f l,ı' *2 , l' ' 1 n , v. -1
yazılabilir. X veri t a b l o s u n u g ö s t e r m e k üzere,
Y . = X C l -S L - (1.32) ol d u ğ u açıktır. M = 1 alınması hali n d e P = U -ı (1.33) olacağından, t = X u £ “ I (1.34) elde edilir.
B ö y l e c e 4^ 1er, ilk p d e ğ i ş k e n i n fakt ö r ü y a r d ı m ı y la li n e e r k o n b i n e z o n u ol a r a k ifade edilmiş olur.
1
,
2
.
ANA B İ L E Ş E N L E R İ N Ü Z V E K T O R L E R Y A R D I M I Y L A EL D E E D İ L M E S İ1.2.1. A N A B İ L E Ş E N L E R İ N HESABI
B u n d a n ö n c e k i bölümde, (n x p) X tablosundan, b i r i m v e k t ö r ü o l a n eks e n i ü z e r i n d e p b o y u t l u bi r v e k t ö r ün e geçiş form ü l ü ç ı k a r t ı l m ı ş t ı (1.34). Bu b ö l ü m d e ana b i l e ş e n l e r ile v a r y a n s - k o v a r y a n s m a t r i s i n i n ö z v e k t ö r l e r i a r a s ı n d a k i ilişki İ n c e l e n m e k t e d i r . B u n u n için,
boLJi o 1 duk hırı lul.m , oı i j ine ohııı O N . u z a k l ı k l a r ı vc d o l a y ı s ı y l a bu u z a k l ı k l a r ı n k a r e l e r i toplamı sabittir. Yani,
Şekil: 1..3) H e r h a n g i b i r b i r e y e ait biri n c i ana bileşen.
(Şekil: 1 . 3 ) te g ö r ü l d ü ğ ü gibi, h e r h a n g i bir bireyi no ait nokta N o lmak üzere, bu n o k t a l a r ı n uzaydaki y e r l e r i
2
E ONT = S a b i t i = l 1
(1.35)
n 0 n 0 n ^
Z Ö N 7 = Z OH. + Z nTÎTT (1.36)
i = l 1 i = 1 1 i = 1 1 1
olur.
A macımız, b u l u t a ait n o k t a l a r ı n izdüşümünde, u z a k l ı k ları en az d e ğ i ş t i r e n bir alt uzay bulmaktır. B a ş k a bi r i f a deyle, n okta b u l u t u n a en y a k ı n alt uzayı (özellikle düzlemi) b e l i r l e m e k istiyoruz. B u n u n için b u l u t a ait no k t a l a r ı ile, bu n o k t a l a r ı n söz k o n u s u alt u z a y a ait A-^ d o ğ r u s u ü z e r i n d e k i Ib i z d ü ş ü m l e r i a r a s ı n d a k i N u z a k l ı k l a r ı n ı n ve b ö y l e c e bu u z a k l ı k l a r ı n k a r e l e r i t o p l a m ı n ı n m i n i m u m y a p ı l m a s ı gerekir. Diğer t a r a f t a n (1.35) ve (1.36) e ş i t l i k l e r i göz ö n ü n e a l ı nırsa, u z a k l ı k l a r ı n ı n k a r e l e r i t oplamının m i n i m u m y a pılması, 01K u z a k l ı k l a r ı n ı n k a r e l e r i t o p l a m ı n ı n m a k s i m u m y a p ı l m a s ı demektir. Yani, n ---2 n 2 Min ( T.M.H. ) < ^ > Max ( X OH T ) (U x ) i = l 1 (U x ) i = 1 1
n — 2
dır. Şu h a l d e problem, i OII . toplamını m a k s i m u m y apacak i-l 1
ş e k i l d e bir alt uza y ı n b e l i r l e n m e s i p r o b l e m i n e i ndirgenmiş olur. Böylece, alt uzaya ai t gibi bir d o ğ r u n u n b u l u n m a s ı için, n n X OII. = T. T? , = T' T i=l 1 i=l 1,1 1 1 - (X IJ! ) 1 1 X ^ 1 = Uj X* X Uj (1.37) y a z ı l a ı a k , U x = i (1.38) koş u l u a l t ı n d a X' X i f a d e s i n i m a k s i m u m y a p a c a k şekilde U v e k t ö r ü n ü b e l i r l e y e c e ğ i z . B ö y l e c e n okta b u l u t u n u en iyi g ö s t e r e n alt uzaya ait A^ d o ğ r u s u n u n a r a ş t ı r ı l m a s ı problemi,
22
-(1.38) k o ş u l u a l t ı n d a LD X' X U ifa d e s i n i m a k s i m u m y a p a n U v e k t ö r ü n ü n a r a ş t ı r ı l m a s ı p r o b l e m i n e d ö n ü ş m ü ş oldu. B u n u n için L a g r a n g e çarp a n ı o l m a k üzere
(V X.' X Ü 1 - Aj ( U 1 U - 1) (1.39) f o n k s i y o n u n u m a k s i m u m y a p a n U v e k t ö r ü n ü n b e l i rlenmesi. E x t r e m u m için g e r e k l i ola n = 0 (1.40) — i. k o ş u l u g ö z ö n ü n e alınarak, (U1 X' X U ) = 2 X' X U 8 U — ı — ı -ı
T T T l A ı < ^ uA - D İ = 2
a aux
— ı konulursa, X' X u j = X 1 U (1.41)e lde edilir. (1.41) e ş i t l i ğ i n i n o r t a y a k o y d u ğ u sonuç şudur;
N o k t a b u l u t u n u en iyi g ö s t e r e n alt u z a y a ait A ^ d o ğ r u su, X' X m a t r i s i n i n A^ ö z d e ğ e r i n e k a r ş ı l ı k g e l e n ö z v e k t ö r ü y a r d ı m ı y l a b e l i r l e n m e k t e d i r . Diğer taraftan U ’ X ' X U - U ' IX' X U ) ; U ' A . U . \ . (1.42) — ı — ı — ı — ı — ı 1 — i L o lduğu n d a n , g e r ç e k t e m a k s i m u m y a p ı l m a s ı g e r e k e n ifade öz- d e ğ e r i d i r . Ş i m d i (1.34) e ş i t l i ğ i ile b e l i r l e n e n b i l e ş e n i n i n v a r y a n s ı n ı h e s a playalım.