• Sonuç bulunamadı

Türkiye akarsuları su kalitesi parametrelerinin çok değişkenli istatistiksel analiz yöntemleri ile incelenmesi

N/A
N/A
Protected

Academic year: 2021

Share "Türkiye akarsuları su kalitesi parametrelerinin çok değişkenli istatistiksel analiz yöntemleri ile incelenmesi"

Copied!
106
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

T.C.

SELÇUK ÜN VERS TES

FEN B MLER ENST TÜSÜ

TÜRK YE AKARSULARI SU KAL TES

PARAMETRELER N ÇOK DE KENL

STAT ST KSEL ANAL Z YÖNTEMLER LE

NCELENMES

Volkan YILMAZ

YÜKSEK L SANS TEZ

AAT MÜHEND SL ANAB M DALI

(2)

T.C.

SELÇUK ÜN VERS TES

FEN B MLER ENST TÜSÜ

TÜRK YE AKARSULARI SU KAL TES

PARAMETRELER N ÇOK DE KENL

STAT ST KSEL ANAL Z YÖNTEMLER LE

NCELENMES

Volkan YILMAZ

YÜKSEK L SANS TEZ

AAT MÜHEND SL ANAB M DALI

Bu tez 19.08.2009 tarihinde a daki jüri taraf ndan oybirli i / oyçoklu u ile kabul edilmi tir

(3)

ÖZET Yüksek Lisans Tezi

TÜRK YE AKARSULARI SU KAL TES

PARAMETRELER N ÇOK DE KENL

STAT ST KSEL ANAL Z YÖNTEMLER LE

NCELENMES Volkan YILMAZ

Selçuk Üniversitesi Fen Bilimleri Enstitüsü aat Mühendisli i Anabilim Dal

Dan man: Yrd. Doç. Dr. Meral BÜYÜKYILDIZ 2009, 94 Sayfa

Jüri: Yrd. Doç. Dr. Meral BÜYÜKYILDIZ Doç. Dr. M. Faik SEV ML

Yrd. Doç. Dr. Mustafa ONÜÇYILDIZ

Bu çal mada; Türkiye genelinde 19 su toplama havzas ndan al nan, E E daresi Genel Müdürlü ü taraf ndan i letilen 67 adet Ak m gözlem stasyonuna ait 1992– 2008 y llar aras nda ölçülmü Ak m ve 11 adet su kalitesi parametresi (S cakl k, pH, Elektriksel letkenlik, Na+, K+, (Ca+Mg)2+, CO32-, Cl-, SO42-, SAR ve Bor

konsantrasyonu) olmak üzere toplam 12 adet parametrenin uzun y ll k ortalama de erlerine çok de kenli istatistiksel analiz yöntemlerinden; Ana Bile enler Analizi, Faktör Analizi ve Kümeleme Analizi uygulanm r. Öncelikle verilerin uygunlu u Ana Bile enler Analizi için Bartlett küresellik testi ile, Faktör Analizi için uygunlu u ise Kaiser-Meyer-Olkin ölçütü ile test edilmi ve verilerin uygun oldu u sonucuna ula lm r. Ana Bile enler Analizi ile toplam varyans n yakla k %80’ i 3 ana bile enle aç klanm r. 1. ana bile enin toplam varyans n %50,25’ini, 2. ana bile en %19,04’ünü ve 3. ana bile en %10,52’sini aç klad görülmü tür. Faktör Analizi ile faktörlerin ifade ettikleri karakterler belirlenmeye çal lm ve istasyonlara ait skor de erleri hesaplanm r. En son Kümeleme Analizi uygulamas nda Ortalama Ba lant Tekni i ve Pearson Uzakl k Ölçütü kullan larak 3 küme elde edilmi tir. Elde edilen kümelerin her birinin ayr bir faktörün hakim oldu u istasyonlardan olu tu u gözlemlenmi tir.

Anahtar Kelimeler: Su Kalitesi, Çok De kenli statistiksel Analiz, Ana Bile enler Analizi, Faktör Analizi, Kümeleme Analizi.

(4)

ABSTRACT Master Thesis

THE INVESTIGATION OF WATER QUALITY PARAMETERS OF TURKEY'S RIVERS WITH

MULTIVARIATE STATISTICAL ANAYLYSIS METHODS

Volkan YILMAZ Selcuk University

Graduate School of Natural and Applied Sciences Department of Civil Engineering

Supervisor: Assist. Prof. Dr. Meral BÜYÜKYILDIZ 2009, 94 pages

Jury: Assist. Prof. Dr. Meral BÜYÜKYILDIZ

Assoc. Prof. Dr. M. Faik SEV ML Assist. Prof. Dr. Mustafa ONÜÇYILDIZ

In this study, Multivariate statistical analysis methods, Principal component analysis, Factor analysis and Cluster analysis were used to data which consist of the flow and 11 water quality parameters (Flow, Temperature, pH, Electrical Conductivity, Na+, K+, (Ca+Mg)2+, CO32-, Cl-, SO42-, SAR and Boron concentration), form 67 stream

flow gauging stations (AGI) which are operated by EIE, in 19 basin form all over Turkey. Data set consist of 1992-2008 time period’s long term average values. At first, the eligibility of the data was tested with Bartlett sphericity test for the Principal Component analysis and Kaiser-Meyer-Olkin criteria for the Factor Analysis. The results of this tests showed that the data is appropriate for the PCA and FA. From the Principal Component Analysis results, first PC explain the %50,25 of total variances, second PC explain the %19,04 and the third PC is explain the %10,25 of total variances. With the Factor Analysis, the characteristics of the factors were tried to explain and found the factor scores of stations. Finally, by the method of Average Linkage and Pearson Distance Methods 3 clusters occurred at the end of the cluster analysis. It has been understood that each cluster consist of stations which has dominated a different factor.

Keywords: Water Quality, Multivariate Statistical Analysis, Principal Component

(5)

TE EKKÜR

Öncelikle yard m, bilgi ve tecrübelerini esirgemeyen, hocam ve dan man m Say n Yrd. Doç. Dr. Meral BÜYÜKYILDIZ’ a, her türlü maddi manevi destekleri ve ilgileri için aileme ve arkada lar ma ve özellikle yard mseverlikleri için, Ziraat Yüksek Mühendisi Ekrem YALÇIN beyin ahs nda bütün E E personeline te ekkürü bir borç bilirim.

(6)

ÖZET ABSTRACT TE EKKÜR

NDEK LER

NDEK LER i

KISALTMALAR ve SEMBOLLER iii

EK L L STES v

TABLO L STES vii

1. G 1

2. L TERATÜR ÖZET 3

3. MATERYAL ve METOT 6

3.1. Materyal 6

3.1.1. Çal mada kullan lan istasyonlar 8

3.1.2. Çal mada kullan lan parametreler 9

3.2. Metot 10

3.2.1. Ana bile enler analizi (ABA) 10

3.2.1.1. Ana bile enler analizinin modeli 12

3.2.1.2. Ana bile en say n belirlenmesi 16

3.2.2. Faktör Analizi 17

3.2.2.1. Faktör analizinin modeli 20

3.2.2.2. Faktör say n belirlenmesi 24

3.2.2.3. Faktör katsay lar ve faktör skorlar 24

3.2.2.4. Faktör döndürülmesi 26

3.2.3. Kümeleme analizi 28

3.2.3.1. Benzerlik ölçütleri 29

3.2.3.2. Kümeleme metodunun seçimi 31

3.2.3.3. A amal (hierarchical) kümeleme yöntemleri 31 3.2.3.4. A amal olmayan (nonhierarchical) kümeleme yöntemleri 37 3.2.3.5. Kümeleme analizinin sonuçland lmas ve kontrolü 38

4. ARA TIRMA SONUÇLARI 41

4.1. Ana Bile enler Analizi Sonuçlar 41

(7)

4.2.1. Faktörlerin grafiksel gösterimi 47

4.2.2. Faktörlerin döndürülmesi 50

4.3. Kümeleme Analizi Sonuçlar 62

5. SONUÇLAR ve ÖNER LER 67

6. KAYNAKLAR 72 EKLER 75 EK-A 76 EK-B 78 EK-C 81 EK-D 84 EK-E 90

(8)

KISALTMALAR ve SEMBOLLER

ABA : Ana Bile enler Analizi

AG : Ak m gözlem stasyonu

Aj : Özvektörler

bij : Faktör skor katsay lar

Ca2+ : Kalsiyum

CCC : Kübik kümeleme kriteri, (Cubic clustering criterion)

CO2 : Karbondioksit

CO3 : Karbonat

Cl- : Klorür

DS : Devlet Su leri

EC : Elektriksel letkenlik

E : Elektrik leri Etüt daresi

fi : Faktör skorlar

HCO3-: Bikarbonat

I : Birim matris

K+ : Potasyum

k : Gözlenen ortak faktörler

KMO : Kaiser – Meyer – Olkin

km2 : Kilometrekare

L : Faktör yükleri matrisi

(9)

m : Metre m3/s : Metreküp/saniye Mg2+ : Magnezyum mg/L : Miligram/litre n : Birey say Na+ : Sodyum O2 : Oksijen p : De ken say pH : Power of hydrogen

ppm : Part per million (milyonda bir k m) q : Ana bile en say

R : Korelasyon matrisi

S : Kovaryans matrisi

SAR : Sodyum absorbsiyon oran

s : Saniye

SO42- : Sülfat

SPSS : Statistical Package for the Social Sciences

Xnxp : Ham veri matrisi

xnq : Bireyler aras nda gözlenen benzerlik ölçütleri

Znxp : Standartla lm veri matrisi

j : Özde erler

i : Hata terimi

(10)

EK L L STES Sayfa No

ekil 3.1 Seçilen istasyonlar n Türkiye haritas üzerinde konumlar 8

ekil 3.2 Yamaç e imi grafi i (scree test) 17

ekil 3.3 Faktörlerin döndürülmesi 27

ekil 3.4 Tek ba lant kümeleme tekni i 33

ekil 3.5 Tam ba lant kümeleme tekni i 34

ekil 3.6 Ortalama ba lant kümeleme tekni i 35

ekil 3.7 Örnek dendogram 40

ekil 4.1 Elde edilen özde erlere ait yamaç e imi grafi i 45

ekil 4.2 Faktör 1 ve Faktör 2’nin kar kl gösterimi (döndürülmemi

yükler) 48

ekil 4.3 Faktör 1 ve Faktör 3’ün kar kl gösterimi (döndürülmemi

yükler) 48

ekil 4.4 Faktör 2 ve Faktör 3’ün kar kl gösterimi (döndürülmemi

yükler) 49

ekil 4.5 Döndürülmemi yüklerin farkl yönlerden 3 boyutlu gösterimi 49 ekil 4.6 Equamax döndürme yöntemi sonucunda yüklerin 3 faktöre

göre konumlar 52

ekil 4.7 Döndürülmü faktör 1 ve faktör 2’ nin kar kl gösterimi

(Equamax yöntemiyle) 53

ekil 4.8 1. faktör için istasyonlar n s ra numaralar ile gösterimi 57 ekil 4.9 2. faktör için istasyonlar n s ra numaralar ile gösterimi 59 ekil 4.10 3. faktör için istasyonlar n s ra numaralar ile gösterimi 61

ekil 4.11 Kümeleme analiz sonucu elde edilen dendogram 64

ekil 4.12 stasyonlar n ait olduklar kümelere göre Türkiye üzerindeki

konumlar 65

ekil E.1 Ortalama ba lant (between group linkage) yöntemi ve

Pearson uzakl k ölçütü ile elde edilen dendogram 90 ekil E.2 Ortalama ba lant (within group linkage) yöntemi ve Cosine

(11)

ekil E.3 En uzak kom uluk yöntemi ve Cosine uzakl k

ölçütü ile elde edilen dendogram 92

ekil E.4 En uzak kom uluk yöntemi ve Pearson uzakl k ölçütü ile elde

edilen dendogram 93

ekil E.5 Ward yöntemi ve Öklit kare uzakl k ölçütü ile

(12)

TABLO L STES Sayfa No

Tablo 3.1 Çal mada kullan lan istasyonlar 7

Tablo 3.2 KMO ölçüsü ve önerilen de er 20

Tablo 4.1 Ana bile enler analizi için Pearson korelasyon matrisi 42

Tablo 4.2 Bartlett küresellik testi ve KMO ölçütü sonuçlar 42

Tablo 4.3 Özde erler ve toplam varyans aç klama paylar 44

Tablo 4.4 lk 3 özde ere ait özvektörler 44

Tablo 4.5 Döndürülmemi faktör yap matrisi 46

Tablo 4.6 Dönmemi ve döndürülmü faktörlere ait de erler 51

Tablo 4.7 Faktör 1,2 ve 3’de yer alan tan mlay parametreler 52

Tablo 4.8 Faktör de erleri katsay lar matrisi 54

Tablo 4.9 stasyonlar n 1. faktör için skor de erleri 56

Tablo 4.10 stasyonlar n 2. faktör için skor de erleri 58

Tablo 4.11 stasyonlar n 3. faktör için skor de erleri 60

Tablo 4.12 Pearson uzakl k ölçütü ve Ortalama ba lant yöntemiyle elde edilen kümelenme sonucu istasyonlar n dahil olduklar

kümeler 63

Tablo A1 Çal mada kullan lan istasyonlar n konumlar na ili kin

detayl bilgiler 76

Tablo B.1 X ham veri matrisi 78

Tablo C.1 Z Standartla lm veri matrisi 81

(13)

1. G

Su, üphesiz canl lar için hayati öneme sahip en önemli maddelerden birisidir. Yeryüzünde 214 ana su toplama havzas mevcut olup dünya nüfusunun su ihtiyac n %40’ na cevap verebilmektedir. Buna ba olarak yeryüzünde toplam su miktar yakla k 1.360.000 km3 olup dünyan n %70’ini kapsamaktad r. Tatl su miktar ise 27.200 km3 olmas na ra men negatif etkenler dolay ile (nüfus art , kirlenme, iklim de ikli i vb. ) her geçen gün azalmaktad r.

Dünyan n %75’inin sularla kapl olmas na ra men mevcut su kaynaklar n sadece %2,6’s tatl su kayna özelli ine sahiptir. Bu miktar n yakla k % 99’u kutuplarda buz ya da kar eklinde bulunmaktad r. Üstelik kullan labilir su kaynaklar n yeryüzünde da da e it de ildir. Kuzey Amerika ve Merkezi Avrupa ansl gözükürken, Afrika, Güney Amerika ve Ortado u ciddi sorunlara sahiptir. Ülkemizde günümüzün teknik ve ekonomik artlar çerçevesinde, çe itli amaçlara yönelik olarak tüketilebilecek yerüstü suyu potansiyeli yurt içindeki akarsulardan 95 milyar m3, kom u ülkelerden yurdumuza gelen akarsulardan 3 milyar m3 olmak üzere y lda ortalama toplam 98 milyar m3’tür. 14 milyar m3 olarak belirlenen yer alt suyu potansiyeli ile birlikte ülkemizin tüketilebilir yerüstü ve yer alt su potansiyeli y lda ortalama toplam 112 milyar m3 olmaktad r. Di er taraftan 2023 y için nüfusun 100 milyon olaca öngörülmü tür. Bu durumda 2023 y için ki i ba na dü en kullan labilir su miktar n 1125 m3 olaca söylenebilir. Bilindi i gibi y ll k ki i ba kullan labilir su miktar 2000 m3’ den az olan ülkeler su fakiri olarak kabul edilmektedir. Bu durumda ülkemizin gelecekte ciddi su s nt lar çeken bir ülke konumuna gelebilece i söylenebilir.

rl su kaynaklar ve h zla artan dünya nüfusu ile birlikte suyun önemi gün geçtikçe daha da artmaktad r. Günümüzde yap lan ara rmalar u sonucu ortaya koymu tur ki kullan labilir su kaynaklar toplam su kaynaklar n çok az bir k sm olu turmakta, ayn zamanda var olan su kaynaklar z giderek kirlenmektedir. Günümüzde suyun önemi giderek daha çok anla lmakta ve su kaynaklar n korunmas na yönelik önlemler daha etkili ad mlarla yürütülmektedir. Su kaynaklar n do rudan yada dolayl olarak (tar m ve hayvanc k faaliyetleri gibi)

(14)

insan sa etkiledi i art k bilinen bir gerçektir ve her geçen gün bu konu daha da önem kazanarak gündemde yer tutabilmektedir.

Su kaynaklar günümüzde pek çok tehdit alt nda olup korunmaya muhtaç haldedir. Bu tehditler; ba ta sanayile me ile birlikte artan sanayi at klar , h zla artan nüfusun getirdi i yo un kanalizasyon at klar ve zirai ilaçlar gibi çevresel at klar olarak say labilir. Son y llarda önemli boyutlara varan çevre kirlili i olgusu, kaynak kullan n sadece nicelik de il, su kayna n niteli i ile de s rland gerçe ini ortaya ç karm r. Dolay yla “yararlan labilir su potansiyeli” suyun miktar ile birlikte kalitesini de ifade eder. Bu aç dan, ülkemizde de suyun niceli i ile birlikte niteli inin de bilinmesi zorunludur. Su kalitesinin ve suyun kirlilik durumunun belirlenebilmesi için fiziksel, kimyasal, biyolojik, radyolojik ve mikrobiyolojik analizler yap lmakta, ayr ca akarsular n hidrolojik özellikleri ile beraber kirlilik parametrelerinin yer ve zamana göre de imi de istatistiki metotlarla incelenmektedir.

Çevre kirlili inden etkilenen en geni alan su kaynaklar r. Su kayna özelliklerinin, konumda ve zamanda nas l de ti inin anla lmas , elde su kalitesini gösteren verilerin olmas , bu verilerin de sürekli olarak toplanmas gerektirir. Böylelikle su kaynaklar n durumu daha aç k ortaya ç karak tedbirlerin al nmas daha kolay hale gelebilir.

Tar msal veya endüstriyel nedenlerle kirlenen su kaynaklar n slah edilmesi, kirlenme sorunlar n olu mas önleyecek ekilde do al kaynaklar n korunmas için, su kalitesinin izleme ve de erlendirilmesi çal malar na h z verilmesi gerekmektedir (E E 2003).

Yap lan çal mada su kalitesi ölçümü yapan Elektrik leri Etüt (E E) daresi Genel Müdürlü üne ba 67 adet ak m gözlem istasyonunda (AG ) ölçülmü 1992– 2008 y llar aras na ait s cakl k, pH, elektriksel iletkenlik, Na+, K+, (Ca+Mg) 2+, CO32-, Cl-, SO42-, SAR ve Bor konsantrastonu olmak üzere toplam 11 adet su kalitesi

parametresine ak mda eklenerek toplam 12 parametre üzerinde Ana Bile enler Analizi (ABA), Faktör Analizi ve Kümeleme Analizi uygulanarak, de ken say n azalt lmas , istasyonlar n faktörlerle ili kisinin incelenmesi ve istasyonlar n bu do rultuda kümelenmesi amaçlanm r.

(15)

2. L TERATÜR ÖZET

Mevcut çal ma, su kalitesi verilerinin çok de kenli istatistiksel analiz yöntemleriyle incelenmesi olmas sebebiyle öncelikle seçilen üç yöntemin (Ana Bile enler Analizi, Faktör Analizi ve Kümeleme Analizi) birlikte yada ayr ayr su kalitesi verilerine uygulanmas eklinde yap lm olan literatürdeki çal malara yer verilmi tir. Daha sonra yöntemlerin daha iyi anla labilmesi için kaynak olabilecek, hidroloji alan nda Ana Bile enler Analizi, Faktör Analizi ve Kümeleme Analizinin çe itli uygulamalar na yer verilmi tir.

Rim taraf ndan (1998) yap lan çal mada, Kansas nehri üzerindeki 9 istasyondan al nan ayl k su kalitesi verileri kullan lm ve bu verilere Faktör Analizi ve Kümeleme Analizi uygulanm r. Yap lan çal ma sonucunda 8 su kalitesi parametresi aras nda yüksek ili kiler saptanm r ve sonuç olarak verinin büyük bir

sm üç faktörün aç klad belirlenmi tir.

Blinstrub’un (2002) yapt çal mada Kaliforniya’da Orange Country havzas nda 31 adet istasyondan al nan su kalitesi de erleri üzerinde Ana Bile enler Analizi uygulanm , analiz sonucunda toplam varyans n %77,6 ‘s aç klayan 5 ana bile en belirlenmi , ortalama ABA skorlar na göre yap lan Kümeleme Analizinde benzer su kalitesi özelliklerinin görüldü ü 6 küme belirlenmi tir.

Roman ve ark.’n n (2003) yapt klar çal mada Puerto Rico da 15 havza için mevcut su kalitesi verileri üzerinde çok de kenli istatistiksel analizler uygulanm r. Yap lan bu çal mada Faktör Analizi ile parametre azaltmas yap larak toplam varyans n %77’sini aç klayan 6 faktör belirlenmi , Kümeleme Analizi ile benzer su kalitesi özelliklerine göre havzalar kümelenmi tir.

Bir di er çal ma Panda ve ark.’n n (2006) yapt klar çal mad r. Bu çal mada do al ve insan etkilerinden kaynaklanan faktörlerin hidrolojik özelliklere etkisi ara lm r. Hindistan’da bulunan Mahanadi nehrine ait su kalitesi verileriyle yap lan bu çal mada R-Mode Faktör Analizi uygulanm daha sonra Kümeleme Analizi ile bireyler kümelendirilmi tir.

Charkhabi ve Sakizadeh’in (2006) çal mas nda, ran’da Siahroud nehrinde 9 istasyondan al nan mevsimlik su kalitesi verileri üzerinde Faktör ve Kümeleme

(16)

Analizleri uygulanm , Faktör Analizi sonucunda tar msal ve insani etkilerin en etkili kirlilik kaynaklar oldu u görülmü , Kümeleme Analizi ile yap lan kümeleme sonucunda 4 küme tespit edilmi tir.

Buraya kadar üstünde durulan çal malar yabanc kaynakl çal malard r. Türkiye’de yap lan çal malar daha çok havza baz nda yada herhangi bir istasyonda ölçülen de erlerin zamanla de iminin incelenmesi eklindedir.

Özgüler’in (2001) yapt çal mada Meriç nehri üzerinde bulunan 01-11-00-008 no’lu Eskiköy su kalitesi gözlem istasyonunda 1983 ve 1988 y llar aras nda gözlenen su kalitesi ve ak m verileri ele al nm , 20 adet parametre Ana Bile enler Analizine tabi tutularak uygulama sonunda varyans n yakla k %69’unun 3 ana bile enle aç kland görülmü tür.

Boyac lu ve ark.’n n (2005) yapt klar çal mada ise Büyük Menderes havzas na ait 19 istasyondan ald klar 9 parametreye Faktör Analizi uygulanm , yap lan analiz sonucunda toplam varyans n yakla k %85’inin 2 faktör taraf ndan aç kland görülmü tür.

Bir di er çal ma Mazlum ve ark.’n n (1999) yapt klar çal mad r. Bu çal mada Sakarya havzas nda Porsuk kolu üzerinde kurulmu bulunan A açköy su kalitesi gözlem istasyonunda gözlenen kalite de imlerine neden olan faktörler Ana Bile enler Analizi kullan larak belirlenmi tir. lemler sonucunda 6 ana bile enin toplam varyans n %86’s aç klad belirlenmi tir.

Bu çal malar n d nda sadece konu olarak Ana Bile enler Analizi, Faktör Analizi ve Kümeleme Analizi ile ilgili yap lm olan hidroloji ile ilgili çe itli önemli çal malar a da verilmi tir.

Kalayc ’n n (2003) yapt çal mada Trend Analizi ve Ana Bile enler Analizi kullan lm r. Çal man n birinci bölümünde Türkiye’deki 26 havzan n 83 ak m gözlem istasyonuna ait 1964–1994 periyodundaki ayl k ak m verilerine parametrik olmayan 4 farkl trend testi (Sen’s T, Spearman’s Rho, Mann-Kendall, Mevsimsel Mann-Kendall) uygulanm r. Ayl k ak mlardaki trendlerin homojenli i de Van Belle ve Hughes taraf ndan geli tirilen bir prosedür kullan larak test edilmi tir. Çal man n ikinci bölümünde ise Türkiye’deki 22 havzan n 78 istasyonuna ait 1964– 1994 y llar aras ndaki 372 ayl k verinin uzaysal ve zamansal de imlerinin sistematik modlar Ana Bile en Analizi kullan larak tan mlanm r. Analiz, ak n

(17)

temel anomali paternlerini ve bu paternlerin zamana göre de imlerini ortaya karmaktad r. %95 önem seviyesinde istatistiksel olarak önemli ilk 7 bile en, orijinal verinin toplam varyans n %70’inden fazlas na aç kl k getirmektedir. Orijinal bile enlerin Varimax ortogonal döndürme yöntemi kullan larak döndürülmesiyle de bölgesel anomali alanlar belirlenmi tir.

Demirel (2004), Türkiye’deki ak m verilerini Kümeleme Analizi ile incelemi tir. 80 ak m gözlem istasyonundan al nan 31 y ll k de erler kullan larak yap lan bu çal mada veriler, y ll k ortalama, mevsimlik ortalama ve ayl k ortalama olarak incelenmi tir. Yöntem olarak Ward yönteminin kullan ld bu çal mada ll k ortalama ve mevsimlik ortalamada 3 kümeleme seviyesi (3, 5 ve 8 küme), ayl k ortalamada ise 1 kümeleme seviyesi (6 küme) belirlenmi tir. Yap lan bu çal mada kümeler aras ndaki uzakl klar bulunmadan önce veriler standartla lm r.

Yan k ve Avc (2005), yapm olduklar çal mada bölgesel debi süreklilik çizgilerini elde ederken homojen bölgelerin belirlenmesinde Kümeleme Analizini kullanm lard r. Debi süreklilik çizgisindeki Q30, Q35,……. Q95, Q100, özgül debileri

Do u Karadeniz’de 26 istasyonda elde edilen debi süreklilik çizgisinden okunmu tur. Çe itli ba lama kriteri (Tam, Ortalama, Tekli ba lama, Ward yöntemi) ile Hiyerar ik Kümeleme ve K-Ortalama Yöntemi ile Hiyerar ik Olmayan Kümeleme uygulanarak küme say 3 olarak belirlenmi tir. Bir kümedeki istasyonlar n debi süreklilik çizgilerinin o kümenin ortalama çizgisinden fark K-Ortalama Yöntemi için %30, Ward Yöntemi içi %53, Tam Ba lama için %48, di er kriterler için daha yüksek de erlerdedir. Hiyerar ik Kümelemede sonuçlar topografya, bitki örtüsü ve ya la uyumlu olmad için K-Ortalama Yöntemi seçilmi tir.

Bu çal malar n d nda farkl disiplinlerde yap lm analiz yöntemi olarak ayn yöntemleri kullanan bir çok çal ma mevcuttur.

(18)

3. MATERYAL VE METOD

3.1. Materyal

Yap lan çal mada, Türkiye akarsular nda E E’ ye ba olarak i letilen 67 adet ak m gözlem istasyonundan elde edilen 1992–2008 y llar aras na ait ak m ve 11 adet su kalitesi parametresi (S cakl k, pH, Elektriksel letkenlik, Na+, K+, (Ca+Mg) 2+, CO32-, Cl-, SO42-, SAR ve Bor konsantrastonu) verileri kullan lm r. Bu veriler,

üzerinde çok de kenli istatistiksel analiz yöntemlerinden Ana Bile enler Analizi, Faktör Analizi ve Kümeleme Analizi uygulanm r. Yap lan uygulama ile kullan lan su kalitesi de kenlerinin say n azalt lmas , istasyonlar n faktörlerle ili kisinin incelenmesi ve istasyonlar n kümelenmesi amaçlanm r.

3.1.1. Çal mada kullan lan istasyonlar

Ülkemizde su kalitesi ölçümünü yapan kamu kurulu lar Devlet Su leri (DS ) ve E E’dir. Bu çal mada E E istasyonlar na ait veriler kullan lm r. E E, yapt ölçümleri 1989, 1996 ve 2003 su kalitesi y ll klar nda yay nlam r.

Bu çal mada istasyonlar seçilirken aç k ak m gözlem istasyonlar içinden verileri olabildi ince kesintisiz bir ekilde geçmi e dayanan istasyonlar n seçimine özen gösterilmi tir. Çal mada ele al nan zaman dilimi 1992–2008 y llar aras r. Marmara Sular , Ege Sular , K. Menderes, Burdur Gölü havzalar na ait istasyonlar, bu zaman dilimi içerisinde yeterli veri uzunlu una sahip olmamalar sebebiyle çal mada kullan lamam r. Çal mada kullan lan istasyonlar n baraj gibi biriktirme haznelerine olan konumu da dikkat gerektiren hususlardan bir tanesidir. Kullan lan istasyonlar Tablo 3.1.’de, istasyonlar n Türkiye üzerindeki da da ekil 3.1’ de gösterilmi tir. stasyonlar hakk nda detayl bilgiler ise Ek-A’da verilmi tir.

(19)

Tablo 3.1 Çal mada kullan lan istasyonlar

Havza

No Havza Ad

Seçilen ak m gözlem istasyonlar n numaralar

1 Meriç 103, 112, 113

3 Susurluk 302, 316, 317, 331

5 Gediz 518, 523

7 B. Menderes 701, 706

8 Bat Akdeniz Sular 812, 815 9 Orta Akdeniz Sular 902, 917

11 Afyon Sular 1108

12 Sakarya 1203, 1233, 1257

13 Bat Karadeniz Sular 1307, 1314, 1332, 1334, 1335, 1343

14 Ye il rmak 1401, 1413 15 rmak 1501, 1503, 1517, 1535 16 Orta Anadolu 1611 17 Do u Akdeniz Sular 1714, 1719 18 Seyhan 1818, 1826 19 Hatay Sular 1907 20 Ceyhan 2004, 2006, 2008, 2025 21 rat 2102, 2115, 2119, 2145, 2154, 2156, 2164, 2174, 2176, 2180 22 Do u Karadeniz Sular 2218, 2228, 2232, 2247 23 Çoruh 2304, 2321, 2325, 2329, 2334 24 Aras 2418 25 Van Gölü 2505, 2511 26 Dicle 2610, 2630, 2633

(20)

ek il 3.1 Seçilen ista syonla r n Türkiye haritas üze rinde konumlar

(21)

3.1.2. Çal mada kullan lan parametreler

Çal mada kulland z parametreler; Ak m, S cakl k, pH, Elektriksel letkenlik, Na+, K+, (Ca + Mg)2+, CO32-, Cl-, SO42-, SAR ve Bor konsantrastonu

parametreleridir. Bu parametrelerin 1992–2008 y llar aras ndan elde edilen uzun llar ortalama de erleri kullan lm r.

Su kalitesi analizleri için al nacak su örnekleri, E E idaresinin i letmekte oldu u ak m gözlem istasyonlar ndan genellikle ayda bir al nmaktad r. Su örne i al nacak plastik bidon, akarsu veya göl kenar na en az bir metre uzakl kta a aç k ve ba a tutularak suya sokulmakta ve bidon yüzeyden yakla k 50 cm. kadar derinlikte ters çevrilerek, su kütlesini temsil edecek ekilde doldurulmaktad r. Daha sonra plastik bidonlarda toplanan su örnekleri bile imi bozulmayacak ekilde laboratuara getirilmektedir. Plastik bidon üzerinde, örne i alan ekibi, al nd tarihi, suyun ad , istasyonun ad , suyun s cakl ve ak m bilgilerini gösteren bilgiler bulunmaktad r.

Su Kalitesi örneklerinin kimyasal analizleri, Türk Standartlar n (TS 266) da bulunan parametreler için bu standartlarda verilen yöntemler uygulanarak veya DS Genel Müdürlü ünün Su Analizleri El Kitab ndaki yöntemler uygulanarak yap r.

Su örneklerinin AG ’lerdeki al lar s ras nda elde edilen tüm veriler ile kimyasal analizlerinin sonucu bilgisayar ortam nda girilerek bir “Su Kalitesi Veri Taban ” olu turulmaktad r. Her su kalitesi gözlem istasyonunun gözlem y na göre ortalama, maksimum, minimum kalite parametre de erleri istatistiksel olarak bulunmaktad r. Bütün bu sonuçlar her be y lda bir “Türkiye Akarsular nda Su Kalitesi Gözlemleri” y ll olarak yay nlanmaktad r (E E 2003).

(22)

3.2. Metot

Yap lan çal mada çok de kenli istatistiksel analiz yöntemlerinden 3 tanesi kullan lm r. Bunlar;

Ana Bile enler Analizi, Faktör Analizi,

Kümeleme Analizi.

3.2.1. Ana bile enler analizi (ABA)

Ana Bile enler Analizi; veri y nlar yla ilgilenen ara rmac lar için, ellerindeki parametre say n mümkün oldu unca verinin büyük bir k sm aç klayacak ekilde azalt lmas na imkan sa layan çok de kenli istatistiki yöntemlerden bir tanesidir. Parametre say azalt rken en önemli konu yeni parametrelerin (ana bile enlerin) birbirleriyle ili kisiz olmas r. Bu sayede de kenler aras ba ml k yap yok edilerek veriler daha az say da de kenle aç klanm olur.

ABA’ n n genel amaçlar a daki gibi verilebilir (Özdamar 2004):

Veri indirgemesi yapmak, Tahminleme yapmak,

Veri setini baz yöntemlerin analiz edebilece i forma sokmak (Ana Bile enler Regresyon Analizi, Faktör Analizi gibi),

li kili de ken setlerinden birimlerin/olu umlar n ana bile en skorlar hesaplamak ve birimleri skorlara göre s raya dizmek (büyükten küçü e, küçükten büyü e s ralamak).

(23)

Ana Bile enler Analizi uygulan rken öncelikle n birey say ve p de ken say olmak üzere Xnxp (ham) veri matrisi olu turulur. Ana Bile enler Analizi

de kenlerin toplam varyans na çok ba ml oldu undan de kenlerin varyans göz önünde tutulmal r. Aksi halde temel bile enlerin bir anlam olmaz. De kenlerden elde edilen varyanslar n birbirine göre farkl olmalar Ana Bile enler Analizi aç ndan önemli bir ölçüttür. Ana Bile enler Analizi’nde de kenlerin ölçü birimleri farkl ise genellikle de kenler standartla r. Daha sonra standartla lm de kenlerden elde edilen, toplam varyans de ken say na e it olan korelasyon matrisine Ana Bile enler Analizi uygulan r (Harman 1976).

Znxp standartla lm veri matrisi, Xnxp (ham) veri matrisinin

standartla lmas sonucu elde edilir. Standartla rma i lemi veri matrisini olu turan de ken serisindeki verilerin ortalamadan olan farklar al narak standart sapmaya bölünmesiyle elde edilir. Bu ekilde yapmakla veri matrisini meydana getiren de ken serisindeki verilerin birbirlerine olan göreceli konumlar korunmu olur (Özgüler 2001).

er ham veri matrisi kullan lacaksa, temel bile enlerin bulunmas nda varyans – kovaryans matrisinden, standartla lm veri matrisi kullan lacaksa korelasyon matrisinden yararlanarak Ana Bile enler Analizi’nin kalan a amalar na devam edilir.

Ele al nan de kenler aras nda korelasyon yoksa, analizi uygulamak herhangi bir fayda sa lamayacakt r. De kenlerin birbiriyle ili kisiz olmas durumunda R korelasyon matrisi, I birim matrisine e it yada çok yak n olacakt r. ABA’n n gereklili i için R korelasyon matrisine Bartlett Küresellik Testi uygulan r.

Bartlett Küresellik (Sphericity) Testi’ne ait hipotezler a daki ekilde ifade edilir:

H0 : R = I (3.1)

H1 : R I

Bartlett test istatisti i,

2 2 ) 1 ( : ln 6 5 2 1 p R p p n (3.2)

(24)

Test sonucunda H0 reddedilirse, ABA uygulaman n anlaml ve gerekli oldu u

söylenebilir, reddedilmezse analizin bir faydas olmayaca aç kt r.

ABA uygulamas n anlaml olabilece ine dair bak labilecek bir ba ka ölçüt de de kenlerin varyanslar r. E er de kenlerin varyanslar birbirine yak n de erler al yorsa yine ABA uygulamas n bir anlam olmaz.

ABA’n n anlaml olaca na karar verilirse öncelikle özde erler ve bu özde erler ait özvektörler hesaplan r. Bu hesaplamalar a da verilen modele göre yürütülür.

3.2.1.1. Ana bile enler analizinin modeli

Ana Bile en Analizi’nin modeli matris notasyonu ile yaz rsa ;

A

X

Z

pxp xp xp) (1 )( ) 1 ( (3.3)

Z sat r vektörü Z1, Z2,…., Zp ana bile enlerinden olu maktad r. 1. ana bile en

Var(Z1) en büyük olacak ekilde belirlenir, bundan sonra 2. ana bile en Var (Z2) en

büyük olacak ekilde belirlenir ve bu ekilde devam edilir. Zj ba ms z (ortogonal)

ana bile enleri standart haldedir (ortalamalar 0, varyanslar 1). Xi, de kenlerinin S

kovaryans matrisinin esas kö egeninde 2 ( )

j

j Var X varyanslar vard r. S matrisinin izi (trace) Xj de kenlerinin varyanslar n toplam verir:

p j j p j z j Var X S Trace V 1 1 ) ( ) ( (3.4)

(3.3) denkleminden Zj ana bile enleri için

j j

X

A

Z

px xp x1) (1 ) ( 1) 1 ( (3.5)

(25)

p k k k j a X Z j 1 (3.6)

Ana bile enlerin elde edilmesi için Ajsütun vektörlerinin belirlenmesi gerekir.

Genel olarak Y, Xj’ lerin do rusal bir kombinezonu ise:

p j j jX a Y 1 (3.7) Y’nin varyans p j i j j T j j i j i j jVar X aa Cov X X A SA a Y Var 1 ) , ( 2 ) ( ) ( (3.8)

Buna göre Zj ana bile eninin varyans ;

j T j j A SA Z Var( ) (3.9)

Ana Bile enler Analizinde Var (Z1) in en büyük yap lmas istenmektedir.

1 ) ( max 1 1 1 1 A A SA A Z Var T T j (3.10)

(3.10) denklemlerinden ikincisi normalizasyon k r.

(3.10) denklemleri bir k tl optimizasyon problemini göstermektedir. Bu problem Lagrange yöntemi ile çözülebilir. 1 Lagrange çarpan olmak üzere :

) 1

(

maxQ A1TSA1 1 A1TA1 (3.11)

(26)

0 ) ( 2 1 1 1 A I S A Q (3.12)

(3.12) denklemi bir karakteristik de er problemidir. Buradan:

0

1I

S (3.13)

(3.13) denklemini sa layan j (j = 1,2,….., p) öz de erleri elde edildikten sonra Aj

öz vektörleri,

j j

j A

SA (3.14)

denkleminden bulunur. Bu denklemde S matrisinin boyutu (pxp) ve Aj matrisinin

boyutu (px1)’dir. En büyük öz de er olan 1’e kar k gelen Aj vektörü A1 , ikinci

büyük öz de er olan 2‘ye kar k gelen Aj vektörü A2 ,…. dir. j öz de erleri Zj ana

bile enlerinin varyanslar gösterir:

) ( j j T j j A SA Var Z (3.15)

(3.4) denklemine göre j‘lerin toplam S kovaryans matrisinin V izine e ittir. Ana

Bile enler Analizinde toplam varyans de memekte, fakat Z1 için Var (Z1), Z2 için

Var (Z2), … , Zj için Var (Zj) en büyük olacak ekilde ayr lmaktad r. Zj temel

bile enlerinin birbirlerinden ba ms z oldu u görülebilir:

0 ) , ( ) , (Zi Zj Cov XAi XAj AiTSAj Cov (3.16)

Zj ana bile enlerinin j varyanslar belirlendikten sonra ilk q adet ana bile en toplam

varyans n (%90 gibi) büyük bir k sm aç kl yorsa daha sonrakileri göz önüne almayarak sadece q adet ana bile en ile çal labilir.

q j q j j j V Z Var 1 1 90 , 0 ) ( (3.17)

(27)

Xi de keni ile Zj ana bile eni aras ndaki korelasyon katsay hesaplan rsa: j iZ X 5 . 0 ) ( ) ( / ) , (Xi Zj Var Xi Var Zj Cov 5 . 0 2 ) /( i j i j T j A A (3.18) i ij j j i ij ja /( ) a / 5 . 0 5 . 0 2

(3.18) ifadesi ana bile enlerin hangi orijinal de kenlerle ili kili oldu unu gösterdi inden ana bile enlerin yorumlanmas nda yararl olur. Xi de keninin bütün

ana bile enlerle korelasyon katsay lar (0,5’den) küçük ise problemden Xi

kar labilir.

Xi orijinal de kenlerinin ölçüldü ü birimler ya da de kenlerin de me

aral klar birbirinden çok farkl ise de kenler standart hale ( i =1) getirildikten

sonra ana bile en analizi yap labilir. Bu durumda Xi standart de keni ile Zj ana

bile eni aras ndaki korelasyon katsay

ij j Z Xi j a 5 , 0 (3.19)

eklinde hesaplanabilir. (3.19) denklemindeki korelasyon katsay na faktör yüklemesi (factor loading) denir. Dikkat edilmesi gereken bir nokta standartla lm de kenlerle elde edilen ana bile enlerin standartla rmadan öncekilerden farkl olaca r.

Ana bile enler elde edildikten sonra yorumlamay kolayla rmak için bunlara baz faktör yüklemelerinin 1’e, di erlerinin 0’a yak n olmas sa layacak ekilde rotasyon uygulanabilir. Bu konu ilerde Faktör Analizi k sm nda daha aç k anlat lacakt r (Bayaz t 2006).

(28)

3.2.1.2. Ana bile en say n belirlenmesi

(3.17)’de gösterildi i gibi ilk q adet ana bile en toplam varyans n önemli bir yüzdesini aç kl yorsa sadece bunlarla çal labilir. q ana bile en say belirlemek için çe itli yöntemler ileri sürülmü tür.

Kaiser Kriteri: Kaiser kriteri kullan nda ana bile en say n

belirlenmesinde R korelasyon matrisinden elde edilen özde erlerden faydalan r. Bu kriter sadece özde erleri 1’den büyük olan ana bile enlerin seçilmesini öngörür (Mardia ve ark. 1979). Ana bile en say n belirlenmesinde en yayg n kullan lan karar verme tekni idir (Stevens 2002).

2/3 aç klama pay : Ana bile en say n belirlenmesinde bir ba ka teknik toplam varyans n en az 2/3’ünü aç klayan say da ana bile en seçilmesidir. Bu oran %95’lere kadar art labilir. Fakat %67 oran ndan sonra aç klanan varyans oran artt rmak için çok say da ana bile en ile çal mak gerekiyor ise oran s rl tutmak uygun olur (Özdamar 2004).

Yamaç e imi testi (Scree test): R yada S matrisinin öz de erleri bulunduktan

sonra bu öz de erlerin büyüklük s ras na göre dizilmi de erleri bir çizgi grafi i biçiminde gösterilir. Bu çizgi grafi inin e imine bak r. E imin monotonla maya ba lad nokta ana bile en say olarak belirlenir (Özdamar 2004). Örnek olarak ekil 3.2’de verilen yamaç e imi grafi ine göre elde edilen ana bile en say 3’ dür.

(29)

0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 8 9 10 11 12 13

Ana Bile en Say

Özde

er

ler

ekil 3.2 Yamaç e imi grafi i (scree test)

Yap lan çal mada Ana Bile enler Analizine ait özde erler ve özvektörler MINITAB 14 paket program yard yla bulunmu tur.

3.2.2. Faktör Analizi

Faktör Analizi birbiriyle ili kili veri yap lar birbirinden ba ms z ve daha az say da yeni veri yap lar na dönü türmek, bir olu umu yada olay aç klad klar varsay lan de kenleri gruplayarak ortak faktörleri ortaya koymak, bir olu umu etkileyen de kenleri gruplamak, majör ve minör faktörleri tan mlamak amac yla ba vurulan bir yöntemdir.

Faktör Analizi, Ana Bile enler Analizine benzeyen bir yöntemdir. Her iki yöntemde de veri indirgeme söz konusudur. Fakat Faktör Analizi de kenleri gruplayarak ortak faktörler tan mlama özelli ine sahiptir.

(30)

Faktör Analizinin iki temel amac bulunmaktad r. Bunlar; de ken say azaltmak ve de kenler aras ndaki ili kilerden yararlanarak baz yeni yap lar ortaya

karmakt r.

Faktör Analizi; özellikle sosyal bilimler, e itim bilimleri, t p, psikoloji, sosyoloji gibi alanlarda, birimlerin çok say daki birbirleriyle ili kisiz fakat bir olu umu aç klamakta yararlan labilecek olanlar bir araya toplayarak yeni bir isimle faktör olarak tan mlamay sa layan, yayg n kullan olan bir yöntemdir (Özdamar 2004)

Faktör Analizi gözlenen ve aralar nda korelasyon bulunan X veri matrisindeki p de kenden gözlenemeyen fakat de kenlerin bir araya gelmesi ile ortaya ç kan, flamay yans tan rasgele faktörleri ortaya ç karmay amaçlar. Türetilen bu yeni de kenlere faktör ad verilir.

Faktör Analizi uygulan biçimine ve uygulama amac na göre farkl isimlerle an lan bir yöntemdir. Bunlar a da detayl bir ekilde aç klanm r (Özdamar 2004).

Aç klay Faktör Analizi (EFA, Exploratory Factor Analysis): Verilerin

kovaryans yada korelasyon matrisinden yararlan larak birbirleri ile ili kili p say da de kenden daha az say da (k<p) ve birbirlerinden ba ms z yeni de kenler (faktör) türetmek üzere yararlan lan faktör analizidir. Genellikle faktör analizi denildi inde Aç klay Faktör Analizi akla gelir. Bu yöntem ile p say da de kenden orijinal de kenli i yüksek oranda aç klayan daha az say da faktör belirlenir. Bu faktörlerin faktör yükleri, faktör katsay lar , faktör skorlar hesaplan r ve orjinal de kenlerle yüksek oranda ili kili fakat kendi aralar nda ili kisiz skorlar üretilir. Yapt z çal mada da Aç klay Faktör Analizi kullan lm r.

Do rulay Faktör Analizi (CFA, Confirmatory Factor Analysis):

Aç klay Faktör Analizi ile belirlenen faktörlerin, hipotezle belirlenen faktör yap lar na uygunlu unu test etmek üzere yararlan lan Faktör Analizidir. Hipotetik olarak; faktörler ile faktörleri belirlemede major rol oynayan de kenler aras nda, önemli ili kinin bulunmad hipotezini test etmek amac yla yararlan lan bir yöntemdir.

Q Tipi Faktör Analizi (Q-type Factor Analysis): p de keni incelenen n birimin korelasyon matrisinden yararlanarak yap lan Faktör Analizidir. Birimlerin

(31)

benzerliklerini inceleyerek birimler aras ndaki benzerliklerden daha az say da homojen birim gruplamalar ortaya koymaya çal an bir yöntemdir. Bu yöntemde X veri matrisi transpoze edilerek R matrisi hesaplan r ve de kenlerde boyut indirgeme yerine n birim için k boyutlu faktörler belirlemek amaçlan r. Transpoze X matrisi elde edildikten sonra yap lan tüm i lemler Aç klay Faktör Analizi yöntemi ile yap r.

R Tipi Faktör Analizi (R- Type Factor Analysis): Aç klay Faktör Analizi ile benzerdir. De kenlerin R matrisinden yararlan larak yap lan bir Faktör Analizi uygulamas r.

O-Tipi Faktör Analizi (O-Mode Factor Analysis): Veri matrisinde s ralar n

ölçümleri, sütunlar n y llar ifade etti i durumlarda ölçümlerin hangi y llarda kümelenme gösterdi ini ara rmaya yarayan yöntemdir. Eski bir zaman serisi analizi yöntemi olarak ele al nabilir. Zaman periyotlar nda verilerin davran aç klamaya yard m eden bir yöntemdir. leri zaman serisi analizi yöntemlerinin geli tirilmi olmas nedeniyle, yayg n kullan olan bir yakla m de ildir.

T-Tipi Faktör Analizi (T-Mode Factor Analysis): Veri matrisinde sat rlar n

birimleri sütunlar n ise y llar gösterdi i durumlarda tek de kenli bir yap da birimlerin y llara göre kümelenmelerini ortaya ç karmak için yararlan lan bir yöntemdir. Bu yöntem tek de kenli bir kümelenmeyi ortaya ç karmak için kullan lan eski bir Faktör Analizi yakla r.

S-Tipi Faktör Analizi (S-Type Factor Analysis): Veri matrisinde sat rlar n

llar , sütunlar n olaylar ve hücrelerde ise bir de kene ili kin ölçüm de erlerinin yer ald durumlarda fenomenlerin zaman periyotlar na göre kümelenmelerini incelemeye yard mc olan bir yöntemdir. Bir fenomende yer alan kategorilere göre, de kenin y llara göre gösterdi i gruplanmalar ortaya ç karmak amac yla yararlan lan bir yöntemdir.

Günümüzde O-tipi, T-tipi ve S-tipi Faktör Analizi, veri analizinde yayg n olarak kullan lmamaktad r. Çünkü bu yöntemler tek de kenli yöntemlerdir. Faktör Analizi ise çok de kenli bir de kenler aras ili kileri incelemeye yarayan bir yöntem olarak kullan lmaktad r (Özdamar 2004).

Kullan lan veri setinin Faktör Analizi için uygun olup olmad Kaiser – Meyer – Olkin (KMO) ölçütü ile test edilir. Bu ölçüt gözlenen korelasyon katsay lar

(32)

büyüklükleri ile k smi korelasyon katsay lar n büyüklüklerini kar la ran bir indekstir. KMO de eri a da (Tablo 3.2) önerilen aral klardan hangisine denk gelirse örneklem hakk nda ona göre karar verilir (Khalaf 2007).

Tablo 3.2 KMO ölçüsü ve önerilen de er

KMO ölçüsü Önerilen de er 0.90 mükemmel 0.80 + çok iyi 0.70 + iyi 0.60 + orta 0.50 + kötü < 0.50 kabul edilemez

3.2.2.1. Faktör analizi modeli

X, p de kenli N birimlik rasgele veri matrisi olsun. X’ in kovaryans matrisi ve ortalama vektörü olsun. X gözlem vektörü ile gözlenemeyen faktörler aras nda Ortogonal Faktör Modeli ve Oblik Faktör Modeli olmak üzere iki tür faktör modeli kurulabilir. Ortogonal Faktör Modeli, X ile do rusal olarak ba ml , fakat aralar nda ba ms z olan k tane gözlenemeyen ortak faktörler F1, F2,….., Fk oldu unu ve p tane

hata diye isimlendirilen özel faktörlerin bulundu unu varsayarak faktörlerin belirlenmesini amaçlar.

Oblik Faktör Modeli ise X ile e risel olarak ba ml olan k tane gözlenemeyen ortak faktörler F1, F2,….., Fk oldu unu ve p tane özel faktörün bulundu unu

varsayarak faktörlerin belirlenmesini amaçlar. Bu bölümde Ortogonal Faktör Modeli üzerinde durulacak ve faktör modeli denildi inde do rusal model anla lacakt r (Özdamar 2004).

(33)

Faktör Analizi modeli; 1 1 2 12 1 11 1 1 l F l F ... lkFk X (3.20) 2 2 2 22 1 21 2 2 l F l F ... l kFk X … … p k pk p p p p l F l F l F X 1 1 1 2 ... eklinde yaz r.

Burada lij katsay , faktör yükü (factor loading) olarak isimlendirilir ve i.

de kenin j. faktör üzerindeki yükünü (a rl ) belirtir. Matris formunda Faktör Analizi modeli;

X – =L × F + (3.21)

eklinde yaz r.

Burada X – ifadesi (px1) boyutlu fark vektörü, L ifadesi (pxk) boyutlu faktör yükleri matrisi, F ifadesi (kx1) boyutlu faktör vektörü ve ise (px1) boyutlu hata vektörüdür.

Modelde yer alan L matrisi p de kenin her birinin k say da (k p) faktör üzerindeki yüklerini belirten lij katsay lar içerir. Bu katsay lar faktör yükleri olarak

isimlendirilirler. i hatas ise sadece Xi cevab ile ilgilidir (Özdamar 2004).

Ortogonal Faktör Analizi modelinde varsay mlar a daki gibi özetlenebilir:

F faktör matrisinin beklenen de eri 0’d r. (E(F)=0)

F matrisinin kovaryans (Cov(F)) birim matristir. (Cov(F) E FF' I)

’ nin beklenen de eri 0’d r. (E( ) =0)

(34)

Cov(e) = E ee' = p . . . 0 0 . . . . . . . . . . . . 0 . . . 0 2 1 (3.22)

eklindedir. k ortak faktörlü bir faktör modeli;

) 1 ( ) 1 ( ) ( ) 1 ( ) 1 (pxX px pxkL kxF px (3.23)

eklinde yaz r. X’in kovaryans , faktör modeline göre

S = Cov(X) = LL’ + i (3.24)

biçiminde yaz r. X ile F aras ndaki kovaryans ise

Cov(X,F) = E(X- )F’ = L E (FF’) + E ( F’) = L (3.25)

olarak belirlenir. Her bir X de keninin varyans (Var(Xi));

i ik i i i X Var 2 2 2 2 1 ... ) ( (3.26)

eklinde belirlenir, ya da;

i ik i i ii 2 2 2 2 1 ... (3.27) biçiminde belirlenir.

(3.27)’da ii; Var (Xi)’yi, 22 2 2

1 i ... ik

i k sm faktörlere ba varyans

oran , yani (hi2)’yi, i k sm ise spesifik varyans olu turmaktad r. Faktörlere ba

varyans oran (hi2), i. de kenin varyans n k ortak faktör ile belirlenen (aç klanan)

(35)

Faktörlere ba varyans oran (hi2) ile spesifik varyans i’ nin toplamlar Xi’ nin

orijinal varyans belirler. Di er bir anlat mla Xi’ nin toplam varyans , faktörlerle

aç klanan varyans ve spesifik varyans biçiminde iki k sma ayr r.

i i ii i h X Var 2 ) ( i = 1,2,…….,p (3.28)

Xi’ye ait olan spesifik varyans, bu de kenin tekli ini ifade eden de kenli i

belirtmektedir. Ana Bile enler Analizi’nde oldu u gibi de kenlerin ölçü birimlerinin farkl ve varyanslar n farkl , Faktör Analizi’nde de faktörlerin belirlenmesinde önemli etkilere sahiptir. Bu nedenle standardize veri matrisi Z ile yada korelasyon matrisi R ile çal mak uygun bir yakla md r. Standardize veri matrisinin kovaryans ve korelasyon matrisleri birbirlerine e ittir.

Faktör Analizinde faktörlerin belirlenmesi için bir çok yöntem bulunmaktad r. Bunlar s kl kla kullan mlar na göre; Ana Bile enler Yöntemi, En Büyük Benzerlik Yöntemi, A rl ks z En Küçük Kareler Yöntemi, Genellenmi En Küçük Kareler Yöntemi, Ana Eksen Faktörizasyonu Yöntemi, Alfa Faktörizasyon Yöntemi ve mge

zlenim) Faktörizasyonu Yöntemi olarak say labilir.

Bu yöntemler içinde genel kabul görmü ve s kl kla uygulanan yöntemlerden ikisi Ana Bile enler Yöntemi ve En Büyük Benzerlik Yöntemi’dir. Bu bölümde aç klamalar Ana Bile enler Yöntemi’ne göre yap lacakt r.

Faktör Analizi, kovaryans matrisi ya da korelasyon matrisi üzerinden yap r. Veri setinde yer alan p de kenin ölçü birimleri birbirlerinden çok farkl ise ve de kenlerin de im aral klar oldukça de ik ve birbirinden büyük farkl klar gösteriyor ise özde erlerin bulunmas nda korelasyon matrisinden yararlanmak uygundur. Di er halde kovaryans matrisinden yararlanmak yerinde olur.

Ana Bile enler Analizi kullan larak, özde erler ve özvektörler bulunduktan sonra faktör yükleri olarak adland lan lij de erleri, her bir özde erin karekökü ile o

özde ere ili kin özvektör elemanlar n çarp ile elde edilir.

i i

(36)

(3.29)’e göre L yük matrisi, p p

e

e

e

L

1 1 2 2 (3.30)

eklinde elde edilir.

er faktör say k = p ise de kenlerin tüm de imi faktörlere atfedilen varyans ile aç klan r. Bu nedenle her de kenin faktöre özgü varyanslar bire e it olur. E er faktör say k<p ise her de kenin faktörlere özgü varyanslar birden küçük olur ve spesifik varyanslar s rdan büyük bir say olarak elde edilir.

Bilindi i gibi

R = LL’ + (3.31)

olarak yaz ld ndan bu e itlikten yararlan larak faktörlere özgü varyans ve spesifik varyans matrisi hesaplan r. Faktörler özgü varyans her bir faktör için, o faktörün hesaplanmas nda yararlan lan özde ere e ittir (Özdamar 2004).

3.2.2.2. Faktör say n belirlenmesi

Faktör say n belirlenmesi için gerekli ölçütler, Ana Bile enler Analizi’nde bölüm 3.2.1.2.’de aç klanan Kaiser kriteri, 2/3 aç klama pay ve yamaç e im testi ölçütleridir. Bu yüzden bu bölümde bu bilgileri bir daha vermeye gerek duyulmam r.

3.2.2.3. Faktör katsay lar ve faktör skorlar

Faktör skorlar her bir birimin faktör yap lar na göre tahmini de erlerini (skorlar ) belirtmektedir. Yukar da aç kland gibi her faktör yap n içinde tüm

(37)

de kenler de ik a rl kta yer almaktad r. Bu de kenlerden baz lar ana (major) rol oynarken baz lar yard mc (minör) rol oynarlar. Belirlenen faktör yüklerinden yararlan larak her bir de kenin faktör yap lar na göre ortak faktör puanlar (skorlar ) hesaplanabilir.

Faktör Analizi’nde, faktör skorlar belirlemek için En Küçük Kareler Yönteminden yararlan r. Bu yakla mda spesifik varyanslar n birbirine e it yada yakla k e it oldu u varsay ndan yola ç r. Faktör skorlar (fi), orijinal veri

matrisi kullan larak yap lan Faktör Analizi’nde her bir faktör için ayr ayr a daki gibi hesaplan r. ) ( ' ) ' (LL 1L x x f i yada ) ( 1 . . ) ( 1 ) ( 1 ' ' 2 2 ' 1 1 x x e x x e x x e f i k k i i i (3.32)

Faktör skorlar (fi), standardize veri matrisi kullan larak Faktör Analizi

yap lm ise her bir faktör için ayr ayr a daki gibi hesaplan r:

) ( ' ) ' ( 1 i z L LL f yada ) ( 1 . . ) ( 1 ) ( 1 ' ' 2 2 ' 1 1 i k k i i i z e z e z e f (3.33)

Yukar da yer alan formüllerde orijinal ya da standardize de ken d nda yer alan ifadeler, R matrisinin (ya da S matrisinin) özde erlerini ya da özvektörlerini belirtmektedir. Bu formüllerde yer alan (1/ i)e ifadesi faktör katsay lar (b, factori'

(38)

hesapland ktan sonra her bir birim için faktör skorlar hesaplamak kolayla r. Bu katsay lar regresyon denkleminde yer alan regresyon katsay lar gibi kabul edilebilir. Fi faktörü için bij faktör skor katsay lar i. faktörün belirlenmesinde yararlan lan

özde erin (1/ i)de eri kullan larak a daki gibi hesaplan r.

ij i

ij e

b 1 (3.34)

Faktör skor katsay lar ndan yararlan larak her bir birim için faktör skorlar (fij)

daki denklemle (3.35) hesaplan r.

ij ij

ij b z

f (3.35)

Faktör skorlar orijinal de kenler yerine, o de kenleri temsil eden de erler olarak kullan lacak, boyutu indirgenmi de kenler olarak alg lan r (Özdamar 2004).

3.2.2.4 Faktör döndürülmesi

Bazen orijinal faktör yüklerinden bilgi elde edilmesi zor olabilir. Bu nedenle faktör yap daha basit hale getirmek için onlar belirli bir aç ile döndürmek uygun olur. Bu i lemi mikroskop alt nda bir preparat en iyi biçimde görebilmek için lameli mikrometrik olarak ileri geri döndürerek maniple etmeye benzetebiliriz (Özdamar 2004).

Faktör rotasyonunu, faktör yüklerinin ortogonal hale getirilmesi için eksenlerin optimal bir aç ile döndürülmesi ve ortogonalizasyonun sa lanmas olarak ifade edebiliriz. Böylelikle faktör yüklemelerinin baz lar n 0’a di erlerinin 1’e yakla mas sa lanm olur ( ekil 3.3).

Elde edilen faktörlere daha iyi yorum verebilecek biçimde yeni faktörlere çevirme olarak ifade edilen faktör döndürmede iki yöntem kullan lmaktad r. Bunlardan ilki, eksenlerin konumlar de tirmeden 90 ’lik aç ile döndürülen dik döndürmedir. kinci yöntem ise, eksenlerin birbirlerine dik olmas na gerek

(39)

duyulmayan, ama her faktör birbirinden ba ms z olarak döndürülen e ik döndürmedir. Asl nda pek çok ili kili de kenden az say da ili kisiz ve kolay yorumlanabilir faktörlere ula mak, Faktör Analizi’nin temel amac oldu una göre, faktörler taraf ndan aç klanan varyans miktar n döndürmeden etkilenmemesi istenir. Bu istem dik dönü ümleri ön plana ç kart r. Ancak baz durumlarda dik döndürme en iyi faktör kümesine ula makta yeterli olmamaktad r (Harman 1976; Mardia ve ark. 1989; Tatl dil 1996). Dik döndürme, bazen hangi faktörlerin hangi parametrelerle ili kin yükleri ta mas gerekti i ile ilgili özellikleri tam olarak vermedi inden, döndürmeden amaçlanan basit yap ya ve anlaml faktörlere ula lamamaktad r. Böyle durumlarda e ik döndürme gündeme gelmektedir. Sonuç olarak, faktörlerin dikli inden belli ölçüde fedakârl k yap lmas durumunda e ik döndürme ile daha anlaml ve daha kolay yorumlanabilir basit yap sonuçlar na ula mak mümkün olmaktad r. E ik döndürmenin dik döndürmeden her zaman daha üstün oldu u savunulmaktad r ( engörür ve sa 2001).

(40)

Dik faktörlerde yükler -1 ile +1 aras nda iken e ik döndürmede baz yüklerin 1’ den büyük olmas durumu ile de kar la r ve bu de erler 1 olarak de erlendirilir ve bu durum yüklerin mükemmel oldu u anlam na gelir (Tatl dil 1996). Elde edilen faktörlerin daha anlaml sonuçlar vermesi için faktörlerden her seferinde m-2 tanesi sabit tutularak, iki er iki er diklik özelli i bozulmayacak biçimde döndürülmesini sa layan pek çok dik döndürme yöntemleri içinde Varimax, e ik döndürme yöntemleri içinde ise Oblimax yöntemi faktör döndürme yöntemleri aras nda çok kullan lan yöntemlerdendir.

3.2.3 Kümeleme analizi

Kümeleme Analizi ilk defa 1939 y nda R. C. Tryon taraf ndan kullan lm r. Kümeleme Analizi’nin genel amac , gruplanmam verileri benzerliklerine göre gruplamak ve ara rmac ya uygun, i e yarar, özetleyici bilgiler elde etmesinde yard mc olmakt r. Kümeleme Analizi’nde birbirine benzeyen elemanlar n ya da de kenlerin olu turdu u kümelerin belirlenmesi istenir. Bir kümenin içindeki elemanlar n aralar ndaki uzakl klar n küçük, buna kar k kümelerin merkezleri aras ndaki uzakl klar n büyük olmas , ba ka bir deyi le bir kümedeki elemanlar n ili kilerinin kuvvetli, farkl kümelerdeki elemanlar n ili kilerinin zay f olmas istenir. Kümeleme Analizi’nin genel amaçlar n yan nda özel amaçlar ndan da söz edilebilir. Bunlar gerçek tiplerin (cinslerin- rklar n) belirlenmesi, model bulman n kolayla lmas , gruplar için ön tahmin, hipotezlerin testi, veri yap n netle tirilmesi, veri indirgenmesi (veriler yerine kümelerin de erlendirilmesi), ayk de erlerin bulunmas r.

Kümeleme Analizi’nde ilk a ama, veri giri a amas r. Verilerin kümelenmeye uygun biçimde girilmesi ile ilgili olan bu a amada uzakl klar matrisi elde edilir. kinci a ama kümeleme tekni inin seçilmesi ve uygulanmas r. Son a ama ise sonuç amas olup bu a amada sonuçlar n duyarl n ve anlaml n tart mas yap r. Sonuçlar n uygun olmamas durumunda (de kenlerin uygun olmamas veya küme say n do ru belirlenmemesi durumunda) tekrar ikinci a amaya dönülmektedir (Bozyoku 1996).

(41)

Kümeleme Analizi’nde öncelikle verilerin standartla p standartla lmayaca bir problem olarak kar za ç kmaktad r. Baz çal malarda (Nathan ve McMahon 1990) de kenlerle ilgili bilgi kayb na neden oldu u gerekçesiyle standartla rma yap lmam , baz çal malarda ise (Lecce 2000; Yan k 2005; Demirel 2004) veriler standart hale getirildikten sonra analize ba lanm r. Sonuç olarak de kenleri standartla rmak uzakl ölçekten ba ms z hale getirmektedir. Ancak bu durumda de kenlere farkl a rl klar verildi i unutulmamal r. Kümeleme Analizi’nin ana ad mlar genel olarak baz kaynaklarda bulunabilir (Arabie ve ark. 1996; Hair ve ark. 1987). Burada ad geçen kritik ad mlar

da verilmi tir (Demirel 2004). Bunlar;

De kenlerin seçimi

Verilerin standartla lmas n gerekli olup olmad Benzerlik ölçütünün ne olaca

Kümeleme metodunun seçimi ve stabilite testleri.

3.2.3.1. Benzerlik ölçütleri

Kümeleme Analizi’ne ba land nda öncelikle de erler aras ndaki uzakl klar (benzerlik ölçüleri, xnq‘lar ) hesaplanmaktad r. Bu a amadan sonra bu de erlere göre

benzerlik matrisi (3.36) e itli i ile olu turulmaktad r.

nq n n ij q q

x

x

x

x

x

x

x

x

x

x

X

.

.

.

.

.

.

2 1 2 22 21 1 12 11 (3.36)

(3.36)’de gösterildi i ekilde olu turulan benzerlik matrisinde n de eri nesne say , q say ise de ken adedini ifade etmektedir. xij de eri ise i. nesnenin j.

de ere kar k gelen de erini göstermektedir. te burada xij de erlerinin

(42)

Seuclidean, Mahalanobis, Cityblock, Minkowski, Cosine, Correlation, Spearman, Hamming, Pearson, Jaccard ve Chebychev uzakl klar r. Bu uzakl klardan baz lar aç klanacak olursa;

Euclidean Uzakl

Bu uzakl k yeni verilerin kat lmas ndan etkilenmez. Ölçekten (birimlerden) ise çok etkilenir. Eksen dönü ümünden etkilenmedi i için ana bile enlerle çal ld nda de mez. En çok kullan lan uzakl k ölçütüdür. Kümeleme Analizi yapan çe itli bilgisayar programlar nda varsay lan olarak kullan r ve (3.37) e itli i ile bulunur.

2 / 1 2 / 1 1 2 2 2 1 1 ) , ( (x y ) ... (x y ) (x y ) (X Y) (X Y) d T p j j j p p y x (3.37) Mahalanobis Uzakl

X ve Y de kenleri aras ndaki korelasyonu da hesaba katan Mahalonobis uzakl ölçekten (birimlerden) ba ms zd r olup (3.38) e itli i ile hesaplan r.

2 / 1 1( ) ) ( ) , (x y X Y S X Y T d (3.38)

P = 2 için (iki de ken için) u ekilde hesaplanabilir.

2 / 1 2 1 2 2 1 1 2 2 2 2 2 2 1 2 1 1 2 ) )( (( 2 ) ( ) ( 1 1 ) , ( s s y x y x r s y x s y x r y x d (3.39)

r; iki de ken aras ndaki korelasyon katsay r. r = 0 için Pearson uzakl na dönü ür.

(43)

Pearson Uzakl

Pearson Uzakl , (3.40) denklemi ile elde edilir ve standartla rma yap ld ndan Pearson uzakl ölçekten (birimlerden) etkilenmez.

2 / 1 1 2 2 / ) ( ) , ( p j j j j y s x y x d (3.40) Chebychev Uzakl

Bu uzakl k da ölçekten (birimlerden) etkilenmez ve (3.41) e itli i ile hesaplan r. 2 / 1 1 2 2 max / ) ( ) , ( p j j j j j j y x y x y x d (3.41)

3.2.3.2 Kümeleme metodunun seçimi

Kümeleme Analizi yöntemleri genel olarak ikiye ayr lmaktad r. Bunlar; amal (Hierarchical) Kümeleme Teknikleri ve A amal Olmayan (Nonhierarchical) Kümeleme Teknikleridir.

3.2.3.3 A amal (hierarchical) kümeleme yöntemleri

Hiyerar ik (a amal ) kümelemede birbirine benzeyen (aralar ndaki uzakl k az olan) elemanlar ard k olarak kümelenir. Böylece iç içe yuvalanm kümeler olu turulur. Hiyerar ik kümeleme daha çok ön analizde, küme say hakk nda bir fikir elde etmek için kullan r. Bu teknikleri kullanarak yap lan kümeleme i leminde genel olarak a daki s ra izlenir.

(44)

i. Gözlemlenen n birimin her biri bir küme (bir elemanl küme) varsay lmak suretiyle n tane küme belirlenir.

ii. Benzerlik matrisine göre aralar nda en çok benzerlik bulunan i ve j kümeleri birle tirilir.

iii. kinci a amada yap lan birle tirme sonucu küme say bir indirilerek (n-1) küme için yenilenmi benzerlik matrisi olu turulur.

iv. kinci ve üçüncü ad mlar tüm birimler tek bir küme olu turuncaya kadar (n-1) kez tekrarlan r.

Üçüncü a amada sözü edilen yenilenmi benzerlik matrisinin olu turulmas nda seçenek yakla mlar n bulunmas çe itli a amal kümeleme tekniklerinin ortaya

kmas na neden olmu tur (Bozyoku 1996).

Tek ba lant kümeleme tekni i (Single Linkage) Tam ba lant kümeleme tekni i (Complete Linkage) Ortalama ba lant kümeleme tekni i (Average Linkage) Merkezi ba lant kümeleme tekni i (Centroid Method) En küçük varyans tekni i (Ward Yöntemi)

Tam ve Tek Ba lant Kümeleme Teknikleri en yayg n kullan lan kümeleme teknikleridir. Bunun d nda Kümeleme Analizi i leyi aç nda iki ekilde yap labilir. Bunlar ;

Toplay Kümeleme: Daha çok kullan lan bir kümeleme eklinde elemanlarla

ba lan p ard k her bir düzeyde küme say azalacak ve kümelerin içlerindeki benzerlik azalacak ekilde kümeler birle tirilir.

Bölücü Kümeleme: Ba lang çta bütün elemanlar tek bir kümede toplan r.

Ard k düzeylerde küme say artacak ve benzerlik de artacak ekilde kümeler ayr r.

(45)

Tek ba lant kümeleme tekni i (Single Linkage): amal kümeleme tekniklerinin en basitlerinden bir tanesidir. En yak n kom uluk olarak da bilinen kümeleme tekni i, ö elerin birle tirilmesinde uzakl n en az yani benzerli in en çok olmas göz önünde bulundurur ( ekil 3.4). Tekli ba lama az say da heterojen kümelere götürür, ayr mlar belirgin olmayan kümeleri ortaya ç karmaz.

ekil 3.4 Tek ba lant kümeleme tekni i

Bu yöntem, hem benzerlik ölçüleri ile hem de uzakl k ölçüleri ile kullan labilir. Tek ba lant yönteminde uzakl k veya benzerlik matrisinden yararlan larak birbirine en yak n iki gözlem veya küme birle tirilmekte ve bu birle tirme i lemi yinelenerek devam ettirilmektedir. Johnson ve Wichern (1988) taraf ndan önerilen bu teknikte, i ve j bireyler kümesinin birle tirilmi kümenin k. birey kümesi ile ili kisi uzakl k ölçütü olarak; Benzerlik türü ölçümlerde; ) , max( ) , (i j ki kj k s s s (3.42)

Uzakl k türü ölçümlerde ise;

) , min( ) , (i j ki kj k d d d (3.43) ile bulunabilir.

(46)

Tam ba lant kümeleme tekni i (Complete Linkage): ki kümedeki en

uzak kom ular n uzakl iki kümenin uzakl olarak al r ( ekil 3.5). En uzak kom uluk olarak da bilinen bu teknik yine Johnson ve ark. (1988) taraf ndan önerilmi tir. Tek ba lant kümeleme tekni ine çok benzeyen bu teknikte tek farkl k iki küme aras ndaki uzakl n en büyü ünü ele almakt r. Çok say da homojen kümelere götüren tam ba lant tekni i kümedeki elemanlar n birbirine yak n olmas halinde iyi sonuç verir, ayk de erlerden etkilenmez.

Tekli ba lant yönteminin tam tersi olan bu yöntemde, elde edilen uzakl k ya da benzerlik matrisinden yararlan larak en yak n iki gözlem veya küme birle tirilir. Bu birle tirme i lemi yap rken,

Benzerlik türü ölçümlerde; ) , min( ) , (i j ki kj k s s s (3.44)

Uzakl k türü ölçümlerde ise;

) , max( ) , (i j ki kj k d d d (3.45) denklemleri kullan r.

(47)

Ortalama ba lant kümeleme tekni i (Average Linkage): Bu yönteme

grup ortalama yöntemi de denir. Ortalama ba lant tekni i iki uç teknik olan tek ve tam ba lant kümeleme teknikleri aras nda sonuçlar vermesi nedeniyle seçenek olarak önerilmektedir. Ortalama ba lant tekni inde iki küme aras ndaki uzakl k ekil 3.6’da görüldü ü gibi kar kl kümelerdeki birimlerin birbirleriyle olan uzakl klar n ortalamas r. Di er bir deyi le, iki küme aras ndaki mesafe, birinci kümedeki noktalardan ikinci kümedeki noktalara olan ortalama uzakl kt r.

ekil 3.6 Ortalama ba lant kümeleme tekni i

Ortalama ba lant tekni inin farkl tipleri vard r. Bu farkl tiplerin her biri söz konusu kümelerin içindeki birimlerin benzerli inin ortalamas hesaplar ve belli bir benzerlik düzeyi tutturuldu unda kümeleri birle tirir. Ortalama ba lant da ço unlukla birimler aras ndaki benzerliklerin aritmetik ortalamas al r. A da, a ve b kümeleri aras ndaki uzakl k formüllerini veren üç farkl ortalama ba lant tekni i gösterilmi tir. Bu üç metot da Everitt (1993) ve Anderberg’de (1973) bulunmaktad r (Demirel 2004). Centroid method ij j i i jb j i i ib j i i ab d N N N d N N N d N N N d (3.46) Median method ij jb ib ab d d d d 2 1 2 1 2 1 (3.47)

(48)

Weighet Average jb ib ab d d d 2 1 2 1 (3.48)

En küçük varyans tekni i (Ward yöntemi): Her bir ad mda kümelerin

elemanlar n, küme merkezlerinden uzakl klar n karelerinin toplam , o ad m için en küçük yap r. Etkin bir yöntem olmakla birlikte çok say da kümeye götürür. Ward, çözümlemenin herhangi bir a amas nda, noktalar n kümelere gruplanmas ndan kaynaklanan bilgi kayb n, her noktan n ait oldu u küme ortalamas ndan sapmalar n karelerinin genel toplam n ölçülebilece ini ileri sürmektedir (Ward 1963 ve Wishard 1969). Bu do rultuda kümeleme çözümlemesinde, gruplar içindeki türde li i ço altmak amac yla, her ad mda hata kareler toplam nda en az art sa layan iki küme belirlenip birle tirilerek, yeni bir küme olu turulabilir. Ward algoritmas , küme kütle merkezleri aras ndaki öklit mesafesine dayanmaktad r. Bu yöntemin di er a amal küme analiz yöntemleriyle test edilmesi tavsiye edilmektedir. Ward taraf ndan ortaya at lan bu yöntem, gözlem say çok oldu unda di er hiyerar ik yöntemlerin uygulanmas zorla ndan, bunlara bir alternatif olarak geli tirilmi tir. Yöntem, kümeler içindeki varyans minimum k lmay amaçlamaktad r. Bunun içinde hatalar n kareleri toplam olan (3.49) denkleminden yararlan lmaktad r. Buradaki n; kümedeki nesne say , xi; i. nesne de erini, x ise

nesne de erlerinin ortalamas göstermektedir.

2 1 n i i x x ESS (3.49)

Öyle ki her basama nda birle mesi mümkün olan küme çiftleri dikkate al p, birle me sonucunda hata kareleri toplam en az artt ran iki küme birle tirilir. Kümeleme i leminin ilk ad nda, her birimin kendisi bir küme olu turdu undan, Ward tekni ine göre hata kareler toplam s r olmaktad r.

(49)

3.2.3.4 A amal olmayan (nonhierarchical) kümeleme yöntemleri

Küme say hakk nda bir ön bilgi varsa ya da ara rmac anlaml olacak küme say na karar vermi se, çok uzun zaman alan a amal teknikler yerine a amal olmayan teknikler tercih edilmelidir. Ayr ca bu tekniklerin kuramsal dayanaklar n güçlü olmas di er bir tercih nedenidir. A amal olmayan teknikler, birimleri mümkün oldu u kadar birbiri ile benzer olacak ekilde gruplara ay r (Bozyoku 1996). Bu kümeleme eklinde eleman çiftlerinin aras ndaki uzakl klar n hesab gerekmez.

K küme say seçildikten sonra K adet çekirdek eleman veya ba lang ç kümesi belirlenir. Bu çe itli ekillerde yap labilir. Çekirdekler rasgele seçilebilece i gibi ilk çekirdek rasgele seçildikten sonra ikinci çekirdek buna uzakl belli bir de erden büyük olacak ekilde rasgele seçilip böyle devam edilebilir. Yada çekirdekler mümkün oldu u kadar ayr k olacak ekilde seçilir. SAS yönteminde K adet çekirdek rasgele seçildikten sonra, en yak n iki çekirde e di er gözlemlerin her birinin uzakl klar hesaplan r. Bir gözlem için bu uzakl klar n küçü ü en yak n iki çekirdek aras ndaki uzakl ktan büyükse, gözlem ile çekirdek yer de tirir ve bu ekilde devam edilir.

Çok kullan lan K-ortalamalar (K-means) yönteminde her gözlemin a rl k merkezine en yak n oldu u kümeye kat lmas amaçlan r. Bunun için K adet çekirdek seçildikten sonra, n-K gözlemin her biri en yak n oldu u kümeye kat r. Kümelerin rl k merkezleri tekrar belirlendikten sonra gözlemler yeniden en yak n olduklar kümelere geçirilir ve merkezlerdeki de meler belli bir de erden küçük oluncaya kadar devam edilir. Merkezler ya bir eleman n kümesi de ince ya da bütün elemanlar n kümeleri yeniden belirlenince tekrar hesaplan r.

Bu yöntem genellikle Ortalama Ba lama Kriterli hiyerar ik kümelemeye benzer sonuç verir. Sonuçlar bir ölçüde ba lang ç çekirdeklerine ba oldu undan, stabilite kontrolü için, de ik çekirdeklerle çal p küme a rl k merkezleri ya da elemanlar n da kar la r.

K küme say n belirlenmesi için çe itli yöntemler vard r. Örnek alt örneklere ayr p biri d nda di erleri için ayr ayr kümeleme yap r ve sonuçlar geriye kalan alt örnek üzerinde kontrol edilir. Bu i lemler K’ n n çe itli de erleri için tekrarlan r.

Şekil

Tablo 3.1 Çal mada kullan lan istasyonlar
Tablo 4.1 Ana bile enler analizi için Pearson korelasyon matrisi
Tablo 4.3 Özde erler ve toplam varyans  aç klama paylar
Tablo 4.5 Döndürülmemi  faktör yap  matrisi
+7

Referanslar

Benzer Belgeler

Bu yeni ölçek; göz cevabı, motor cevap, beyin sapı refleksleri ve solunum olmak üzere dört bölüm- den oluşmaktadır.. Her bölümden en fazla dört puan

Dağıtım filtre seçimi ile dağıtım için kullanılacak siparişler filtrelenerek Sipariş Dağıtım işlemi için listelenir....

We found that SenseWear Armband (step counts, duration of moderate and vigorous physical activity) and International Physical Activity Questionnaire (walking physical

Erişkinlerde Akut Migren Atağının Tedavisi ve Amerikan Baş Ağrısı Derneği Migren Farmakoterapisi Kanıt Değerlendirmesi.. The Acute Treatment of Migraine Attack in Adults

Ancak belirgin olarak azalm›fl in vit- ro ASA aktivitesiyle iliflkili ASA yalanc›-eksiklik alellerinde heterozigotluk, toplumun %10-20’sinde görülebilir ve bu kiflilerde de

In the brain stem, hyperintense signal abnormalities are seen in the intraparenchymal part of the trigeminal nerve (thick black arrow), superior cerebellar peduncles (thin black

2017’de Tazi ve arkadaşlarının yaptığı sistemik tedavi endikasyonu olan 35 erişkin hastayı içeren çok merkezli retrospektif çalışmada, akciğer tutulumu

Resim 2: Kranial T1 ağırlıklı kontrastlı aksial MRG kesitinde serebellar orta hatta, yer yer kalsifiye, heterojen kontrast tutan kitle lezyonu izlenmekte.. Resim 3: