• Sonuç bulunamadı

YAŞAM ÇÖZÜMLEMESİNDE YAPISAL EŞİTLİK MODELLERİ STRUCTURAL EQUATION MODELS IN SURVIVAL ANALYSIS

N/A
N/A
Protected

Academic year: 2023

Share "YAŞAM ÇÖZÜMLEMESİNDE YAPISAL EŞİTLİK MODELLERİ STRUCTURAL EQUATION MODELS IN SURVIVAL ANALYSIS"

Copied!
78
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

YAŞAM ÇÖZÜMLEMESİNDE YAPISAL EŞİTLİK MODELLERİ

STRUCTURAL EQUATION MODELS IN SURVIVAL ANALYSIS

İDİL KARAKAŞ

PROF. DR. DURU KARASOY Tez Danışmanı

Hacettepe Üniversitesi

Lisansüstü Eğitim-Öğretim ve Sınav Yönetmeliğinin İstatistik Anabilim Dalı için Öngördüğü YÜKSEK LİSANS TEZİ olarak hazırlanmıştır.

2019

(2)
(3)

Prof. Dr. Beril DEDEOĞLU’ nun anısına…

(4)
(5)
(6)

i

ÖZET

YAŞAM ÇÖZÜMLEMESİNDE YAPISAL EŞİTLİK MODELLERİ

İdil KARAKAŞ

Yüksek Lisans, İstatistik Bölümü Tez Danışmanı: Prof. Dr. Duru Karasoy

Haziran 2019, 62 sayfa

Yaşam çözümlemesi, belirlenmiş bir olay gerçekleşene kadar geçen sürenin incelenmesi için geliştirilmiş istatistiksel yöntemler topluluğudur. Olayın ortaya çıkma zamanının tam olarak bilinmemesi kesikli zamanlı yaşam çözümlemesi olarak tanımlanırken, olay zamanının açık bir şekilde tespit edilebilmesi sürekli zamanlı yaşam çözümlemesi olarak tanımlanır. En çok bilinen sürekli zamanlı yaşam çözümlemesi modeli Cox regresyon modeli olmasına rağmen parametrik dağılımlar da kullanılabilmektedir.

Yapısal eşitlik modelleri ise gözlemlenen değişkene ek olarak gizli değişkenleri de çözümlemeye katarak zamanla gelişmiş, farklı bir yöntem haline gelmiştir. Yapısal eşitlik modelinde gizli ve gözlenen değişkenler arasındaki kovaryans ilişkisi esas alındığından hata payının az çıkması daha güvenilir çözüm sonuçlarına neden olmuştur. Yaşam çözümlemesinde yer almayan gizli değişkenlerin etkisi yapısal eşitlik modelleri sayesinde daha kapsamlı çözümlemelerin yapılmasını sağlamıştır. Ayrıca yaşam çözümlemesi yaklaşımları olan kesikli ve sürekli zaman ayrımlarının yapısal eşitlik modelleri içinde kullanılabilir olması avantaj sağlamaktadır.

(7)

ii

Bu çalışmada, yaşam çözümlemesi, yapısal eşitlik modeli ve yaşam çözümlemesinde yapısal eşitlik modelleri hakkında ayrıntılı bilgi verilmiştir. Yaşam çözümlemesinde yapısal eşitlik modellerinin uygulanabilirliğini göstermek için Gazimağusa Tıp Merkezi Hastanesi Çocuk Poliklinikleri’ne başvuran, en az 6 aylık bebeği olan 187 anneden anne sütü ile beslenmeyle ilgili elde edilmiş veri seti üzerinde uygulanmış ve yorumlanmıştır.

Anahtar Kelimeler: Yapısal eşitlik modelleri, yol diyagramı, yaşam çözümlemesi, gizli değişken, dışsal değişken, içsel değişken.

(8)

iii

ABSTRACT

STRUCTURAL EQUATION MODELS IN SURVIVAL ANALYSIS

İdil KARAKAŞ

Master of Science, Department of Statistics Supervisor: Prof. Dr. Duru Karasoy

June 2019, 62 pages

Survival analysis is a collection of statistical methods developed to examine the time elapsed until a given event occurs. The fact that the exact time of occurrence of the event is not known is defined as a discrete-time survival analysis, whereas a clear determination of the event time is defined as a continuous-time survival analysis. Although Cox regression model is the most known continuous-time survival analysis model, parametric distributions can also be used.

In addition to the observed variables, structural equation models have become a different method developed by adding hidden variables to analysis. Since the covariance relationship between the hidden and observed variables is based on the structural equation model, the fact that the margin of error is low has led to more reliable solution results. The effect of hidden variables that are not included in survival analysis has led to more comprehensive analyzes thanks to structural equation models. In addition, it is advantageous that discrete and continuous time separations, which are survival analysis approaches, can be used in structural equation models.

(9)

iv

In this study, detailed information about survival analysis, structural equation model and structural equation models in survival analysis is given. In order to demonstrate the applicability of structural equation models in survival analysis, it was applied and interpreted on the data set obtained from breastfeeding from 187 mothers of at least 6 months old infants who applied to Gazimağusa Medical Center Hospital Children's Polyclinics.

Key Words: Structural equation models, path diagram, survival analysis, latent variable, exogenous variable, endogenous variable.

(10)

v

TEŞEKKÜR

Tezimin yazım aşamasında bana yürekten desteğini hissettiren, çalışmamda katettiğim her yolda bilgisini, tecrübesini ve yardımlarını esirgemeyerek teşvik eden, farklı şehirlerde olsak bile her zaman iletişim halinde olup yol gösteren danışmanım Sayın Prof. Dr. Duru KARASOY’a, geçtiğim her aşamada yanımda olduklarını bildiğim, hayatımın baş kahramanları olmalarından dolayı minnet duyduğum, sadece sevgilerini değil güvenlerini de her zaman içimde hissettiğim sevgili babam Murat KARAKAŞ, annem Nevin KARAKAŞ, kardeşim Mina KARAKAŞ ve hayat arkadaşım Efe DEDEOĞLU’na içtenlikle teşekkür ederim.

(11)

vi

İÇİNDEKİLER

ÖZET ... i

ABSTRACT ... iii

TEŞEKKÜR ... v

İÇİNDEKİLER ... vi

ÇİZELGELER ... viii

ŞEKİLLER ... ix

SİMGELER VE KISALTMALAR ... x

1. GİRİŞ ... 1

2. YAŞAM ÇÖZÜMLEMESİ ... 3

2.1. Sürekli Zamanlı Yaşam Modelleri ... 4

2.2. Kesikli Zamanlı Yaşam Modelleri ... 5

2.3. En Çok Olabilirlik Fonksiyonu ... 6

2.4. Cox Regresyon Modeli ... 7

2.5. Orantılı Tehlikeler Varsayımı ... 8

2.6. Parametrik Dağılımlar ... 10

2.6.1. Üstel Dağılım ... 11

2.6.2. Weibull Dağılımı ... 12

2.6.3. Log-Normal Dağılım ... 13

2.6.4. Log-Lojistik Dağılım ... 14

2.6.5. Gamma ve Genelleştirilmiş Gamma Dağılımı ... 15

3. YAPISAL EŞİTLİK MODELLERİ ... 17

3.1.Yapısal Eşitlik Modelleri Stratejileri ... 17

3.1.1. Doğrulayıcı Modelleme Stratejisi ... 18

3.1.2. Alternatif Modeller Stratejisi ... 18

3.1.3. Model Geliştirme Stratejisi ... 18

3.2. Gizli ve Gözlenen Değişkenler ... 22

3.2.1. Dışsal ve İçsel Gizli Değişkenler ... 23

3.3. Faktör Analitik Modeli ... 23

3.4. İstatistiksel Modellemenin Genel Amacı ve Süreci ... 24

(12)

vii

3.5. Genel Yapısal Eşitlik Modelleri Sembol Gösterimi ... 25

3.6. Yol Diyagramı ... 26

3.7. Yapısal Denklemler ... 29

3.8. Gizli Ortalama Yapıları Test Etme ... 29

3.9. Model Tanımlama ... 30

4. YAŞAM ÇÖZÜMLEMESİNDE YAPISAL EŞİTLİK MODELLERİ ... 31

4.1. Kesikli Zamanlı Yaşam Çözümlemesinde Yapısal Eşitlik Modelleri ... 32

4.1.1. En Çok Olabilirlik Tahmini ... 33

4.2. Sürekli Zamanlı Yaşam Çözümlemesinde Yapısal Eşitlik Modelleri ... 35

5. UYGULAMA ... 37

5.1. Hızlandırılmış Başarısızlık Süresi Modellerinin Uygulanması ... 41

5.2. Hızlandırılmış Başarısızlık Süresi Yapısal Eşitlik Modelleri Uygulaması ... 46

6. SONUÇLAR ... 56

KAYNAKLAR ... 58

ÖZGEÇMİŞ ... 62

(13)

viii

ÇİZELGELER

Çizelge 3.1. Örnek ölçme modelindeki sembollerin açıklamaları ... 21

Çizelge 3.2. Yapısal eşitlik modeli sembol gösterimi ... 26

Çizelge 5.1. Kullanılan değişkenler ve düzeyleri ... 38

Çizelge 5.2. Schoenfeld artıkları ile yaşam süresinin rankı arasındaki ilişki testi sonuçları 39 Çizelge 5.3. Cox regresyon modeli sonuçları ... 40

Çizelge 5.4. Üstel HBS modeli sonuçları ... 41

Çizelge 5.5. Weibull HBS modeli sonuçları ... 42

Çizelge 5.6. Log-normal HBS modeli sonuçları ... 43

Çizelge 5.7. Log-lojistik HBS modeli sonuçları ... 44

Çizelge 5.8. HBS modelleri için AIC ve BIC değerleri... 45

Çizelge 5.9. Log-lojistik HBS modeli için adımsal seçim yöntemi sonuçları ... 46

Çizelge 5.10. Üstel HBS yapısal eşitlik modeli sonuçları ... 47

Çizelge 5.11. Weibull HBS yapısal eşitlik modeli sonuçları ... 48

Çizelge 5.12. Log-normal HBS yapısal eşitlik modeli sonuçları ... 49

Çizelge 5.13. Loglojistik HBS yapısal eşitlik modeli sonuçları ... 50

Çizelge 5.14. Gamma HBS yapısal eşitlik modeli sonuçları ... 51

Çizelge 5.15. HBS yapısal eşitlik modelleri için AIC ve BIC değerleri ... 52

Çizelge 5.16. Log-lojistik HBS yapısal eşitlik modeli için ileriye doğru seçim yöntemi sonuçları ... 52

Çizelge 5.17. Log-lojistik HBS yapısal eşitlik modeli marjin değerleri ... 55

(14)

ix

ŞEKİLLER

Şekil 3.1. Ölçme modeli örneği ... 20

Şekil 3.2. Yapısal eşitlik modeli yol diyagramı ... 28

Şekil 4.1. Gözlenen ve gizli eğilimli olayların arasındaki ilişkilerin gösterimi ... 33

Şekil 4.2. Orantılı tehlikeler özelliğini sağlayan model örneği ... 34

Şekil 4.3. Cox regresyon ile yapısal eşitlik modelleri ... 35

Şekil 5.1: Log-lojistik HBS yapısal eşitlik modeli yol diyagramı ... 54

Şekil 5.2. Log-lojistik HBS yapısal eşitlik modeli marjin grafiği ... 55

(15)

x

SİMGELER VE KISALTMALAR

Simgeler

Ortalama μ Varyans σ2

Kısaltmalar

AIC Akaike Bigi Kriteri BIC Bayesci Bilgi Kriteri YEM Yapısal Eşitlik Modelleri

HBS Hızlandırılmış Başarısızlık Süresi

(16)

1

1. GİRİŞ

Yaşam çözümlemesi; araştırılmak istenilen durumun veya olayın, başlangıç noktasının tanımlanmasından, gözlemlenmesine kadar geçen sürenin çözümlemesi için kullanılan istatistiksel yöntemler topluluğudur (Karasoy ve Keskin Kaplan, 2017). Yaşam çözümlemesinde süre; yıl, ay, hafta, gün ve yaş gibi olayın ortaya çıktığı herhangi bir zaman dilimi olabilmektedir. Bu süre, yaşam süresi ya da başarısızlık süresi olarak tanımlanır. Olay ise ölüm, hastalık nüks etme, iyileşme gibi ilgilenilen herhangi bir durum olabilmektedir. Ayrıca olay, izleme süresi içerisinde bazı gözlemler için gerçekleşmeyebilir. Bu gözlemler ise durdurulmuş (censored) gözlemler olarak tanımlanır.

Yaşam çözümlemesi için iki genel yaklaşım bulunmaktadır. Bunlar, kesikli zamanlı yaşam çözümlemesi ve sürekli zamanlı yaşam çözümlemesi olarak adlandırılabilir. Olayın zamanı tam olarak bilinmiyor ancak bir panel çalışmasının görüşme aralıkları arasında olayın ortaya çıktığı biliniyorsa kesikli zamanlı yaşam çözümlemesi kullanılır. Olay meydana gelene kadar geçen süre gün, hafta, ay veya yıl gibi tam olarak biliniyorsa, sürekli zamanlı yaşam çözümlemesi kullanılır. Sürekli zamanlı yaşam çözümlemesinde en çok kullanılan model ise, Cox regresyon modelidir. Ayrıca üstel, weibull, log-lojistik, log-normal ve gamma gibi parametrik modeller da kullanılabilir (Bauldry ve Bollen, 2008).

Doğru bir analiz yapmak için ölçüm hatasını kabul etmenin önemli olduğu bilinmektedir.

Bu hatanın göz ardı edilmesi durumunda, kovaryansların etkisinden dolayı tahminler hatalı olabilmekte ve bu durum araştırmacıları yanıltabilmektedir. Yapısal eşitlik modelleri ise gözlenen değişkenler ve gizli değişkenler arasındaki kovaryans ilişkilerinin bir arada bulunduğu modellerin test edilmesi için kullanıldığından hata payı az olan analizlerin gerçekleşmesine yardımcı olur. Yapısal eşitlik modellerinde kullanılan eşzamanlı denklemler, bir değişkenin doğrudan, dolaylı ve toplam etkilerinin daha iyi kavranmasına yardımcı olmaktadır. Yaşam çözümlemesi ise, doğrudan etkiyi ortaya koymaktadır. Bu iki yöntemin birlikte kullanımı, uygun istatistiksel verilerde doğru analiz için önemli bir adım sayılabilmektedir (Bauldry ve Bollen, 2008).

(17)

2

Yaşam çözümlemesi birçok farklı disiplinde uygulanmış olsa bile yapısal eşitlik modelleri ile birlikte olan uygulamaları çok az ele alınmıştır. Ancak, gizli değişkenlerin, karmaşık yol diyagramlarının, eksik veri tahmini veya çoklu başarısızlık süreçlerinin dahil edilmesi gibi olanaklar sunan, yapısal eşitlik modellerinin yaşam çözümlemesinde kullanılması avantaj sağlamaktadır (Newsom, 2015).

Bu çalışmanın amacı, yaşam çözümlemesinde yapısal eşitlik modelleri hakkında bilgi vermek ve gerçek bir veri ile uygulama yapmaktır.

İkinci bölümde yaşam çözümlemesi hakkında genel bilgiler verilmiş ve yaşam çözümlemesinde kullanılan fonksiyonlar, parametrik dağılımlar ve modeller üzerinde durulmuştur. Üçüncü bölümde ise yapısal eşitlik modelleri hakkında genel bilgiler verilmiş olup genel amacı, değişken türleri ve yol diyagramı oluşturma anlatılmıştır. Yapısal eşitlik modellerinin sürekli ve kesikli zamanlı yaşam çözümlemesi dördüncü bölümde incelenmiştir. Beşinci bölümde ise bebeklerin anne sütü alma süreleri yaşam süresi alınarak, uygulama yapılmış ve sonuçlar yorumlanmıştır.

(18)

3

2. YAŞAM ÇÖZÜMLEMESİ

Yaşam çözümlemesi, belirlenmiş bir başlangıç noktasından beklenen olay sonuçlanana kadar geçen sürenin çözümlemesidir (Yay ve ark., 2007).

İlgilenilen süresi, başarısızlık süresi ya da yaşam süresi olarak tanımlanır. Analizde kullanılan süre rasgeledir ve bir dağılım oluşturur. Ele alınan süre gün, hafta, ay, yıl olabileceği gibi izlenilen olgu birey ise içinde bulunduğu yaş da olabilir (Çelik, 2011;

İnceoğlu,2013).

Yaşam çözümlemesi tıp alanında uygulandığı gibi ekonomi, sosyoloji, pazarlama, botanik gibi birçok alanda da uygulanabilir (İnceoğlu, 2013).

Yaşam çözümlemesinde, tıp alanında iyileşen bir hastanın tekrardan hastalığının nüksetmesi durumundan sosyal alanda iş arayan bireyin iş bulduğu zamana kadar geçen sürenin incelenmesi durumuna kadar pek çok konu üzerinde çalışılabilir. Bunların ötesinde araştırmacının ilgilendiği olay sadece bir durumun sona ermesi ile ilgili olmayacağı gibi bir durumun başlaması da olabilir. Önemli olan belirlenmiş süre içinde ilgilenilen olayın meydana gelmesidir (İnceoğlu, 2013).

Yaşam çözümlemesinde ele alınan verilerde karşılaşılan ana sorun, gözlem altında tutulan birimlerden bazılarının başarısızlık sürelerinin elde edilemiyor olmasıdır. Olay bazı durumlarda gözlem süresinin bitiminin hemen ardından ortaya çıkabilirken bazı durumlarda ise hiçbir zaman ortaya çıkmayabilir (Keskin, 2015 ; Karasoy ve ark., 2017). Başarısızlık süresi bilinmeyen vakaları içinde bulunduran veriler durdurulmuş veri olarak tanımlanır.

Ayrıca durdurulmuş veriler gözlemlerin bir kısmının bilindiği veriler olarak düşünülebilir (Bauldry ve Bollen, 2008).

Durdurma soldan, sağdan ve aralıklı olmak üzere üç çeşittir. En yaygın kullanılanı sağdan durdurmadır (right censoring) (Kleinbaum ve Klein, 2012).

(19)

4

2.1. Sürekli Zamanlı Yaşam Modelleri

Sürekli zaman modelleri, bir olayın "tam" zamanlaması bilinirse (örn., ölüm günü ve yılı) kullanılabilir. Başarısızlık süresinin negatif değer almayacağı bilinen bir durumdur (Bauldry ve Bollen, 2008). Ele alınan olgunun başarısızlık süresi, pozitif değer olmak üzere T raslantı değişkeni ile gösterildiğinde çözümlemesi yapılan olgunun t zamanından önce olayın gerçekleşmesi olasılığı, aşağıda yer alan dağılım fonksiyonu ile bulunur:

t

0

F (t) = P (Tt) = f (x) dx

, t > 0

Fonksiyonda yer alan f(t) olasılık yoğunluk fonksiyonudur (Tamam, 2008). f(t) olasılık yoğunluk fonksiyonu,

δt 0

P (t T t + δt) f (t) = lim

δt

 

şeklindedir (Collet, 2014).

T raslantı değişkeni için t zamanına kadar olayın gözlemlenemediği bilinmektedir. Bu durumda t zamanından sonra yaşam olasılığı aşağıdaki şekilde bulunur:

0

S (t) = P (T > t) = f (x) dx

Bu fonksiyona yaşam fonksiyonu denilmektedir. Yaşam fonksiyonu ve dağılım fonksiyonu arasında ilişki;

S (t) = 1- F (t)

biçimindedir. Yaşam fonksiyonu S(t) azalan bir fonksiyondur (Tamam, 2008).

(20)

5

2.2. Kesikli Zamanlı Yaşam Modelleri

Yaşam çözümlemesinin diğer yöntemleri ile karşılaştırıldığında, kesikli zamanlı yaşam çözümlemesi, ilgili olayın meydana gelebileceği ayrı parçalardaki zamanları çözümler.

(Institute for Digital Research and Education, 2018).

Kesikli zamanlı yaşam modelleri, genellikle, bir olayın meydana geldiği aralık biliniyorsa veya olayın kendisi ayrı aralıklarda gerçekleşmişse kullanılır. Uygulamada, bir olayın sürekli-zaman ya da kesikli-zaman içinde ölçülüp ölçülmemesi arasındaki ayrım, belirli bir parametrik zaman fonksiyonunun uygun olup olmadığı bağlıdır. Sosyolojik uygulamalar kesikli zamanlı yaşam modelleri kullanmayı gerektirir. Aynı zamanda bir yapısal eşitlik modeli çerçevesinde sürekli zamanlı yaşam modellerini tahmin etmek de mümkündür (Bauldry ve Bollen, 2008; Tamam, 2008).

Başarısızlık süresi sürekli zamanlarda ele alındığı gibi kesikli zamanlarda da incelenebilmektedir. 0<t1<t2<… olduğu bilindiğinde T raslantı değişkeninin olasılık fonksiyonu aşağıdaki gibidir (Tamam, 2008):

j j

f (t ) = P (T = t ), j = 1, 2, ...

Yinelenmeyen olaylarla kesikli zaman çerçevesinde iki olasılık vardır. Bunlar; tehlike olasılığı ve yaşam olasılığıdır. Tehlike olasılığı, olayın daha önce herhangi bir zaman aralığında yaşanmamış olması koşuluyla, bir birimin bir zaman aralığında olayı yaşama ihtimalini ifade eder.

T, rastgele değişken, i durumlar için bir gösterge ve j zaman periyotları için bir gösterge olarak ifade edildiğinde tehlike olasılığı, koşullu olasılık fonksiyonu olarak verilir (Bauldry ve Bollen, 2008).

Tehlike olasılığı,

ij i= i

h (t ) = P (T j | T  j) (2.1) biçimindedir.

(21)

6

Yaşam olasılığı ise, belirli bir zaman periyodunun ötesinde yaşama ihtimali veya bir olay yaşamaması ihtimali olarak tanımlanır. Yaşam olasılığı Eşitlik 2.2’ de verildiği gibidir (Bauldry ve Bollen, 2008)

j

j j j

j:t >t

S (t ) = P (T t ) =

f (t ) (2.2)

biçiminde ifade edilir.

Yaşam olasılığı aşağıdaki biçimde de yazılabilir:

j

ij ik

k=1

S (t ) =

(1- h (t ))

Bu eşitlik ile, tehlike olasılıklarının tahminlerini kullanarak belirli bir zaman noktasındaki tahmini yaşam olasılığını hesaplamak kolaydır (Bauldry ve Bollen, 2008).

2.3. En Çok Olabilirlik Fonksiyonu

En çok olabilirlik fonksiyonu, tehlike olasılıklarının tahminlerini elde etmek için en yaygın kullanılan yaklaşımdır. Kesikli zamanlı yaşam çözümlemesi modelleri için, olasılık fonksiyonu, olay meydana geldiğinde veride gözlemlenme ihtimalini ifade eder. Gösterge değişkeni (δij), her zaman dönemi için bir birimin olayı yaşayıp yaşamadığını gösterir.

Tehlike, birimin risk döneminde, olayı yaşama ihtimalini gösterir. Dolayısıyla, i. birim, j zaman döneminde olayı yaşarsa, olasılık fonksiyonuna h(tij) şeklinde; i. birim, j. zaman dönemi olayı yaşamazsa, olasılık fonksiyonuna 1-h(tij) şeklinde yansır. Durum tüm birimler ve tüm zaman aralıklarında risk grubunda kalmaya devam ederse, olabilirlik fonksiyonu aşağıdaki gibi yazılabilir (Bauldry ve Bollen, 2008):

i

ij ij

N J

δ 1-δ

ij ij

i=1 j=1

L =  ( h (t ) (1- h (t )) )

Kesikli zaman diliminde, logit bağlantı fonksiyonu en çok kullanılan model olarak, çoğunlukla hem zamanla değişmeyen hem de zamanla değişen kovaryansları içerebilir.

Tehlike olasılığının logit'i,

(22)

7

ij ij

h (t ) log 1- h (t )

 

 

 

 

biçiminde yazılabilir (Bauldry ve Bollen, 2008).

Modelin bu biçiminde zamana bağlı değişken, her bir zaman periyodu için aynı olacak şekilde sınırlandırılmıştır. Buna orantılı tehlikeler özelliği denir. Orantılı tehlikeler özelliği test edilebilir (Bauldry ve Bollen, 2008).

2.4. Cox Regresyon Modeli

Cox regresyon modeli (Cox orantılı tehlikeler modeli), yaşam süresini etkileyen faktörleri incelemek için en sık kullanılan yaşam çözümlemesi yöntemidir (Cox, 1972).

Cox regresyon modeli bir bağımlı değişken (başarsızlık süresi) ve bir ya da birden çok açıklayıcı değişkenin arasında olan ilişkiyi ele alan, bu ilişkiyi aynı zaman içerisinde açıklayabilen bir yöntemdir.

Cox regresyon modeli, h (t, x) = h (t)exp (β x)0

biçimindedir.

Bu modelde,  regresyon katsayıları vektörü ve h0t ise, açıklayıcı değişkene sahip olmayan bir birimin temel tehlike fonksiyonu olarak gösterilir (Ata ve ark., 2007).

Modeldeki katsayılar, kısmi olabilirlik fonksiyonu sayesinde tahmin edilir. Birbiriyle aynı olmayan başarısızlık süreleri sayısı k olmak üzere, kısmi olabilirlik fonksiyonu L

aşağıdaki gibi hesaplanır:

j

k

i j

j R i=1

L(β) = exp (β x ) / exp (β x )

(23)

8

Burada xi, i. sıralı başarısızlık zamanı ti ’de başarısız olan birimlerin açıklayıcı değişkenler vektörüdür. Paydadaki toplam, ti zamanda riskte olan birimler üzerinden exp'x

değerlerinin toplamıdır (Tuncer, 2014).

Regresyon katsayılarının en çok olabilirlik tahminleri, lnL ile hesaplanır. Sonra Newton- Raphson algoritması yardımıyla iteratif çözümlemeler yapılır ve  katsayıları tahmin edilir (Tuncer, 2014).

Cox regresyon modelinde yer alan ve gösterimi exp(β) biçiminde olan tehlike oranı, durumlar arasındaki farklılığın kaç kat olduğunu gösterir. 1’den küçük tehlike oranı riskin az olduğunu ifade ederken 1’den büyük tehlike oranı riskin fazlalığını ifade eder. 1’e eşit tehlike oranı değeri ise durumlar arası farklılık olmadığını gösterir. Ayrıca Cox regresyon modeli için tehlikenin zaman içinde değişmemesi veya orantılı olması beklenir.

Cox regresyon modelinin; normallik varsayımı, varyans bağımsızlığı gibi parametrik modellerin varsayımları sonuç vermediğinde kullanılması daha etkilidir (Bulut, 2011;

Tuncer, 2014).

2.5. Orantılı Tehlikeler Varsayımı

Cox regresyon modelinin ana varsayımı orantılı tehlikeler varsayımıdır. Tehlike oranının zaman içinde değişmezliği ya da birimlerin birbirlerinin tehlikelerine orantılı olması, orantılı tehlikeler varsayımını göstermektedir (Grambsch ve Therneau, 2000; Ata, Karasoy ve Sözer, 2007).

* * * *

1 2 P

X = (x , x ,..., x ) ve X = (x , x ,..., x )1 2 P iki birime ait açıklayıcı değişkenler vektörü olmak üzere tehlike oranı (TO),

p

* j j 0

* p

j=1 *

j j

p j

0 j=1 j j j=1

exp ( ˆ x ) h (t) h (t, X )

TO = = = exp β (x - x )

h (t, X) exp ( β x ) h (t)

 

 

 

 

β

biçimindedir.

(24)

9

x* ve x herhangi bir değer aldığında tehlike oranı tahmininde zamana bağlılık olmadığından üstel değer değişmez. Bu duruma göre orantılı tehlikeler varsayımını gösteren matematiksel ifade,

h (t, x )*

θ =

h (t, x) veya

h(t, x ) = θ h(t, x)*

biçimindedir.

Orantılı tehlikeler varsayımını incelemek için log(-log) yaşam eğrileri, schoenfeld artıkları ile yaşam süresinin rankı arasındaki korelasyon testi, gözlenen ve beklenen yaşam eğrileri ve arjas grafikleri gibi birçok yöntem bulunmaktadır (Yılmaz ve ark., 2013; Keskin, 2015).

Kullanımı yaygın olan grafiksel yöntem, log(-log) yaşam eğrileri, açıklayıcı değişkenlerin farklı düzeyleri üzerinden -ln(-ln) yaşam eğrileri tahminlerinin karşılaştırılmasını sağlamaktadır. Ortaya çıkan paralel yaşam eğrileri orantılı tehlikeler varsayımının sağlandığının kanıtıdır (Grambsch ve Therneau, 2000; Ata ve ark., 2007).

Uyum iyiliği testi yaklaşımının grafiksel karşılığı olan gözlenen yaşam olasılıkları ile beklenen yaşam olasılıklarının çizimlerinin kullanımı, orantılı tehlikeler varsayımını değerlendirmek için idealdir. Beklenen yaşam olasılıkları çizimi için, tahmin edici içeren Cox regresyon modeli oluşturulur. Yaşam eğrisinin tahmini, tahmin edicinin her bir sınıfı için değerler formülde yerlerine konularak elde edilir. Beklenen ve gözlenen yaşam eğrileri arasında yakınlık varsa, tahmin edicinin her bir sınıfı için orantılı tehlikeler varsayımının sağlandığı düşünülebilir. Ancak bir ya da birden çok sınıf için bu eğriler arasında fark varsa, varsayımın sağlanmadığı göz önünde bulundurulur (Ata ve ark., 2007) .

Uyum iyiliğini ölçme amacıyla kullanılan Arjas grafikleri ise orantılı tehlikeler modelinde kullanılan grafiksel bir yöntemdir (Arjas, 1988).

Zamana bağlı değişkenler; zamana bağlı olmayan değişkenin orantılı tehlike varsayımını doğrulayıp doğrulamadığı hakkında bilgi verebilir.

(25)

10

Bu durum için kurulan Cox regresyon modeli,

h (t, x) = h (t) exp [βx + δ (x g(t))] 0

biçimindedir. g (t) fonksiyonu için farklı seçenekler vardır.

Genişletilmiş Cox regresyon modelinde ise, çarpım terimlerinin önemliliği için ölçüm yapılarak orantılı tehlikeler varsayımı değerlendirilmektedir. Yokluk hipotezi, H0:0 biçimindedir. Yokluk hipotezi kabul edilirse, model tek bir değişken içeren orantılı tehlikeler modeline getirilerek daha kolay çözümlenebilir (Ata ve ark., 2007).

Orantılı tehlikeler varsayımının başka bir kontrol yöntemi olan Schoenfeld artıkları, nesnellik özelliği gösterir. Ayrıca açıklayıcı değişkenin asıl değeri ve ağırlıklı risk ortalaması arasında çıkan fark olarakta tanımlanır. Artıklar yatay doğru etrafında tesadüfi dağıldığında orantılı tehlikeler varsayımı sağlanır, aksi takdirde grafik bir trende sahipse orantılı tehlikeler sağlanmaz yorumu yapılabilir (Ata, Karasoy ve Sözer, 2007).

Yaşam süresi bağımlı değişken olan ve açıklayıcı değişkenlerin yaşam süresi üzerindeki etkilerine odaklanan regresyon modellerinin yaşam çözümlemesinde büyük bir önemi vardır. Cox regresyon modelinde orantılı tehlikeler varsayımı sağlanmadığı takdirde yaşam verisi ile yeni bir modelleme yapılabilmesi için birçok yaklaşım bulunur (Grambsch ve Therneau, 2000; Ata ve ark., 2007).

2.6. Parametrik Dağılımlar

Genellikle, belli bir olayın belirli bir zamanda başarısızlıkla sonuçlanmasına neden olan birçok somut sebep vardır. İmkansız olmasa da, somut olmayan nedenleri matematiksel olarak hesaba katmak zordur. Bu nedenle, yaşam çözümlemesinde veriye uygulanacak dağılımın seçimi oldukça önemlidir (Lee ve Wang, 2003).

Yaşam çözümlemesinde yaygın olarak kullanılan parametrik dağılımlar ise;

 Üstel dağılım

 Weibull dağılım

(26)

11

 Log-normal dağılım

 Log-lojistik dağılım

 Gamma dağılımıdır.

2.6.1. Üstel Dağılım

Üstel dağılım, yaşam çözümlemesi çalışmalarında en kolay uygulanan önemli bir dağılımdır. 1940'larda, araştırmacılar elektronik sistemlerin yaşam şeklini analiz edip tanımlamak amacıyla üstel dağılımı kullanmaya başlamışlardır. Davis’in 1952’de banka hesap özeti, bordro çek hataları gibi konular üzerinde üstel dağılımı kullanarak bir dizi örnek vermesinden sonra; Epstein ve Sobel (1953) neden üstel dağılımı seçtikleri ve parametrenin nasıl tahmin edileceği sorularına cevap aramışlardır. Epstein (1958) ayrıca üstel bir dağılımın varsayımı gerekçesini biraz ayrıntılı olarak tartışmıştır. Üstel dağılım o zamanlardan beri, istatistiğin diğer alanlarındaki çalışmalarında da sürekli olarak rol oynamaya devam etmiştir. “Tamamen Rasgele Başarısızlık Modeli” olarak da ifade edilen üstel dağılım, bazı durumlarda yaşam çözümlemesi verisini anlamayı kolaylaştırsa da, birçok veri için yeterli açıklama sağlayamamaktadır (Lee ve Wang, 2003; İnceoğlu, 2013;

Keskin, 2015).

Üstel dağılımın tehlike fonksiyonu güvenilirlik altında yaygın olarak kullanılmaktadır.

Üstel dağılımın tehlike fonksiyonu ve yaşam fonksiyonu sırasıyla, h (t;β) = β , t-1 0

t

0

S (t;β) = exp [- h(u)du] = exp (-t / β)

biçimindedir.

Dağılım fonksiyonu ve olasılık yoğunluk fonksiyonu ise sırasıyla, F (t;β) = 1- exp (-t / β) , t0

f (t;β) = β exp (-t / β) , t-1 0

biçimindedir.

(27)

12

2.6.2. Weibull Dağılımı

Weibull dağılımı üstel dağılımın daha genel bir hali olmakla birlikte daha esnek bir dağılım sınıfına sahiptir. Ancak geniş bir uygulama alanına sahip olan Weibull dağılımının üstel dağılımdan farkı sabit tehlike oranına sahip olmamasıdır. Dağılım 1939’da Weibull tarafından önerilmiştir (Weibull, 1939) ve Weibull tarafından 1951’de çeşitli başarısızlık durumlarına uygulanması tartışılmıştır (Weibull, 1951).

Daha sonra birçok güvenilirlik ve hastalıklardan ölüm çalışmalarında kullanılmıştır.

Günümüzde ise Weibull dağılımı sigortacılık ve risk gibi çalışma alanlarının yanında yaşam çözümlemesinde de yaygın olarak kulllanılmaktadır. Ayrıca Weibull dağılımı, başarısızlık gözlemlenene kadar geçen süreyi ya da başarısızlık gözlemlendikten sonra yeniden bir başarısızlığın oluşmasına kadar geçen süreyi modellemede kullanılır (Lee ve Wang, 2003; Tamam, 2008).

Weibull dağılımı iki parametrelidir ve W(α, β) ile gösterilir. Bu dağılım Johnson v.d.

(1970) ve Barnett (1982) ’den farklı başka araştırmacılar tarafından da çalışılmıştır (İnceoğlu, 2013).

Tehlike fonksiyonu,

-1 -1 α-1

h (t, α,β) = α β (β t) ile verilir.

Weibull dağılımı için yaşam fonksiyonu,

 

-1 α

S(t, α,β) = exp - β t 

 

 

ve dağılım fonksiyonu,

 

α

F (t; α,β) = 1- exp - t / β  , t 0 biçiminde verilir.

Burada β ölçek ve α ise biçim parametresidir. α=1 ise Weibull dağılımı üstel dağılıma dönüşmektedir.

(28)

13

Buradan Weibull dağılımının olasılık yoğunluk fonksiyonu,

 

α

-1 -1

f (t, α,β) = α β (β t) exp - t / β  , t 0 ile ifade edilir (Ersoy, 2005).

2.6.3. Log-Normal Dağılım

Log-normal dağılım, logaritması normal dağılımı izleyen bir değişkenin dağılımı şeklinde tanımlanabilir. Öncelikle, McAlister (1879) dağılımın açık teorisini, Gandum (1945a,b) biyoloji alanındaki uygulamaları çalışmışlardır. Bu çalışmaları Boag’ın (1949) kanser araştırmalarındaki uygulamaları takip etmiştir. Bu dağılım Aitchison ve Brown (1957) tarafından ayrıntılı olarak tartışılmıştır (Lee ve Wang, 2003).

Yaşam çözümlemesi için kullanılacak verinin üzerinde hangi dağılımın uygulanacağı kararının verilmesi oldukça önemlidir. Bazen hangi dağılımın ve ona uygun modelin kullanılacağı bir nedene dayalı olabilirken bazen de veriye uyum sağlaması beklenen model, istenileni sağlasa dahi tehlike fonksiyonunun formundan dolayı kullanılmayabilir.

Log-normal dağılımda da bu durum gözlenebilmektedir. İki dağılım, benzeyen olasılık yoğunluk fonksiyonlarına sahip olabilirken farklı tehlike fonksiyonlarına sahip olabilir.

Böyle bir durumla karşılaşıldığı takdirde tehlike fonksiyonunun yapısına ilişkin bir varsayım veya bilgi sayesinde, dağılımlarından birini uygulamak için karar verilir (İnceoğlu, 2013).

Eğer logT , μ ortalama ve σ 2 varyansı normal dağılıma sahip ise, T rasgele değişkeninin μ ve σ parametreli log-normal dağılıma sahip olduğu söylenir. Log-normal dağılımın tehlike fonksiyonu,

h (t;μ, σ) = f (t) S (t) -1

ile verilir. Log-normal dağılım için yaşam fonksiyonu, lnt - μ

S(t,μ, σ) = 1-

σ

 

  

ile verilir. Burada, Φ normal birikimli dağılım fonksiyonudur.

(29)

14

Eğer T rasgele değişkeni log-normal dağılıma sahip ise T~ln( μ, σ )ilen gösterilir. Böylece T ~ ln ( μ, σ )’ in dağılım fonksiyonu,

lnt - μ

F (t,μ, σ) = Φ , t > 0 σ

 

 

 

ile verilir.

Buradan olasılık yoğunluk fonksiyonu ise,

-1 2 2

f (t;μ, σ) = 1 t exp - (logt - μ) / 2σ , t > 0

σ 2π  

ile verilir (Ersoy, 2005).

2.6.4. Log-Lojistik Dağılım

Log-lojistik dağılım; α ve λ olmak üzere iki parametreye sahiptir (Lee ve Wang, 2003).

Ayrıca log(T)'de lojistik dağılım görüldüğünde T yaşam süresininde log-lojistik dağıldığı söylenirken bu dağılımın ilk artan sonrasında azalan bir grafiğe sahip olduğu bilinmektedir.

Log-lojistik dağılımı, Weibull dağılımının alternatifi olarak ifade edilmektedir. Bunun nedeni ise; Weibull tehlike fonksiyonunun kısıtlı olduğu zamanlarda log-lojistik dağılımının kullanılabilir olmasıdır.

Log-lojistik tehlike fonksiyonu,

α α -1

h (t, α, λ) = α λ t (1+ λt ) , t0 ile verilir.

Log-lojistik dağılımı, monoton artan (α>1) veya monoton bir şekilde azalan tehlikeyi (α ≤ 1) tanımlamak için kullanılabilir. Yaşam fonksiyonu,

S (t, α, λ) = [1+ λt ] , tα -1 0 ile verilir.

(30)

15

Log-lojistik dağılımın dağılım fonksiyonu,

α α -1

F (t;α, λ) = λ t [1+ λt ] , t0

biçimindedir. Buradan olasılık yoğunluk fonksiyonu,

α-1 α -2

f (t;α, λ) = λ t [1+ λt ] , t 0

eşitliği ile verilir. Böyle bir olasılık yoğunluk fonksiyonuna sahip T rasgele değişkeni için λ ve α parametreli Log-lojistik dağılımı sahip olduğu söylenebilmektedir (İnceoğlu, 2013).

2.6.5. Gamma ve Genelleştirilmiş Gamma Dağılımı

Üstel ve Ki-kare dağılımını içinde bulunduran Gamma dağılımı; ilk olarak bir kafeteryada kullanılmakta olan cam bardakların ömrü için Brown ve Flood (1947) tarafından önerilmiş daha sonra Birnbaum ve Saunders (1958) tarafından materyallerin yaşam uzunluğunu tespit etmek için istatistiksel bir model olarak kullanılmıştır. O zamandan beri, bu dağılım endüstriyel güvenilirlik problemleri ve yaşam süresi için bir model olarak sıkça kullanılmaktadır. (Lee ve Wang, 2003).

 , (0,1) aralığında olduğunda grafiğin azalan bir ivme gösterdiği, başka bir deyişle zaman, sonsuza doğru giderken tehlike oranının durgun halde λ’ya doğru azaldığı söylenebilir.

=1 olduğunda ise tehlike oranı λ’ya eşit sayılırken >1 olduğunda ise zaman artarken tehlike oranının λ’ya doğru arttığı böylece grafiğin artan bir ivme kazandığı söylenebilir.

Gamma dağılımının olasılık yoğunluk fonksiyonu, λ -λt

f (t) = (λt) t > 0, λ > 0, γ > 0 Γ (γ)

biçimindedir. Burada  şekil, λ ölçüm parametresidir. Yani ’daki değişim grafiğin şeklini, λ’daki değişim ise ölçümünü değiştirmektedir.

(31)

16

> 1 iken grafik bir tepe noktasına sahip olduğu zaman, bu tepe noktasıt = (γ -1) / λ biçimindedir.

Gamma dağılımı için yaşam fonksiyonu ve tehlike fonksiyonu sırasıyla,

n-1 k -t

k=0

S (t) = e (λt)

k !

n-1 n-1

k k=0

λ (λt) h (t) =

(n -1)! ( ) (λt)1

k!

biçimindedir.

Genelleştirilmiş Gamma dağılımının λ, α ve  olmak üzere üç parametresi bulunmaktadır.

Genelleştirilmiş Gamma dağılımının olasılık yoğunluk fonksiyonu,

αγ

αγ-1 α

f (t) = α λ t exp [- (λt) ] , t > 0, γ > 0, λ > 0, α > 0 Γ (γ)

biçimindedir.

Üstel, Weibull, log-normal ve Gamma dağılımları, Genelleştirilmiş Gamma dağılımının özel halleridir. Buna göre;

α = = 1 ise Üstel dağılım,

→ 1 ise Weibull dağılımı,

→ ∞ ise Log-normal dağılım,

𝛼 = 1 ise Gamma dağılımı elde edilir (Lee ve Wang, 2003; Keskin, 2015).

(32)

17

3. YAPISAL EŞİTLİK MODELLERİ

Yapısal Eşitlik Modelleri (YEM), gizli ve gözlemlenen değişkenler arasındaki ilişkileri temsil eden çoklu tanımlama sistemlerinden oluşan istatistiksel modellerin genel bir sınıfıdır. Genel doğrusal modeller, faktör analizi ve eş zamanlı denklemler hepsi YEM'lerin özel halidir (Anderson ve Gerbing, 1988).

Çoklu regresyon analizi ve faktör analizi birleşimi olarak kabul edilebilen YEM’lerin tarihçesi doğrulayıcı faktör analizi, açıklayıcı faktör analizi, çoklu regresyon analizi ve yol analizine dayanır (Bayram, 2010; Köseoğlu, 2013).

Gözlenemeyen değişkenleri de bazı çalışmalarında kullanan ve ilgi alanı genetik bilimi olan Sewell Wright yapısal eşitlik modelini ilk kez ele alan bilim insanıdır. Ancak, Duncan’ın 1966 yılında sosyal bilimlere yapısal eşitlik modellerini tanıtana kadar geçen sürede, sosyal bilim alanında çalışanlar Wright’ın çalışmalarını pek önemsememişlerdir (Hair, 1998;

Yener, 2007).

Ayrıca YEM için en önemli gösterimlerden biri olan yol diyagramına, Keesing (1972), Joreskog (1973) ve Willy (1973) (JKW modeli) tarafından model kurma aşamalarında veri analizinde yer verilmiştir. Gözlemlenemeyen değişkenlerin de eklenmesiyle modellerin daha karışık bir hal alması 60’lar ve 70’ler arasında gerçekleşmiştir. Örneğin, Blalock 1963 yılında değişkenlerin birbirinden etkilenebileceğini düşünürken, Duncan, Haller ve Portes ise gözlemlenemeyen değişkenlerin arasında ilişkinin var olabileceğini deneysel olarak ortaya koymuşlardır. Daha sonra Bentler ve Weeks (1980), Mcardle ve ark. (1984) alternatif önerilerde bulunmuşlar, ancak en yaygın olan Maksimum Benzerlik yöntemi 1973 yılında Joreskog tarafından önerilmiştir (Hair 1998; Yener, 2007).

Yapısal eşitlik modellemesi, regresyon gibi istatistiksel yöntemlere oranla, birden fazla bağımlı ve bağımsız değişkenler arasında ölçülen ilişkinin modellenmesi ile kompleks bir problemi kapsamlı bir biçimde çözmeyi sağlamaktadır (Anderson ve Gerbing, 1988).

3.1.Yapısal Eşitlik Modelleri Stratejileri

YEM, modelleme bakımından üçe ayrılmaktadır (Joreskog, 1993):

(33)

18

3.1.1. Doğrulayıcı Modelleme Stratejisi

Bu tür çalışmaların asıl amacı; tam anlamıyla doğrulanma sağlanamasa da, modelin veri için doğrulanıp doğrulanmadığının görülüp teste tabii tutulmasıdır. Araştırmayı yapan kişi kullandığı modelin, muhtemel diğer modeller için doğrulanabilir olduğunu tahmin edebilmektedir. Doğrulayıcı senaryoda, araştırmacı teoriye dayanan tek bir modeli ele alır, uygun verileri toplar ve hipotez modelin uygunluğunu örnek verilerle test eder. Bu testin sonucundan, araştırmacı modeli reddetmekte ya da reddetmemektedir; modelde başka değişiklik yapılmamaktadır (Model, 2018).

3.1.2. Alternatif Modeller Stratejisi

Bu tür çalışmaların asıl amacı; bir sıra değişken modele koyulduğunda, bu değişkenler arasında var olan ilişkinin açıklanmasında söz konusu olan alternatif modellerden hangisinin veriyi en çok desteklediği belirlenebilmektedir. Alternatif modeller durumunda, araştırmacı, teoriye dayanan birkaç alternatif (yani rakip) model önermektedir. Tek bir veri kümesinin analizini takiben, örnek verileri temsil etmede en uygun olan modeli seçer.

Jöreskog (1993), hedefin hem anlamlı hem de istatistiksel olarak iyi uyuşan bir model bulmak olduğunu belirtmiştir (Joreskog, 1993; Model, 2018).

3.1.3. Model Geliştirme Stratejisi

Bu tür çalışmaların amacı, alternatif modeller içinden seçilmiş bir dizi değişken arasında olan ilişkiyi en iyi açıklayan modelin çözümlenmesi ve gerekli testler uygulanarak geliştirilmesidir (Model, 2018).

Bu üç şekilde incelenen stratejiler karşılaştırıldığında literatürde en çok kabul gören alternatif modeller stratejisidir. Çünkü birden çok modelin, değişkenler arasındaki ilişkilerin incelenmesinde benzer sonuçları verebilmesi muhtemeldir. Ayrıca bilimin her alanında ilerleme, alternatif yöntemlerin geliştirilmesiyle doğru orantılıdır. Böylece yapısal eşitlik modellemelerinden alternatif modeller stratejisinin, en çok kullanılan yöntem olması anlamlı olmuştur (Model, 2018).

Ayrıca alternatif modeller stratejisinin bir diğer avantajı, ele alınan değişkenler arasındaki ilişkilerin açıklanmasının test edilen model tarafından yapıldığına dair daha kuvvetli

(34)

19

kanıtların verilmesine imkan sağlamasıdır. Ayrıca, araştırmacının elinde alternatif bir model olmasa dahi, işlenen değişkenler göz önüne alındığında diğer modellerin de test edilmesi beklenir, çünkü YEM çalışmalarında rastgele bir doğrulama gerçekleşebilir (Bentler, 1980; Model, 2018).

YEM’in, aracılık etkisiyle incelemeyi kolay bir hale getirirken aynı zamanda ele alınan modelde yer alan ilişkilere yeni düzenlemeler önerdiği gözlenmektedir. Ayrıca YEM ile kurulan model ölçüm hatasını da kapsadığından istenen hipotezlerin test edilebilmesi veya yeni modellerin ortaya çıkarılması için kullanılmaya uygun bir yöntem olarak bilinmektedir (Dursun ve Kocagöz, 2010).

Regresyon çözümlemesi ise, bağımsız değişkenlerin ve etkilediği düşünülen bağımlı değişkenin arasındaki ilişkiyi inceleyen istatistiksel veri çözümleme tekniğidir. Regresyon çözümlemesi sadece değişkenler arasındaki doğrudan ilişkileri incelemektedir. Yapısal eşitlik modelinde yer alan her bir ilişki dolaylı etkilerde ön planda tutularak aynı zamanlı değerlendirilmeye alınabilmektedir. Bu durum regresyon çözümlemesi ve yapısal eşitlik modelleri arasındaki farklardan bir tanesi sayılabilmektedir (Dursun ve Kocagöz, 2010).

YEM esas alınarak gerçekleşen çözümleme, regresyon çözümlemesi yardımı ile yapılabiliyor olsa bile her bir değişken arasındaki ilişki için ayrı model kurulması gerekmektedir.

Ancak yapısal eşitlik modellerinde kullanılan adımlar ve ayrıca hazırlanan yol diyagramı sayesinde değişkenler arasında bulunan her ilişki tek bir analizle ortaya çıkarılabilmektedir.

Hatta ölçmeden kaynaklanan hata payı hazırlanan yol diyagramında yok sayılabilmektedir.

Yapısal eşitliğin bu özelliği ise diğer çözümleme türlerine göre üstünlük olarak sayılabilmektedir (Dursun ve Kocagöz, 2010).

YEM; gözlenen değişkenler ve gizli değişkenler arasında bulunan nedensellik ve korelasyon ilişkilerini aynı anda kapsayan modellerin ölçülmesi için kullanılan istatistiksel bir yöntem olmasının dışında bağımlılık ilişkilerini tahmin etmek için, varyans, kovaryans çözümlemeleri, faktör analizi ve çoklu regresyon gibi çözümlemelerin bir araya gelmesiyle oluşan çok değişkenli bir yöntemdir. Yapısal eşitlik modellemesi özellikle sosyoloji,

(35)

20

Ψ21

Ψ 23

λ11

λ21

λ31

λ42

λ52

λ73 λ83

λ93

psikoloji, satış vb. alanlarda değişkenler arasındaki ilişkilerin yorumlanmasında ve modellerin testinde kullanılabilmektedir (Tüfekçi ve Tüfekçi, 2006).

Gizli değişkenler, YEM yönteminin en temel kavramlarından birisidir. Müşteri memnuniyeti, kalite algılanışı gibi kavramlar gizli değişkenlere örnek olarak verilebilmektedir. Bu değişkenler gözlenemediği için doğrudan ölçülememektedir. Bu yüzden, araştırmacı, gizli değişkeni modelde işlemsel olarak tanımlamak için, gizli değişkeni gözlenebilir değişkenlerle ilişkilendirmektedir (Yılmaz, 2004a). Yapısal eşitlik modellerinin esas özelliği, teorik yapıya sahip olması ve gizli değişkenler için nedensel yapının dikkate alınabilir olmasıdır (Yılmaz, 2004b). Verilerin model içinde anlamlı ya da anlamsız olduğunu ölçmek için kullanılan en yaygın yöntem olan yapısal eşitlik modelleri, iki evreden oluşmaktadır. İlk evre modeldeki ölçümlerin doğru ölçülüp ölçülmediğine ilişkin doğrulamaya yöneliktir. İkinci evre ise oluşturulan yapısal modellerin incelenmesidir (Dursun ve Kocagöz, 2010). Şekil 3.1.’de basit bir ölçme modeli örneğine yer verilmiştir.

δ1 δ2 δ3

δ4 δ5 δ6

δ7 δ8 δ9

Şekil 3.1. Ölçme modeli örneği X1

X2

X3

X4

X5

X6

X7

X8 X9

ζ1

ζ2

ζ3

Ψ 31

λ62

(36)

21

Ölçme modeli örneğindeki semboller Çizelge 3.1’ de verilmiştir (Dursun ve Kocagöz, 2010).

Çizelge 3.1. Örnek ölçme modelindeki sembollerin açıklamaları

Sembol Karşılığı

ζ Gizli değişken

X Gözlenen değişken

λ Gizli değişkeni gözlenen değişkene bağlayan yol katsayısı Ψ Gizli değişkenlerin arasındaki ilişki değerleri

δ Gözlenen değişkendeki hata

Yapısal eşitlik modelleri, gizli değişken modeli ve ölçüm modeli olmak üzere iki temel bileşene sahiptir.

Gizli değişken modeli;

i η i i i

η = α +β η + Γ ξ + ζ

biçimindedir.

Burada ηi gizli içsel (endojen) değişkenlerin bir vektörü, αn ise bir kesme vektörüdür.β, gizli içsel değişkenlerin birbirleri üzerindeki etkilerini içeren bir matris katsayısı, ξi, gizli dışsal (eksojen) değişkenlerin bir vektörü, Γ, gizli dışsal değişkenlerin gizli içsel değişkenler üzerindeki etkilerini içeren bir katsayı matrisi ve ζi ise bir artık vektörüdür. i alt dizini, örnekte i. durumu endeksler (Bauldry ve Bollen, 2008).

Bu modelde E(ζi) = 0; Cov(ξi; ζi) = 0, ve (I-B) ters çevrilebilir. İçsel değişkenler sistemdeki diğer değişkenlerden etkilenirken, dışsal değişkenler denklem sisteminin dışında belirlenir.

Ölçüm modeli gizli gözlemlenen değişkenlerle ilişkilendirir. Aşağıdaki iki denklem bu ilişkiyi ele almaktadır:

i y y i i

Y = α + Λ η + ε

i x x i i

X = α + Λ ξ + δ

(37)

22

Burada Yi ve Xi, sırasıyla ηi ve 𝜉i'deki gizli değişkenlerin göstergelerine ait vektörlerdir, αy

ve αx, kesişme terimlerinin ilgili vektörleri, Λy ve Λx, faktör yüklemelerinin ilgili matrisleridir ve

𝜀

i ve δi, bozuklukların vektörleridir. E (

𝜀

i) = E (δi) = 0‘dır. Ayrıca

𝜀

i; δi; 𝜉i; ve ζi tümüyle ilişkisizdir (Bauldry ve Bollen, 2008).

Zaman içinde, modelde kategorik bağımlı değişkenlerin de hesaba katılması için YEM'ler genelleştirilmiştir. Bağımlı bir değişken modeli aşağıdaki şekilde yazılabilir:

*

i i i

Y = X β + ε

Burada Yi*, gözlenen kategorik değişken Yi ile ilişkili, gözlemlenmeyen bir sürekli değişkendir. Tam ilişki, kategorik değişkenin niteliğine bağlıdır.

Herhangi bir ikili değişken için, ilişki aşağıdaki şekilde yazılabilir (Byrne, 2012):

* i

i *

i

1 , Y > τ Y =

0 , Y τ



 

Bu denklem bir eşik modelini temsil eder. Altta yatan sürekli değişkeni eşik bir miktar τ'yi aştığında, 1 gözlenir, aksi takdirde 0 gözlenir. Modelin tanımlanması için, artık

𝜀

i için bir dağılım varsaymalıdır (Bauldry ve Bollen, 2008).

3.2. Gizli ve Gözlenen Değişkenler

Araştırmacılar genellikle davranış bilimleri üzerinde çalışırken soyut yapılar üstünde inceleme yaparlar. Bu soyut olgular doğrudan gözlemlenemediğinden gizli değişkenler olarak adlandırılır. Örneğin; psikolojideki gizli değişkenler depresyon veya motivasyon sayılabilirken, sosyolojide; profesyonellik, eğitimde; sözel yetenek ve öğretmen beklentisi, ekonomide ise, kapitalizm ve sosyal sınıftır (Byrne, 2012).

Gizli değişkenler doğrudan gözlenmez ve doğrudan ölçülemez oldukları için, araştırmacı, ilgilendiği gizli değişkeni ve onu temsil ettiği düşünülen davranışı işlevsel olarak tanımlamalıdır. Bu şekilde, gözlemlenmemiş değişken, gözlemlenebilir değişkenle bağlantı kurar, böylece ölçülebilir. Davranışın değerlendirilmesi, gözlemlenmemiş bir değişkenin dolaylı olarak ölçülmesinin yanı sıra, gözlenen bir değişkenin doğrudan ölçümünü

(38)

23

oluşturur. Bu terim, en geniş anlamıyla herhangi bir ölçme aracından türetilen puanları içerecek şekilde kullanılır. Bu nedenle gözlem, örneğin, bir tutum ölçeğine ilişkin öz- bildirim yanıtlarını, bir başarı testine ilişkin puanları, bir fiziksel görevi ya da mülakat sorularına kodlanmış cevapları ve benzerlerini içerebilir. Ölçülen bu puanlar gözlemlenen değişkenler olarak adlandırılır. Gözlemlenen değişkenlerle gözlemlenmemiş değişkenler arasındaki bu gerekli geçiş süreci göz önüne alındığında, araştırmacıların, değerlendirme ölçütlerinin seçiminde çevresel faktörleri ele alma nedenleri açıkça gösterilmelidir (Byrne, 2012).

3.2.1. Dışsal ve İçsel Gizli Değişkenler

Dışsal olan ve içsel olan gizli değişkenleri ayırt etmek için YEM incelenebilir. Dışsal gizli değişkenler bağımsız değişkenler anlamına gelirken dışsal değişkenlerin değerlerinde meydana gelen değişiklikler model tarafından açıklanmamaktadır. Bu yüzden, modeli;

cinsiyet, yaş ve sosyoekonomik durum gibi dış faktörlerin etkilediği düşünülmektedir. İçsel gizli değişkenler bağımlı değişkenler anlamındadır ve modeldeki dışsal değişkenlerden doğrudan ya da dolaylı olarak etkilenmektedir. Ayrıca, dışsal değişkenin aksine, içsel değişkenlerin değerlerindeki dalgalanma model tarafından açıklanmaktadır. Çünkü onları etkileyen tüm gizli değişkenler modele dahil edilmektedir (Byrne, 2012).

3.3. Faktör Analitik Modeli

Gözlemlenen ve gizli değişkenler arasındaki ilişkileri araştırmak için en eski ve en iyi bilinen istatistiksel işlem, faktör analitik modelidir. Bu yaklaşım, veri analizine yönelik olarak, bir faktör analizi bağlamında, gizli yapılar hakkında bilgi toplamak için gözlemlenen değişkenler arasındaki ilişkiyi incelemektedir. Açıklayıcı (Keşif) faktör analizi (AFA) ve Doğrulayıcı faktör analizi (DFA) olmak üzere iki temel faktör analizi türü bulunur (Byrne, 2012).

1970’lerden önce faktör analizine dayanan hipotez testi çalışmaları yürüten bilim adamlarından sonra Bock ve Bargmann (1966) ile Jöreskog (1969) gözlemlenen değişkenlerin modellere uygun olup olmadığını incelemeye başlamışlardır. Bu çalışmalar, açıklayıcı faktör analizi ve doğrulayıcı faktör analizi olmak üzere faktör analizinin iki türe ayrılmasına sebep olmuştur. Böylece 20. yüzyılın başlarında faktör analizi kavramını ilk

(39)

24

kez ortaya atan Spearman tarafından gerçekleştirilen analiz, açıklayıcı faktör analizi olarak adlandırılmıştır. (Bektaş, 2015; Uğurlu ve Aylar, 2017).

AFA, gizli ve gözlenen değişken bağlantıların belirli olmadığı durumlar için uygulanabilmektedir. Bu özellik sayesinde araştırmacı analizini, gözlemlenen değişkenlerin bağlı olduğu faktörlere ne kadar, nasıl bağlı olduğu sorularını göz önünde bulundurarak bu faktörlerin minimum sayısını belirlemek için şekillendirmektedir (Byrne, 2012).

DFA ise ilk olarak Howe (1955), daha sonrasında sırasıyla Anderson ve Robin (1956), Lawley’in (1958) çalışmalarıyla ortaya çıkmıştır. Jöreskog (1960) tarafından bu model daha sonra geliştirmiştir (Tomer, 2003; Köseoğlu, 2013).

DFA’da ise araştırmacı, altta yatan gizli değişken yapısı hakkında bazı bilgilere sahip olduğunda kullanır. Bu teori, gözlemlenen değişkenler ve onların faktörleri arasında bulunan ilişkiyi daha önceden belirleyerek, bu yapıyı istatistiksel anlamda ölçmektedir (Byrne, 2012).

Özetle, faktör analitik modeli (AFA veya DFA) sadece gözlemlenen değişkenlerin altta yatan gizli faktörlerine nasıl ve ne ölçüde bağlı olduğuna odaklanır. Bu nedenle faktörlerden gözlemlenen değişkenleri olan regresyon modellerinin gücü araştırmacıların ilgi alanına girmektedir (Byrne, 2012).

3.4. İstatistiksel Modellemenin Genel Amacı ve Süreci

İstatistiksel modeller, gözlenen değişkenin altında yatan gizli yapıyı açıklamanın etkili ve uygun bir yolunu sağlar. Bir dizi denklem aracılığıyla ya şematik ya da matematiksel olarak ifade edilir. Bu tür modeller, gözlemlenen ve gizli değişkenlerin birbiriyle nasıl bağlantılı olduğunu açıklar (Byrne, 2012).

Bir araştırmacı, ilgili teori hakkındaki bilgisine, çalışma alanındaki deneysel araştırmalara ya da her ikisinin bir kombinasyonuna dayanarak bir istatistiksel modeli benimsemektedir.

Model belirlendikten sonra araştırmacı, modeldeki tüm gözlemlenen değişkenleri içeren örnek verilere dayanarak uygunluğunu test eder. Araştırmacı için ilk aşama, hipotez model ve örnek veriler arasındaki uygunluğu saptamaktır. Bu nedenle, araştırmacı örnek veriler

(40)

25

üzerinde hipotez modeli uygular ve sonra gözlemlenen verilerin bu sınırlı yapıya ne kadar uyduğunu test eder. Çünkü gözlemlenen veriler ile hipotezi hazırlanmış model arasında mükemmel bir uyumun olma olasılığı azdır. Bu nedenle ikisi arasında bir farkın olması kaçınılmazdır; bu durum artık olarak adlandırılır.

Model kurma süreci, Veri= Model + Artık

biçiminde gösterilir (Byrne, 2012).

Denklemde; veri, türetilmiş gözlemlenen değişkenlerle ilgili skor ölçümlerini temsil eder;

model, gözlemlenen değişkenleri gizli değişkenlere bağlayan hipotezlenmiş yapıyı temsil eder ve bazı modellerde belirli gizli değişkenleri birbirine bağlar; son olarak artık, hipotez model ve gözlenen veriler arasındaki uyuşmazlığı temsil eder (Byrne, 2012).

Genel YEM, ölçüm modeli ve bir yapısal model olmak üzere iki alt modele ayrılabilir.

Ölçüm modeli, gözlemlenen ve gözlemlenmeyen değişkenler arasındaki ilişkileri tanımlarken; yapısal model ise, gözlemlenmemiş değişkenler arasındaki ilişkileri tanımlamaktadır.

3.5. Genel Yapısal Eşitlik Modelleri Sembol Gösterimi

Yapısal eşitlik modelleri, dört geometrik sembolün bir daire (veya elips), bir kare (veya dikdörtgen), tek başlı bir ok ve bir çift başlı okun özel birleşimiyle şematik olarak tasvir edilmiştir. Kurallara göre, daireler (veya elips), gözlemlenmemiş değişkenleri, tek-başlı oklar; bir değişkenin diğerine etkisini ve çift başlı oklar; değişken çiftleri arasındaki kovaryansları ya da korelasyonları temsil eder. Araştırmacılar, incelenen belirli bir yapının modelini oluştururken, bu sembolleri, her biri analitik süreçte önemli bir bileşeni temsil eden dört temel yapılandırma çerçevesinde kullanırlar. Her biri kısa bir açıklama ile birlikte verilen bu semboller Çizelge 3.2.’de verilmiştir (Byrne, 2012).

(41)

26

Çizelge 3.2. Yapısal eşitlik modeli sembol gösterimi

Gözlemlenen bir değişkeni gözlemlenmemiş bir gizli değişkene (veya faktöre) regresyon için yol katsayısı Bir faktörün başka bir faktöre regresyonu için yol katsayısı Gözlenen bir değişkenle ilişkili ölçüm hatası

Gözlemlenmemiş bir faktörün tahmininde kalan hata

3.6. Yol Diyagramı

Yol diyagramı Wright tarafından 1934 yılında geliştirilmesinden sonra ilk defa uygulanması hayvan davranışlarının modellemesi konusunda olmuştur. Wright’a göre yol diyagramı; yol analizi, kovaryans ve korelasyonlar ile ilgili eşitlikler ve etkilerin ayrıştırılması şeklinde tanımlanmıştır (Yılmaz ve Çelik, 2009; Köseoğlu, 2013)

Yol diyagramı, gözlemlenen değişkenler için doğrusal regresyon çözümlemesi ile de ortaya koyulabilirken bu analiz için değişkenler arası her ilişkinin ayrı ayrı analizinin yapılması gerekir. Ancak Lisrel gibi programlarla nedensellik içeren değişkenleri ölçmeden kaynaklanan hatanın yok edilmesi ve değişkenler arası gözlenen ilişkiler tek analizle değerlendirilmesi gerçekleşmektedir. Hatanın yok edilmesi ise yapısal eşitlik modellerinin önemli özelliklerinden biridir (Tatlıdil, 1992; Yener, 2007). Ayrıca nedensel değişkenleri açıklamada yol diyagramı doğrusal regresyon modeline göre daha iyi sonuçlar vermektedir (Kaşıkçı, 2000; Yener, 2007).

İki değişken arasında basit korelasyon katsayılarıyla açıklanamayacak kadar detaylı etkiler barınabilmektedir. Değişkenler arasında gözlenen doğrudan ve dolaylı etkileri aynı anda ve ayrıntılı şekilde ortaya koymak için yol diyagramı uygun bir tekniktir (Şahinler, 2000;

Yener, 2007). Korelasyon katsayıları -1 ve +1 arası değer alabilmekteyken yol diyagramı analizinin bu aralığın dışına da çıkabilmesi pozitif ve negatif yol diyagramı katsayılarının dengede olmasını sağlar (Kaşıkçı, 2000; Yener, 2007).

(42)

27

Modellerin şematik gösterimlerini sağlayan, YEM’i betimleyen bir yol diyagramı aslında matematiksel modelin grafiksel gösterimidir. Bu da bağımlı değişkenleri açıklayıcı değişkenlerle ilişkilendiren bir dizi denklemdir. Bu diyagram YEM ile ilgili yorumlamayı kolaylaştırmak için, tüm değişkenler parametre etiketlerinden ziyade gerçek etiketleriyle tanımlanır (Byrne, 2012).

Yol diyagramına bir örnek Şekil 3.2.’de verilmiştir.

(43)

28

Şekil 3.2. Yapısal eşitlik modeli yol diyagramı

C A B

D E

A3 A2 A1 C3 C2 C1

t

B2 B1

D2 D1 E2 E1

Ɛ1 Ɛ2 Ɛ3 Ɛ6 Ɛ4 Ɛ5 Ɛ6

Ɛ8 Ɛ9 Ɛ10 Ɛ11

Ɛ7

(44)

29

Şekil 3.2’de görüldüğü üzere beş tane açıklayıcı değişken vardır. Bu değişkenler A, B, C, D ve E olarak adlandırılmıştır. Açıklayıcı değişkenlere ait gizli değişkenler numaralanmış şekilde oluşturulmuş ve ona bağlı hata katsayıları Ɛ simgesiyle konumlandırılmıştır. t değişkenine bağlanan açıklayıcı değişkenlerin sahip oldukları ilişki katsayıları okların üstüne yazılabilmektedir (Byrne, 2012).

3.7. Yapısal Denklemler

İncelenen süreçlerin şematik sunumu yoluyla resimsel açıklamanın yanı sıra, YEM, bir dizi yapısal denklemlerle de temsil edilebilir. Regresyon denklemleri, bir veya daha fazla değişkenin birbirleri üzerindeki etkisini temsil ettiğinden ve bu etki, YEM’de, etki değişkenini ilgili değişkene işaret eden tek başlı bir ok ile sembolize edilir. Bu nedenle, bu denklemleri formüle etmede basit bir yaklaşım, ona yönelen bir veya daha fazla ok içeren her bir değişkeni belirlemek ve daha sonra bu bağımlı değişkenlerin her biri için bu tür etkilerin toplamını kaydetmektir (Byrne, 2012).

Kovaryans yapılarının analizine odaklanan yapısal eşitlik modellerinde birincil parametreler, regresyon katsayıları, bağımsız değişkenlerin varyansları ve kovaryanslarıdır (Byrne, 2012).

3.8. Gizli Ortalama Yapıları Test Etme

Çok gruplu karşılaştırmalar içeren olağan tek değişkenli veya çok değişkenli analizler, çeşitli grupları temsil eden gözlemlenen olayların, birbirlerinden istatistiksel olarak önemli ölçüde farklı olup olmadığının test edilmesiyle ilgilenir. Bu değerler ham verilerden doğrudan hesaplanabildiği için, gözlemlenen değerler olarak kabul edilir. Aksine, gizli değişkenleri içeren olaylar gözlemlenemezdir. Ancak, bu gizli yapıların temelini, doğrudan veya dolaylı ölçülebilir olan, gösterge değişkenleri oluşturur.

Regresyon katsayılarını, varyanslarını ve kovaryansları temsil eden parametreler birbiriyle ilişkilidir. Buna göre, gözlemlenen değişkenlerin kovaryans yapısı, kritik parametrik bilgiyi oluşturduğundan, varsayımsal bir model, örnek kovaryans matrisi üzerinden tahmin edilip test edilebilir (Byrne, 2012).

(45)

30

3.9. Model Tanımlama

Belli bir modelin elde edilmesi; gözlemlenen değişkenler ile ilişkili kesişme noktalarının tahmini düşünüldüğünde, gözlenmemiş gizli yapılarla ilişkili olanlara ilave olarak, sadece birkaç özellik kısıtının uygulanmasıyla mümkündür. Tek gruplu analizlerde gözlemlenemeyen olayların tahmin edilmesi zor ve karmaşık bir durumdur. Ancak, çok gruplu analizlerde, modele ciddi kısıtlamalar getirilmesiyle, tahmin kolaylaşır. Daha detaylı olarak, çalışılan iki (veya daha fazla) grup aynı anda test edildiğinden, tanımlama ölçütünün değerlendirilmesi gruplar arasında gerçekleşir (Byrne, 2012).

Referanslar

Benzer Belgeler

PARALOG® yazılımları birden çok kişi tarafından kullanılıyor ve her bir kullanıcının kayıtlar üzerinde yapmış olduğu işlemlerin sonradan incelenmek üzere saklanması

H10: Akademik Ortam ve Öğrenmeyi Destekleyici Olanaklar, Sunulan Hizmetler, Eğitim-Öğretim Programları, Öğretim Elemanı ve Dersler bağımlı değişkenleri

Görüştüğümüz kadınlar arasında işyerinde alınan pandemi tedbirlerini yeterli bulan kadınların yüzde 75’i pan- demi tedbirlerini “maske ve dezenfektan temini”

Bu araştırmada Gamma zayıflık terimi içeren Log-Normal modeli ile yapılan analiz sonucunda meme kanseri hastalarının yaşam süresini etkileyen tümör boyutu,

ALC ile 5651 Nolu yasa kapsamında sistemde alınması gereken tüm logların merkezi bir noktaya toplanmasını ve kanunda belirtilen Bilgilerin Doğruluğunu, Bütünlüğünü

Sözleşme, Türk Telekom’un onayı dışında kısmen veya tamamen devir edilemez. Sözleşmeyi devretmek isteyen Yüklenici Sözleşmenin devri hususundaki talebini yazılı

[r]

Araştırma sonuçlarına göre cep telefonu bağımlılığı, internet bağımlılığı, sosyal medya bağımlılığı sosyetelizmin önemli belirleyicileridir ve