• Sonuç bulunamadı

YAŞAM ÇÖZÜMLEMESİNDE ZAYIFLIK MODELLERİ FRAILTY MODELS IN SURVIVAL ANALYSIS

N/A
N/A
Protected

Academic year: 2023

Share "YAŞAM ÇÖZÜMLEMESİNDE ZAYIFLIK MODELLERİ FRAILTY MODELS IN SURVIVAL ANALYSIS"

Copied!
98
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

YAŞAM ÇÖZÜMLEMESİNDE ZAYIFLIK MODELLERİ

FRAILTY MODELS IN SURVIVAL ANALYSIS

DİREN YEĞEN

DOÇ. DR. NİHAL ATA TUTKUN Tez Danışmanı

Hacettepe Üniversitesi Lisansüstü Eğitim-Öğretim ve Sınav Yönetmeliğinin İstatistik Anabilim Dalı için Öngördüğü

YÜKSEK LİSANS TEZİ olarak hazırlanmıştır.

2015

(2)

DİREN YEĞEN’ in hazırladığı “Yaşam Çözümlemesinde Zayıflık Modelleri” adlı bu çalışma aşağıdaki jüri tarafından İSTATİSTİK ANABİLİM DALI’ nda YÜKSEK LİSANS TEZİ olarak kabul edilmiştir.

Başkan ………

Danışman ………

Üye ……….

Bu tez Hacettepe Üniversitesi Fen Bilimleri Enstitüsü tarafından YÜKSEK LİSANS TEZİ olarak onaylanmıştır.

Prof. Dr. Fatma SEVİN DÜZ Fen Bilimleri Enstitüsü Müdürü

(3)

ETİK

Hacettepe Üniversitesi Fen Bilimleri Enstitüsü, tez yazım kurallarına uygun olarak hazırladığım bu tez çalışmasında;

 tez içindeki bütün bilgi ve belgeleri akademik kurallar çerçevesinde elde ettiğimi,

 görsel, işitsel ve yazılı tüm bilgi ve sonuçları bilimsel ahlak kurallarına uygun olarak sunduğumu,

 başkalarının eserlerinden yararlanılması durumunda ilgili eserlere bilimsel normlara uygun olarak atıfta bulunduğumu,

 atıfta bulunduğum eserlerin tümünü kaynak gösterdiğimi,

 kullanılan verilerde herhangi bir tahrifat yapmadığımı,

 ve bu tezin herhangi bir bölümünü bu üniversite veya başka bir üniversitede başka bir tez çalışması olarak sunmadığımı

beyan ederim.

…/…/2015

DİREN YEĞEN

(4)

i

ÖZET

YAŞAM ÇÖZÜMLEMESİNDE ZAYIFLIK MODELLERİ

Diren YEĞEN

Yüksek Lisans, İstatistik Bölümü

Tez Danışmanı: Doç. Dr. Nihal ATA TUTKUN Mayıs 2015, 87 sayfa

Yaşam çözümlemesinin konusu bir olayın gözlem sürecinde gerçekleşmesi ya da gerçekleşmemesi durumudur. Yaşam çözümlemesinde klasik istatistiksel yöntemler dışında birçok istatistiksel yöntemler kullanılmaktadır.

Yaşam çözümlemesinde sıklıkla kullanılan Cox regresyon modeli orantılı tehlikeler varsayımı altında kurulmaktadır. Ancak çalışmalarda verinin heterojen özellik gösterdiği durumlar ile karşılaşılmaktadır. Bu durumda modele bağlı olarak elde edilen yorumların daha etkin olabilmesi için heterojenliğin açıklanması gerekmektedir.

Zayıflık modelleri heterojenliğin açıklanması için geliştirilmiş bir yaşam çözümlemesi yöntemidir.

Bu çalışmada, zayıflık modelleri teorik açıdan incelenmiş ve uygulama bölümünde ise akciğer kanseri verisine uygulanmıştır. Veri kümesindeki bireylerin taşıdığı genel risk ile herhangi bir bireyin anlık riski arasındaki farklılığı açıklamada paylaşılmamış zayıflık modeli kullanılmıştır. Açıklayıcı değişkenlerin çeşitli düzeylerine sahip bireylerin veri kümesindeki diğer bireylere göre anlık riskinin karşılaştırılmasında ise paylaşılmış zayıflık modelleri kullanılmıştır.

Anahtar Kelimeler: Yaşam çözümlemesi, Cox regresyon, orantılı tehlikeler, parametrik regresyon modelleri, zayıflık modelleri.

(5)

ii

ABSTRACT

FRAILTY MODELS IN SURVIVAL ANALYSIS

Diren YEĞEN

Master of Science, Department of Statistics Supervisor: Assoc. Prof. Dr. Nihal ATA TUTKUN

May 2015, 87 pages

The subject of survival analysis is the status of an event, whether it takes place or not in an observation process. Various statistical methods differ than classical methods have been used in survival analysis.

The Cox regression model which is commonly used in survival analysis is established under the proportional hazards assumption. However cases in which the data shows heterogeneity come across in studies. In this case, heterogeneity should be explained in order to make the interpretations more effective which were obtained depending on the model. Frailty models are one of the survival analysis methods which were developed for explaining heterogeneity.

In this study, frailty models are examined theoretically and were applied to the lung cancer data. The unshared frailty model has been used to explain the difference between general risk and momentary risk of individuals in the data set. As for comparing the momentary risk between individuals with various levels of explanatory variables with other individuals, shared frailty models have been used.

Keywords: Survival analysis, Cox regression, proportional hazards, parametric regression models, frailty models.

(6)

iii

TEŞEKKÜR

Tezimin oluşmasında bana en büyük desteği veren, çalışmalarımda bana yol gösteren ve teşvik eden, bilgisini ve tecrübesini en iyi biçimde benimle paylaşan danışmanım Sayın Doç. Dr. Nihal ATA TUTKUN’a tüm samimiyetimle teşekkür ederim.

(7)

iv

İÇİNDEKİLER

Sayfa

ÖZET ... i

TEŞEKKÜR ... iii

İÇİNDEKİLER ... iv

ÇİZELGELER ... vi

ŞEKİLLER ... vii

SİMGELER VE KISALTMALAR ... viii

1. GİRİŞ... 1

2. YAŞAM ÇÖZÜMLEMESİ... 2

2.1. Giriş ... 2

2.2. Yaşam Süresi ve Kullanılan Fonksiyonlar ... 2

2.3. Durdurma ve Kesilme ... 5

2.3.1. Durdurma ... 5

2.3.2. Kesilme ... 9

2.3.3. Durdurulmuş ve Kesilmiş Veriler İçin Olabilirlik Fonksiyonu ... 10

2.4. Yaşam Çözümlemesinde Kullanılan Bazı Dağılımlar ... 11

2.4.1. Üstel Dağılım ... 11

2.4.2. Weibull Dağılımı ... 12

2.4.3. Log-normal Dağılım ... 13

2.4.4. Log-lojistik Dağılım ... 14

2.4.5. Gamma Dağılımı ... 15

2.4.6. Gompertz Dağılımı ... 16

2.5. Yaşam Modelleri ... 18

2.5.1. Cox Orantılı Tehlikeler Modeli ... 18

2.5.1.1. Olabilirlik Fonksiyonu ... 19

2.5.1.2. Eş Zamanlı Gözlemler İçin Olabilirlik Fonsiyonu ... 20

2.5.1.3. Parametre Tahmini: Bilinmeyen Parametreler Vektörünün Elde Edilmesi .... 23

2.5.1.4. Newton-Raphson Yöntemi ... 25

2.5.1.5. Parametreler İçin Güven Aralıkları ve Hipotez Testleri ... 25

(8)

v

2.5.1.6. Cox Orantılı Tehlikeler Modelinde Model Seçim Kriterleri ... 28

2.5.2. Parametrik Regresyon Modelleri ... 29

2.5.2.1. Birinci Yaklaşım: Orantılı Tehlikeler Biçimindeki Parametrik Regresyon Modelleri ... 29

2.5.2.2. İkinci Yaklaşım: Hızlandırılmış Başarısızlık Süresi Modelleri ... 30

2.5.2.3. Parametrik Regresyon Modellerinde Model Seçim Kriterleri ve Model Uyumu ... 35

3. ZAYIFLIK MODELLERİ ... 36

3.1. Giriş ... 36

3.2. Paylaşılmamış Zayıflık Modeli ... 39

3.3. Paylaşılmış Zayıflık Modeli ... 42

3.4. İlişkili Zayıflık Modeli ... 47

3.5. Zayıflık Terimi için Kullanılan Dağılımlar... 49

3.5.1 Gamma Zayıflık Modeli... 49

3.5.2 Ters-Gauss Zayıflık Modeli ... 53

3.6. Zayıflık Terimi ile Gözlenen Açıklayıcı Değişkenler Arasındaki Bağımlılık ve Etkileşim ... 56

3.7 Zayıflık Modelinde Log-Rank Testi ... 57

3.8 Zamana Bağlı Zayıflık Modelleri ... 58

4. UYGULAMA ... 59

4.1. Veri Yapısı ... 59

4. 2. Parametrik Regresyon Modeli Sonuçları ... 63

4.3. Zayıflık Modeli Sonuçları ... 66

5. SONUÇLAR ... 77

KAYNAKLAR ... 79

ÖZGEÇMİŞ ... 87

(9)

vi

ÇİZELGELER

Sayfa

Çizelge 2.1. Model Seçim Kriterleri ... 28

Çizelge 4.1. Kullanılan Değişkenler ve Düzeyleri ... 60

Çizelge 4.2. Parametrik Regresyon Modelleri için -2logL ve AIC Değerleri ... 63

Çizelge 4.3. Log-lojistik Regresyon Çözümlemesinin Sonuçları ... 65

Çizelge 4.4. Gamma Zayıflık Terimi içeren Log-Lojistik AFT modeli çözümlemesi ... 67

Çizelge 4.5. Ters-Gauss Zayıflık Terimi içeren Log-Lojistik AFT modeli çözümlemesi ... 68

Çizelge 4.6. Yaş değişkeni için zayıflık terimi içeren log-lojistik AFT modeli çözümlemesi ... 70

Çizelge 4.7. Sigara tüketimi değişkeni için zayıflık terimi içeren log-lojistik AFT modeli çözümlemesi ... 71

Çizelge 4.8. Genişletilmiş Rezeksiyon değişkeni için zayıflık terimi içeren log-lojistik AFT modeli çözümlemesi ... 72

Çizelge 4.9. Boyut değişkeni için zayıflık terimi içeren log-lojistik AFT modeli çözümlemesi ... 73

Çizelge 4.10. İnvazyon değişkeni için zayıflık terimi içeren log-lojistik AFT modeli çözümlemesi ... 74

Çizelge 4.11. Patolojik Evre değişkeni için zayıflık terimi içeren log-lojistik AFT modeli çözümlemesi ... 75

(10)

vii

ŞEKİLLER

Sayfa Şekil 4.1. Kaplan-Meier Yaşam Eğrileri ... 61 Şekil 4.2. Cox-Snell Artık Grafikleri ... 64

(11)

viii

SİMGELER VE KISALTMALAR

Simgeler

μ Ortalama

σ2 Varyans

Γ Gamma Fonksiyonu

Z Zayıflık Terimi

δ ij Durdurma Fonksiyonu

Kısaltmalar

AIC Akaike Bilgi Kriteri

AFT Hızlandırılmış Başarısızlık Süresi EM Beklenti Maksimizasyonu

PVF Güç Varyans Fonksiyonu BIC Bayesci Bilgi Kriteri

(12)

1

1. GİRİŞ

Yaşam çözümlemesinde, yaşayan bir organizmanın ya da cansız bir nesnenin belirli bir başlangıç zamanı ile başarısızlığı arasında geçen zamana “yaşam süresi” ya da

“başarısızlık süresi“ adı verilmektedir. Bağımlı değişken olarak ele alınan yaşam süresinin açıklayıcı değişkenler tarafından etkilenebileceği göz önünde bulundurulduğunda, regresyon modellerinin yaşam çözümlemesinde önemli bir yere sahip olduğu görülmektedir. Yaşam verilerinin modellenmesinde en çok kullanılan regresyon modelleri Cox orantılı tehlikeler modeli ve parametrik regresyon modelleridir.

Yaşam modelleri, farklı uygulama alanlarında kullanılabilecek biçimde geliştirilmektedir. Bu modellerden biri de zayıflık (frailty) modelidir. Zayıflık modeli özellikle tıp, biyoloji ve genetik çalışmalarının da içinde bulunduğu çeşitli alanlarda kullanılmaktadır. Cox orantılı tehlikeler modelinde aynı değişken değerine sahip olan birimlerin aynı yaşam süresine sahip olacağı varsayılmaktadır. Ancak bu durum, aynı tedavi, yaş ve cinsiyet grubundaki gözlenen tüm bireylerin aynı gözlenen yaşam sürelerine sahip olduğu anlamına gelmemektedir. Bazı çalışmalarda, ölçülen açıklayıcı değişkenler dışında yaşam süresini önemli derecede etkileyen ancak gözlenemeyen başka faktörler de olabilir. Bu durum, birimlerin heterojenliği olarak belirtilmektedir. Zayıflık modelinin temeli, birimler arasındaki heterojenliği açıklamak için ölçülemeyen rasgele etkiyi modele dahil etmektir.

Bu çalışmanın amacı, yaşam çözümlemesinde zayıflık modellerini, zayıflık terimi için kullanılan dağılımları incelemek ve konuyla ilgili uygulama yapmaktır. Bu kapsamda ikinci bölümde yaşam çözümlemesine ait genel bilgiler verilmiştir. Üçüncü bölümde yaşam çözümlemesinde zayıflık modelleri incelenmiş olup, zayıflık modellerinde kullanılan yöntemler anlatılmıştır. Dördüncü bölümde ise akciğer kanseri verilerine klasik yaşam çözümlemesinin yanı sıra zayıflık modelleri uygulanmış ve elde edilen sonuçlar incelenmiştir.

(13)

2

2. YAŞAM ÇÖZÜMLEMESİ

2.1. Giriş

Yaşam çözümlemesi mühendislik, tıp, biyoloji ve demografi gibi bilim dallarında kullanılan temel bir araştırma yöntemidir. Yaşam çözümlemesi, tıbbi ve demografik çalışmalarda incelenen ölümlülük kavramının bir karşılığı olarak ortaya çıkmıştır.

İlgilenilen olayın ortaya çıkma süresine yani başarısızlık süresi verilerine dayanan bu araştırma yöntemi Cox’un [1] geliştirdiği Orantılı Tehlikeler Modeli yaklaşımıyla beraber geniş bir uygulama alanına yayılmıştır.

Yaşam çözümlemesi, hem sosyal hem de fen bilimlerde birçok farklı olayı incelemek için yararlı bir çözümleme yöntemidir. Bu yöntem, sosyolojide “olay geçmişi çözümlemesi (event history analysis)”, mühendislikte “güvenilirlik kuramı (reliability theory)” ya da “başarısızlık zamanı çözümlemesi (failure time analysis)”, ekonomide

“süre çözümlemesi (duration analysis)” ya da “geçiş çözümlemesi (transition analysis)” ve sağlık alanında “yaşam çözümlemesi (survival analysis)” olarak adlandırılmaktadır [2].

2.2. Yaşam Süresi ve Kullanılan Fonksiyonlar

Yaşayan bir organizmanın ya da cansız bir nesnenin belirli bir başlangıç zamanı ile başarısızlığı arasında geçen zamana “yaşam süresi” ya da “başarısızlık süresi“ adı verilmektedir ve genellikle T ile gösterilmektedir. Her bir birime ait yaşam süresi, tanımı gereği sürekli ve pozitif bir değere sahiptir. Başarısızlık süresine örnek olarak, makine bileşenlerinin yaşam süreleri, işçilerin grev süreleri, ekonomide işsizlik dönemleri, psikolojik bir deneyde deneğin belirlenen görevi tamamlama süresi ve klinik bir deneyde hastaların yaşam süreleri gösterilebilir.

Yaşam süresi T’nin dağılımını niteleyen birçok fonksiyon vardır. T’nin olasılık yoğunluk fonksiyonu f(t) ve dağılım fonksiyonu F(t) olmak üzere sırasıyla,

(14)

3 t

) t t T t ( lim P ) t (

f t 0

 , 0 < t < ∞ , (2.1)

t

0

dx ) x ( f ) t T ( P ) t (

F , 0 < t < ∞ (2.2)

biçimindedir. F(t), T’nin belirli bir sabit sayı t’den küçük ya da t’ye eşit olması olasılığıdır. S(t), yaşam fonksiyonu olmak üzere T raslantı değişkeninin t’den daha büyük olma olasılığı olarak tanımlanmaktadır ve

t

dx ) x ( f ) t T ( P ) t (

S , 0 < t < ∞ (2.3)

biçiminde gösterilmektedir. Dağılım fonksiyonu ile yaşam fonksiyonu arasındaki ilişki,

) t ( F 1 ) t (

S (2.4)

ile verilmektedir. Yaşam fonksiyonu monoton azalan, soldan-sürekli bir fonksiyondur.

Yaşam fonksiyonunun t0 ve t için aldığı değerler S(0) limS(t) 1

0

t

ve

0 ) t ( S lim ) (

S t

’dır.

Tehlike fonksiyonu, t zamanına kadar yaşayan bir birimin [t, t+t] aralığında yaşamının sona ermesi riski olarak tanımlanmaktadır. Tehlike fonksiyonu, başarısızlık hızı (failure rate), ölümlülük gücü (force of mortality) olarak da adlandırılmaktadır. Bu tanıma göre tehlike fonksiyonu,

(15)

4 t

) t T t t T t ( limP ) t (

h t 0

 

(2.5)

biçimindedir. Birikimli tehlike fonksiyonu ise,

t

0

dx ) x ( h ) t (

H logS(t) (2.6)

biçiminde ifade edilmektedir. Birikimli tehlike fonksiyonu artan, sağdan sürekli ve

H(t) limt

olan bir fonksiyondur [3,4].

Yaşam çözümlemesinde ilgilenilen önemli parametrelerden biri de x anındaki ortalama kalan ömür fonksiyonudur (mean residual life function). Bu parametre, x yaşındaki birimlerin kalan yaşam süresinin beklenen değerini ölçer ve mrl(x)=E(X-x\X>x) ile gösterilir. µ=mrl(0) yaşam eğrisinin altında kalan toplam alandır.

Sürekli bir x rasgele değişkeni için;

) x ( S

dt ) t ( S )

x ( S

dt ) t ( f ) x t ) ( x (

mrl x

x

 

 

 (2.7)

olarak verilir ve;

 

0 0

dt ) t ( S dt ) t ( tf ) X (

E (2.8)

olarak tanımlanır. X rasgele değişkenine ait varyans ise;

(16)

5

2

0 0

dt ) t ( S dt ) t ( tS 2 ) X (

Var

 



 (2.9)

biçimindedir. p inci yüzdelik dilim (kuantil) (xp) ise; F(xp)p ve S(xp)1p olarak gösterilir. X rasgele değişkeni sürekli olmak üzere p inci kuantil S(xp)1p eşitliği çözülerek bulunur. Ortanca yaşam süresi (median survival time) ise X dağılımında 50.

yüzdeliğe denk gelmektedir. Bu X rasgele değişkeni için ortanca yaşam süresi (x0.5);

5 . 0 ) x (

S 0.5  olmaktadır.

2.3. Durdurma ve Kesilme 2.3.1. Durdurma

Durdurma (censoring), yaşam çözümlemesini diğer istatistiksel yöntemlerden ayıran en önemli özelliktir. Durdurulmuş gözlem tamamlanamamış gözlem demektir ve başarısızlığın gerçekleşme zamanı hakkında kısmen bilgi vermektedir. Bunun anlamı, bir birimin bir süre boyunca gözlenmesine rağmen bu süreçte başarısızlığın meydana gelmemesidir. Bu durumda başarısızlığın gerçekleşme zamanının, gözlenen durdurma zamanını aşıp daha sonraki bir zamanda meydana geldiği bilinmektedir.

Örneğin tıbbi bir çalışmada gözlem altına alınan hastaların bazıları deney sonunda hala yaşamlarını sürdürüyor olabilir ya da bir endüstriyel güvenilirlik çalışmasında, deneye tabi tutulan birimlerden bazıları, deney sona erdiğinde bozulmamış olabilir.

Ayrıca gözlem altındaki bir birim bazı nedenlerden dolayı gözlemden çıkabilir. Eğer başarısızlık süresi, bu gibi nedenlerden dolayı tamamlanmamış ise durdurulmuş (censored) gözlem söz konusudur.

* n

* 2

*

1,T ,...,T

T birbirinden bağımsız ve aynı dağılımlı yaşam sürelerini göstersin ve yaşam sürelerine ait dağılım fonksiyonu ise F ile gösterilsin. C1,C2,...,Cn birbirinden bağımsız ve aynı dağılımlı durdurma sürelerini göstersin ve G’de durdurma sürelerini ait dağılım fonksiyonu olsun. F ve G’nin sürekli olduğu varsayımı altında f ve g

(17)

6

sırasıyla F ve G’ye ait olasılık yoğunluk fonksiyonlarını göstermektedir. Gözlenen veri )

, T ( ),..., ,

T ( ), , T

( 11 22 nn biçiminde gösterilmektedir. Bu gösterimde

i

* i

i minT ,C

T  olmak üzere;

ise gözlem durdurulmamıştır.

İse gözlem durdurulmuştur.

olmaktadır.

T*,T ’yi C ise Ci* i’yi, H ise T=min

{

T*,C

}

’nin dağılım fonksiyonunu göstermek üzere,

H(t)P

min

 

T*,C t

1P

min

 

T*,C t

1P

T* t,Ct

biçimindedir. T* ve C bağımsız olarak kabul edilirse;

H(t)1P(T* t)P(C t)

1(1P(T* t))(1P(Ct))

1(1F(t))(1G(t))





 

T , C T , 0

T C T , 1

i i

* i

i , i

* i i

(18)

7

yazılabilir. Bu eşitlik, başarısızlık süresi ve durdurma süresi arasındaki bağımsızlığın yaşam çözümlemesi açısından önemini vurgulamaktadır.

Durdurma klinik araştırmalar başta olmak üzere, birçok araştırmada karşılaşılan bir durumdur. Birimler araştırmaya farklı zamanlarda dahil olmuş olabilir. Bu birimlere ait başarısızlık süresi gözlemlenirken, durdurma farklı biçimlerde meydana gelebilir.

Bunlar;

 İzlem dışı (Loss to follow-up): Birimin çalışma sürecinde bir daha gözlenmememesi durumuna denir.

 Ayrılma (Drop out): Birimin çalışmadan çekilmesi durumuna denir.

 Çalışmanın sonlandırılması (Termination of Study): Çalışmanın belirlenen sonlanma tarihinden önce bitirilmesi durumuna yönetimsel (administrative censoring) durdurma da denir.

 Yarışan tehlikeler (Competing risks): İlgilenilen olaya ait başarısızlık gözlenememe durumudur. Bu süreç içinde birim başka bir sebepten dolayı başarısız olmuştur. Örneğin, hasta bir kişinin hastalığından dolayı değil de trafik kazası geçirerek hayatını kaybetmesi.

olarak sıralanabilirler.

Farklı durdurma türleri olmakla birlikte uygulamada en çok sağdan-durdurma ile karşılaşılmaktadır. Durdurma türleri aşağıda verildiği gibi sınıflandırılmaktadır;

 Sağdan durdurulmış (Right censored): Bir gözlemin kesin başarısızlık süresi bilinmiyor fakat sadece belirli bir zaman olan C’ye eşit ya da C’den büyük olduğu biliniyorsa, gözleme C’de sağdan durdurulmuş gözlem denir.

(19)

8

 Soldan durdurulmuş (Left censored): Gözlemin başarısızlık süresinin C’ye eşit ya da C’den küçük olduğu biliniyorsa, gözleme C’de soldan durdurulmuş gözlem denir.

 Aralıklı durdurulmuş (Interval censored): Gözlemin başarısızlık süresi belli bir aralıkta gerçekleşiyorsa ve başarısızlığın bu aralıktaki olasılığı biliniyorsa, bu durum aralıklı durdurulma olarak ifade edilmektedir.

 Zamansal durdurma (Time censoring): Önceden belirlenen belirli bir zamanda çalışmanın sona erdirildiği bir durdurma zamansal durdurma olarak adlandırılmaktadır.

 Sayısal durdurma (Failure censoring): Önceden belirlenen belirli bir sayıda başarısızlık olduğu anda çalışma sona erdiriliyorsa bu durum sayısal durdurma olarak ifade edilmektedir.

 Rasgele durdurma (Random censoring): Durdurma süreleri rasgele belirlenirse rasgele durdurma söz konusu olur. Örneğin, bir deneyde birimler beklenmedik nedenlerle tahrip olursa, planlanmamış bu zamanlar rasgele durdurma süreleri olarak kabul edilebilir. Basit bir rasgele durdurma sürecinde her bir birimin T başarısızlık süresi ve C durdurma süresine sahip olduğu varsayılır. Bu durumda T ve C bağımsız, sürekli raslantı değişkenleridir.

biçiminde sınıflandırılmaktadır.

(20)

9 2.3.2. Kesilme

Durdurmanın yanı sıra kesilme (truncation) de bir diğer önemli yaşam çözümlemesi özelliğidir. Durdurma, orijinal başarısızlık süreleri ve durdurma sürelerinin bir haritalandırılması iken; kesilme gözlemlerin dağılımlarına etkide bulunur ve dağılım fonksiyonuna koşul getirmektedir. Uygulamalarda en çok karşılaşılan kesilme tipi soldan-kesilmiş gözlemlerdir. Kesilme sürelerinin rasgele olmama varsayımı altında incelemeler yapılabilir. Rasgele olmayan soldan kesilme, birimler sadece çalışmanın asıl başlangıç noktasından sonraki bilinen bir zamanda gözlemlendiğinde ortaya çıkmaktadır. Bu kesilme zamanından önce başarısız olan birimlerin kaydedilememesi anlamına gelir. Bu durum, sayısı bilinmeyen ve gözlem başlamadan önce başarısızlıkla karşılaşan birimlerin çalışma kümesinde kayıp gözlem olduğu anlamına gelmektedir [5].

Kesilmiş bir verinin dağılım fonksiyonu, (T,) sırasıyla başarısızlık süresi ve durdurma gösterge değişkeni olmak üzere T t (tbilinirken) koşulu altında orijinal verinin dağılım fonksiyonundan aşağıdaki biçimde elde edilebilir:

) t T

\ , t T (

P   

) t T ( P

) , t T ( P

  =

)) t ( G 1 ))(

t ( F 1 (

) , t T ( P

 (2.10)

Benzer biçimde soldan-kesilmiş ve sağdan durdurulmuş gözlemler için olasılık yoğunluk fonksiyonu aşağıdaki biçiminde verilebilir:

)) t ( G 1 ))(

t ( F 1 (

))) t ( F 1 )(

t ( g ( ))) t ( G 1 )(

t ( f ) ( t , , t ( f

1

 

 . (2.11)

Kesilme, yaşam çözümlemesinde kullanılan dağılımlarda önemli bir değişikliğe neden olur. Yaşam fonksiyonu ve olasılık yoğunluk fonksiyonu (T>t+) koşulu altında

(21)

10

değişirken, tehlike fonksiyonunda herhangi bir değişim olmaz. Bunun nedeni ise tehlike fonksiyonunun yaşam süresi “t” üzerinden koşullu olmasıdır. Dolayısıyla t’den daha küçük olan yaşam süreleri üzerinden koşullandırmak bir değişikliğe neden olmamaktadır.

2.3.3. Durdurulmuş ve Kesilmiş Veriler İçin Olabilirlik Fonksiyonu

Yaşam çözümlemesi çalışmalarında, olabilirlik fonksiyonları oluşturulurken durdurma ve kesilme dikkate alınmalıdır. Yaşam süreleri ve durdurma sürelerinin bağımsız olduğu varsayımı vardır. Eğer bağımsız değillerse bazı farklı yöntemlerden yararlanılır. Başarısızlık süresine karşılık gelen gözlem, olasılık yoğunluk fonksiyonunda T anında gerçekleşen başarısızlığın olasılığı hakkında bilgi vermektedir. Sağdan-durdurulmuş gözlem için başarısızlık süresinin durdurma süresinden büyük olduğu bilinmektedir ve bilgi yaşam fonksiyonunun çalışma sürecinde değerlendirilmesinde elde edilir. Benzer biçimde soldan-durdurulmuş gözlem için başarısızlığın daha önceden gerçekleştiği bilimektedir ve olabilirliğe katkısına ilişkin bilgi dağılım fonksiyonunun çalışma sürecinde değerlendirilmesiyle elde edilir. Aralıklı durdurulmuş veri için başarısızlığın belli bir aralıkta meydana geldiği ve başarısızlığın bu aralıkta gerçekleşmesi olasılığı bilinmektedir. Olabilirlik fonksiyonlarını elde etmede gerekli olan bileşenler aşağıda verilmektedir:

f(t): Olasılık yoğunluk fonksiyonu, S(Cr): Sağdan-durdurulmuş gözlem, 1-S(Cl): Soldan-durdurulmuş gözlem,

f(t)\S(t+): Soldan-kesilmiş gözlem (t+:Kesilme süreleri), f(t+)\[1-S(t+)]: Sağdan-kesilmiş gözlem (t+:Kesilme süreleri), [S(Li)-S(Ri)]: Aralıklı-durdurulmuş gözlem.

(22)

11 Olabilirlik fonksiyonu,

   

D

i i R i L i I

i i

l r

i) S(C ) (1 S(C)) [S(L ) S(R)]

t ( f

L (2.12)

biçimindedir. Burada: D, Başarısızlık sürelerinin kümesini; R:Sağdan-durdurulmuş gözlemlerin kümesini; L:Soldan-durdurulmuş gözlemlerin kümesini; I:Aralıklı- durdurulmuş gözlemlerin kümesini göstermektedir. f(ti) yerine f(ti)\S(ti+) ve S(C) yerine S(C)\ S(ti+) yazılırsa, Eşitlik (2.12) sağdan-kesilmiş gözlemler için;

)]

t ( S 1 [ ) t ( f

L i

i i

(2.13)

biçimine dönüşür[6].

2.4. Yaşam Çözümlemesinde Kullanılan Bazı Dağılımlar

Üstel, Weibull, Log-lojistik, Log-normal, Gamma, Gompertz dağılımları yaşam süresi ile ilgili çalışmalarda sıklıkla kullanılmaktadır. Bu dağılımların dışında Rayleigh, Pareto, Burr, ters-Gauss, sıfırda soldan kesilmiş normal dağılım gibi dağılımlar da kullanılmaktadır [6]. Yaşam çözümlemesinde en sık kullanılan dağılımlar Altbölüm 2.4.1-2.4.6’de ele alınmıştır.

2.4.1. Üstel Dağılım

Yaşam çözümlemesinde kullanılan en basit ve en önemli dağılım üstel dağılımdır.

1940’lı yılların sonunda araştırmacılar elektronik sistemlerin yaşam örüntülerini (pattern) açıklayabilmek için üstel dağılım kullanmaya başlamışlardır.

Yaşam süresi, λ parametresi ile üstel dağılıma sahip ise, olasılık yoğunluk fonksiyonu aşağıdaki gibi tanımlanmaktadır:

(23)

12



 

0 t

0 0, t , 0

, ) e

t ( f

t

.

Üstel dağılımda tehlike fonksiyonu sabittir, yani zamandan bağımsızdır. Sabit tehlike fonksiyonu,

 ) t (

h

biçimindedir. Yaşam fonksiyonu ise,

e t

) t (

S 

olarak elde edilir [4, 6].

2.4.2. Weibull Dağılımı

Weibull dağılımı, üstel dağılımdan farklı olarak sabit tehlike fonksiyonuna sahip olmadığından daha geniş uygulama alanına sahiptir. Dağılım Weibull (1939) tarafından önerilmiş ve çeşitli başarısızlık durumlarına uygulanabilirliği Weibull (1951) çalışmasında ele alınmıştır. Weibull dağılımı, güvenilirlik ve yaşam çözümlemesi çalışmalarında kullanılmaktadır.

Weibull dağılımı biçim () ve ölçek () parametreleri ile tanımlanmaktadır.  = 1 iken tehlike fonksiyonu zaman arttıkça sabit kalmaktadır. Tehlike fonksiyonu,  1 iken artar ve 1 iken azalır. Weibull dağılımı, kitlenin yaşam dağılımını artan, azalan ya da sabit risk ile modellemek için kullanılabilir. Akciğer kanseri hastaları artan

(24)

13

tehlike fonksiyonuna, başarılı ve büyük bir ameliyat geçiren hastalar ise azalan tehlike fonksiyonuna sahip durumlara örnek olarak verilebilir.

Dağılımın olasılık yoğunluk, yaşam ve tehlike fonksiyonları sırasıyla aşağıda verilmiştir:[4, 6]



 ( t) 1e ( t) )

t (

f , t0, , 0 ,

 

exp t )

t (

S ,

) 1

t ( ) t (

h  

2.4.3. Log-normal Dağılım

Log-normal dağılım, en basit biçimde logaritması normal dağılım gösteren bir değişkenin dağılımı olarak tanımlanabilir. Dağılımın kuramı McAlister (1879) tarafından açıklanmıştır. Bu dağılım biyoloji alanında, kanser araştırmalarında ve ekonomi alanında uygulamalarda kullanılmaktadır. Alzheimer, Hodgkin ve lösemi gibi birçok hastalıkta yaşam süresinin dağılımının log-normal dağılım olduğu düşünülmektedir [4].

Dağılımın olasılık yoğunluk, yaşam ve tehlike fonksiyonları sırasıyla aşağıdaki gibidir:



 

 

  2(logt )2

2 exp 1 2 t ) 1 t (

f , t0, 2,

(25)

14



 

 

 

t

2

2(logx ) dx

2 exp 1 x 1 2 ) 1 t (

S ,

 

 

/ ) t e log(

1

2 / ) t e (log(

exp ) 2 t / 1 ) ( t ( h

2 2

.

Log-normal dağılımda, tehlike fonksiyonu önce en yüksek değere kadar artar, daha sonra zaman sonsuza yaklaştıkça (çoğunlukla ortancayı geçer geçmez) sıfıra doğru azalır. Bu nedenle, log-normal dağılım önce artan, daha sonra azalan tehlikeye sahip yaşam örüntüleri için uygun bir dağılımdır [4, 6].

2.4.4. Log-lojistik Dağılım

Log-lojistik dağılım, Weibull dağılımı için alternatif bir yapıdır. İki parametreli bir dağılımdır. Log(T) lojistik dağılıma sahip ise, yaşam süresi T log-lojistik dağılıma saihptir. Log-lojistik dağılımın parametreleri  ve  olmak üzere olasılık yoğunluk fonksiyonu,

2 1

) t 1 (

) t ) (

t (

f

  , t0, 0, 0,

biçimindedir. Yaşam fonksiyonu ve tehlike fonksiyonu ise sırasıyla aşağıda verilmektedir:

  t 1 ) 1 t (

S ,

 

t 1

) t ) (

t ( h

1

.

(26)

15

1

iken log-lojistik dağılımın tehlike fonksiyonu sıfır zamanında sıfır değerini alır,

( 1)1/ / 1/

t noktasında tepe değerini alacak biçimde artar ve daha sonra azalır.

1

 iken tehlike fonksiyonu 1/ de başlar ve monoton olarak azalır. 1 iken tehlike fonksiyonu sonsuzda başlar ve daha sonra Weibull dağılımına benzer biçimde azalır. t sonsuza gittikçe tehlike fonksiyonu sıfıra doğru azalır. Bu nedenle, log-lojistik dağılım önce artan, sonra azalan ya da monoton olarak azalan tehlikeyi tanımlamak için kullanılabilir [4, 6].

2.4.5. Gamma Dağılımı

Birnbaum ve Saunders (1958) dinamik yük altındaki yapıların ömrü için ustaca hazırlanmış bir istatistiksel model sunmuşlardır. Bu modelde hata oranı bozulma ve yıpranmanın bir fonksiyonu olarak kullanılmıştır [4].

Güvenilirlik ve yaşam çözümlemelerinde sıklıkla kullanılan bir dağılımdır. 01 iken zaman sıfırdan sonsuza doğru gittikçe, tehlike fonksiyonu sonsuzdan ya monoton olarak azalır. 1 iken zaman sıfırdan sonsuza doğru gittikçe tehlike fonksiyonu sonsuzdan ’ya monoton olarak artar. 1 iken tehlike fonksiyonu ’ya eşittir, yani üstel dağılımda olduğu gibi sabittir. Gamma dağılımı için zaman sonsuza yaklaştıkça tehlike fonksiyonu sabit bir değere doğru azalır ya da artar.

Gamma dağılımının olasılık yoğunluk fonksiyonu,  ve sırasıyla biçim ve ölçek parametreleri olmak üzere,

t 1e ) t )( ) (

t (

f 

  , t0, 0, 0

biçimindedir. Gamma dağılımı için yaşam fonksiyonu ise,

(27)

16

 

t

x

1e dx

) x )( ) (

t ( S

biçimindedir.

Üstel, Weibul, log-normal ve gamma dağılımları üç parametreli genelleştirilmiş gamma dağılımının özel durumlarıdır. Genelleştirilmiş gamma dağılımının olasılık yoğunluk fonksiyonu,

 

 

  t exp ( t) )

) ( t (

f 1 , t0, 0, 0, 0

biçimindedir. Genelleştirilmiş gamma dağılımı, 1 ise üstel dağılım; 1 ise Weibull dağılımı;  ise log-normal dağılım ve 1 ise gamma dağılmına dönüşmektedir [4, 6].

2.4.6. Gompertz Dağılımı

İngiliz aktüer Benjamin Gompertz (1825) insan ölümlülüğüne ilişkin yaptığı çalışmalarda üstel artışın insan ölümlülüğüne iyi bir açıklama getirdiğini gözlemlemiştir. Geliştirdiği dağılım, cinsiyet ve ileri yaşlar arasında üstel bir ilişki olduğunu ifade etmektedir. Bu dağılım aktüerya, biyoloji ve demografi alanlarındaki çalışmalarda sıklıkla kullanılan bir dağılımdır. T rasgele değişkeni λ ve φ parametreleriyle Gompertz dağılımına uyuyorsa T~G(λ,φ) olarak gösterilir. Dağılımın olasılık yoğunluk fonksiyonu;

) 1 e t (

t

e e ) t ( f

 , 0

(28)

17 biçiminde verilir. Yaşam fonksiyonu ise,

) 1 e ( t

e ) t ( S

 ,

biçimindedir. Tehlike fonksiyonu ve birikimli tehlike fonksiyonu ise sırasıyla aşağıdaki gibi elde edilir:

e t

) t (

h  ,

) 1 e ( ) t (

H t

  .

Φ=0 durumunda ise Gompertz dağılımı Üstel dağılıma dönüşür. Gompertz-Makeham dağılımı ise; Gompertz dağılımına bir c sabiti eklenmesi durumunda elde edilir ve tehlike fonksiyonu;

c e ) t (

h  t

biçimindedir. Bu fonksiyonda c sabiti, t’den bağımsız olarak yaştan bağımsızlık durumunu belirtirken, fonksiyonun diğer kısmı ise yaşa bağımlı olan üstel ifadeyi içermektedir.

Gompertz-Makeham dağılımı, 30-80 yaş arasında insan ölümlülüğünün yapısını kesin bir biçimde tanımlamaktadır. İleri yaşlarda ölüm oranları “Ölümlülük Kanunu”nda tahmin edildiği kadar hızlı artmaz, bu ileri yaşta ölümlülüğünün yavaşlaması olarak

(29)

18

bilinir ve paylaşılmamış zayıflık modellerinin geliştirilmesinin başlangıç noktalarından biridir [5].

2.5. Yaşam Modelleri

Yaşam çözümlemesinde, klasik istatistiksel modellerin kullanılmamasının nedenlerinden biri durdurma, diğeri ise zamana bağlı açıklayıcı değişkenlerdir. Bu özellikleri de dikkate alan modeller altbölümlerde incelenmiştir.

2.5.1. Cox Orantılı Tehlikeler Modeli

Yaşam çözümlemesinde başarısızlık ya da ölüm zamanının istatistiksel olarak değerlendirilmesine ilişkin çalışmalar yaşam tablosu yardımıyla başlamıştır. Bu çalışmalar daha sonra geliştirilerek başarısızlık modeli ya da tehlike modeli olarak adlandırılmıştır.

Yaşam verisinin çözümlenmesinde modelleme sürecinin amacı, tehlike fonksiyonunu etkileyen açıklayıcı değişkenleri belirlemek ve birime ait tehlike fonksiyonunu elde etmektir. Yaşam verisini modellemek için kullanılan temel model orantılı tehlikeler modelidir. Cox [1] tarafından önerildiğinden Cox orantılı tehlikeler modeli olarak da adlandırılmaktadır. Model, orantılı tehlikeler varsayımına dayanmasına rağmen, yaşam süreleri için olasılık dağılımının belirli bir biçimi yoktur. Bu nedenle, Cox orantılı tehlikeler modeli yarı parametrik bir model olarak nitelendirilmektedir.

p 2

1 ,X ,...,X

X p tane açıklayıcı değişken ve x1 ,x2 ,...,xp bu değişkenlerin aldığı değerler olsun. Cox orantılı tehlikeler modelinde açıklayıcı değişkenlerin değerlerinin kümesi x vektörü ile, yani x(x1 ,x2 ,...,xp) gösterilsin. h0(t) temel tehlike fonksiyonu olmak üzere, i. birim için Cox orantılı tehlikeler modeli,

(30)

19 ) x ...

x x

exp(

) t ( h ) t (

hi01 1i 2 2i  p pi (2.14)

biçimindedir [3].

2.5.1.1. Olabilirlik Fonksiyonu

r tanesi ayrık ölüm zamanlarına ve nr tanesi sağdan durdurulmuş yaşam sürelerine sahip n tane birim olsun. Her bir ölüm zamanında bir birimin öldüğü ve de hiçbir eş zamanlı gözlem olmadığı varsayılsın. t , j. sıralı ölüm zamanı olmak üzere r tane (j) sıralı ölüm zamanı t(1) t(2)  ...t(r) biçiminde gösterilsin. t(j) zamanında riskte olan birimlerin kümesi R(t(j)) ile gösterilsin, böylece R(t(j)), t(j) zamanından hemen önce yaşayan ve durdurulmamış olan birimlerin kümesi olur. R(t(j)) “risk kümesi” olarak da adlandırılmaktadır.

Cox orantılı tehlikeler modeli için olabilirlik fonksiyonu aşağıdaki gibi verilmektedir:

 



 

r

1 j

) t ( R

) j (

) j (

) exp(

) ) exp(

( L

x

x . (2.15)

Burada x , j. sıralı ölüm zamanı (j) t(j)’de ölen birimler için açıklayıcı değişkenler vektörüdür. Olabilirlik fonksiyonunun paydasındaki toplam, t(j) zamanında riskte olan birimler üzerinden exp( x ) değerlerinin toplamıdır. Olabilirlik fonksiyonunda kullanılan çarpım işlemi ölüm zamanları kaydedilen birimler üzerinden yapılmaktadır.

Yaşam süreleri durdurulmuş olan birimler, olabilirlik fonksiyonunun payında yer almaz, fakat durdurma zamanından önce ortaya çıkan ölüm zamanlarındaki risk kümeleri üzerinden toplama girer. Olabilirlik fonksiyonunun iki temel özelliği vardır;

(31)

20

bilinmeyen büyüklük h0(t)’nin yok edilmesi ve durdurulmuş yaşam sürelerinden etkilenmemesidir [3].

Veri kümesinin, t1,t 2 ,...,t n olmak üzere n tane gözlemlenen yaşam süresi içerdiği düşünülsün. i(i1 ,2 ,...,n) ise gösterge değişken olsun, i. yaşam süresi (t ) sağdan i durdurulmuş ise 0, diğer durumda ise 1 değerini alır. R(ti), t zamanındaki risk i kümesi olmak üzere Eş. 2.15.’deki olabilirlik fonksiyonu,

 









n

1 i

) t ( R

i

i

i

) exp(

) exp(

x

x

biçiminde de ifade edilir. Buna karşılık gelen log-olabilirlik fonksiyonu ise aşağıdaki gibi verilmektedir:

 





  

n

1

i R(t)

i i

i

) exp(

log )

( L log

x

x . (2.16)

Cox orantılı tehlikeler modelinde,  parametrelerinin en çok olabilirlik tahminleri Newton-Raphson tekniği gibi sayısal yöntemler kullanılarak log-olabilirlik fonksiyonunun en büyüklenmesi ile bulunmaktadır [3].

2.5.1.2. Eş Zamanlı Gözlemler İçin Olabilirlik Fonsiyonu

Cox orantılı tehlikeler modeli, tehlike fonksiyonunun sürekli olduğunu varsayar ve bu varsayıma göre eş zamanlı (bağlı) yaşam süreleri (tied survival time) yoktur. Yaşam süreleri genellikle en yakın güne, aya ve yıla göre kaydedilir ve eş zamanlı yaşam

(32)

21

süreleri bu dönüşümlü sürecin sonucu olarak ortaya çıkabilir. Verilen bir zamanda birden çok başarısızlık olmasının yanı sıra başarısızlık zamanında bir ya da daha çok durdurulmuş gözlem olabilir. İlgilenilen zaman noktasında durdurulmuş yaşam süreleri ve başarısızlıkların her ikisi de varken, durdurmanın tüm başarısızlıklardan sonra ortaya çıktığı varsayılmaktadır [7].

Eş zamanlı gözlemlerin olması durumunda kullanılan olabilirlik fonksiyonları Cox [1], Breslow [8], Efron [9], Kalbfleisch ve Prentice [10] tarafından önerilmiştir. Kalbfleisch ve Prentice [10] tarafından önerilen olabilirlik fonksiyonunun hesaplanışı zor ve zaman alıcı olduğundan, bu fonksiyona göre hesaplama avantajlarına sahip olan diğer yaklaşımlar kullanılmaktadır [3].

Breslow [8] tarafından önerilen olabilirlik fonksiyonu,





 



r

1

j d

) t ( R

j

j

) j (

) exp(

) exp(

x

s (2.17)

biçimindedir. Burada s , j. başarısızlık zamanında başarısız olan birimler için her bir j p açıklayıcı değişkenin toplamlarından oluşan vektördür. t zamanında (j) d tane j başarısızlık varsa, s ’nin h. elemanı j

j

d

1 k

hjk

hj x

s ’dır. x , j. (hjk j1 ,2 ,...,r) başarısızlık zamanında, başarısız olan birimler d birimden k.’sı j (k1 ,2 ,...,dj) için, h.

) p ..., , 2 , 1 h

( açıklayıcı değişkenin değeridir.

Bu yaklaşımda, t zamanında (j) d tane başarısızlığın ayrık ve ardışık olarak ortaya j çıktığı düşünülmektedir. Bütün ardışık başarısızlıkların olasılığı, Eş. 2.17.’deki

(33)

22

olabilirliğin elde edilmesi için toplanır. Bu yaklaşım aynı zamanda Peto [11] tarafından da önerilmiştir. Bu olabilirlik fonksiyonunun hesaplanması kolaydır ve herhangi bir ölüm zamanında eş zamanlı gözlemlerin sayısı çok fazla değilse uygun bir yaklaşımdır.

Efron [9] ise, Cox orantılı tehlikeler modeli için uygun olabilirliği, D(t(j)), t zamanında j başarısız olan birimlerin kümesi olmak üzere aşağıdaki gibi tanımlamıştır:

  





    



r

1

j d

1

k R(t ) D(t )

1 k j

j

) j

( (j)

) exp(

d ) 1 k ( ) exp(

) exp(

s x

s . (2.18)

Breslow [8]’un ve Efron [9]’un olabilirlik fonksiyonu için önerdiği yaklaşımlar uygulamada benzer sonuçlar vermektedir [3].

Cox [1] ise, eş zamanlı gözlemlerin olması durumunda aşağıda tanımlanan olabilirlik fonksiyonunu önermiştir:

 





r

1 j

) d

; t ( R

j

j ) j (

) exp(

) exp(

s

s . (2.19)

Burada R(t(j);dj), R(t(j))’den çekilen d birimin kümesini göstermektedir. Eş zamanlı j yaşam süreleri yokken, Eş. 2.17., Eş. 2.18. ve Eş. 2.19., Eş. 2.15.’de verilen olabilirlik fonksiyonuna indirgenir [3, 12].

(34)

23

2.5.1.3. Parametre Tahmini: Bilinmeyen Parametreler Vektörünün Elde Edilmesi n tane gözlem ve p tane bilinmeyen parametre olsun. Olabilirlik fonksiyonu ise L() ile gösterilsin. p tane bilinmeyen parametrenin en çok olabilirlik tahmini L()’yı en büyükleyen ˆ1 ,ˆ2 ,...,ˆp değerleridir. Parametre tahminleri,

d 0 ) ( L log d

j ˆ

 

, j1 ,2 ,...,p

olmak üzere p tane denklem aynı anda çözülerek elde edilir. ˆ1 ,ˆ2 ,...,ˆp’lerden oluşan vektör βˆ ile gösterilir ve buna göre en büyüklenmiş olabilirlik fonksiyonu L(ˆ) olur. j için etkili skor,

j

j d

) ( L log ) d

(

u 

 

biçimindedir ve bu nicelikler u() ile gösterilen etkili skorların p bileşenli vektörünü oluşturur. En çok olabilirlik tahminlerinin vektörü,

0 u()ˆ 

biçimindedir ve burada 0, sıfırlardan oluşan px1 boyutlu bir vektördür.

Gözlenen bilgi matrisi Ι() ile gösterilir ve log-olabilirlik fonksiyonunun ikinci türevinin negatifinin pxp matrisidir. Ι()’nin (,jk)’ıncı elemanı,

(35)

24

k j 2logL( )



biçimindedir. En çok olabilirlik tahmin edicilerinin varyans-kovaryans matrisi ise V(ˆ) ile gösterilir ve

ˆ) ( ˆ)

(

V  Ι1

biçiminde verilmektedir. j1 ,2 ,...,p olmak üzere bu matrisin (,j )j. elemanının karekökü ˆj’nin standart hatası olarak tanımlanmaktadır.

Olabilirlik oranı test istatistiğinin değeri,

logL(ˆ) logL(0)

2  

biçimindedir. Wald testi,

ˆ Ι(ˆ)ˆ

ile verilmektedir. Skor testi istatistiği ise aşağıdaki gibidir:

) 0 ( ) 0 ( ) 0

( 1 u

u  .

Bu istatistiklerin her biri 0 yokluk hipotezi altında bir serbestlik dereceli ki-kare dağılımı göstermektedir [12, 13].

(36)

25 2.5.1.4. Newton-Raphson Yöntemi

Newton Raphson yöntemi doğrusal olmayan denklemlerin çözümünde kullanılabilen adımsal bir yöntemdir [14, 15]. Bu yöntem ardışık yaklaşımlar tekniğidir ve bu yaklaşımların her biri adım olarak adlandırılmaktadır. Parametrelerin en çok olabilirlik tahminleri ve katsayıları bu yöntem kullanılarak elde edilmektedir [4].

Newton-Raphson yöntemine göre, bu adımsal yöntem (s1). adımda iken  parametreleri vektörünün tahmini, ˆs1,

βˆ ) ( βˆ ) ( βˆ +

βˆs+1= s Ι 1 s u s (2.20)

biçimindedir. Eş. 2.20.’deki s0 ,1 ,2 ,... olmak üzere u(ˆs) etkili skorların vektörü ve ˆ )

( s

1

Ι bilgi matrisinin tersi olarak ele alınmaktadır. Süreç, ˆ0 0 alınarak başlayabilir. Log-olabilirlik fonksiyonundaki değişim yeterli derecede küçük olduğunda ya da parametre tahminlerinin değerlerindeki en büyük değişim yeterli derecede küçük olduğunda süreç sona erdirilir [3].

2.5.1.5. Parametreler İçin Güven Aralıkları ve Hipotez Testleri

 parametresi için yanılma düzeyinde güven aralığı ˆz/2sh(ˆ) biçiminde tanımlanmaktadır. Burada ˆ , ’nın tahminidir.  parametresi için %100(1) güven aralığı sıfırı içermemesi, ’nın sıfırdan farklı olduğunu göstermektedir. 0 yokluk hipotezi, ˆ/sh(ˆ) istatistiğinin değeri hesaplanarak test edilir. Bu istatistiğin karesi, bir serbestlik dereceli ki-kare dağılımı göstermektedir [3, 13].

Yaşam çözümlemesinde tehlike oranı, ilgilenilen olayın riski ya da tehlike üzerinde açıklayıcı değişkenin etkisi olarak tanımlanmaktadır. İki gruba ait açıklayıcı

(37)

26

değişkenler vektörü x(x1 ,x2 ,...,xp) ve x* (x1* ,x2* ,...,xp*) olmak üzere tehlike oranı,



 

 





 

p

1 j

j j 0

p

1 j

* j j 0

ˆ x exp ) t ( hˆ

ˆ x exp ) t ( hˆ ˆ





 



 

 

p

1 j

j j p

1 j

* j j

ˆ x exp

ˆx

exp

 





  

p

1 j

j

* j

j x x

exp ˆ (2.21)

biçiminde elde edilir [6].  parametresi tehlike oranının doğal logaritmasıdır. Tehlike oranının tahmini ˆ exp(ˆ)’dır. ˆ ’nın standart hatası ise aşağıdaki gibi verilir:

ˆ) ( ˆsh ˆ) (

sh   .

Tehlike oranı için  yanılma düzeyinde güven aralığı  için güven sınırlarını üstelleştirerek bulunabilir. Bu yolla elde edilen aralık tahmini ˆ z sh(ˆ)

2

/

’yı

kullanarak bulunan aralık tahminine tercih edilmektedir [3].

Cox orantılı tehlikeler modelinin kullanılabilmesi için tehlike fonksiyonlarının orantılı olması gerektiğinden açıklayıcı değişkenlerin orantılı tehlikeler varsayımını sağlamaları önemlidir [16].

Orantılı tehlikeler varsayımı, tehlike oranının zamana karşı sabit olması ya da bir grubun tehlike fonksiyonunun diğer grubun tehlike fonksiyonuna orantılı olması anlamına gelmektedir [13]. Ancak özellikle uzun süreli yaşam verileri incelendiğinde, tehlike oranının zamanla değiştiği, sabit olmadığı görülmektedir. Bu durumda da orantısız tehlikeler açığa çıkmaktadır.

(38)

27

Orantılı tehlikeler varsayımı sayısal ya da grafiksel yöntemler kullanılarak incelenmektedir. Sayısal yöntemlerden en çok bilinenleri modele zamana bağlı değişkenlerin eklenmesi [17], Schoenfeld artıkları ile yaşam süresinin rankı arasındaki korelasyon testi, Schoenfeld [18], Harrell [19], Gill veSchmacher [20], Grambsch ve Therneau [21], Quantin [22], Ngandu [23], Chung ve Song [24] tarafından yapılan çalışmalardır. Orantılı tehlikeler varsayımını incelemek için kullanılan grafiksel yöntemler ise,

 Log-(log) yaşam eğrilerinin çizimi,

 Cox orantılı tehlikeler modeline ve her bir grup için Kaplan-Meier tahminlerine dayanan yaşam eğrilerinin çizimi (gözlenen ve beklenen yaşam eğrileri),

 Birikimli tehlike fonksiyonu tahminlerinin başarısızlık sayısına karşı çizimi (Arjas [25] grafikleri olarak da adlandırılır),

 Farklı gruplar için, birikimli temel tehlike fonksiyonlarının çizimi (Andersen [26] çizimi olarak da adlandırılmaktadır),

 Log birikimli temel tehlike oranının zamana karşı düzleştirilmiş çizimi,

 Ölçeklendirilmiş Schoenfeld artıklarının zamana karşı düzleştirilmiş çizimleri

biçiminde sıralanabilir [13, 16].

Kullanılan grafiksel ya da sayısal yöntemlerden hangisinin diğerlerine göre daha iyi olduğuna dair kesin bir sonuç verilememiştir. Persson [16] çalışmasında farklı tehlike fonksiyonlarının biçimleri (artan, azalan, çakışan, ıraksak ve monoton olmayan tehlike), örneklem büyüklükleri ve durdurma oranları için literatürde yer alan yöntemleri bir benzetim çalışması ile karşılaştırılmıştır. Bu çalışmasında; Cox tarafından önerilen zamana bağlı açıklayıcı değişken testi ve Grambsch ve Therneau [21] tarafından önerilen ağırlıklandırılmış Schoenfeld artık skor testinin orantısız

(39)

28

tehlikeleri belirlemede en uygun yöntem olduğu sonucuna ulaşılmıştır. Düşük durdurma oranları için Quantin [22]’in önerdiği yöntemin iyi sonuçlar verdiği görülmüştür. Harrell [23] ve Gill ve Schmacher [24] tarafından önerilen yöntemlerin ise diğer testlerin başarısız olduğu durumlarda daha iyi olduğu gözlemlenmiştir [7].

Cox orantılı tehlikeler modelinin temel varsayımı olan orantılı tehlikeler varsayımının sağlanmaması durumunda klasik Cox orantılı tehlikeler modelinin kullanılması uygun olmamaktadır. Orantısız tehlikeler içeren yaşam verisinin modellenebilmesi için önerilen farklı yaklaşımlar vardır. Bunlar; zamana bağlı açıklayıcı değişkenli Cox regresyon modeli, Tabakalandırılmış Cox regresyon modeli, parametrik regresyon modelleri ve zayıflık modelleri olarak sıralanabilir.

2.5.1.6. Cox Orantılı Tehlikeler Modelinde Model Seçim Kriterleri

Yaşam modellerinde yaşam verisi için en uygun olan modele karar verebilmek için Akaike bilgi kriteri (AIC) ya da Bayesci bilgi kriteri (BIC) kullanılmaktadır. Literatürde birçok model seçim kriteri önerilmiştir. Çizelge 2.1’de en çok bilinenlerden Akaike (AIC), Düzeltilmiş Akaike (Corrected Akaike AICC), Geliştirilmiş Akaike (Improved Akaike AICSUR) ve Bayesci Bilgi Kriteri (BIC) verilmiştir. Bu eşitliklerde p, bilinmeyen parametrelerin sayısını, n toplam gözlem sayısını ve L modelin olabilirlik fonksiyonunu göstermektedir.

Çizelge 2.1. Model Seçim Kriterleri

p 2 L log 2

AIC  - 

1 p n

) 1 p ( p AIC 2 AICC

 

 -

3 p n

) 3 p )(

2 p ( AIC 2 AICSUR

- -

 

) n ln(

p L log 2

BIC - 

Referanslar

Outline

Benzer Belgeler

• Amaç erken ve doğru şekilde yanıtsızlığın değerlendirilip hastanın normal solumadığını anlayıp KPR basamaklarına geçmek.. Eğitimsiz kurtarıcıların 112

 TYD kalp durması olan kazazedelerde hayat kurtarmak amaçlı TYD kalp durması olan kazazedelerde hayat kurtarmak amaçlı yapılan bir seri eylem.. yapılan bir

• Temel yaşam desteği (TYD) hastane dışı kardiak arrest vakalarının hayatta kalması için esastır..

• Her soluk 1 saniyede verilecek (Göğüs hareketi!). suni

Hollanda’da kayıtlı birliktelik statüsüne girmiş çiftlerin ayrılmaları sonucu Türk mahkemelerinde nafaka davası açılması; yine aynı hukuka göre Hollanda vatandaşı

Ça lış ma da me me kan se ri ve ri si için ba şa rı sız lı ğı et ki le yen risk fak tör le ri ni be lir le mek için en uy gun mo de lin et ki le şim siz ta ba ka lan dı

This paper aimed to extend the results of Finkelstein and Esaulova (2008), in order to relax the problem of independence assumption in the competing risks survival analysis

Uniform ve binom dağılımlı bağımsız değişkene göre =1 ve n=250 için farklı prior bilgi koşullarında BYA ve CRA’nın 1000 Monte Carlo simülasyonundan elde edilen