• Sonuç bulunamadı

ORANTILI HAZARD MODELİNİN ZAMANA BAĞLI DEĞİŞKENLERLE GENİŞLETİLMESİ VE ÇOCUK SUÇLULUĞU ÜZERİNE BİR UYGULAMA. Özlem GÖZ ÇEKÇEKİ

N/A
N/A
Protected

Academic year: 2022

Share "ORANTILI HAZARD MODELİNİN ZAMANA BAĞLI DEĞİŞKENLERLE GENİŞLETİLMESİ VE ÇOCUK SUÇLULUĞU ÜZERİNE BİR UYGULAMA. Özlem GÖZ ÇEKÇEKİ"

Copied!
84
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

SUÇLULUĞU ÜZERİNE BİR UYGULAMA

Özlem GÖZ ÇEKÇEKİ

YÜKSEK LİSANS TEZİ İSTATİSTİK

GAZİ ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ

HAZİRAN 2007 ANKARA

(2)
(3)
(4)

ORANTILI HAZARD MODELİNİN ZAMANA BAĞLI DEĞİŞKENLERLE GENİŞLETİLMESİ VE ÇOCUK SUÇLULUĞU ÜZERİNE BİR UYGULAMA

(Yüksek Lisans Tezi)

Özlem GÖZ ÇEKÇEKİ

GAZİ ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ

Haziran 2007

ÖZET

Yaşam sürdürme analizi zamanla ölçülen değişkenlerin analizinde kullanılan bir yöntemdir. Yaşam sürdürme analizinde en çok kullanılan model Cox tarafından önerilen Cox orantılı hazard regresyon modelidir. Model kolay anlaşılabilir, herhangi bir dağılıma bağlı olmayan ve uygulanması kolay bir regresyon modelidir. Modelin temel varsayımı, yaşam sürdürme zamanı üzerinde etkili olduğu düşünülen değişkenlere ait hazard oranının zaman boyunca sabit olmasıdır. Orantılılık varsayımı birçok yöntemle denetlenebilir.

Bu yöntemlerden bir tanesi de zamana bağlı değişkenlerin kullanılmasıdır.

Orantılılık varsayımının bozulduğu durumlarda değişen hazard oranını belirlemek ve tahmin edici ile zaman arasındaki ilişkiyi gösterebilmek için zamana bağlı değişkenler kullanılır.

(5)

Bu çalışmada Cox orantılı hazard regresyon modeli, orantılılık varsayımının denetlenmesi, zamana bağlı değişkenler, zamana bağlı değişkenler için Cox orantılı hazard modelinin genişletilmesi ve orantılılığın testi için zamana bağlı değişkenlerin kullanımı anlatılmıştır. Uygulama bölümünde çocuk suçluluğu konusunda bir çalışma yapılarak yaşam sürdürme analizinin suç araştırmalarında kullanılabilirliği gösterilmiştir.

Bilim Kodu : 205, 1.066

Anahtar Kelimeler :Yaşam sürdürme analizi, Cox orantılı hazard regresyon modeli, çocuk suçluluğu

Sayfa Adedi :70

Tez Yöneticisi :Yrd. Doç. Dr. Emel BAŞAR

(6)

REFINEMENT OF PROPORTIONAL HAZARD MODEL BY TIME DEPENDENT VARIABLES AND AN APPLICATION ON JUVENILE

DELINQUENCY (M.Sc.Thesis)

Özlem GÖZ ÇEKÇEKİ

GAZI UNIVERSITY

INSTITUTE OF SCIENCE AND TECHNOLOGY June 2007

ABSTRACT

Survival analysis are used to analyse the variables that are evaluated by time.

The most used model in survival analysis is the Cox proportional hazard regression model which is proposed by Cox. The model is an intelligible regression model and it is easy to apply while it does not depend on any distribution. The basic assumption of the model is the constancy of the hazard ratio of variables which are conceived to affect the survival time, over time. The proportionality assumption is assessed by many methods. One of these methods is the use of time dependent variables. Time dependent variables are used to point out the relation between the predictor and time and to define the hazard ratio that changes when the proportionality assumption is not satisfied.

(7)

In this study, Cox proportional hazard regression model, evaluating the proportionality assumption, time dependent variables, refinement of Cox proportional hazard model for time dependent variables and using time dependent variables for testing the proportionality are described. In the application chapter the utility of survival analysis in criminal studies is shown by a study about juvenile delinquency.

Science Code :205. 1.066

Key Words :Survival Analysis, Cox proportional hazard regression model, juvenile delinquency

Page Number :70

Adviser :Assist. Prof. Dr. Emel BAŞAR

(8)

TEŞEKKÜR

Çalışmalarım boyunca değerli yardım ve katkılarıyla beni yönlendiren danışmanım Sayın Yrd. Doç. Dr. Emel BAŞAR’a, Çocuk Suçluluğu verilerini kullanmama izin veren Ankara Emniyet Müdürü Sayın Ercüment YILMAZ’a, verileri kullanmak için izin almamda bana yardımcı olan Ar-Ge Büro Amiri Sayın İbrahim ÇAPAN’a, çizimleri ve çevirileriyle teknik destek sağlayan Sayın Ferhat TÜRKMEN’e, her zaman olduğu gibi destekleriyle yanımda olan Sevgili Aileme, her konuda olduğu gibi yüksek lisans eğitimim boyunca bana yardımcı olan, destekleyen, benim kadar emek veren anlayışlı eşime sonsuz teşekkürlerimi sunarım.

(9)

İÇİNDEKİLER

Sayfa

ÖZET ...iv

ABSTRACT...vi

TEŞEKKÜR……… .viii

İÇİNDEKİLER ... ix

ÇİZELGELERİN LİSTESİ...xii

ŞEKİLLERİN LİSTESİ...xiii

1. GİRİŞ ... 1

2.YAŞAM SÜRDÜRME ANALİZİNE GİRİŞ ... 3

2.1. Durdurma... 5

2.1.1. Planlanmış durdurma ... 7

2.1.2. Planlanmamış durdurma... 8

2.2. Yaşam Sürdürme Analizinde Kullanılan Fonksiyonlar ... 9

2.2.1. Olasılık yoğunluk fonksiyonu……...………..…...10

2.2.2. Yaşam sürdürme fonksiyonu……...……….…….10

2.2.3. Hazard fonksiyonu……...……….………….11

2.2.4. Birikimli hazard fonksiyonu....……...………...13

2.3. Yaşam Sürdürme Analizinde Kullanılan Fonksiyonlar Arasındaki İlişkiler………...14

3. COX ORANTILI HAZARD REGRESYON MODELİ……….17

3.1. Cox Orantılı Hazard Regresyon Modelinin Yapısı………...18

3.2. Orantılı Hazard Modeli İçin Olabilirlik Fonksiyonunun Elde Edilmesi……...19

3.2.1. Newton-Raphson yöntemi…………...………..23

(10)

Sayfa 3.2.2. β Parametrelerine ilişkin hipotez testleri ve güven

aralıkları…...…...24

4. ORANTILI HAZARD VARSAYIMININ DEĞERLENDİRMESİ...26

4.1. Grafiksel Yaklaşım…...………...26

4.2.1. Log-Log grafikleri…....………...…………..26

4.2.2. Gözlenen ve beklenen yaşam eğrileri………... 30

4.2.3. Uyum iyiliği araştırması………...………31

4.2.4. Oransal hazard varsayımının testi için zamana bağlı değişkenlerin kullanılması…………...………...32

5. ZAMANA BAĞLI DEĞİŞKENLER……….34

5.1. Zamana Bağlı Değişkenlerin Tanımı………...………34

5.2. Zamana Bağlı Değişken Tipleri………...………34

5.2.1. İçsel değişkenler………...……….…..35

5.2.2. Dışsal değişkenler…...………...……….…...35

5.3. Cox Orantılı Hazard Modelinin Zamana Bağlı Değişkenler İçin Genişletilmesi………..37

5.4. Orantılı Hazard Varsayımının Denetlenmesi İçin Zamana Bağlı Değişkenlerin Kullanılması……….40

6. UYGULAMA…...………..44

6.1. Araştırmada Kullanılan Değişkenler ve Tanımları…...………....……46

6.2. Araştırmada Kullanılan Değişkenlerin Özellikleri… ………....………47

6.3. Araştırmada Kullanılan Değişkenler İçin Yaşam Sürdürme ve Hazard Fonksiyonları Grafikleri……....………...…..…50

6.4. Cox Orantılı Hazard Regresyon Modeli………..…..…...56

(11)

Sayfa

6.5. Modelde Yer Alan Değişkenlerin Orantılılık Varsayımının

Denetlenmesi ve Zamana Bağlı Değişkenlerin Kullanılması……...……58

7. SONUÇ VE ÖNERİLER ...65

KAYNAKLAR ...68

ÖZGEÇMİŞ ...70

(12)

ÇİZELGELERİN LİSTESİ

Çizelge Sayfa

Çizelge 6.1. Çalışmada kullanılan değişkenler ve düzeyleri...43 Çizelge 6.2. Modelde yer alan değişkenlerin katsayı tahminleri...57 Çizelge 6.3. Modelde yer alan değişkenler ve zaman ile etkileşimlerindeki

tahmin değerleri...60

(13)

ŞEKİLLERİN LİSTESİ

Şekil Sayfa

Şekil 2.1.On birey için 1970-1980 yılları arasındaki yaşam sürdürme süreleri...6

Şekil 2.2.On birey için yaşam sürdürme sonuçları ( x: öldü, o: durduruldu)...7

Şekil 2.3. Yaşam sürdürme fonksiyonu...11

Şekil 2.4. Yaşam sürdürme sürelerine ilişkin basamak fonksiyonu ...11

Şekil 2.5. Sabit hazard modeli...12

Şekil 2.6. Artan hazard modeli...13

Şekil 2.7. Azalan hazard modeli...13

Şekil 2.8. İlk önce artan sonra azalan hazard modeli...13

Şekil 3.1.Bireyler için durdurma zamanı...22

Şekil.4.1.ln(-lnS(ˆ t)) eğrisinin elde edilmesi …...27

Şekil 4.2. Bireylere ilişkin log-log grafiği...29

Şekil4.3. Tedavi edilen ve placebo hastalar için gözlenen yaşam eğrisi...31

Şekil.5.2. İki ölçüm arasındaki zamana bağlı değişkenin değerinin hesaplanması ...36

Şekil.5.1. Üç hastanın yaşam sürdürme zamanları...39

Şekil 6.1. Cinsiyet değişkeni için yaşam sürdürme grafiği...50

Şekil 6.2. Cinsiyet değişkeni için hazard grafiği...50

Şekil 6.3. Karakol değişkeni için yaşam sürdürme grafiği...51

Şekil 6.4. Karakol değişkeni için hazard grafiği...51

Şekil 6.5. Doğum yeri değişkeni için yaşam sürdürme grafiği...52

Şekil 6.6. Doğum yeri değişkeni için hazard grafiği...52

Şekil 6.7. Yaş değişkeni için yaşam sürdürme grafiği...53

Şekil 6.8. Yaş değişkeni için hazard grafiği...53

(14)

Şekil Sayfa

Şekil 6.9. Suç çeşiti değişkeni için yaşam sürdürme grafiği...54

Şekil 6.10. Suç çeşiti değişkeni için hazard grafiği...54

Şekil 6.11. Ögrenim değişkeni için yaşam sürdürme grafiği...55

Şekil 6.12. Ögrenim değişkeni için hazard grafiği...55

Şekil 6.13. Cinsiyet değişkeni için log-log grafiği...58

Şekil 6.14. Yaş değişkeni için log-log grafiği...58

Şekil 6.15. Öğrenim değişkeni için log-log grafiği...62

Şekil 6.16. Suç çeşiti değişkeni için log-log grafiği...64

(15)

1.GİRİŞ

Yaşam sürdürme analizi, bir zaman aralığı belirlendikten sonra tanımlanan bir olay meydana gelene kadar geçen zaman sürelerinden oluşan veriyi analiz etmek için kullanılan bir yöntemdir. Başarısızlık zamanı analizi (failure time analysis) ya da olay zaman analizi (event time analysis) olarak da ifade edilir [Başar, 1993].

Yaşam sürdürme analizinde değişkenler ile yaşam sürdürme süresi arasındaki ilişki regresyon modelleriyle belirlenebilir. Yaşam sürdürme analizinde kullanılan regresyon modellerinin bir tanesi de 1972 yılında Cox tarafından öne sürülen Cox orantılı hazard regresyon modelidir.

Cox orantılı hazard regresyon modeli kolay anlaşılabilir, herhangi bir dağılıma bağlı olmayan ve uygulanması kolay bir regresyon modelidir. Ancak bu model bazı varsayımlar altında kullanılabilir. Orantılı hazard regresyon modeli, değişkenlerin düzeyleri arasındaki hazardların orantılı olduğu ve zaman boyunca hazard oranının sabit olduğu varsayımına dayanır. Kimi çalışmalarda değişkenlerin hazard üzerindeki etkisi izleme süresi boyunca değişebilir ve orantılılık varsayımı sağlanmayabilir. Bu gibi durumlarda orantılı hazard regresyon modeli zamana bağlı değişkenleri içerecek şekilde genişletilebilir.

Çalışmada orantılı hazard modelinin zamana bağlı değişkenlerle genişletilmesinin anlatılması ile Dünya’da ve Türkiye’de gitgide artan bir sorun olan çocuk suçluluğuna ilişkin bir uygulama yapılarak, daha çok fen bilimleri ve tıp alanında gelişme gösteren yaşam sürdürme analizinin suç araştırmalarında da uygulanması ile suça karışmış bir çocuğun ikinci kez suça karışmasına kadar geçen süreye etki eden faktörlerin incelenmesi amaçlanmıştır. Daha önce yapılan literatür çalışmalarında Türkiye’de suç araştırmalarında yaşam sürdürme analizinin kullanımı hakkında herhangi bir bilgiye ulaşılamamıştır.

Çalışmanın ilk bölümünde, yaşam sürdürme analizine kısa bir giriş yapılarak temel kavramlar açıklanmıştır.

(16)

İkinci bölümde, yaşam sürdürme analizini diğer istatistiksel yöntemlerden ayıran önemli özelliklerden birisi olan durdurulmuş gözlemler ve durdurma tipleri hakkında bilgi verilmiştir.

Üçüncü bölümde, yaşam sürdürme analizinde kullanılan ve önemli bir regresyon modeli olan Cox regresyon modelinin yapısı, olabilirlik fonksiyonu, parametre tahminleri, güven aralıkları ve hipotez testleri hakkında bilgi verilmiştir.

Dördüncü bölümde, Cox orantılı hazard regresyon modelinin varsayımı olan orantılılık varsayımının denetlenmesi ve bu amaçla kullanılan yöntemler hakkında bilgi verilmiştir.

Beşinci bölümde, zamana bağlı değişkenlerin modele katılması anlatılmaya çalışılmıştır. Zamana bağlı değişkenlerin tanımı, değişken tipleri, Cox orantılı hazard regresyon modelinin zamana bağlı değişkenler için genişletilmesi ve orantılı hazard varsayımının denetlenmesi için zamana bağlı değişkenlerin nasıl kullanılacağı hakkında bilgi verilmiştir.

Altıncı bölümde, uluslararası, ulusal ve yerel boyutta kamuoyunun dikkatini ve duyarlılığını her gün artıran bir sorun olan çocuk suçluluğu konusunda bir uygulama yapılmıştır.

(17)

2.YAŞAM SÜRDÜRME ANALİZİNE GİRİŞ

Yaşam sürdürme analizi ilk olarak 17. yüzyılda kullanılmaya başlamıştır. 1687-1691 yılları arasında Edmund Halley ilk yaşam tablosunu tasarlamıştır. Halley’in tasarladığı yaşam tablosu günümüzde demografi ve aktüerya çalışmalarında kullanılan yaşam tabloları ile çok benzerlik göstermektedir.

20. yüzyılda İkinci Dünya Savaşı sırasında özellikle askeri teçhizatların güvenilirliği ve yaşam sürdürme süreleri üzerine araştırmalar hızlanmıştır. Savaş sonrasında da özellikle elektronik endüstrisi alanında yaşam sürdürme analizlerinin önemi artmıştır [Marubini ve Valsecchi, 2004].

20. yüzyılın ikinci yarısından sonra başta tıp olmak üzere fen ve sosyal bilimlerde yapılan araştırmalarda yaşam sürdürme analizi daha çok kullanılır hale gelmiştir.

Örneğin; Mac Donald’ın 1963 yılında bir hastalığa yakalananları belirli bir süre izleyerek yaşam sürdürme sürelerinin ölçülmesine ilişkin araştırması [Mac Donald,1963], ya da Frei’in 1961 yılında belirli bir hastalığı olan ve tedavi edilen kişilerin tedaviden sonra iyileşme sürelerinin incelenmesine ilişkin araştırması [Frei,1961], gibi birçok tıbbi araştırmada yaşam sürdürme analizi kullanılmıştır.

Yaşam sürdürme analizi sadece ölümlülüğün değil ölçülebilir süreçlerin analizi için de kullanılır.

Sosyal bilimler alanında ise, 1988 yılında Fichman maden ocağında çalışan kömür işçilerinin çalıştığı günlerin kayıtlarına ilişkin veriyi kullanarak, işe devam etmenin motivasyonel sonuçlarını yaşam sürdürme analizi kullanarak araştırmıştır [Fichman, 1988]. Yine 1988 yılında Lehler evlilikteki anlaşmazlıklara neden olan faktörlerin etkilerini yaşam sürdürme analizi ile incelemiştir [Lehler,1988]. 1997 yılında Albonetti ve Hepburn tarafından şartlı olarak serbest bırakılan 617 suçlunun ortalama şartlı serbest bırakılma süresini etkileyen faktörleri yaşam sürdürme analizi ile araştırılmıştır [Albonetti ve Hepburn, 1997]. Bu alanlarda yapılan örnekleri artırmak mümkündür.

(18)

Yaşam sürdürme analizi, hastalara uygulanan tedavi biçimlerinin başarısının gösterilmesi, farklı tedavi yöntemlerinin veya farklı ilaç tedavilerinin uygulandığı gruplar arasında kıyaslamalar yapılabilmesi gibi tıp araştırmalarında ya da herhangi bir sürecin (prosess) güvenilirlik uygulamalarının test edilmesi, makinelerin ardışık iki kez bozulması arasında geçen sürenin analiz edilmesi, elektronik parçalarının yaşam sürdürme sürelerinin analiz edilmesi, firmaların piyasadaki yaşam sürdürme sürelerinin analiz edilmesi gibi endüstriyel araştırmalarda ve daha birçok alanda kullanılabilir.

Yaşam sürdürme analizinin kullanılabilmesi için yaşam sürdürme zamanı hiçbir tereddüde yer vermeyecek biçimde açık olarak tanımlanmalıdır. Örneğin, tıp alanında yapılan bir araştırmada hastalık teşhisinin konulduğu an yaşam sürdürme zamanının başlangıcı olarak değerlendirilebilir. Başlangıç zamanı her birey için farklı olabilir, farklı zamanlarda araştırmaya katılan bireyler izleme dönemi boyunca izlenirler. Yine hasta bir birey için hastalıktan kurtulduğu zaman da yaşam sürdürme süresinin sona erdiği an olarak değerlendirilebilir.

Yaşam sürdürme süresi iyi belirlenmiş bir başlangıç zamanı ile tanımlanan durumun ortaya çıktığı zaman arasında geçen süre olarak tanımlanır ve rasgele değişken T ile gösterilir [Cox ve Oakes, 1984]. Yaşam sürdürme verisi de bu sürelerden oluşur.

Araştırmaya katılan her bir birey ya da birim için yaşam sürdürme süresinin ölçümü aynı ölçek ile yapılmalıdır (gün, ay, yıl, taşıt için kilometre gibi).

Yaşam sürdürme analizi, pozitif değer alan değişken olan yaşam sürdürme sürelerinden oluşan verilerin analiz edilmesinde kullanılır. Yaşam sürdürme analizi ile yapılan araştırmalarda tanımlanan olay, belirlenmiş olan zaman diliminde ortaya çıkmayabilir. Herhangi bir nedenden dolayı verinin izlemesi yapılamamış ya da çeşitli nedenlerle gözlem dışı bırakılmış olabilir bu durumda yaşam sürdürme analizinde “durdurulmuş” (censored) gözlemler kullanılmaktadır [Kleinbaum,1996].

(19)

2.1.Durdurma

Yaşam sürdürme analizini diğer analiz tekniklerinden ayıran en önemli özellik durdurulmuş gözlemlerin kullanılabilmesidir.

Örneğin, tıp alanında yapılan bir araştırmada çalışmanın sonunda bütün izleme süresi boyunca yaşam sürdürme süresini tamamlamayan ya da araştırma esnasında iletişime devam edilemeyen hastalar da olabilir. Bu gibi durumlarda hiçbir araştırmacı bu birim ya da bireylerin tamamını kayıp veri (missing data) olarak çalışmanın dışında bırakmak istemez, çünkü bunların çoğu araştırma sonucunu etkileyebilir. Bireyin başka bir kente taşınması ya da tekrar kontrole gelmemesi gibi nedenlerle hastanın durumunun takip edilmesi mümkün olmayabilir. Bu bireyin yaşam sürdürme süresiyle ilgili bilgi, hastanın en son görüldüğü anda elde edilen bilgi olur ve durdurulmuş gözlem olarak araştırmaya katılır [Collet, 2003].

Herhangi bir tıbbi araştırmada tanımlanan olaydan başka bir nedenle de yaşam sürdürme süresi sona erebilir. Örneğin tanımlanan durumun ölüm olarak alındığı bir araştırmada ölümün tedavi ile ilgili olmayan nedenlerle gerçekleşmesi durumunda da yaşam sürdürme süresi durdurulmuş olarak değerlendirilir. Ancak ölümün hastaya uygulanmakta olan belirli bir tedaviden bağımsız olup olamadığının tespit edilmesi zor olabilir. Örneğin kanser tedavisinde kullanılan yöntemlerin araştırıldığı bir araştırmaya katılan bir hastanın trafik kazasında hayatını kaybettiği durumda kaza, tedavi yöntemlerinden bağımsız gibi görünse de hastaya uygulanan tedavinin yan etkisi olan bir baş dönmesi nöbetinin kazaya sebep olması durumunda ölümün tedavi yöntemlerinden bağımsız olamayacağı açıktır. Bu gibi durumlarda, herhangi bir sebepten kaynaklanan ölüme kadar yaşam sürdürme süresi de yaşam sürdürme analizi sürecine dahil edilebilir [Collet, 2003].

n tane bireyin yer aldığı bir araştırmada i. birey için yaşam sürdürme zamanı, rasgele değişkenin aldığı değeri ve eğer tanımlanan olay ortaya çıkmamış ise durdurma zamanı olsun, o zaman yaşam sürdürme süresi rassal değişkeni

ti

ci

(20)

min( , )

i i

T = t ci ’ dir. Eğer, ti ≤ ise olay durdurma zamanından önce ortaya çıkmıştır ci ve değişkeni durdurulmamıştır. Aksine ise durdurma zamanı olayın ortaya çıkma zamanından daha önce gerçekleşmiştir ve değişkeni durdurulmuştur [Cox&Oakes, 1984].

Ti ti >ci

Ti

Yaşam sürdürme zamanı her birey için farklı olabilir. Bireyler farklı zamanlarda araştırmaya katılabilir. Farklı zamanlarda tanımlanan olay ortaya çıkabilir ya da birey durdurulmuş gözlem olarak araştırmaya katılabilir. Örneğin, Şekil 2.1 ve Şekil 2.2’den de görüleceği üzere 1970 yılının araştırmanın başlangıç zamanı ve 1980 yıllının ise araştırmanın sona erdirildiği zaman olarak kabul edildiği bir araştırmada, bireyler farklı zamanlarda araştırmaya katılmış ve yaşam sürdürme süreleri farklı olmuştur.

1970 1975 1977 1980

Şekil 2.1. On birey için 1970-1980 yılları arasındaki yaşam sürdürme süreleri

(21)

t=0 t=10

Şekil 2.2. On birey için yaşam sürdürme sonuçları ( x: öldü, o: durduruldu)

Burada 3 birey için durdurma gözlenmiş ve bireyler yaşam sürdürme zamanlarını çalışma döneminin ilerleyen kesimi içinde yani dönemin sağ tarafında tamamlamışlardır. Yani çalışma bitmeden bireyin kaybolması, ayrılması, yok olması dönemin sağ tarafında olmuştur [Cox&Oakes, 1984].

İncelenen olayın yapısına ve elde edilen verinin türüne bağlı olarak birçok durdurma tipinden bahsetmek mümkündür. Durdurma tipleri hakkında pek çok farklı görüş olmasına rağmen en uygun sınıflandırma, durdurmayı planlanmış ve planlanmamış olarak iki ana başlıkta incelemektir [Başar,1993].

2.1.1. Planlanmış durdurma

Planlanmış durdurmada araştırmanın en başında araştırma süresinin belirlendiği ve bu süre sonunda araştırmanının sona erdirildiği ya da yine araştırmanın başında ortaya çıkacak olay sayısının belirlendiği ve belirlenen sayıda olay ortaya çıktığında araştırmanın sona erdirildiği durdurma çeşididir. I. Tip Durdurma ve II. Tip durdurma olmak üzere iki başlıkta incelenebilir.

(22)

I. Tip durdurma

I. Tip durdurma, önceden planlanan bir zamanda çalışmanın sona erdirildiği bir durdurma kuralıdır ve zamansal durdurma (time censoring) olarak da isimlendirilir.

Araştırmanın sürdürüldüğü zaman sabit olduğundan bu süre içinde gözlenen yaşam sürdürme zamanları rassal değişkendir [Başar,1993].

II. Tip durdurma

Önceden planlanan sayıda olay meydana geldiği anda çalışmanın sona erdirildiği bir durdurma kuralıdır ve sayısal durdurma (failure cersoring) olarak adlandırılır.

Araştırmada yaşam sürdürme sayısı sabit olduğundan rassal değişken her birim için yaşam sürdürme zamanıdır [Başar,1993].

2.1.2. Planlanmamış durdurma

Durdurma zamanları rasgeleliğe bağlı nedenlerle belirlenirse rassal durdurma ortaya çıkar. Basit bir rassal durdurma sürecinde her bir bireyin yaşam sürdürme zamanı ve durdurma zamanına sahip olduğu varsayılır. ve bağımsız, sürekli rasgele

değişkenlerdir. Durdurma elde edilen bilgi türüne göre farklı tiplerde sınıflanır [Başar, 1993].

ti

ci ti ci

Sağdan durdurma

Tıbbi alanda yapılan çalışmalarda, anında tedavisine başlanan her hasta + t zamanında iyileşecektir. Ancak, hastanın yaşam sürdürme zamanı t, hala iyileşmemesi ya da takibinin mümkün olmaması durumunda bilinemeyebilir. Eğer bireyin en son belirli bir zamanda daha iyileşmemiş olduğu biliniyor ise, en son bilginin alındığı bu zaman bir durdurulmuş yaşam sürdürme süresidir. Bu durdurma, birey çalışmaya dahil olduktan sonra ortaya çıkar ve en son bilinen yaşam sürdürme süresinin sağ tarafıyla ilgili olduğundan “sağdan durdurma” (right censoring) olarak

t0 t0

(23)

adlandırılır. Sağdan durdurulmuş yaşam sürdürme süresi, bilinmeyen gerçek yaşam sürdürme süresinden daha küçük olur [Collet, 2003].

Soldan durdurma

Bir başka durdurma çeşiti de, tanımlanan durumun yaşam sürdürme zamanı başlamadan önce ortaya çıktığı yani başlangıç zamanının kesin olarak bilinmediği durumlarda karşılaşılan “soldan durdurma” (left censoring) dır. Belirli bir kanser olayında, birincil tümörün cerrahi müdahaleyle alınmasından sonra tekrarlama süresinin incelendiği bir çalışmada hastaların operasyondan üç ay sonra kanserin tekrarlayıp tekrarlamadığı konusunda karar verilmek üzere incelendiği düşünülsün.

Bazı hastalarda tekrarlama gözlendiği halde tekrarlama süresi yaşam sürdürme süresi başlamadan ortaya çıkabilir. Bu gibi durumlarda tekrarlama süreleri soldan durdurulmuş olur. Soldan durdurma sağdan durdurmaya göre daha nadir uygulanmaktadır [Collet, 2003].

Aralıklı durdurma

Diğer bir durdurma çeşidi de “aralıklı durdurma”dır. Bu durdurma çeşidinde bireyler bir zaman aralığında tanımlanan olayla karşı karşıya kalmaktadır. Belirli bir hastanın ilk üç aylık kontrolünde hastalık belirtilerine rastlanmamış ancak altıncı ayda yapılan ikinci kontrolde tümörün tekrarladığı görülürse hastalığın gerçek tekrarlama süresi üçüncü ve altıncı aylar arasında olacak ve dolayısıyla gözlemlenen tekrarlama süresinin aralıklı durdurulduğu söylenebilecektir [Collet, 2003].

2.2. Yaşam Sürdürme Analizinde Kullanılan Fonksiyonlar

Yaşam sürdürme analizinde temel olarak üç fonksiyon 1.Olasılık yoğunluk fonksiyonu,

2.Yaşam sürdürme fonksiyonu,

3.Hazard fonksiyonu kullanılmaktadır.

(24)

2.2.1.Olasılık yoğunluk fonksiyonu

i. birey için yaşam sürdürme zamanı T rasgele değişken olmak üzere, T t= ’ye ilişkin olasılık yoğunluk fonksiyonu;

0

( )

( ) limP t T t f t

δ

δ δ

≤ ≤ +

= (2.1)

şeklinde gösterilmektedir. Bu fonksiyon, birey ya da birimin t anındaki istenilen durumun koşulsuz ortaya çıkma yoğunluğunu verir [Cox&Oakes, 1984].

2.2.2. Yaşam sürdürme fonksiyonu

Yaşam Sürdürme Fonksiyonu S(t) , T’ nin belirlenmiş bir yaşam sürdürme zamanı olan t’ den daha büyük olması olasılığını verir.

T, sürekli bir değişken ise;

( ) ( ) ( )

S t =P T t> =

t f t dt 0 t< < ∞ (2.2) T, kesikle bir değişken ise f P T tj: ( = ( )j ) olmak üzere,

( )

( ) ( )

j

j

t t

S t P T t f

>

= ≥ =

j=1, 2,... (2.3) olarak tanımlanır. Yaşam sürdürme fonksiyonu monoton azalan bir fonksiyondur.

(25)

S(t)

S(0) = 1

0 t 1

S(ω) = 0

Şekil 2.3. Yaşam sürdürme fonksiyonu t=0 iken; S(t)=S(0)=1

t= iken; S(t)=S( )=0 ∞ ∞

Teorik olarak S(t) eğirisi 0’a doğru azalır. Fakat uygulamada her bir gözlenen yaşam sürdürme zamanı ti ‘de kesikli olduğu için yaşam sürdürme fonksiyonu basamak (step) fonksiyonu biçimindedir. Çalışma döneminin sona erdiği zaman kesin olarak belirlendiği için çalışılan dönem sonsuz uzunlukta olmaz ve çalışma dönemi sonunda S(t) fonksiyonu belli bir t zamanında kesilir [ Kleinbaum, 1996 ].

S(t)

0 t 1

Çalışma

Şekil 2.4. Yaşam sürdürme sürelerine ilişkin basamak fonksiyonu 2.2.3. Hazard fonksiyonu

Hazard fonksiyonu h(t), bireyin t zamanına kadar yaşadığı biliniyorken ( t+ Δ ) t zamanına kadar yaşamının sona ermesi riskidir. Bireyin ilgilenilen özellik bakımından başarısızlık eğiliminin bir ölçüsüdür.

(26)

Burada h(t) başarısızlık hızı (failure rate), ani ölüm hızı (instantaneous death rate) ya da ölümlülük gücü (force of mortality) olarak ifade edilebilir. Hazard fonksiyonu, yaşam sürdürme analizinde önemli bir yer tutar ;

0

( /

( ) lim

t

P t T t t T t

h t Δ → t

≤ < + Δ ≥

= Δ

) (2.4)

şeklinde ifade edilir. Sürekli dağılımlar için h(t) fonksiyonu,

- h(t) 0 ≥ (2.5)

- ( ) (2.6)

t

h t dt

= ∞

özelliklerini sağlar [Lawless, 1982].

Hazard fonksiyonu bir zaman aralığında var olan başarısızlık riskinin tanımıdır ve

“koşullu başarısızlık oranı “ olarak da tanımlanabilir. Hazard fonksiyonu bir olasılık fonksiyonu değil bir orandır. Olasılık değerleri gibi (0,1) aralığında değil (0, ∞ ) aralığında yer alır.Yaşam sürdürme fonksiyonunun sahip olduğu dağılıma göre hazard fonksiyonu farklı yapıdadır. Örneğin, yaşam sürdürme modeli üstel dağılıma sahip ise hazard fonksiyonu sabit bir değer, Weibull dağılımına sahipse artan ya da azalan değerler, log-normal dağılıma sahip ise önce artan sonra azalan değerler alır.

Örneğin; T üstel dağılımlı olduğunda,

t 0

h(t)

Şekil 2.5. Sabit hazard modeli

(27)

T weibull dağılımlı olduğunda,

Şekil 2.6. Artan hazard modeli T weibull dağılımlı olduğunda,

Şekil 2.7. Azalan hazard modeli T log-normal dağılımlı olduğunda,

t 0

h(t)

t 0

h(t)

0 h(t)

t

Şekil 2.8. İlk önce artan sonra azalan hazard modeli eğrileri elde edilir [Kleinbaum, 1996].

(28)

2.2.4.Birikimli hazard fonksiyonu

irikimli hazard fonksiyonu, araştırma dönemi içerisinde belirli bir t anı için B

hesaplanmış olan başarısızlık hızlarının birikimli fonksiyonudur. Birikimli hazard fonksiyonu H(t) ile gösterilir ve

0

( ) ( )

t

H th u d

= ⎜ ⎟

u⎠ (2.7)

larak tanımlanır. Ayrıca

o lim ( )

t H t

→∞ = ∞olur. H(t) fonksiyonu artan bir fonksiyondur

.3.5.Yaşam sürdürme analizinde kullanılan fonksiyonlar arasındaki ilişkiler

oşullu olasılık tanımından hazard fonksiyonu;

[Cox&Oakes, 1984].

2

K

( ) ( ) ( ) h t f t

= S t (2.8)

eklinde ifade edilebilir. ( ), ( ), ( )f t S t h t

ş T değişkenin farklı şekillerde ifade edilmesi

lirtilen üç

olarak düşünülebilir. Be fonksiyonun da birbiri ile ilişkili olduğu söylenebilir. Olasılık yoğunluk fonksiyonu yaşam sürdürme fonksiyonu cinsinden

( ) ( ) [1 ( )] '( )

f t F t S t S

t t

= = = −

t (2.9)

eklinde ifade edilebilir. Bu ifade Eş. 2.8’de yerine yazılırsa, ş

( ) '( ) ln[ ( )]

( )

S t d

h t S t

S t dt

=− = − (2.10)

(29)

ifadesi elde edilir. Yaşam sürdürme fonksiyonunun logaritmik ölçekte gösterilmesi hazard fonksiyonunu vermektedir.

Elde edilen ifade birikimli hazard fonksiyonunda yerine yazılırsa;

0 0

( ) ( ) ln( ( )) ln ( )

t

H t =

h u du = − S u t = − S t (2.11) elde edilir. Yaşam sürdürme ve hazard fonksiyonu ise;

0

( ) exp[ ( ) ] exp[ ( )]

t

S t = −

h u du = −H t (2.12)

şeklinde yazılabilir. Son olarak ise;

( ) ( ) / ( )

h t = f t S t eşitliği dikkate alınarak olasılık fonksiyonu hazard fonksiyonu cinsinden yazılabilir.

0

( ) ( ) exp[ ( ) ]

t

f t =h t

h u du (2.13)

Yaşam sürdürme analizi ile yapılan araştırmalarda her birey ya da birim için ilave bilgiler de kaydedilir. Örnek olarak iki tedavi şeklinin kıyaslandığı tıbbi araştırmalarda, hastanın yaşı ve cinsiyeti gibi demografik değişkenler, kandaki hemoglobin miktarı ve nabız gibi fizyolojik değişkenler ve hastanın sigara ve yeme alışkanlığı gibi yaşam tarzıyla ilgili değişkenler araştırılan durumun yanı sıra ek bilgi olarak elde edilebilir. Bu değişkenler hastanın yaşam süresi üzerinde etkili olabilir.

Yaşam süresini etkilediği düşünülen bu değişkenler eşdeğişken (covariate) olarak adlandırılabilir [Collet, 2003].

(30)

Birçok araştırmada incelenen yığın homojen yapıya sahip olmayıp heterojen bir durum sergiler. Yaşam sürdürme süresinin de çoğunlukla homojen olmayıp birçok durumdan etkilendiği söylenebilir. Yaşam sürdürme analizinde her bir birey veya her bir birim için belirli bir zaman aralığında yaşam sürdürme zamanını etkilediği düşünülen, bir ya da daha çok eşdeğişkenin değerine bağlı olarak, belli bir grubun yaşamsal deneyimi modellenir.

Yaşam sürdürme analizinde eşdeğişkenlere ait bilgi edinilebiliyorsa bu bilgilerin hesaplanan modelde nasıl ve ne şekilde yer aldığı önem kazanır. Yaşam sürdürme süresi bağımlı değişken olarak ve açıklayıcı değişkenler ise eşdeğişken olarak modelde yer alırlar.

Regresyon modelleri yaşam sürdürme süresi ile eş değişkenler arasındaki ilişkiyi açıklamakta önemli bir yere sahip olmaktadır. Değişkenler, yaşam sürdürme süresinin logaritması üzerinde toplamsal ya da yaşam sürdürme süresi üzerine çarpımsal etkiye sahip olduğu log-lineer modeller ve hazard fonksiyonu üzerinde çarpımsal etkiye sahip olduğu orantılı hazard modeli gibi farklı biçimlerde modellenebilir [Başar, 2003].

Orantılı hazard regresyon modellerinin en önemlisi Cox tarafından öne sürülen Cox orantılı hazard regresyon modelidir.

(31)

3.COX ORANTILI HAZARD REGRESYON MODELİ

Yaşam sürdürme analizinde, yaşam sürdürme süresini etkilediği düşünülen eş değişkenlere bağlı olarak yaşam sürdürme süresi modellenebilir. Bu modelleme, özellikle sağlık alanında büyük öneme sahiptir. Örneğin bir kanser hastasına uygulanan tedavi yönteminin kişinin yaşam süresine etkisi ortaya konulabilir ve ele alınan bir grup hastanın verisi karşılaştırılarak tedavi yöntemleri arasından daha başarılı olan belirlenebilir. Burada önemli olan çalışmanın başlangıç zamanında ölçülen eşdeğişken değerlerinin yaşam sürdürme süresini ya da ölüm riskini ne şekilde etkilediğinin tespit edilebilmesidir.

Yaşam sürdürme süresinin modellenmesinin iki önemli amacı bulunmaktadır.

Birincisi, hazard fonksiyonunun şeklini etkileyen eşdeğişkenlerin belirlenmesidir.

Böylece ölüm riskini etkileyen değişkenler belirlenirken eşdeğişkenlerin hazard oranına etkileri incelenebilir. İkincisi ise, bir birey için hazard fonksiyonunun tahmin edilmesidir. Elde edilen hazard fonksiyonu ile yaşam sürdürme fonksiyonu tahminlerine de ulaşılabilir. Böylece bireyin yaklaşık yaşam sürdürme süresi konusunda çıkarımlar yapılabilir. Cox orantılı hazard regresyon modeli yaşam sürdürme süresini etkilediği belirlenen eşdeğişkenlerin bu süreyi ne yönde ve ne kadar etkilediğinin belirlenebilmesi ve bu sayede mevcut ve gelecekteki hastaların yaşam sürdürme sürelerinin yaklaşık olarak bu değerlere göre tahmin edilmesini sağlar [Fleming ve Lin, 2000].

Cox regresyon modeliçalışmaya konu olan yığında farklı birey ya da birimlerin ilgilenilen durum için hazardların zamana orantılı olduğu varsayımına dayanır. Eğer hazardlar orantılı değilse bu, hazardların bazı durumlarda zamanla değiştiği anlamına gelmektedir.

Orantılı hazard regresyon modeli 1972 yılında Cox tarafından öne sürülen bir model olduğu için Cox regresyon modeli olarak bilinir. Modelde yaşam sürdürme süresi rasgele değişkeni için belirli bir olasılık dağılımı yoktur. Bu nedenle de yarı parametrik model olarak bilinir [Collet, 2003].

(32)

3.1.Cox Orantılı Hazard Regresyon Modelinin Yapısı

Cox orantılı hazard modeli durdurulmuş yaşam sürdürme verilerine kolayca uygulanması nedeniyle sıkça kullanılan bir modeldir. Model genel olarak;

1

,

2

,....,

P

X X X

açıklayıcı değişkenler ve x x1, ,...,2 xp açıklayıcı değişkenlerin aldığı değerler olmak üzere;

i.birey için hazard fonksiyonu

( ) 0( ) ( )

h ti =h tψ xi i=1,2,…,n (3.1)

şeklinde ifade edilir. Bütün x eşdeğişkenlerinin değerlerinin “0” olduğu durumda i olur ve hazard fonksiyonu, temel hazard fonksiyonu olarak adlandırılır.

( ) 0( ) h ti =h t

Yaşam sürdürme analizinde iki farklı grubu karşılaştırmak için hazard oranları kullanılabilir.

X X

1

,

2

,...., X

P ve X*1,X*2,....,X*P iki ayrı gruba ilişkin eşdeğişkenler olmak üzere;

* *

* 0

1 1

0

1 1

ˆ ( ) exp( ˆ ) exp( ˆ ) ˆ( , )

( )

ˆ( , ) ˆ ( ) exp( ˆ ) exp( ˆ )

p p

i i i i

i i

p p

i i i i

i i

h t X X

h t X

HR sabit

h t X h t X X

β β

β β

= =

= =

= =

=

= Θ

∑ ∑

şeklinde tanımlanır ve Θsabit bir değerdir.

Hazard fonksiyonunda ( ) exp( )ψ xi = ηi dir. ( )ψ xi , i. bireye ilişkin eşdeğişken değerlerinin bir fonksiyonudur. ηi, p tane eşdeğişkenin doğrusal kombinasyonudur ve ηi;

1 1 2 2 ...

i xi xi p pix

η β= +β + +β j=1,2,…p (3.2)

(33)

1 p

i j jxji

η =

= β

olarak gösterilir. ηi’ye modelin doğrusal bileşeni denilebilir. Ayrıca ηii. birey için risk skoru (risk score) ya da tahmin indeksi (prognostic index) olarak da tanımlanmaktadır. Orantılı hazard modeli yeniden yazılırsa,

1 1 2 2 0

( ) exp( ... ) ( )

i i i p pi

h t = β xx + +β x h t (3.3)

ya da

1 1 2 2

0

log ( ) ...

( )

i i i p

h t

x x xpi

h t β β β

⎧ ⎫

= + + +

⎨ ⎬

⎩ ⎭ (3.4)

şeklinde ifade edilebilir. Böylece orantılı hazard modeli, hazard oranının logaritması için doğrusal bir model haline gelir.

Orantılı hazard modelinin doğrusal bileşenleri sabit terim içermemektedir. Eğer modelβ0 gibi sabit bir terim içerirse, h t0( ) temel hazard fonksiyonu exp(β0)’a bölünerek yeniden ölçeklendirilebilir. Ölçeklendirildikten sonra sabit terim modelde yer almayabilir [Collet,2003] .

3.2. Orantılı Hazard Modeli İçin Olabilirlik Fonksiyonunun Elde Edilmesi

Orantılı hazard modelinin yaşam sürdürme verisine uygulanabilmesi için temel hazard fonksiyonunun dolayısıyla da bilinmeyen parametrelerin tahmin edilmesi gerekir.

Orantılı hazard modelinin bilinmeyen parametreleri olan β katsayıları en çok olabilirlik yöntemi kullanılarak tahmin edilebilir [Gehan ve Siddiqui, 1973]. En çok olabilirlik yönteminin kullanılabilmesi için örneklem verisinin olabilirliğinin

(34)

bilinmesi gerekmektedir. Dikkate alınan modeldeki bilinmeyen parametrelerin bir fonksiyonu sayılan örneklem verisinin olabilirliği gözlenen verinin ortak olasılığıdır.

Bu olasılık;

( ) ( )

( )

( değişkenlerine sahip olan bir bireyin zamanında ölmesi) P( zamanında bir ölümün gerçekleşmesi)

j j

j

P x t

t (3.5)

ifadesinden hareketle bulunabilir.

r tane ayrı ölüm zamanlarına sahip n tane birey olsun ve bu bireylerin n–r tanesi sağdan durdurulmuş olsun. Her bir birey için farklı bir yaşam sürdürme süresinin olduğu, veriler arasında herhangi bir eşzamanlılığın (ties) olmadığı kabul edilsin. Bu durumda j. sıradaki yaşam sürdürme zamanı olmak üzere r tane yaşam sürdürme zamanı,

( )j

t

(1) (2) (3) ... ( )r t <t <t < <t

ile gösterilebilir ve dolayısıyla t , zamanında risk altında bulunan bireyler kümesi ( )j (( )j )

R t olarak ifade edilebilir. Öyleyse, risk kümesi olarak adlandırılan R t(( )j ), zamanından önceki bir zamanda yaşamakta olan ve durdurulmamış bireyler grubudur. Eş. 3.5’de verilen ifadede pay, eşdeğişken vektörü

( )j

t

( )j

x olan bireyin zamanındaki ölüm riskidir. Payda ise,

( )j

t

( )j

t zamanında ölüm riski ile karşı karşıya olan bütün bireylerin ölüm risklerinin toplamlarıdır. Eş. 3.5’de belirtilen ifadeyi daha genel olarak,

( )

( )

( )

exp( ' ) exp( ' )

j

j

l R t l

x x β

β

(3.6)

(35)

şeklinde ifade edebiliriz. Sonuçta r tane ölüm zamanı üzerinden olasılıkların çarpımı olan orantılı hazard regresyon modeli için olabilirlik fonksiyonu;

( )

' ( )

1 ( )

exp( )

( ) exp( ' )

j

r j

j l R t l

L x

x β β

β

=

=

∏ ∑

(3.7)

biçiminde yazılabilir. Eş.3.7.’de verilen olabilirlik fonksiyonuna durdurulmuş bireyler katılmazlar. Ancak herhangi bir durdurma zamanından hemen önceki zamanda risk kümesinde yer alırlar. Her ölüm zamanında risk kümesi belirlenmiş olduğu için olabilirlik fonksiyonu sadece ölüm zamanlarının sıralanmasına bağlıdır.

Eğer olabilirlik fonksiyonuna gözlemlenmiş bireylerin yanı sıra durdurulmuş bireyler de katılırsa olabilirlik fonksiyonu değişerek durdurmaya uygun hale gelir.

Orantılı hazard modeli için olabilirlik fonksiyonu;

0 , durdurma var ise 1 , durdurma yok ise λi = ⎨

⎩ ⎭

olmak üzere;

( )

' ( )

1 ( )

exp( )

( ) exp( ' )

i

j

n j

j l R t l

L x

x β λ

β = β

=

∏ ∑

(3.8)

olarak gösterilebilir. En çok olabilirlik fonksiyonunun hesaplanabilirliği açısından fonksiyonun logaritmasının maksimum hale getirilmesi gerekmektedir. Eş. 3.7’de verilen olabilirlik fonksiyonunun logaritması alınarak;

1 ( )

( ) ' log exp( ' )

i

n

i i l

i l R t

LogL β λ β x β x

=

=

∑ ∑

(3.9)

(36)

log-olabilirlik fonksiyonu elde edilir. Elde edilen olabilirlik fonksiyonu, kısmi olabilirlik fonksiyonu olarak adlandırılır [Cox & Oakes, 1984].

Kısmi olabilirliği daha iyi açıklamak için 1’den 5’e kadar numaralandırılmış bireylerden oluşan bir örnek düşünelim.

Y-Axis

Zaman

Birey

D

C

D

D

C 1

2

3

4

5

0 t(1) t(2) t(3)

Şekil 3.1.Bireyler için durdurma zamanı

2 ve 5 nolu bireylere ilişkin gözlenen yaşam sürdürme verileri sağdan durdurulmuş olsun ve üç sıralanmış ölüm zamanı sırasıyla t(1)<t(2)<t(3) olsun , 3 nolu bireyin

, 1 nolu bireyin, ise 4.nolu bireyin ölüm zamanı olsun.

t(1)

t(2) t(3)

Sıralı ölüm zamanlarının her birindeki risk kümesi , her bir ölüm zamanından önce yaşayan ve durdurulmamış bireyleri içerir. R t( )(1) 1,2,3,4,5 bireylerini içerirken,

((2))

R t 1,2,4 bireyleri ve R t((3)) ise 4. bireyi içerir.

x ; i. birey için açıklayıcı değişken vektörü ve i i=1, 2,..,5 olmak üzere

(37)

( ) exp( ' )xi xi

ψ = β

(1), (2), (3)

t t t zamanlarında sırasıyla 3’üncü, 1’inci ve 4’üncü bireylerin öldüğü zamanlardır. Bu zamanlara ilişkin kısmı olabilirlik fonksiyonunun payı

(3), (1), (4)

ψ ψ ψ dür. Ve bu üç zaman için kısmi olabilirlik fonksiyonu,

(3) (1) (4)

x x

(1) (2) (3) (4) (5) (1) (2) (4) (4)

ψ ψ ψ

ψ +ψ +ψ +ψ +ψ ψ +ψ +ψ ψ

şeklinde ifade edilebilir [Collet, 2003].

Eş. 3.9’da verilen ifade maksimize edilerek β katsayıları tahminleri elde edilir.β katsayılarının tahmin edilmesinde Newton-Raphson yöntemi kullanılmaktadır.

3.2.1. Newton – Raphson yöntemi

Durdurulmuş yaşam sürdürme verisinde β katsayılarının en çok olabilirlik tahminleri için kısmi olabilirlik fonksiyonunun maksimize edilmesinde Newton – Raphson yöntemi kullanılmaktadır.

( )

u β ; Eş. 3.9’daki log-olabilirlik fonksiyonunun β’ya göre birinci türevlerinden oluşan px1’lik vektör olsun. Bu değer “etkin skorların vektörü” olarak bilinmektedir.

( )

I β ; log-olabilirlik fonksiyonunun ikinci türevlerinden oluşan p p boyutlu matris x olsun.

( )

I β ’nin (j, k) için değeri;

2log ( ) ( )

J k

I β L β

β β

= −

∂ ∂ (3.10)

(38)

şeklindedir ve ( )I β matrisi “gözlenen bilgi matrisi” olarak bilinmektedir.

Newton – Raphson yöntemi adımsal bir yöntemdir. Bu yöntem (s+1). döngüsünde iken β parametreleri vektörünün tahmini βˆs+1 ‘dir .

( )s

u β , etkin skorların vektörü veI 1( )βˆS de bilgi matrisinin tersi olarak ele alındığında

0,1, 2,....

s= ve a adım sayısı olmak üzere;

1

ˆs 1 ˆs a I[ ( ) ( )]ˆs u ˆs

β + =β + β β (3.11)

olacaktır.

Log–olabilirlik fonksiyonundaki değişim yeterince küçük olduğunda ya da katsayı tahminlerinin değerlerindeki göreli değişim yeterince küçük olduğunda hesaplama süreci sona erdirilir [Collet, 2003].

3.5. β Parametrelerine İlişkin Hipotez Testleri ve Güven Aralıkları

β parametreleri için,

0 1 2

1 1 2

: ... 0

: ... 0

n n

H H

β β β

β β β

= = = =

≠ ≠ ≠ ≠

hipotezi aşağıdaki istatistikler kullanılarak test edilir.

1-Wald Test İstatistiği: Wald testi, en çok olabilirlik tahmin edicilerinin normal dağıldığı varsayımına dayanır.

(39)

2 ˆT[ ( )]ˆ ˆ 1

w V ˆ

χ =β β β biçiminde ifade edilir.

2-Olabilirlik Oran Test İstatistiği: Wald testinden daha genel bir yapısı olup kategorik değişkenlerin iki veya daha fazla düzeyinin olduğu ve Cox modeline aynı anda birden çok eşdeğişkenin alındığı durumlarda kullanılır.

2 2[ ( )ˆ (0)]

LR InL InL

χ = β −

biçiminde ifade edilir.

3-Skor Test İstatistiği: Modeldeki eşdeğişkenler sürekli olduğunda ya da birden fazla değişken bulunduğunda kullanılır.

2 [ ( ) ][ ( )] [ ( )]' 1

S V I V

χ = β β β

olarak ifade edilebilir.

Yukarıdaki test istatistiklerinin tümüde, ’ın doğruluğu altında n serbestlik dereceli ki-kare (

H0 2

χn ) dağılımına sahiptir

Bir β parametresi için 1−α anlamlılık düzeyinde güven aralığıda yine aynı varsayım altında,

ˆ z shα/ 2 ( )ˆ

β± β (3.12)

olarak gösterilebilir [Hosmer ve Lemeslow, 1999; Collet, 2003].

(40)

4. ORANTILI HAZARD VARSAYIMININ DEĞERLENDİRİLMESİ

Cox regresyon modelinin en önemli varsayımı orantılı hazard varsayımı eşdeğişkenlere ilişkin hazardların orantılı olması varsayımıdır. Bu nedenle orantılılığın test edilmesi önemlidir. Genel olarak orantılı hazard varsayımının üç yaklaşımla incelenmesi mümkündür. Bu yaklaşımlar,

• Grafiksel yaklaşım,

• Uyum iyiliği yaklaşımı,

• Zamana bağlı değişkenlerdir.

4.1. Grafiksel Yaklaşım

Orantılı hazard varsayımlarının test edilmesinde kullanılan iki grafiksel yaklaşım, log-log yaşam sürdürme eğrilerinin karşılaştırılması, beklenen yaşam sürdürme eğrilerinin gözlenen yaşam sürdürme eğrileriyle karşılaştırılmasıdır.

4.1.1. Log-log grafikleri yaklaşımı

Grafiksel yaklaşımda en fazla uygulamakta olan yöntem incelenen değişkenlere ilişkin log-log yaşam sürdürme eğrilerinin karşılaştırılmasıdır. Karşılaştırılan eğrilerin birbirine paralel olması, varsayımın doğru olduğunu gösterir.

Bir log-log yaşam sürdürme eğrisi tahmin edilen yaşam sürdürme fonksiyonunun iki kere logaritmasının alınması ile elde edilen eğridir. Bir log-log eğrisi

şekilde ifade edilmektedir.

ln(-lnS(t) ) ˆ

Yaşam sürdürme fonksiyonu gibi (0,1) arasında değer alan bir olasılığın logaritması daima negatif bir sayı olacağından, birinci kez ’nın logaritması alınır ancak negatif işareti olan birinci logaritmanın yeniden logaritmasının alınması için ifade (-) ile çarpılarak pozitif işaret alması sağlanır. Yaşam sürdürme eğrileri bir adım

ˆS(t)

(41)

fonksiyonu olarak çizildiğinden log-log eğrisi de bir adım fonksiyonu olarak çizilmektedir.

0.197

1

0 0.25 t 0

∞ +

-0.484

t

-0.237

) ˆ t( S

ln( ln ( ))S tˆ

− −

Şekil. 4.1. ln(-lnS(t) ) ˆ eğrisinin elde edilmesi

Yaşam sürdürme eğrisinin y-ekseni değerleri (0,1) arasında iken, eğrisi (-∞,+∞) arasında değer alır. Orantılı hazard modeli için hazard ve yaşam sürdürme fonksiyonları ;

ln(-lnS(t)) ˆ

0

1

( , ) ( ) exp

p j j j

h t x h t β x

=

⎡ ⎤

= ⎢ ⎥

(4.1)

1

exp

( , ) 0( )

p j j j

x

S t x S t

β

=

= (4.2)

şeklinde ifade edilir. Yaşam olasılığı tahmini olan yaşam sürdürme fonksiyonunun iki kez logaritması alındığında;

(42)

p

j j 0

j=1

lnS(t,x)= expb x lnS (t)

⎢ ⎥

⎦ (4.3)

[ ]

p j j 0

j=1

ln -lnS(t,x) = ln -exp⎡ ⎡ b x lnS (t)⎤ ⎤

⎢ ⎢ ⎥

⎢ ⎣ ⎦ ⎥

]

(4.4)

[ ]

p j j

[

0

j=1

ln -InS(t,x) = ln exp⎡ ⎡ b x +ln -lnS (t)⎤ ⎤

⎢ ⎢ ⎥

⎢ ⎣ ⎦ ⎥

⎦ (4.5)

ifadesi elde edilir [Kleinbaum, 1996].

Örneğin;

1 11 12 1

2 21 22 2

( , ,..., ) ( , ,..., )

p

p

X x x x

X x x x

=

=

iki bireye ait eşdeğişken vektörü olsun.

[ ] [

[ ] [

1 1

1

2 2

1

( , ) ( )

( , ) ( )

p

j j

j p

j j

j

ln lnS t X X ln lnS t

ln lnS t X X ln lnS t

β β

=

=

= −

= −

] ]

0

0

2 1

Yukarıdaki iki ifade oranlanırsa,

[

1

] [

2

]

1

( , ) ( ( , ) ) ( )

p

j J j

j

ln lnS t X ln lnS t X β X X

=

− − − − − =

ve eşitlik t zamanını içermediğinden yeniden düzenlenirse,

(43)

[

1

] [

2

]

2 1

( , ) ( , ) ( )

p

j J j

j

ln lnS t X ln lnS t X β X X

=

− − = − − +

1

ifadesi elde edilir. Bu iki birey için log(-log) yaşam eğrilerinin tahmini çizilirse, iki bireye ilişkin eğrilerinin paralellik olup olmadığı görülebilir.

βj(X2jX1j)

X1

X2

t ]

ln ln[−

S

Şekil 4.2. Bireylere ilişkin log-log grafiği

Grafiksel yöntemle orantılı hazard varsayımının test edilmesinin bazı olumsuz yönleri vardır. Bunlardan ilki; paralel olup olmadığına karar verirken yaşanan öznel kararlar sonucunda yöntemin güvenilirliği sarsılmaktadır. İkinci bir sorun da sürekli değişkenlerin nasıl sınıflandırılacağına karar vermektir. Farklı sınıflandırmalar farklı sonuçlar ortaya çıkarabilir. Sürekli değişkenler gruplanırken sınıf sayısının mümkün olduğunca az olmasına dikkat edilmelidir. Sınıfların seçiminde anlamlılık ön planda tutulmalıdır.

Bir diğer konu da, birçok değişken için orantılı hazard varsayımının eş zamanlı olarak nasıl değerlendirileceğidir. Bir çözüm yolu olarak bütün değişkenler ayrı ayrı sınıflandırılmalı, bu sınıflardan ayrı kombinasyonlar oluşturulmalı daha sonra ise aynı grafik üzerinden bütün log-log yaşam eğrileri kıyaslanmalıdır. Ancak bütün

(44)

bunlara rağmen paralellik olup olmadığına karar vermek ya da başka bir deyişle paralellik olmadığını söylemek zordur [Kleinbaum, 1996].

4.1.2. Gözlenen ve beklenen yaşam eğrileri yaklaşımı

Orantılı hazard varsayımının test edilmesinde kullanılan bir diğer grafiksel yöntem ise tahmin edilen eğrilerin, gözlenen eğrilerle karşılaştırılmasıdır. Beklenen ve gözlenen eğrilerin birbirine yakın olması durumunda orantılılık varsayımı doğrulanmış olmaktadır.

Gözlenen ve beklenen yaşam eğrileri testinde gözlenen ve beklenen yaşam olasılıkları kullanılır. Bu yaklaşım aşağıda belirtilen metotlardan biri ya da ikisi de kullanarak uygulanır.

1. Her bir zaman noktasındaki değişkenler için orantılı hazard varsayımının değerlendirilmesi

2. Diğer değişkenler için gerekli düzeltmeler yapıldıktan sonra orantılı hazard varsayımının değerlendirilmesi.

Birinci metotta gözlenen çizimleri elde etmek için Kaplan-Meier (KM) eğrileri kullanılır.

Örneğin 42 lösemi hastasının tedavi edildiği bir çalışmada, hastaların 21 tanesi tedavi edilen ve 21 tanesi de placebo olarak adlandırılsın. Gözlenen değerler Kaplan- Meier KM grafiği ile gösterilsin. Aşağıda gösterilen grafik bize “gözlenen yaşam eğrisini” vermektedir. Beklenen yaşam eğrilerini elde etmek için yaşam sürdürme fonksiyonunun tahmini elde edilir.

(45)

0.2 0.4 0.6 0.8 1

0

0 8 16 24 32 Haftalar

Tedavi Placebo

Şekil 4.3. Tedavi edilen ve placebo hastalar için gözlenen yaşam eğrisi.

Sürekli değişkenler için gözlenen ve beklenen yaşam eğrilerini kullanırken; sürekli değişkenler önce kategorik hale dönüştürülür ve her düzey için Kaplan-Meier eğrisi çizilir

Gözlenen ve beklenen değerleri kıyaslamak için her iki grafiğin de birlikte yorumlanması gerekir. Tahmin edilen değişkenin her bir düzeyi için gözlenen ve beklenen yaşam eğrileri birbirine yakın ise orantılı hazard varsayımının sağlandığına, eğer eğriler birbirinden ciddi farklılık gösteriyorsa orantılı hazard varsayımının sağlanmadığına karar verilir [Kleinbaum, 1996].

4.2. Uyum iyiliği Yaklaşımı

Orantılı hazard varsayımının değerlendirilmesinde kullanılan ikinci bir yaklaşım ise uyum iyiliği testleridir. Bu yaklaşım modeldeki her değişken için hesaplanabilen ki- kare istatistiklerine dayanan testler yardımıyla orantılı hazard varsayımını test eder.

Uyum iyiliği testi, orantılı hazard varsayımının değerlendirilmesinde istatistiksel güvenilirliği yüksek bir test sağlar. Bu nedenle uyum iyiliği testi kullanarak grafiksel yaklaşımlardan daha kesin ve objektif karar verilebilir.

(46)

Uyum iyiliği testlerinin avantajlarının yanı sıra dezavantajları da bulunmaktadır. İlk olarak, Uyum iyiliği testi genel anlamda orantılı hazard varsayımından sapmaları tespit etmek için yapılmış genel bir kontrol mekanizmasıdır. Ancak bu test orantılı hazard varsayımında özel bir sapmayı tespit edemeyebilir. Daha önce anlatılan grafiksel testler bu tarz özel sapmaların tespitinde daha kullanışlıdır. Sonuç olarak orantılı hazard varsayımının değerlendirilmesinde son karar verilirken hem grafiksel yöntemlerin hem de uyum iyiliği testinin kullanılması tavsiye edilmektedir [Kleinbaum, 1996].

4.3. Oransal Hazard Varsayımının Testi İçin Zamana Bağlı Değişkenlerin Kullanılması

Cox modeli, zamana bağlı değişkenleri kapsayacak şekilde genişletilir. Örneğin orantılı hazard varsayımı cinsiyet için değerlendiriliyorsa Cox modeli cinsiyet’e ek olarak “ ” yi de kapsayacak şekilde genişletilebilir. Bu değişkenin katsayısı anlamsız çıkarsa orantılı hazard varsayımının cinsiyet için sağlandığı anlaşılır.

x ( ) cinsiyet t

Orantılı hazard varsayımının denetlenmesinde zamana bağlı değişkenler bir gösterge fonksiyonu yardımıyla modele katılırken, zamandan bağımsız değişken yine gösterge fonksiyonu ve zamandan bağımsız değişkenin çarpımından oluşan yapay değişken ile modele katılır.

1 2

0

1 1

( , ( )) ( ) exp ( )

p p

i i i i i

i i

h t X t h t β X δ X g t

= =

⎡ ⎤

= ⎢ + ⎥

∑ ∑

⎦ (4.7)

Xi değişkeninin orantılı olup olmamasının test edilmesi için Eş. 4.7’de verilen δi katsayısının anlamlı olup olmadığına bakılır.

(47)

Hipotez;

0 1

: 0

: 0

i i

H H

δ δ

=

dir. Burada H0 hipotezi red edilemez ise Xi değişkeninin orantılı olduğuna karar verilir [Kleinbaum, 1996].

Orantılı hazard varsayımının denetlenmesinde şimdiye kadar belirttiğimiz yöntemlerin yanı sıra, arjas grafikleri, schoenfeld artıkları, Cox-Snell artıkları ve korelasyon testi gibi başka yöntemlerle de kullanılabilir.

Referanslar

Benzer Belgeler

Elde edilen yüzey sıcaklığı haritaları üzerinde bölgeyi etkileyen baskın hava kütleleri ve farklı yeryüzü şekilleri dikkate alınarak oluşturulan kesit

社會間取得平衡發展習習相關,如何將研究成果因地制宜、融入國家或地方政

(四)預期完成之工作項目及成果。請列述:1.預期完成之工作項目。2.對於學術研究、國家發展及

(1) oxLDL may induce radical-radical termination reactions by oxLDL-derived lipid radical interactions with free radicals (such as hydroxyl radicals) released from

Ordered probit olasılık modelinin oluĢturulmasında cinsiyet, medeni durum, çocuk sayısı, yaĢ, eğitim, gelir, Ģans oyunlarına aylık yapılan harcama tutarı,

Laparoskopik sleeve gastrektomi (LSG) son yıllarda primer bariatrik cerrahi yöntem olarak artan sıklıkla kullanılmaktadır. Literatürde, LSG’nin kısa dönem sonuçları

Epidermal büyüme faktörü sinyalizasyon yolaklarının, Parkinson hastalığı deneysel modellerinde ve Parkinson hastalarında ve in vitro çalışmalarda dopaminerjik

12 kişilik bir sınıfta Nisanur dolapların olduğu tarafta dördüncü sırada, Şükriye, Nisanur' un solunda, Mete pencere tarafında ilk sırada, Zümra orta tarafta