Uzun kuyruklu simetrik dağılımın parametreleri için sansürlü örneklemlere dayalı istatistiksel sonuç çıkarımı

(1)

FEN BİLİMLERİ ENSTİTÜSÜ

UZUN KUYRUKLU SİMETRİK DAĞILIMIN PARAMETRELERİ İÇİN SANSÜRLÜ ÖRNEKLEMLERE DAYALI İSTATİSTİKSEL SONUÇ

ÇIKARIMI

Erol KUŞ

YÜKSEK LİSANS TEZİ İSTATİSTİK ANABİLİM DALI

(2)

2

FEN BİLİMLERİ ENSTİTÜSÜ

ÇIKARIMI

Erol KUŞ

YÜKSEK LİSANS TEZİ İSTATİSTİK ANABİLİM DALI

Bu tez 26/02/2010 tarihinde aşağıdaki jüri tarafından oybirliği / oyçokluğu ile kabul edilmiştir.

... ………. ………

Doç. Dr. Coşkun KUŞ Doç.Dr. Aşır GENÇ Yrd.Doç.Dr.Hasan KÖSE

(3)

i

ÇIKARIMI

Erol KUŞ Selçuk Üniversitesi Fen Bilimleri Enstitüsü İstatistik Anabilim Dalı

Danışman: Doç.Dr. Coşkun KUŞ 2010, 62 Sayfa

Jüri: Doç.Dr. Coşkun KUŞ Doç.Dr. Aşır GENÇ

Yrd.Doç.Dr. Hasan KÖSE

Bu tez çalışmasında, uzun kuyruklu simetrik dağılımın parametrelerinin ilerleyen tür tip-II sağdan sansürlü örneklemlere dayalı parametre tahmini ele alınmıştır. Uzun kuyruklu simetrik dağılımın konum ve ölçek parametrelerinin modifiye edilmiş en çok olabilirlik tahmin edicileri analitik olarak elde edildi. En çok olabilirlik tahmin edicilerin asimptotik normallik özelliği kullanılarak konum ve ölçek parametreleri için yaklaşık güven aralıkları inşa edilmiştir. Modifiye edilmiş en çok olabilirlik tahmin edicilerinin ve güven aralıklarının kapsama olasılıklarının performanslarını incelemek için simülasyon çalışması yapılmıştır. Aynı zamanda nümerik bir örnek verilmiştir.

Anahtar Kelimeler: Modifiye edilmiş en çok olabilirlik tahmin edicileri, ilerleyen

(4)

ii

STATISCIAL INFERENCE FOR THE PARAMETERS OF LONG-TAILED SYMMETRIC DISTRIBUTION BASED ON CENCORED SAMPLES

Erol KUŞ Selçuk University

Graduate School of Natural and Applied Sciences Department of Statistics

Supervisor:Assoc.Prof.Dr Coşkun KUŞ 2010, 62 Pages

Jury: Assoc.Prof.Dr. Coşkun KUŞ

Assoc.Prof.Dr. Aşır GENÇ

Ass.Prof.Dr. Hasan KÖSE

In this thesis, it is considered that the estimation of parameters of long tailed symmetric distribution based on progressive type-II right censored samples. Modified maximum likelihood estimators are obtained analitically for location and scale parameters of long tailed symmetric distribution. Approximate confidence intervals of location and scale parameters are constructed using asymtotic normality of maximum likelihood estimators. Simulation study is performed to investigate the performances of the modified maximum likelihood estimators and coverage probabilities of the approximate confidence intervals. A numerical example is also presented.

Key Words: Long tailed symmetric distribution, modified maximum likelihood

(5)

iii

Bu çalışma konusunu bana veren, çalışmalarım süresince beni teşvik eden, maddi ve manevi yardımlarını hiçbir zaman esirgemeyen değerli hocam sayın Doç.Dr.Coşkun KUŞ’a, çalışmalarımda yardımcı olan değerli hocalarım Yrd.Doç.Dr.İsmail KINACI, Yrd.Doç.Dr.Buğra SARAÇOĞLU, Arş.Gör.Ahmet PEKGÖR, Arş.Gör.Alper SİNAN, Dr.Aydın KARAKOCA ve Dr.Neslihan İYİT’e sonsuz teşekkürlerimi sunarım.

(6)

iv

Çizelge 2.1 Farklı p değerleri için LTS dağılımının Basıklık Katsayı

değerleri.

31

Çizelge 3.1 Modifiye edilmiş en çok olabilirlik tahmin edicilerinin

simulasyonla ve fisher bilgi matrisi kullanılarak elde edilen varyans ve

kovaryansları (p=3)……….. 46

Çizelge 3.2 Modifiye edilmiş en çok olabilirlik tahmin edicilerinin

simulasyonla ve fisher bilgi matrisi kullanılarak elde edilen varyans ve

kovaryansları (p= )……….. 5 47

Çizelge 3.3 Modifiye edilmiş en çok olabilirlik tahmin edicilerinin simulasyonla ve fisher bilgi matrisi kullanılarak elde edilen varyans ve kovaryansları

(p=10)……….

48

Çizelge 3.4 Konum ve Ölçek parametrelerinin fisher bilgi matrisine dayalı %95 lik yaklaşık güven aralıklarının kapsama olasılıkları……….. 49

(7)

v

ŞEKİLLER DİZİNİ

Şekil 1.1. İlerleyen tür tip-II sağdan sansürlü örneklem plânı... 13 Şekil 2.1 Farklı p değerleri için LTS dağılımının o.y.f grafiği……… 27 Şekil 2.2 Farklı μ değerleri için LTS dağılımının o.y.f grafiği……… 28

Şekil 2.3 Farklı σ değerleri için LTS dağılımının olasılık o.y.f.

grafiği………...

28

Şekil 2.4 LTS dağılımının farklı p değerleri için kurtosis değişim grafiği……... 31 Şekil 4.1 Çizelge 4.1’de verilen verilere ait (2.25)’te tanımlanan α_i

değerleri….

51

Şekil 4.2 Çizelge 4.1’de verilen verilere ait (2.25)’te tanımlanan β_i

değerleri….

51

Şekil 4.3 Çizelge 4.1’de verilen verilere ait (2.25)’te tanımlanan Δ değerleri… 51 _i

Şekil 4.4 Çizelge 4.1’de verilen verilere ait (2.25)’te tanımlanan γ_i

değerleri….

(8)

GİRİŞ ... 1

1. TEMEL KAVRAMLAR... 3

1.1. Bazı Özel Fonksiyonlar... 3

1.1.1. Gamma Fonksiyonu ... 3

1.1.2. Beta Fonksiyonu ... 4

1.1.3. Genelleştirilmiş Hipergeometrik Fonksiyon... 4

1.2. Çarpıklık Katsayısı... 5

1.3. Basıklık Katsayısı ... 5

1.4. Konum-Ölçek Parametreli Dağılımlar Ailesi... 6

1.5. Bazı Özel Dağılımlar ... 8

1.5.1. Düzgün Dağılım... 8

1.5.2. Student t Dağılım ... 8

1.5.3. Lojistik Dağılım ... 9

1.6. Sıra İstatistikleri ... 10

1.7. Tip-II Sağdan Sansürlü Örneklem ... 12

1.8. İlerleyen Tür Tip-II Sağdan Sansürlü Örneklem ... 13

1.9. Asimptotik Normallik ... 17

1.10. Olabilirlik Fonksiyonu ... 18

1.11. Fisher Bilgi Matrisi ... 19

1.12. En Çok Olabilirlik Tahmin Edicileri... 19

1.13. Asimptotik Güven Aralıkları... 20

1.14. Taylor Serileri ... 21

1.15. Birinci Mertebe Yaklaşımı... 21

1.16. Newton-Raphson Yöntemi... 24

2.UZUN KUYRUKLU SİMETRİK DAĞILIM ... 26

2.1.En Çok Olabilirlik Tahmincisi... 32

2.2. Modifiye Edilmiş En Çok Olabilirlik Tahmin Edicileri ... 33

2.3. LTS Dağılımının Parametrelerinin MMLE Tahmin Edicileri ... 36

2.4. MLE Tahmin Edicilerinin Varyans-Kovaryans Matrisi ... 42

2.5 Gözlenen Fisher Bilgi Matrisi... 43

3. SİMÜLASYON ÇALIŞMASI... 45

4. UYGULAMA ... 50

5. SONUÇ VE ÖNERİLER ... 53

EK 1. Simulasyon Sonuçları İçin Delphi 5 Programında Yazılan Kod ... 54

(9)

GİRİŞ

Bir sistemin güvenilirliği için sonuç çıkarımı yaparken sistemi oluşturan tüm bileşenlerin bozulma zamanlarını gözlemlemek her zaman mümkün olmayabilir. Örneğin; bir klinikte tedavi gören hastalara ilişkin veriler, eksiksiz gözlenemeyebilir veya pahalı bir elektronik parçanın yaşam zamanı hakkında bilgi edinmek için yapılan yaşam testinde, parçaların hepsinin bozulmalarının gözlenmesi maliyeti ve test zamanını artıracağından istenmeyebilir. Bu tip durumlarda, deney yada gözlem sonrası sansürlenmiş veri elde edilir. Tıp, biyoloji, sigortacılık, mühendislik, kalite kontrol ve birçok alanda sansürlenmiş verilerle karşılaşılmaktadır.

Deney ya da gözlemler sonucunda değişik sansür türleriyle karşılaşmak mümkündür. Birinci tip sansürleme olarak adlandırılan sansürleme modeli, t gibi önceden belirlenmiş bir zamandan önce, sistemdeki bozulan birimlerin bozulma zamanının gözlenmesi durumudur. İkinci tip sansürleme olarak adlandırılan sansürleme modeli, n birimden oluşan bir sistemin bozulan k ≤n biriminin bozulma zamanının gözlenmesi durumudur. Rasgele sansürleme olarak adlandırılan sansürleme modeli ise birimlerin bozulma zamanlarının başka bir rasgele olaydan dolayı sansürlenmesi durumudur (Kale 2003).

İkinci tip sansürlemenin en popüler olanı, ilerleyen tür tip-II sağdan sansürlemedir (progressive type-II right censoring). Bu sansürleme modeli şu şekilde izah edilebilir: n sayıda özdeş bileşenin (aynı yaşam zamanı dağılımına sahip) yaşam testine tabi tutulduğu düşünülsün. Sistemde meydana gelen 1. bozulma ile rasgele R₁ sayıda bileşenin sistemden çekildiğini, daha sonra geriye kalan n− R₁−1 bileşenden, 2. bozulma ile rasgele R₂ sayıda bileşenin sistemden çekildiğini ve böylece m. bozulma ile rasgele R sayıda bileşenin sistemden _m

(10)

hacimli örneklem ilerleyen tür tip-II sağdan sansürlü örneklemdir (Balakrishnan ve Aggarwala 2000)

İlerleyen Tür Tip-II sağdan sansürlü örneklemlere dayalı Balakrishnan ve ark. (2004) Uç Değer dağılımının, Balakrishnan ve Asgharzadeh (2005) Ölçeklendirilmiş Yarı Lojistik dağılımın (Scaled Half-Logistic Distribution), Lin ve ark. (2006) Log-Gamma dağılımının, Asgharzadeh (2006) Genelleştirilmiş Lojistik dağılımın(Generalized Logistic Distribution), Sultan ve ark. (2007) Weibull dağılımının, Asgharzadeh (2009) Genelleştirilmiş Üstel dağılımın ve parametreleri için modifiye edilmiş en çok olabilirlik tahmin edicilerini önermişler ve bu tahmin edicilerin özelliklerini Monte Carlo simülasyonu yardımıyla incelemişlerdir.

Tezin birinci bölümünde, çalışmada gerekli olan temel kavramlar verilmiştir. İkinci Bölümde, uzun kuyruklu simetrik dağılım ve özellikleri tanıtılmıştır. Ayrıca bu dağılımın parametrelerinin modifiye edilmiş en çok olabilirlik tahmin edicileri ve asimptotik varyans-kovaryans matrisi elde edilmiştir. Üçüncü Bölümde, uzun kuyruklu simetrik dağılımın konum ve ölçek parametreleri için modifiye edilmiş en çok olabilirlik tahmin edicilerinin beklenen değerleri, varyansları ve kovaryansları hem simülasyon hem de fisher bilgi matrisine dayalı olarak elde edilmiştir. Yine simülasyon çalışmasıyla fisher bilgi matrisine dayalı yaklaşık güven aralıklarının kapsama olasılılıkları incelenmiştir. Dördüncü Bölümde tezde elde edilen sonuçlar için bir uygulama verilmiştir. Beşinci Bölümde ise tezde elde edilen sonuçlara ve ilerideki çalışmalar için bazı önerilere yer verilmiştir.

(11)

1. TEMEL KAVRAMLAR

1.1. Bazı Özel Fonksiyonlar

1.1.1. Gamma Fonksiyonu Gamma fonksiyonu

( )

₌

_∫

∞ −

( )

₋ _> Γ 0 1_exp _, _β ₀ β _tβ _t _dt

şeklinde tanımlanır (Kuş 2004). β pozitif tam sayı olmak üzere

(

β +1

)

=β! Γ

( )

1.7724538509 exp 2 2 1 0 2 ₌ ₌ − = ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ Γ

∫

∞ t dt π

( ) ( )

2 ₌ 2 1/222 1/2_Γ

( ) (

_Γ ₊1/2

)

Γ _β _π − β− _β _β dir. Stirling formülü

( )

_⎥ ⎦ ⎤ ⎢ ⎣ ⎡ + + − Γ − 288 1 12 1 1 2 exp ~ 1/2 1/2 β π β β β β

( )

[

Γ

]

=

(

− −

)

( )

− + −

( )

+ − + + 5 3 1 1 1260 1 360 1 12 1 2 log 2 log 2 log β β β π β β β β şeklindedir.

(12)

1.1.2. Beta Fonksiyonu

, 0

a b> olmak üzere Beta fonksiyonu

( )

( ) ( )

₍

₎

b a b a b a + Γ Γ Γ = , B

şeklinde tanımlanır. Burada Γ i

( )

, Gamma fonksiyonudur (Kuş, 2004).

1.1.3. Genelleştirilmiş Hipergeometrik Fonksiyon

Genelleştirilmiş hipergeometrik fonksiyon

(

) ( )

(

)

(

) ( )

1 1 , 1 0 1 ( , , ) 1 p k i i i p q q k i i i r n k n F r k d k d − ∞ = − = = ∏ Γ + Γ = Γ + ∏ Γ + Γ

∑

n d

biçiminde tanımlanır. Burada n=[n₁,n₂,...,n_p], ]d=[d₁,d₂,...,d_q dır. Özel olarak 1p= q2, = için hipergeometrik fonksiyon

(

)

(

) (

) ( ) ( )

(

) (

η

) ( )

η β α β α β η β η η β α β η_α β 1 1 1 0 1 0 1 1 1 , 2 1 ) 1 ( ) 1 ( ) ( ) ( ) ; ; , ( − − − = ∞ − − − Γ + Γ + Γ Γ Γ + Γ + Γ ∑ = − − − Γ Γ Γ =

_∫

k k k k z dt tz t t z F k k

(13)

1.2. Çarpıklık Katsayısı

İlk üç momenti sonlu olan bir X rasgele değişkeninin beklenen değeri μ, varyansı _σ2_{olsun. Bu durumda}_{X rasgele değişkeninin Çarpıklık(Skewness)} Katsayısı 3 1 ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − = σ μ γ E X şeklinde tanımlanır.

Çarpıklık katsayısı olasılık (yoğunluk) fonksiyonunun ortalama etrafındaki asimetrikliğin ölçüsü olarak yorumlanır(Casella ve Berger 2002, Roussas 1973).

0

1 >

γ ise dağılım sağa çarpıktır, γ₁ <0 ise dağılım sola çarpıktır denir(Roussas 1973). X rasgele değişkeninin olasılık yoğunluk fonksiyonu f

( )

x , a∈ noktası etrafında simetrik ise γ₁ =0 dır(Casella ve Berger 2002, Roussas 1973).

1.3. Basıklık Katsayısı

İlk dört momenti sonlu olan bir X rasgele değişkeninin beklenen değeri μ, varyansı _σ2_{olsun. Bu durumda X rasgele değişkeninin Basıklık(kurtosis)} Katsayısı 4 2 ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − = σ μ γ E X şeklinde tanımlanır(Roussas 1973).

Yukarıdaki tanım ele alındığında, normal dağılım için Basıklık Katsayısı 3 olarak elde edilir.

(14)

Basıklık Katsayısı, olasılık (yoğunluk) fonksiyonunun yükseklik derecesinin ölçüsü olarak yorumlanır. Dağılımın Basıklık Katsayısı γ₂ >3

olduğunda normal dağılıma göre sivri, γ₂ <3 olduğunda normal dağılıma göre daha basıktır denir.

1.4. Konum-Ölçek Parametreli Dağılımlar Ailesi

X rasgele değişkeninin dağılım fonksiyonu F_μ(x) ve

( )

₁

{

F

( ) ( )

x:F x F

(

x

)

; , Fbiliniyor

}

F_μ ⋅ ∈ℑ = _μ _μ = −μ μ∈Θ

olmak üzere ℑ₁’e konum parametreli dağılımlar ailesi, μ’ye ise konum parametresi denir. Burada Θ, μ parametresi için parametre uzayıdır. μ parametresinin X rasgele değişkeni için konum parametresi olması için gerek ve yeter koşul X −μ rasgele değişkeninin dağılımının μ’den bağımsız olmasıdır. Yani

(

X x

)

P

(

X x

)

F

(

x

)

F

(

x

)

F(x)

P −μ ≤ = ≤ +μ = _μ +μ = +μ−μ =

dir.

X rasgele değişkeninin dağılım fonksiyonu F_σ(x) ve

( )

2

( )

:

( )

; , biliniyor x F_σ F x F x_σ _σ F σ F σ ⎧ ⎛ ⎞ ⎫ ⋅ ∈ ℑ =_⎨ = _{⎜ ⎟} ∈ ∑ _⎬ ⎝ ⎠ ⎩ ⎭

olmak üzere ℑ₂’e konum parametreli dağılımlar ailesi, σ ’ya ise ölçek parametresi denir. Burada ∑ , σ parametresi için parametre uzayıdır. σ

(15)

parametresinin X rasgele değişkeni için ölçek parametresi olması için gerek ve yeter koşul

σ

X _{rasgele değişkeninin dağılımının σ ’dan bağımsız olmasıdır. Yani}

(

)

( )

X x P x P X σx F_σ σx F σ F x σ σ ⎛ _≤ ⎞₌ _≤ ₌ ₌ ⎛ ⎞₌ ⎜ ⎟ ⎜ ⎟ ⎝ ⎠ ⎝ ⎠ dir.

(

μ σ,

)

′ =

γ olmak üzere X rasgele değişkeninin dağılım fonksiyonu F x_γ( ) ve

( )

3

( ) ( )

: ; , biliniyor x F_γ F x F x_γ _γ F μ γ F σ ⎧ ⎛ − ⎞ ⎫ ⋅ ∈ ℑ =_⎨ = _⎜ _⎟ ∈Γ _⎬ ⎝ ⎠ ⎩ ⎭

olmak üzere ℑ ’e konum ve ölçek parametreli dağılımlar ailesi, ₃ μ’ye konum ve σ ’ya da ölçek parametresi denir. Burada Γ , γ parametresi için parametre uzayıdır. γ parametresinin X rasgele değişkeni için konum parametresi olması

için gerek ve yeter koşul σ

μ −

X

rasgele değişkeninin dağılımının γ dan bağımsız

olmasıdır. Yani

(

)

(

)

( )

X x P μ x P X σx μ F σx μ F σ μ μ F x σ σ − + − ⎛ _≤ ⎞₌ _≤ ₊ ₌ ₊ ₌ ⎛ ⎞₌ ⎜ ⎟ ⎜ ⎟ ⎝ ⎠ γ ⎝ ⎠

(16)

1.5. Bazı Özel Dağılımlar

1.5.1. Düzgün Dağılım

X rasgele değişkeni,

(

β,θ

)

aralığında düzgün dağılıma sahip ise, sırasıyla, olasılık yoğunluk ve dağılım fonksiyonu,

( ) (

= θ −β

)

− β < <θ x x f 1, (1.1)

( ) (

= −β

)(

θ −β

)

− β < <θ x x x F 1, (1.2)

biçimindedir. Düzgün dağılım için Düzgün

(

β,θ

)

gösterimi kullanılacaktır.

X rasgele değişkeni Düzgün

(

β,θ

)

dağılımına sahip olduğunda X in beklenen

değer ve varyansı, sırasıyla,

( ) (

_X ₌ _β ₊_θ

)

₂−1 E

( ) (

)

2 1 12− − = θ β X Var şeklindedir. 1.5.2. Student t Dağılım

Sürekli bir X rasgele değişkeninin olasılık yoğunluk fonksiyonu

( )

1 2 ₂ 1 2 1 , , 2 r r x f x x r r _π_r r + + + ⎛ ⎞ Γ⎜_⎝ ⎟_⎠ _⎛ _⎞ = × +_⎜ _⎟ ∈ ∈ ⎛ ⎞ _⎝ _⎠ Γ⎜ ⎟_{⎝ ⎠}

(17)

ise X rasgele değişkenine t dağılımına sahiptir denir. Burada r parametresi,

dağılımın serbestlik derecesi olarak adlandırılır. r serbestlik dereceli t dağılımı

için t r

( )

gösterimi kullanılacaktır.

X rasgele değişkeni t r

( )

dağılımına sahip olduğunda X in beklenen

değer ve varyansı sırasıyla,

( )

0, 2,3, E X = r= …

( )

, 3, 4, 2 r Var X r r = = − … şeklindedir (Ghahramani 2005). 1.5.3. Lojistik Dağılım

μ ve σ parametreli lojistik dağılıma sahip olan X rasgele değişkeninin olasılık yoğunluk fonksiyonu

( )

2 exp , 1 exp x f x x x μ σ μ σ σ − ⎛₋ ⎞ ⎜ ⎟ ⎝ ⎠ = ∈ ⎡ ₊ ⎛₋ − ⎞⎤ ⎜ ⎟ ⎢ _⎝ _⎠⎥ ⎣ ⎦ (1.3)

şeklinde tanımlanır. Burada, μ∈ konum ve σ_∈ +_{ölçek parametresidir.}_μ_ve

σ parametreli lojistik dağılım kısaca Lojistik

(

μ,σ

)

ile gösterilecektir.

(

μ,σ

)

Lojistik dağılımına sahip olan X rasgele değişkeninin dağılım

fonksiyonu

( )

1 , 1 exp F x x x μ σ = ∈ − ⎛ ⎞ + _⎜− _⎟ ⎝ ⎠ (1.4)

(18)

şeklindedir. Lojistik

(

μ,σ

)

dağılıma sahip X rasgele değişkeninin beklenen değer ve varyansı sırasıyla E

( )

X =μ ve

( )

3 2 2_σ π = X

Var şeklindedir. Lojistik

dağılımın çarpıklık katsayısı sıfır olup E

( )

X =μ etrafında simetriktir (Asgharzadeh 2006).

1.6. Sıra İstatistikleri

F dağılım fonksiyonuna sahip bir kitleden alınan X₁,X₂,…,X_n

örnekleminin X₁_:_n ≤ X₂_:_n ≤ ≤ X_n_:_n olacak biçimde büyüklük sırasına göre dizilmesiyle elde edilen her bir X_i_:_n rasgele değişkeni i. sıra istatistiği olarak isimlendirilir.

{

n

}

n X X X

X₁_: =min ₁, ₂,…,

sıra istatistiğinin dağılım fonksiyonu,

{

}

(

)

n n x F x X P x F₁( )= ₁_: ≤ =1− 1− ( ) (1.5) ve maks :n = n X

{

X₁,X₂,…,X_n

}

sıra istatistiğinin dağılım fonksiyonu,

{

:

} (

)

( ) ( ) n

n n n

F x =P X ≤x = F x

(19)

1≤ ≤r n olmak üzere r. sıra istatistiğinin dağılım fonksiyonu

{

X x

} {

P X X X r x

}

P x

F_r( )= _r_:_n ≤ = ₁, ₂,…, _n lerden enaz tanesi≤

dir.

{

X X₁, ₂, ,… X_n lerden tam tanesii ≤x

}

olayı A ile gösterilsin. A_i _i olayları ayrık olduğundan,

( )

( ) n n r i i i r i r F x P A P A = = ⎧ ⎫ = _⎨ _⎬= ⎩

∪

⎭

∑

n

(

( ) 1

) (

i ( )

)

n i i r n F x F x i − = ⎛ ⎞ = _{⎜ ⎟} − ⎝ ⎠

∑

(1.6)

dır. Bu ise tam olmayan beta fonksiyonudur. Yani

(

) (

)

( ) n ( ) 1i ( ) n i r i r n F x F x F x i − = ⎛ ⎞ = _{⎜ ⎟} − ⎝ ⎠

∑

∫

− − − + − = ) ( 0 1₍₁ ₎ ) 1 , ( 1 F x_tr _t n r_dt r n r B =I_F₍_x₎(r,n−r+1) dır. Şayet X_i’ ler f x dF x dx

( ) = ( ) olacak biçimde sürekli rasgele değişkenler ise

∫

− ₋ − + − = = ) ( 0 1₍₁ ₎ ) 1 , ( B 1 ) ( ) ( x F r n r r r t t dt dx d r n r dx x dF x f

(

( )

) (

1 ( )

)

( ) ) 1 , ( B 1 1 x f x F x F r n r r n r− ₋ − + − = olur.

(20)

Burada

( )

! ( 1)!( )! ) 1 , ( B r n−r+ = n −1 r− n−r şeklindedir (David 1970). n n n n X X

X₁_: , ₂_: ,…, _: sıra istatistiklerinin ortak olasılık yoğunluk fonksiyonu ise

f₁_,₂_,_…_,_n(x₁,x₂,…,x_n)=n!f

( ) ( )

x₁ f x₂ × × f

( )

x_n , −∞<x₁ ≤ ≤ x_n <∞ (1.7)

şeklindedir (David 1970).

1.7. Tip-II Sağdan Sansürlü Örneklem

n sayıda özdeş bileşenin yaşam testine tabi tutulduğu düşünülsün.

Meydana gelen m≤ bozulma ile yaşam testi sona erdirilsin. Bu şekilde yapılan n

sansürlemeye Tip-II sağdan sansürleme denir (Kale 2003).

n m n

n X X

X₁_: < ₂_: < < _: , olasılık yoğunluk fonksiyonu f ve dağılım fonksiyonu F olan dağılımdan alınan tip-II sağdan sansürlü örneklem olmak üzere X₁_:_n,X₂_:_n,…,X_m_:_n’ nin marjinal ortak olasılık yoğunluk fonksiyonu (1.7) den

(

_{) ( ) ( ) ( )}

{

1

}

, ! ! , , , 1 2 1 , , 2 , 1

∏

= − − − = m i m n i i m m f x F x m n n x x x f _… … −∞<x₁< <x_m<∞ (1.8)

(21)

Eşitlik (1.8)’de m=n alınırsa bilinen sıra istatistiklerinin ortak olasılık yoğunluk fonksiyonu (1.7) elde edilir.

Tip-II sağdan sansürleme, yaşam testinin maliyetini ve süresini azaltmasına karşın sonuç çıkarımının güvenilirliğini azaltmaktadır.

1.8. İlerleyen Tür Tip-II Sağdan Sansürlü Örneklem

İlerleyen tür tip-II sağdan sansürlenmiş model (Progressive type-II right censoring model) şu şekilde tanımlanmaktadır (Balakrishnan ve Aggarwala 2000).

n sayıda özdeş bileşenin bir sistemde yaşam testine tabi tutulduğu

düşünülsün. Sistemde meydana gelen 1. bozulma ile R₁ sayıda bileşenin sistemden çekildiğini daha sonra geriye kalan n− R₁−1 bileşenden, 2. bozulma ile R₂ sayıda bileşenin sistemden çekildiğini ve böylece m. bozulma ile R _m

sayıda bileşenin sistemden çekilmesiyle m bileşenin bozulma zamanı gözlenir. Bu şekilde elde edilen m hacimli örnekleme ilerleyen tür tip-II sağdan sansürlü

örneklem denir. Burada n=m+

∑

m_i₌₁R_i biçimindedir ve R=

(

R₁,R₂,…,R_m

)

sansür şeması olarak adlandırılır.

Şekil 1.1. İlerleyen tür tip-II sağdan sansürlü örneklem plânı

R R R n m m n m n m X X

X₁_: _: < ₂_: _: < < _: _: , olasılık yoğunluk fonksiyonu g ve dağılım

fonksiyonu G olan dağılımdan alınan ilerleyen tür tip-II sağdan sansürlü

örneklem olmak üzere R R R

n m m n m n m X X

X₁_: _: < ₂_: _: < < _: _: ’ nin ortak olasılık yoğunluk fonksiyonu kombinatorik yöntemler de kullanılarak aşağıdaki gibi elde edilir:

(22)

{

x X mn x x x X mn x x xm Xmmn xm xm

}

A= < R < +Δ < R < +Δ < R < +Δ : : 2 2 : : 2 2 1 1 : : 1 1 , ,…,

olayı göz önüne alınsın. A olayının gerçekleşmesi için mümkün X₁,X₂,…,X_n

rasgele değişkenlerinin kendi aralarında mümkün sıralanmalarının sayısı;

(

− ₁−1

)

× ×

(

− ₁ − ₂ − − ₁− +1

)

=n n R n R R R ₋ m c _m (1.9) olmak üzere

{ }

A P

{

x X mn x x x X mn x x xm Xmmn xm xm

}

P = < R < +Δ < R < +Δ < R < +Δ : : 2 2 : : 2 2 1 1 : : 1 1 , ,…,

{

}

m m m m m m m X x x R X x x x x x X R x x X x x x X R x x X x P c Δ + > Δ + < < Δ + > Δ + < < Δ + > Δ + < < × = tane , , tane , , tane , 2 2 2 2 2 2 2 1 1 1 1 1 1 1 m

[

(

)

]

[

(

_i _i

) ( )

_i

]

i R i i x G x x G x x G c× − +Δ i +Δ − =

∏

=1 1

(

m

)

X X X x x x g n m m n m n m , 2R: :, , R: : 1, 1, , R : : 1 … …

( )

m x x x _x _x _x A P m Δ × × Δ × Δ = → Δ → Δ → Δ 2 1 0 0 0 2 1 lim =

(

)

[

]

[

(

) ( )

]

m m i i i i R i i x x x x G x x G x x G c i Δ × × Δ − Δ + Δ + − ×

∏

= → Δ 1 1 0 1 lim

(

)

[

]

[

(

)

( )

]

∏

= = = → Δ Δ − Δ + Δ + − × = _m i i m i i i i m i R i i x x x G x x G x x G c i 1 1 1 0 1 lim

(

)

[

]

(

) ( )

i i i i m i x m i R i i x x x G x x G x x G c i Δ − Δ + Δ + − × =

∏

= Δ → =1 Δ →0 1 0 lim 1 lim

( )

1 1 1 i m m R i i i i c G x g x = = = ×

∏

⎡_⎣ − ⎤_⎦

∏

(23)

( )

[

]

( )

i R m i i g x x G c i

∏

= − × = 1 1 (1.10)

elde edilir. (1.10)’da R=

(

0 …, ,0

)

alınırsa bilinen sıra istatistiklerinin ortak olasılık yoğunluk fonksiyonu (1.7), R=

(

0 …, ,n−m

)

alınırsa tip-II sağdan sansürlü sıra istatistiklerinin ortak olasılık yoğunluk fonksiyonu (1.8) elde edilir (Balakrishnan ve Aggarwala 2000).

İlerleyen tür tip-II sağdan sansürlü örnekleme, yaşam zamanı analizlerinde veri elde etmede önemli bir yöntemdir. Çalışan parça diğer bir test için sistemden çekilip, deneyin maliyeti ve deney süresi azaltılabilir(Kuş, 2004).

Teorem 1.1 (Balakrishnan ve Sandhu 1995) R R R

n m m n m n m U U U₁_: _: < ₂_: _: < < _: _: ,

( )

0,1

Düzgün dağılımından alınmış R sansür şemalı ilerleyen tür tip-II sağdan

sansürlü sıra istatistikleri olsun.

R R R R R n m m n m m n m m n m m n m m U V U U V U U V : : 1 : : 2 : : 1 2 : : 1 : : 1 1 1 1 1 1 − = − − = − − = − − − (1.11)

rasgele değişkenleri bağımsızdır ve sırasıyla

m i R i Beta V m i m j j i ~ ,1 , 1,2, , 1 … = ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ +

∑

+ − =

(24)

İspat. (1.1),( 1.2) ve (1.10)’dan, R R R n m m n m n m U U

U₁_: _: < ₂_: _: < < _: _: ’nin ortak olasılık fonksiyonu

(

, , ,

)

(

1

)

, 0 ₁ 1 1 2 1 , , , 2: : :: : : 1 =

∏

− < < < < = m m i R i m U U U u u u c u u u f i n m m n m n m R … R … R (1.12)

şeklinde elde edilir. Burada c , (1.9)’da tanımlandığı gibidir. (1.11)’de ters

dönüşüm yapılırsa m i V U m i m j j n m i 1 , 1,2, , 1 : : = −

∏

= … + − = R

elde edilir. Eşitlik (1.11)’de tanımlanan dönüşümün jakobiyeni

∏

= − = m i i i V J 2 1

olarak bulunur. Böylece V₁,V₂,…,V_m in ortak olasılık yoğunluk fonksiyonu

(

v v v

)

f v v v v J f m j j m m m U U U m V V V m _m_n _m_n _m_m_n ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ − − − =

∏

= − 1 1 , , , 2 1 , , ,2 , , , ₁_:_: ₂_:_: _: _: 1 ,1 , ,1 1 … … R R … R … 1 , , 0 , ₁ 1 1 1 < < ∑ =

∏

= + − + − = m m i R i i v v v c m i m j j … (1.13) biçiminde elde edilir.

Eşitlik (1.13)’de faktorizasyon teoremi kullanılırsa

1 ~ m ,1 i j j m i V Beta i R = − + ⎛ ⎞ + ⎜ ⎟ ⎝

∑

⎠

, i=1, 2, ,… m ve V₁,V₂,…,V_m’nin bağımsız olduğu görülür.

R R R n m m n m n m U U U₁_: _: < ₂_: _: < < _: _: , Düzgün

( )

0,1 dağılımından alınmış R

sansür şemalı ilerleyen tür tip-II sağdan sansürlü sıra istatistikleri olsun. Teorem 1.1’den

(25)

R R R R R n m m n m m n m m n m m n m m U V U U V U U V : : 1 : : 2 : : 1 2 : : 1 : : 1 1 1 1 1 1 − = − − = − − = − − −

rasgele değişkenleri bağımsız ve sırasıyla

m i R i Beta V m i m j j i ~ ,1 , 1,2, , 1 … = ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ +

∑

+ − =

beta rasgele değişkenleridir. O zaman W V i m

m i m j j R i i i , 1,2, , 1 = _… ∑ = = −+ + bağımsız ve

( )

0,1 Düzgün dağılımına sahiptir. 1.9. Asimptotik Normallik

( )

X rasgele değişkenlerin bir dizisi , Z , standart normal dağılıma sahip n

bir rasgele değişken ve _⎯⎯d_{→ , dağılımda yakınsamayı göstermek üzere,} d n n n X a Z b − ⎯⎯→

olacak şekilde reel sayıların

( )

a ve pozitif reel sayıların _n

( )

b dizileri varsa, _n

( )

X _n

dizisine asimptotik normal veya daha açık olarak “a ortalaması” ve “_n 2 n b

varyansı” ile asimptotik normal dizisi denir ve _~

(

_, 2

)

n n n AN a b

X biçiminde

gösterilir. Buradaki a sayısı _n X ’in beklenen değeri ve _n 2 n

b sayısı X nin varyansı _n

olmayabilir. Bu değerler sırasıyla X ’in asimptotik ortalama ve asimptotik _n

(26)

1.10. Olabilirlik Fonksiyonu

n X X

X₁, ₂,..., örneklemi, olasılık (yoğunluk) fonksiyonu ( ; ),_{f x} _{γ γ}_∈ p

olan kitleden alınan n birimlik bir örneklem olsun. Örneklemin ortak olasılık yoğunluk fonksiyonu

( ; ), n

f x γ x∈

olmak üzere bu fonksiyona parametrenin bir fonksiyonu gözü ile bakıldığında

( )

;

( )

; , p

L γ x = f x γ γ∈Γ ⊂ (1.14)

şeklinde tanımlanan fonksiyona X₁,X₂,...,X_n örneklemine dayalı olabilirlik

fonksiyonu denir. Burada x=

(

x x₁, , ,₂ … x ′_n

)

ve γ =

(

γ γ₁, , ,₂ … γ_n

)

′ şeklinde olup

Γ parametre uzayıdır. Olabilirlik fonksiyonu L

( )

γ x; in logaritması alınarak

( )

_γ ₌log

(

_L

( )

_{γ x};

)

, _γ_{∈Γ ⊂} p _(1.15)

(27)

1.11. Fisher Bilgi Matrisi

n X X

X₁, ₂,..., örneklemi, olasılık (yoğunluk) fonksiyonu ( ; ),_{f x} _{γ γ}_∈ p

olan kitleden alınan n birimlik bir örneklem olsun. Bu örneklem için Fisher bilgi matrisi(Fisher information matrix)

(

)

(

)

( )

( ) log ; I E L E ⎧⎛ ∂ ⎞⎫ = − ⎨⎜_∂ ⎟⎬ ⎝ ⎠ ⎩ ⎭ ⎧⎛ ∂ ⎞⎫ = − ⎨⎜_∂ ⎟⎬ ⎝ ⎠ ⎩ ⎭ γ γ X γ γ γ

( )

2 2 2 2 1 1 2 1 2 2 2 2 2 1 2 2 2 2 2 2 1 2 p p p p p γ γ γ γ γ γ γ γ γ γ γ γ γ γ γ ⎛∂ ∂ ∂ ⎞ ⎜ _∂ _{∂ ∂} _{∂ ∂} ⎟ ⎜ ⎟ ⎜_∂ _∂ _∂ ⎟ ⎜ ⎟ ⎜ ⎟ = − ∂ ∂ ∂ ∂ ∂ ⎜ ⎟ ⎜ ⎟ ⎜_∂ _∂ _∂ ⎟ ⎜ ⎟ ⎜_{∂ ∂} _{∂ ∂} _∂ ⎟ ⎝ ⎠ γ γ γ γ γ γ γ γ γ (1.16)

şeklinde tanımlanır, burada L γ X

(

;

)

ve

( )

γ sırasıyla eşitlik (1.14) ve (1.15) de verilen olabilirlik ve log-olabilirlik fonksiyonlarıdır (Wu ve Kuş 2009).

1.12. En Çok Olabilirlik Tahmin Edicileri

Olabilirlik veya log-olabilirlik fonksiyonunu maksimum yapan γ değeri

( )

(

)

(

( )

)

ˆ arg max= L ; =arg max

γ γ x γ (1.17)

γ nın en çok olabilirlik tahmin edicisi (Maximum Likelihood Estimator, MLE)

(28)

1.13. Asimptotik Güven Aralıkları

Eşitlik (1.17) de tanımlanan en çok olabilirlik tahmin edicisi ˆγ bazı düzgünlük şartları altında

(

_ˆ

)

d

(

_0, 1

( )

)

n γ γ− ⎯⎯→N I− γ

olmak üzere asimptotik normaldir, burada _I−1

( )

_γ _{, (1.16) eşitliğinde tanımlı}

Fisher Bilgi Matrisidir. Fisher Bilgi matrisinin tersi ˆγ nın asimptotik varyans-kovaryans matrisidir. Bu matrisin bilinmesi, büyük örneklemler için γ γˆ ˆ₁, , ,₂ … γˆ_n tahmin edicilerinin ayrı ayrı asimptotik varyanslarının bilinmesi anlamına gelmektedir. _I−1

( )

_γ _{nın tutarlı bir tahmin edicisi}

( )

1 2 2 2 2 1 1 2 1 2 2 2 1 ₂ 2 1 2 2 2 2 2 2 1 2 _ˆ p p p p p I γ γ γ γ γ γ γ γ γ γ γ γ γ γ γ γ γ − − = ⎛∂ ∂ ∂ ⎞ ⎜ _∂ _{∂ ∂} _{∂ ∂} ⎟ ⎜ ⎟ ⎜_∂ _∂ _∂ ⎟ ⎜ ⎟ ⎜ ⎟ = − ∂ ∂ ∂ ∂ ∂ ⎜ ⎟ ⎜ ⎟ ⎜_∂ _∂ _∂ ⎟ ⎜ ⎟ ⎜_{∂ ∂} _{∂ ∂} _∂ ⎟ ⎝ ⎠ γ γ γ γ γ γ γ γ γ γ (1.18a)

dır (Adamidis ve Loukas 1998). Buradan ,γ_i i=1, 2, ,… p için ˆγ_i’ya dayalı asimptotik güven aralığı

1 1 2 2 ˆ_i _ii _i ˆ_i _ii 1 P γ z _α V γ γ z _α V α − − ⎛ ⎞ − < < + ≅ − ⎜ ⎟ ⎝ ⎠ (1.18b)

şeklinde oluşturulabilir. Burada V , eşitlik (1.18a)’da verilen matrisin _ii .i diogonal elemanıdır ve a∈

( )

0,1 için z , standart normal dağılımın _a a. kuantilidir (Wu ve Kuş 2009).

(29)

1.14. Taylor Serileri

[ ]

a b R

f : , → fonksiyonunun

( )

a b, aralığında n. mertebeden türevi _f (n)

olmak üzere

[ ]

a,b ’nin keyfi x ve ₀ x>x₀ noktaları için

(

)

∑

= + − = n k n k k _x _x _x _k _R _x f x f 0 0 0 ) ( ₍ ₎ _/ _! ₍ ₎ ) ( (1.19)

açılımına f fonksiyonunun x noktasındaki Taylor serisi denir. Burada ₀

(

1

)

!

(

)

)(

1

) (

)

, 0 1 1 ) ( ( 1) ₀ ₊ ₋ ₀ ₋ ₋ ₀ 1 _< _< + = n+ _θ _θ n n+ _θ n f x x x x x n x R (1.20) veya

( )

x o

(

x x0

)

, x x0 R n n = − → (1.21) şeklindedir (Shahbazov 2005).

1.15. Birinci Mertebe Yaklaşımı

1: :m n, 2: :m n, , m m n: :

UR UR _… UR _Düzgün

( )

₀_,₁ _{dağılımından alınmış ilerleyen tür tip II}

sağdan sansürlü örneklem olmak üzere bu örneklemin ortak olasılık yoğunluk fonksiyonu;

(

1 2

)

(

)

1 1 , , , 1 i, 0 1 m R m i m i f u u u c u u u = =

∏

− < < < < … (1.22) şeklindedir, burada c

(

− ₁−1

)

× ×

(

− ₁ − ₂ − − ₁− +1

)

=n n R n R R R ₋ m c _m dir.

(30)

Bu sonuçlar kullanılarak, U_{1: :}R_{m n},U_{2: :}R_{m n}, ,_… U_{m m n}R_{: :} _Düzgün

( )

₀_,₁ _{dağılımından}

alınmış ilerleyen tür tip II sağdan sansürlü örneklem olmak üzere

: : , 1, 2, , i m n

UR i= _… m _{.i ilerleyen tür sağdan sansürlü sıra istatistiğinin beklenen}

değer ve varyansı

(

i m n: :

)

i 1 i,

E UR =π = −b _i₌_{1 …}_,₂_, _,_m _(1.23)

(

i m n: :

)

i i,

Var UR =k b _i₌_{1, 2, ,}_… _m _(1.24)

şeklindedir. 1 i≤ < ≤ için j n U_{i m n}R_{: :} _ile

: : j m n

UR _{rasgele değişkenlerinin arasındaki}

kovaryans

(

i m n: : , j m n: :

)

i j, Cov UR UR =k b _{1 i}_{≤ < ≤}_{j m} biçimindedir. Burada i=1 …,2, ,m ve 1 1 1 m j m j m j m j R R a j R R − + − + + + + = + + + + için 1 1 1 1 1 1 1 1 2 3 1 2 i k k m i k k k m i k k m k k k m m m j j j m i j m i m k R R R k m k R R R m k R R R m k R R R a γ + = + + = + = − + = − + ⎧ − + + + + + ⎫ = _⎨ _⎬ − + + + + + ⎩ ⎭ ⎧ − + + + + + ⎫ − _⎨ _⎬ − + + + + + ⎩ ⎭ = −

∏

(1.25) ve 1 1 1 1 1 2 i m k k m i j k k k m j m i m k R R R b a m k R R R + = + = − + ⎧ − + + + + + ⎫ = _⎨ _⎬= − + + + + + ⎩ ⎭

∏

(1.26)

(31)

Yukarıdaki açıklamalar kullanılarak herhangi sürekli bir F i

( )

dağılımına sahip bir kitleden alnınan ilerleyen tür tip II sağdan sansürlü sıra istatistiklerinin beklenen değer, varyans ve kovaryans değerleri aşağıdaki gibi elde edilebilir.

Ters olasılık integral dönüşümünden

(

)

1 : : : : d i m n i m n YR ₌F− UR _(1.27)

yazılabilir. Burada _{F , ilerleyen tür tip II sağdan sansürlü örneklemin geldiği}−1

yaşam zamanı dağılımı için dağılım fonksiyonun tersidir ve = ise dağılımda d eşitliği göstermektedir. (1.27) eşitliğinin sağ tarafı π_i =E U

(

_{i m n}R_{: :}

)

_{civarında Taylor}

serisine açıp beklenen değerini alınıp ilk terim dışındakiler göz ardı edilerek

( )

1

( )

: : ,

i m n i

E YR ≈F− π _i₌_{1 …}_,₂_, _,_m _(1.28)

yazılabilir. Eşitlik (1.28)’deki π_i, (1.23) eşitliğinde verildiği gibidir. Bu bilgiler yardımıyla varyans ve kovaryans değerleri de

( )

{

1

}

2 1 : : i m n i i i Var YR ≈ F− π k b _i₌_{1 …}_,₂_, _,_m _(1.29) ve

(

)

( )

1 1 1 1 : : , : : , i m n j m n i j i j Cov YR YR ≈F− π F− π k b _{1 i}_{≤ < ≤ (1.30)}_{j m} şeklindedir. Burada _F 1( )1

( )

_u d _F 1

( )

_u du

− ₌ − _{şeklinde tanımlıdır (Balakrishnan ve}

(32)

1.16. Newton-Raphson Yöntemi

( )

x =0

f denkleminin bir kökünün bulunmasındaki iteratif yöntemlerden biridir. f

( )

x sürekli ve türevlenebilen fonksiyonunun bilinen yaklaşık bir kökü

n

x olsun. f

(

x_n + fonksiyonu h

)

x civarında ikinci mertebeye kadar Taylor _n

serisine açılırsa

(

x h

)

f

( )

x hf

( )

x h hf

( )

(

x x h

)

f _n + = _n + ′ _n + ′′ _n ∈ _n, _n + 2 2 ξ ξ

yazılabilir. x_n +h=x_n₊₁ değerinin gerçek köke çok yakın olduğu yani

(

x h

)

f _n + ’ ın hemen sıfır olduğu düşünülürse,

( )

x hf

( )

x h f

( )

(

x x h

)

f _n + ′ _n + ′′ _n ∈ _n _n + = , 2 0 2 ξ ξ

yazılır. h yeterince küçük ise _{h ’yi içeren terim ve sonraki terimler ihmal}2

edilebilir. Böylece

( )

x_n +hf′

( )

x_n =0 f veya

( )

xn_n f x f h ′ − =

(33)

( )

n n n n x f x f x x ′ − = +1 iterasyon denklemine ulaşılır (Oturanç ve ark 2003).

Newton – Raphson yöntemi geometrik olarak incelenecek olursa

( )

x =0

f fonksiyonunun başlangıç yaklaşık kökü x olmak üzere fonksiyonun ₀

( )

(

x0,f x0

)

noktasındaki teğetinin denklemi

( )

x0 f

( )(

x0 x x0

)

f

y− = ′ −

olarak yazılabilir. Bu teğetin x eksenini kestiği nokta ilk kök yaklaşımı olur ve

( )

0₀ 0 1 x f x f x x ′ − =

(34)

2.UZUN KUYRUKLU SİMETRİK DAĞILIM

Uzun Kuyruklu Simetrik dağılım, özellikle aykırı değer içeren örneklemlere dayalı istatistiksel sonuç çıkarımı yaparken çok kullanışlıdır (Tiku ve Akkaya 2004). X rasgele değişkeni, Uzun Kuyruklu Simetrik dağılıma (Long-Tailed Symmetric Distribution, LTS) sahip olduğunda, X ’in olasılık yoğunluk fonksiyonu 2 1 1 ( ; , ) 1 , 1 1 B , 2 2 p x g x x k k p μ μ σ σ σ − ⎧ ₋ ⎫ ⎪ ⎛ ⎞ ⎪ = _⎨ + _⎜ _⎟ _⎬ ∈ ⎛ ₋ ⎞_⎪_⎩ ⎝ ⎠ _⎪_⎭ ⎜ ⎟ ⎝ ⎠ (2.1)

şeklinde tanımlanır (Tiku ve Akkaya 2004, syf:30).

Burada k = p2 −3, 3 2

p> , μ∈ ve σ >0 dır. Ayrıca X rasgele değişkeninin 5p>1. için beklenen değer ve varyansı E

( )

X =μ, _Var

( )

_X ₌_σ2

şeklindedir. Ayrıca μ konum, σ ölçek parametresidir (Şenoğlu ve Tiku 2001).

3

2 −

= p

k ifadesinde p ’nin sonsuza yaklaşması durumunda LTS

dağılımı normal dağılıma yaklaşır (Şenoğlu ve Tiku 2001, Tiku ve Akaya, 2004). Şekil 2.1 de μ =0 veσ =1 olması durumunda farklı p değerleri için LTS

(35)

Şekil 2.1 Farklı p değerleri için LTS dağılımının olasılık yoğunluk

fonksiyonunun grafiği

Şekil 2.1 incelendiğinde, p değerlerinin artması durumunda LTS dağılımının olasılık yoğunluk fonksiyonu normal dağılımın olasılık yoğunluk fonksiyonuna benzemektedir. p=10 olması durumunda LTS dağılımının olasılık yoğunluk fonksiyonu hemen hemen normal dağılımın olasılık yoğunluk fonksiyonu ile aynıdır.

Aşağıda p=2,σ = değerleri sabit kalması koşulu ile farklı 1 μ değerleri için LTS dağılımının olasılık yoğunluk fonksiyonunun grafiği aşağıda verilmiştir.

(36)

Şekil 2.2 Farklı μ değerleri için LTS dağılımının olasılık yoğunluk fonksiyonunun grafiği

Şekil 2.2 incelendiğinde μ arttırıldığında LTS dağılımının olasılık yoğunluk fonksiyonunun grafiği sağa doğru kaymaktadır. Burada μ parametresinin LTS dağılımı için bir konum parametresi olduğu açıkça gözlenmektedir.

Şekil 2.3 Farklı σ değerleri için LTS dağılımının olasılık yoğunluk

(37)

Şekil 2.3’teki grafikte sabit p=2,μ =0 değerleri için farklı σ değerlerine karşılık LTS dağılımının olasılık yoğunluk fonksiyonunun grafiği çizilmiştir. Grafik incelendiğinde σ değerleri arttıkça olasılık yoğunluk fonksiyonunun grafiğinin yayılımı artmaktadır. Burada σ ’nın, LTS dağılımı için ölçek parametresi olduğu açıkça gözlemlenmektedir.

LTS dağılımına sahip X rasgele değişkeninin dağılım fonksiyonu

2 1 1 ( , , ) 1 1 1 B , 2 2 p x _x G x dx k k p μ μ σ σ σ − −∞ ⎧ ₋ ⎫ ⎪ ⎛ ⎞ ⎪ = _⎨ + _⎜ _⎟ _⎬ ⎛ ₋ ⎞⎪_⎩ ⎝ ⎠ ⎪_⎭ ⎜ ⎟ ⎝ ⎠

∫

(2.2) şeklindedir.

X rasgele değişkeni μ veσ parametreli LTS dağılımına sahip olduğunda

σ μ − = X

Z dönüşümü uygulanırsa Z standart LTS dağılımına sahip olur ve

Z ’nin olasılık yoğunluk fonksiyonu

2 1 ( ) 1 , 1 1 B , 2 2 p z f z z k k p − ⎧ ⎫ = _⎨ + _⎬ ∈ ⎛ ₋ _{⎞ ⎩} _⎭ ⎜ ⎟ ⎝ ⎠ (2.3)

şeklinde tanımlanır. Burada B ,ii

( )

Beta fonksiyonudur. Z’nin Maple 11 program yardımıyla hesaplanan dağılım fonksiyonu ise

2 1 ( ) 1 , 1 1 B , 2 2 p z _z F z dz z k k p − −∞ ⎧ ⎫ = _⎨ + _⎬ ∈ ⎛ ₋ _{⎞ ⎩} _⎭ ⎜ ⎟ ⎝ ⎠

∫

(2.4) şeklindedir.

(38)

X , LTS dağılıma sahip bir rasgele değişken olmak üzere X rasgele

değişkeninin r.momenti Maple 11 programı yardımıyla

( )

(

)

(

( )

)

2 2 1 1 1 1 B , 2 2 1 1 2 3 1 1 1 2 2 2 2 _, 3 1 2 2 2 p r r r r z E X x dx k k p r r p p p p π − ∞ −∞ ⎛ ⎞ ⎜ ⎟ ⎝ ⎠ ⎧ ⎫ = _⎨ + _⎬ ⎛ ₋ _{⎞ ⎩} _⎭ ⎜ ⎟ ⎝ ⎠ ⎛ ⎞ ⎛ ⎞ Γ_⎜ − − _{⎟ ⎜}Γ + _⎟ − + − ⎝ ⎠ ⎝ ⎠ = > ⎛ ⎞ Γ_⎜ − _⎟ ⎝ ⎠

∫

(2.5)

biçiminde elde edilir.

(2.5) eşitsizliği kullanılarak LTS dağılımının Basıklık katsayısı (kurtosis)

2 3 3 5 2 , 5 ₂ 2 p p p γ ⎛ ₋ ⎞ ⎜ ⎟ ⎝ ⎠ = > −

şeklindedir (Tiku ve Akkaya 2004).

Ayrıca LTS dağılımı simetrik dağılım olduğundan çarpıklık katsayısı

1 0

γ = dır. Çizelge 2.1’de LTS dağılımının farklı p değerleri için Basıklık

katsayısı değerleri verilmiştir(Tiku ve Akaya 2004). Şekil 2.4’de Excel yazılımı

(39)

Çizelge 2.1 Farklı p değerleri için LTS dağılımının Basıklık Katsayı değerleri

p _{2.5 3.5 5 10}_… _∞

Basıklık

katsayısı ∞ 6 4.2 3.4 … 3

Şekil 2.4 LTS dağılımının farklı p değerleri için Basıklık katsayısı değişim grafiği

Şekil 2.4 incelendiğinde 2.5p= için basıklık katsayısının sonsuza gittiği,

p arttıkça basıklık katsayısının 3’e yaklaştığı (normal dağılım basıklık katsayısı)

gözükmektedir. Buda LTS dağılımının, p parametresi sonsuza gittiğinde normal

dağılıma yaklaştığını desteklemektedir.

X , LTS dağılımına sahip bir rasgele değişken olmak üzere

v X v T Z k k μ σ − ⎛ ⎞ = _⎜ _⎟=

⎝ ⎠ şeklinde tanımlanan T rasgele değişkeni v= p2 −1 serbestlik dereceli t dağılımına sahiptir (Tiku ve Akkaya 2004, Tiku ve Sürücü,

(40)

2.1.En Çok Olabilirlik Tahmincisi R R R n m m n m n m X X X₁_: _: < ₂_: _: < < _: _: , LTS dağılımından

(

R₁,R₂,…,R_n

)

sansür şemalı ilerleyen tür tip II sağdan sansürlü örneklem olsun.(1.10)’dan ilerleyen tür tip II sağdan sansürlü örnekleme dayalı olabilirlik fonksiyonu

(

)

(

)

(

)

1 , m , , 1 , , Rj j j j L μ σ c g x μ σ G x μ σ = =

∏

− (2.6)

şeklindedir. Burada G, eşitlik (2.1)’de verilen g yoğunluk fonksiyonuna ilişkin

(2.2) de verilen dağılım fonksiyonudur. Eşitlik (2.6)’da verilen olabilirlik fonksiyonu

(

)

( )

(

( )

)

Rj j m j j m _f _z _F _z c L =

∏

− = − ₁ , 1 σ σ μ (2.7)

şeklinde yazılabilir, burada f i

( )

ve F i

( )

, sırasıyla, (2.3) ve (2.4) de tanımlandığı gibidir. Ayrıca, z_j =

(

x_j −μ

)

/σ dır. Olabilirlik fonksiyonun logaritması alınarak log-olabilirlik fonksiyonu

(

)

[

]

( )

_∑

(

( )

)

_∑

(

( )

)

= = − + + − = m j j j m j j R F z z f m c L 1 1 1 log log log log , log μ σ σ

biçiminde elde edilir. Buradan olabilirlik denklemleri aşağıdaki gibi elde edilmiştir (Asgharzadeh 2006).

(41)

(

)

( )

∑

( )

∑

= = = − + ′ − = ∂ ∂ m j j j j m j j j z F z f R z f z f L 1 1 0 1 1 1 , log σ σ μ σ μ (2.8)

(

)

( )

∑

( )

∑

= = = − + ′ − − = ∂ ∂ m j j j j j m j j j j z F z f z R z f z f z m L 1 1 0 1 1 1 , log σ σ σ σ σ μ (2.9)

2.2. Modifiye Edilmiş En Çok Olabilirlik Tahmin Edicileri

İlerleyen tür tip II sağdan sansürlü örneklemlere dayalı olabilirlik denklemlerinden ilgili parametrelerin en çok olabilirlik tahmin edicileri genellikle analitik olarak elde edilemez. Böylece konum ölçek parametreleri için analitik olarak elde edilebilen asimptotik en çok olabilirlik tahmin edicileri arzu edilebilir. Bu analitik tahmin ediciler olabilirlik denklemlerin iteratif çözümleri için iyi bir başlangıç değeri olarak kullanılabilirler. Asimptotik olabilirlik denklemleri fikri yeni değildir. Asimptotik en çok olabilirlik tahmin edicileri ayrıntılı olarak Tiku ve Akkaya ( Robust Estimation and Hypothesis Testing )’nın kitabında tartışılmıştır.

En çok olabilirlik tahmin edicileri (MLE), bazı düzgünlük şartları (regularity conditions) altında asimptotik normallik gibi arzu edilen özelliklere sahip olmaktadır. Fisher bilgi matrisinin (Fisher Information Matrix) tersi, bazı düzgünlük şartları altında ML tahmin edicilerinin asimptotik dağılımının varyans-kovaryans matrisi olması nedeniyle parametrelerin asimptotik güven aralıkları ML tahmin edicilerine dayalı olarak elde edilebilmektedir. ML tahmin edicilerinin istenen özelliklere sahip olmasının yanı sıra bazı durumlarda bu tahmin edicilerin elde edilmesinde bazı sorunlar ortaya çıkabilir. Örneğin, olabilirlik fonksiyonunun parametreye göre lineer olmadığı ve birden fazla tepeli (polymodal) olması durumunda ML tahmin edicilerini elde etmek için Newton-Raphson ve EM (Expectation-Maximization) algoritması gibi bazı iteratif yöntemler kullanılmaktadır. Bu iteratif yöntemlerin uygulanmasında parametrelerin başlangıç değerlerinin seçimi birden fazla tepeli olabilirlik fonksiyonunun en

(42)

büyüklenmesinde önemli rol oynamaktadır. Olabilirlik denklemlerinin gerçek çözümlerine uzak başlangıç değerleri verilmesi durumunda yukarıda bahsedilen iteratif yöntemler genel maksimum yerine yerel maksimum değerine ulaşabilir. Sansürlü ve maskeli örneklemlere dayalı olabilirlik fonksiyonları, genellikle parametrelere göre lineer değildir. Bu sebepten iteratif yöntemlerin, istenilen çözüme ulaştırmama ihtimali göz önüne alındığında daima analitik olarak elde edilen ve ML tahmin edicileri ile aynı asimptotik özelliklere sahip olan modifiye edilmiş en çok olabilirlik tahmin edicilerinin (MMLE, Tiku 1967a, b; 1968a, b, c; 1970; 1973) önemi ortaya çıkmaktadır. Modifiye edilmiş tahmin ediciler aşağıdaki prosedür yardımıyla elde edilebilir (Tiku ve Akkaya 2004).

Aşağıda ölçek parametresi bilindiğinde konum parametresinin modifiye edilmiş en çok olabilirlik tahmin edicisinin elde edilmesindeki süreç verilmiştir.

1, 2, , n

X X … X , konum parametresi θ , ölçek parametresi σ (biliniyor) olan g yoğunluklu bir kitleden alınan nbirimlik bir örneklem olmak üzere bu örnekleme dayalı olabilirlik denklemi

(

)

1 log ; 1 ( ) 0 n i i L g z θ θ σ = ∂ = = ∂

∑

X , (z_i = x_i−θ σ) / (2.10)

şeklinde yazılabilir, burada ,x i_i =1, 2, ,… n, X X₁, ₂, ,… X_n örnekleminin aldığı değerler ve X=

(

X X₁, ₂, ,… X_n

)

dir. X X₁, ₂, ,… X_n örneklemine dayalı sıra istatistikleri

(1) (2) ( )n

X ≤X ≤ ≤ X (2.11) olmak üzere (2.10) eşitliği, (2.11) de verilen sıra istatistiklerine dayalı olarak

(

)

( ) 1 log ; 1 ( ) 0 n i i L g z θ θ σ = ∂ = = ∂

∑

X , z_{( )}_i =(x_{( )}_i −θ σ) / (2.12)

biçiminde yazılabilir, burada ,z i_i =1, 2, ,… , n Z₍₁₎ ≤Z₍₂₎≤ ≤Z_{( )}_n sıra istatistiklerinin aldığı değerlerdir. t , .i standartlaştırılmış sıra istatistiği ₍_i₎ Z_{( )}_i nin

(43)

beklenen değeri

(

t_{( )}_i =E Z

( )

_{( )}_i ,i=1, 2, ,… n

)

olmak üzere g(z₍_i₎) yi, t civarında ₍_i₎

Taylor serisine açıp ilk iki terimi alındığında aşağıdaki doğrusal eşitlik elde edilir.

) ( ) ( ) ( ) ( ) ( ₍₎ ₍₎ ₍₎ ₍₎ i t z i i i i g z z t z t g z g = ⎭ ⎬ ⎫ ⎩ ⎨ ⎧ ∂ ∂ − + ≅ (2.13) ) (i i i β z α + = , (1≤i≤n) , burada ) ( ) ( i t z i g z z ⎭⎬ ₌ ⎫ ⎩ ⎨ ⎧ ∂ ∂ = β ve α_i =g(t₍_i₎)−β_it₍_i₎ (2.14)

dır. Eğer g(z) sınırlı bir fonksiyon ve z , _(i₎ t ye yaklaştığında _(i₎ 1 i n≤ ≤ için

( ) ( )

( _i ) ( _i _i _i ) _n 0

g z − α β+ z ⎯⎯⎯_→∞→ , (2.15)

dır. (2.13) (2.12) de yazıldığında modifiye edilmiş olabilirlik denklemi

{

}

* ( ) 1 log log 1 0 n i i i i L L z α β θ θ σ = ∂ _≅∂ ₌ ₊ ₌ ∂ ∂

∑

(2.16)

şeklinde yazılabilir. Bu eşitlik bazı düzgünlük (regularity) şartlar altında

* 1 log log lim 0 n L L n θ θ →∞ ⎧∂ ∂ ⎫ ⎪ ₋ ⎪₌ ⎨ _∂ _∂ ⎬ ⎪ ⎪ ⎩ ⎭ (2.17) dır. (2.15) ve (2.17) den, modifiye edilmiş en çok olabilirlik denklemi asimptotik olarak en çok olabilirlik denklemine denk olduğu söylenebebilir. (2.16) denkleminden elde analitik olarak elde edilen θ parametresinin tahmin edicisine modifiye edilmiş olabilirlik MML (Modified Maxsimum Likelihood) tahmin edicisi