• Sonuç bulunamadı

Kategorik veriler için ortaya konulan iki önemli GLM açısından istatistiksel yorumlama ve model kontrolü konularına odaklanılacaktır. İlk önce Poisson rassal bileşenine sahip GLM için açıklama yapılacaktır. İlerleyen bölümlerde ise binom rassal değişkenine sahip GLM’ ler için aynı metotlar ele alınacaktır. Kategorik yanıtlar için kullanılan çoğu GLM için, ML parametre tahminlerini elde etmek hesaplama açısından oldukça karmaşıktır. GLM yazılımı nümerik bir metot kullanmaktadır. ML tahminleri, büyük örnekler için yaklaşık olarak normal dağılım

146

göstermektedir. Bu nedenle model parametresi β için oluşturulan bir güven aralığı şu şekilde ifade edilir: βˆ±zα/2ASE (ASE: βˆ’ nın asimptotik standart hatasıdır.).

3.4.1. Wald, Olabilirlik Oranı (likelihood-ratio), Skor Testi

GLM’ lerde yer alan parametrelere ilişkin 0H0:β = hipotezinin anlamlılık testlerinin oluşturulması için üç metot söz konusudur. En basit metotta ML tahminlerinin büyük örneklem normalliğinden yararlanılmaktadır. Test istatistiği aşağıdaki şekildedir ve β =0 olduğunda (yani sıfır hipotezi doğruyken) yaklaşık bir normal dağılıma sahiptir:

ASE z=βˆ/

İki yanlı ya da tek yanlı P-değerleri ile z için standart normal dağılım tablosu kullanılır.

İki yanlı alternatif hipotezi için z2 , df=1 serbestlik dereceli bir ki-kare dağılımına sahiptir ve P-değeri ise gözlemlenen değerin üzerinde kalan sağ kuyruk ki-kare olasılığıdır. Parametre tahminin standart hatasına bölünmesi ile elde edilen bu türdeki istatistiğe Wald İstatistiği adı verilmektedir(Agresti,1996). İkinci metotta ise

maksimize edilen iki oran arasındaki olabilirlik fonksiyonu kullanılmaktadır: (1) Sıfır hipotezi doğru iken olası parametre değerleri arasındaki maksimumum oran. (2) tüm değişkenlerin dahil olduğu tam modele göre elde edilebilecek daha fazla parametre değerleri arasındaki maksimum oran (sıfır ya da alternatif hipotezinin doğru olmasını sağlayan değerlerdir).

1

l ; tam model için olabilirlik fonksiyonunu maksimize eden değeri ve l ; 0

sıfır hipotezi ile temsil edilen daha basit olan model için maksimize eden değeri göstersin. Örnek olarak, doğrusal tahmin edici α+βx şeklinde ve sıfır hipotezi de

0 :

0 β =

147

oluşturulabilecek (α,β) kombinasyonu için hesaplanan olabilirlik fonksiyonudur. l ; 0

0 =

β olduğunda elde edilmesi en yüksek olasılığa sahip verilere göre α ile hesaplanan olabilirlik fonksiyonudur. l her zaman en azından 1 l kadar büyüktür. 0

Çünkü l ; 0 l ’in elde edildiği parametre değerlerinin sınırlandırılması aracılığı ile 1 maksimize etmeye dayanmaktadır. Olabilirlik oran (Likelihood-ratio) test istatistiği aşağıdaki şekildedir: ) ( 2 )] log( ) [log( 2 ) / log( 2 0 1 =− 01 =− L0L1l l l l

L0 ve L1 ; maksimum log-olabilirlik fonksiyonlarıdır. l ve 0 l ’ in bu şekilde 1

dönüştürülmesi ile bir ki-kare istatistiği elde edilir. H0 :β =0 altında, bu istatistik aynı zamanda df=1 serbestlik dereceli büyük örneklem ki-kare dağılımına sahiptir.

GLM’ ler için kullanılan çoğu yazılımda maksimum log-olabilirlik değerleri ve )−2(L0L1 şeklindeki olabilirlik oran istatistiği hesaplanmaktadır (Agresti,1996). Hatta bazı yazılımlarda, skor istatistiğinin kullanıldığı üçüncü bir ki- kare testi de hesaplanmaktadır ve bazen yeterli ya da etkin skor istatistiği olarak da adlandırılmaktadır.

Uygulamada kullanılan örnek büyüklükleri için olabilirlik oran testi Wald testine kıyasla daha güvenilirdir. Üç istatistiğin değerlerinde belirlenen bir ıraksama;

βˆ dağılımının normallikten uzak olabileceğine işaret etmektedir. Bu durumda büyük örnek metotlarından ziyade küçük örnek metotları daha uygun olur. En iyi bilinen GLM, özdeşlik bağıntısının kullanıldığı normal verilere göre oluşturulan regresyondur ve bu regresyon için yukarıda sözü edilen üç test istatistiği de özdeş sonuçlar sağlamaktadır.

148

3.4.2. Poisson Model Kontrolü

Uyum iyiliği istatistiklerinin özetlenmesi ve artıklar; bir GLM uyumunun yeterliliğinin ve uygunluğunun araştırılmasında yardımcı olmaktadır. Poisson rassal değişkeni ile birlikte oluşturulan GLM’ ler için bu durumu açıklayalım. N tane açıklayıcı değişkenden i.’si yi ile gösterilen gözlem sayısıdır veµˆ ile de uydurulmuş i

değerdir. Uyum iyiliğinin Pearson ve olabilirlik oran istatistikleri aşağıdaki şekildedir:

(

)

− = i i i y X µ µ ˆ ˆ 2 2 ,

⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ = i i i y y G µˆ log 2 2

{ }

µˆ şeklinde uydurulmuş değerler göreceli olarak büyükse (5 değerini i

aşarsa) ve N sayısı sabit ise bu test istatistikleri yaklaşık ki-kare dağılımı göstermektedir. df serbestlik derecesi yanıt sayısından model parametre sayısının çıkarılması ile elde edilir. Bu df değeri model için artık df olarak adlandırılır. P-

değeri sağ kuyruk olasılığıdır; büyük test istatistikleri ve küçük P-değerleri zayıf bir model uyumu göstermektedir. Fakat bu istatistikler için büyük örnek ki-kare teorisi iki açıdan geçerli olmamaktadır (Agresti,1996): İlki, gözlemlenen toplam değerlerin bir çoğu küçüktür ve bazıları sıfıra eşittir. İkincisi, ki-kare yaklaşımı; N tane sabit sayıdaki açıklayıcı değişkene göre Poisson uyumlu değerleri arttırmaktadır. Böylece X2 ve G2 değerleri burada güvenilir nitelikte olmamaktadır (uyumsuzluğun ölçülmesi şeklinde). Uydurulmuş değerler her bir kategori için µˆi ≥5 değerini sağlamalıdır. Daha basit bir yaklaşım ise gruplandırılmış değerler ile modelin tekrar oluşturulmasından meydana gelmektedir. Bu durumda kategorilere skorların atanması gerekmektedir.

3.4.3. Model Artıkları

Herhangi bir GLM için, uyum iyiliği istatistikleri sadece modellerin verilere en iyi nasıl uydurulacağını özetlemektedir. Uydurulmuş ve gözlemlenen değerlerin

149

kıyaslanması ile daha fazla bilgi elde edilmektedir. i. gözleme göre gözlemlenen ve uydurulmuş sayı arasındaki artık farkı yi − sınırlı bir fayda sağlamaktadır. µˆi

Pearson artığı (Pearson residual) bu farkın standartlaştırılmasıdır ve aşağıdaki

şekilde belirlenir(Agresti,1996): ) ( ˆ ) ( n gözlemlene ar V uydurulan n gözlemlene ığı PearsonArt = −

Poisson GLM’ lere göre i. değere göre şu şekilde basitleştirilir:

i i i i y e µ µ ˆ ˆ − =

Bu farkın tahmin edilen Poisson standart sapmasına bölünmesi ile standartlaştırılmaktadır. Bu artıklar

2 = 2

X

ei aracılığı ile belirlenen Pearson

uyum iyiliği istatistiği ile ilişkilidir. Daha büyük artıklara sahip değerler model uyumunun test edilmesinde genel X2 değerine daha fazla katkı yapmışlardır. Pearson artık değerleri, yaklaşık olarak sıfırın etrafında dalgalanmaktadır. µi büyük olduğunda bu dalgalanma yaklaşık olarak normal bir dağılımı izlemektedir. Uydurulmuş değer örnek verileri ile belirlendiğinden dolayı yi − farkı µˆi yi − µi farkından daha küçük olma eğilimindedir. Tahmin edilen standart hataya bölünmesi ile elde edilen Pearson artığı ayarlanmış artık (Adjustment Residual) olarak

adlandırılmaktadır (Agresti,1996). µi büyük olduğunda bu yaklaşık bir normal dağılıma sahip olur. Bu nedenle ayarlanmış artıklara göre bir sapmanın yi − µˆi

“büyük” olduğunu söylemek daha kolaydır. Kategori sayısı büyük olduğunda bu hacimdeki bazı değerlerin gerçekleşmesi beklense de, mutlak değer olarak yaklaşık olarak 2’den daha büyük ayarlanmış artıklar dikkat gerektirmektedir.

Ayarlanmış artıklar Pearson artıklarına kıyasla daha fazla tercih edilmektedir. Daha önceki bölümde iki yönlü kontenjans tablolarında bağımsızlığın test edilmesi için ayarlanmış artıklar açıklanmıştır. Poisson GLM’ ler için ayarlanmış artığın genel formu aşağıdaki şekildedir:

150

(

)

) 1 ( ) 1 ( ˆ ˆ i i i i i i h e h y − = − − µ µ

hi: i. gözlemin kaldıraç gücü (leverage) olarak adlandırılmaktadır. Kaldıraç

gücü için oluşturulan formül oldukça karışıktır. Kaldıraç gücü arttıkça ilgili gözlemin, model uyumunu etkilemede daha fazla potansiyele sahip olduğu şeklinde kabaca bir yorum yapılabilmektedir. Çoğu GLM yazılımında (SAS’ta PROC GENMOD komutu) GLM’ ler için ayarlanmış artıklarda raporlanmaktadır (Stokes, Davis ve Koch, 1991). Regresyon modellemesinde kullanılan diğer teşhis araçları aynı zamanda GLM uyumlarının değerlendirilmesinde de yardımcı olmaktadır. Örnek olarak bir gözlemin tüm modelin uyumu üzerindeki etkisini belirlemek amacıyla öncelikle bu gözlem silinerek model tekrar oluşturulur. Bu sadece ilgili gözleme dayanan bir parametreye sahip daha karışık bir modelin uygunluğuna karşılık gelmektedir. İlk olarak uyum iyiliğindeki değişim için parametre tahminleri ile uydurulmuş değerlerdeki değişimler incelenir.

3.4.4. Poisson Regresyonunda Aşırı Yayılım

Eğer yanıt dağılımı gerçekten Poisson ise genellikle sayılabilir veriler, yanıt değerlerinde beklenenden daha fazla değişkenlik göstermektedir. Örnek olarak varyanslar ortalamadan daha büyük olabilir. Oysa Poisson dağılımlarında ortalama ve varyans aynıdır. Rassal bileşene göre tahmin edilenden daha fazla değişkenliğe sahip bir GLM olayına “Aşırı Yayılım (overdispersion)” adı verilmektedir (Agresti, 1996). Aşırı yayılımın en yaygın nedeni denekler arasındaki heterojenliktir. Eğer tüm ilgili değişkenler kontrol altına alınırsa varyans ortalamaya eşit olur. Sadece biri kontrol altına alınırsa varyans ortalamayı aşar. Böyle durumlarda bilinen Poisson regresyonu uygulanamamaktadır. Çünkü GLM ile elde edilen parametre değerleri sapmalı olmaktadır. Bunun yerine extra- Poisson değişimini açıklayan yayılım parametresini içeren regresyon analizleri ya da Quasi-olabilirlik yöntemleri kullanılmalıdır. Söz konusu regresyon analizleri, negatif binomial karışık Poisson regresyon ve karışımlı Poisson regresyon analizleri olmaktadır(Yeşilova,2003).

151

Aşırı yayılım normal bir şekilde dağılmış rassal bir bileşene göre oluşturulan sıradan regresyon modellerinde herhangi bir sorun oluşturmamaktadır. Çünkü normal dağılım değişkenliğin tanımlanması amacıyla ortalamadan ayrı bir parametreye sahiptir (yani varyans, σ2 ). Fakat Binom ve Poisson dağılımları için varyans ortalamanın bir fonksiyonudur. Dolayısı ile Poisson ve binom sayılarının modellenmesinde aşırı yayılım ortak bir sorundur. Kesikli verilerdeki aşırı yayılım ile ilgili birçok metot söz konusudur. Ancak bu metotlar konumuz dışında kalmaktadır (Başvuru kaynakları; Collet(1992) ve Morgan (1992)). Sadece temel bir yönteme dikkat çekilecektir. Model kabul edildiğinde serbestlik derecesi yaklaşık olarak X2’ nin beklenen değeridir. Gerçek yanıt dağılımı Poissondan daha değişken ise açıklayıcı değişkenler için beklenen değere göre oluşturulan model formu doğru olmamaktadır. Eğer yanıt varyansı ortalama ile orantılı (Poissonda gerektiği gibi eşit olmaktan öte) ise X2 /s.d. ile orantısallık sabiti tahminlenir (Agresti, 2002).