• Sonuç bulunamadı

Şimdiye kadar lojistik regresyon modeli, iki sonuçlu yanıtlar üzerinde tahmin edicilerin etkileri konusunda yorumlama ve tanımlama için kullanılmıştır. Fakat bu şekilde belirli bir modelin uygun olduğu ya da veriler için iyi bir uyuma sahip olduğu konusunda bir garanti yoktur. Bu bölümde model uyumunun kontrol edilmesi için çeşitli yöntemler ele alınmaktadır. Sıfır hipotezinin testi; model kurulduktan sonra Pearson X2 veya olabilirlik oran G2 test istatistikleri kullanılarak gözlemlenen ve uydurulan değerler karşılaştırılarak yapılır. Belirli bir sayıdaki kümeye göre

164

uydurulan değerlerin çoğu en azından yaklaşık olarak 5 ise X2 ve G2 istatistikleri yaklaşık olarak bir ki-kare dağılımı gösterir. Serbestlik derecesi, model için artık serbestlik derecesi (residual df) olarak adlandırılır ve örnek lojitlerin sayısı ile (yani açıklayıcı değişken kümelerinin sayısı) modeldeki parametre sayısı arasındaki farka eşittir (Agresti, 1996). Doğal olarak, X2 ve G2 istatistiklerinin büyük değerlere sahip olması uygunsuzluğun bir kanıtını oluşturmaktadır ve P-değeri gözlemlenen değerin üzerindeki sağ kuyruk olasılığıdır. Uyum zayıf olduğunda, artıklar ve diğer teşhis ölçümleri, bireysel gözlemlerin model uyumu üzerindeki etkilerini tanımlamaktadır ve uygunsuzluğun nedenlerini belirtmektedir. Açıklayıcı değişkenler sürekli nitelikte olduğunda, her hangi bir gruplandırma türü kullanılmaksızın uyumsuzluğun analiz edilmesi oldukça zordur. Gruplandırmanın alternatif bir yolu ise gözlemlenen ve uydurulmuş değerlerin tahminlenen olasılıklara bağlı olarak şekillendirilmesidir. Modelde kaç tane parametre olursa olsun gözlemlenen ve uydurulmuş değerler tahminlenen olasılıklara göre parçalanabilir.

En yaygın yaklaşım parçalınıma göre gruplamadır. Bu nedenle de bu gruplar yaklaşık olarak eşit büyüklüktedir. Her bir grup için bir sonucun uydurulmuş değeri; ilgili gruptaki tüm gözlemlerin tahmin edilen olasılıklarının toplamıdır. Bu yapı Hosmer ve Lemeshow45 (1989) için bir testin temelini oluşturmaktadır. Onların Pearson benzeri istatistikleri gerçekte bir ki-kare dağılımına sahip değildir. Fakat bu istatistiğin dağılımı, s.d=g-2 olan bir ki-kare dağılımına yaklaştırılarak benzetimleri gösterilmiştir(g burada grup sayısını ifade etmektedir)46. Daha karışık modeller ile kullanılan modelin karşılaştırılmasında kullanılan olabilirlik oran testi aracılığı ile aynı zamanda uygunsuzlukta ortaya çıkarılabilmektedir. Örnek olarak, kantitatif tahmin ediciler ya da etkileşim ifadeleri için lineer olmayan etkileri (kuadratik terimler şeklindeki) içeren daha karışık modeller dikkate alınabilir.

45 Katsayıların önem kontrolü yapıldıktan sonra katsayıların yorumlanması odds oranları ya da

Hosmer ve Lemeshow tarafından geliştirilen daha kapsamlı uyum iyiliği testleri kullanılarak yapılmaktadır (Arabacı, 2002). Lojistik regresyon analizinin kullanım amaçlarından en önemlisi sıklıkla karşılaşılan bağımlı değişkenin iki ya da daha çok düzey içerdiği, bağımsız değişkenlerin ise hem kesikli hem de sürekli olabildiği durumlarda, verilerin ait oldukları gruplara en doğru şekilde atayacak ve konuya ilişkin risk faktörlerini belirleyebilecek modeli kurmaktır.

46 Kurulan modelin uyum iyiliği testi Hosmer-Lemeshow’un hem onlu risk grupları hem de sabit

165

Eğer daha iyi bir uyum sağlayan daha karışık bir model bulunamazsa uydurulan modelin mantıklı ve uygun olduğu konusunda güven elde ederiz. Bu yaklaşım bilimsel bir perspektiften daha fazla yarar sağlamaktadır (Agresti, 1996). Büyük bir uyum iyiliği istatistiği bazı uyumsuzluklar olduğuna işaret etmektedir. Fakat yapısı konusunda her hangi bir bilgi vermemektedir.

4.3.1. Uyum İyiliği ve Olabilirlik Oran Model Karşılaştırma Testleri

Daha önce bir modelde belirlenen parametrelerin sıfıra eşit olup olmadığını test etmek amacıyla -2(L1 –L0) şeklindeki olabilirlik oran istatistiği gösterilmiştir.

Kurulan model için maksimumum log- olabilirlik(L1) ile daha basit bir model için

(bu modelde parametreler silinir) log-olabilirliğini (L0) karşılaştırmaktadır.

M1; uydurulmuş modeli ve M0; uydurulmuş modeldeki parametrelerin sıfıra

eşit olduğu daha basit bir modeli ifade etsin. M şeklindeki bir lojistik regresyon modelinin uyumunun test edilmesi için G2 şeklindeki uyum iyiliği istatistiği olabilirlik oran istatistiğinin özel bir durumudur (M0 =M ve M1; en karışık model).

Bu karışık model her bir lojit için ayrı bir parametre değerine sahiptir ve örneklem lojitleri için mükemmel bir uyum sağlamaktadır. Bu modele doygun model adı

verilmektedir (Agresti, 1996; Bircan, 2004). M’ in uygun olup olmadığını test ederken, doymuş modelde yer alan ama M’ de yer alamayan tüm parametrelerin sıfıra eşit olup olmadığı test edilir. M’ in uyumunu test eden bu istatistik G2 (M) ile gösterilir. LS doymuş modelin maksimize edilmiş log-olabilirliğini göstersin. Örnek

olarak M0 ve M1 modelleri için artıklar sırasıyla G2 (M0)=-2(L0 - LS ) ve G2 (M1)=-

2(L1 - LS ) şeklindedir47. M1 gibi belirli bir model kullanılarak M0’ın test edilmesi

47 Lojistik regresyonda gözlenen ve beklenen değerlerin karşılaştırılması log olabilirlik fonksiyonu ile

yapılmaktadır. D=-2ln(Şu andaki modelin olabilirliği/ Doymuş modelin Olabilirliği) Şeklindedir. Parantez içinde verilen ifade olabilirlik oranı olarak adlandırılır. Bağımsız değişkenin önemine karar vermek için denklemde bağımsız değişkenin olduğu ve olmadığı durumlardaki D değerleri karşılaştırılır. Bağımsız değişkeni kapsamasından dolayı ortaya çıkan D’ deki değişim şu şekildedir: G=D(Değişkensiz Model için)- D(Değişkenli model için). Hesaplanan bu istatistik de doğrusal regresyonda kullanılan F testindeki pay kısmı ile aynı rolü üstlenir (Bircan, 2004:185-208). G’ yi hesaplamak için farkı alınacak D değerlerinin her ikisi için de doymuş modelin olabilirlikleri ortak olduğundan G istatistiği şu şekli alır: G=-2ln( Değişkensiz modelin olabilirliği/değişkenli modelin olabilirliği).

166

için hesaplanan olabilirlik oran istatistiği G2 (M0| M1) ile gösterilsin. Bu modellerin

karşılaştırılması için bu istatistik aşağıdaki şekilde hesaplanmaktadır:

) ( ) ( )] ( 2 [ ) ( 2 ) ( 2 ) | ( 0 1 0 1 0 1 2 0 2 1 2 M M L L L L L L G M G M G =− − =− − S − − − S = −

İki modele göre Uyum İyiliği İstatistiklerindeki (G2 ) farktır. İki modelin karşılaştırılmasında olabilirlik oran istatistiği, bu modellerin sapmalarındaki farktır(Hosmer ve Lemeshow, 2000:13). M0 modeli M1 modeli ile kıyaslandığında

daha az bir uyuma sahipse bu istatistik büyük bir değer almaktadır.

Bu istatistik büyük örnek ki-kare istatistiğidir ki serbestlik derecesi iki model için kullanılan artık serbestlik derecesi değerlerinin farkına eşittir. İki yönlü bir çapraz tabloda bağımsızlığın test edilmesi için kullanılan bir istatistiktir (2.4.3). Gerçekte bu istatistik gruplanmış veriler için uydurulmuş lojistik regresyon modelinde 0β = hipotezinin test edilmesi amacıyla hesaplanan olabilirlik oran istatistiğine (-2(L0 - L1 ) ) eşittir.

4.3.2. Lojit Modeller İçin Artıklar

G2 ve X2 şeklindeki uyum iyiliği istatistikleri; uyumun genel kalitesi konusunda özet göstergelerdir. Herhangi bir uyumsuzluğun yapısının tanımlanması amacıyla ilave teşhis analizleri gerekmektedir. Gözlemlenen ve uydurulan sayıların karşılaştırılmasını sağlayan artıklar bu amaç için oldukça kullanışlıdır (Anderson, 1990:278). y ; i’ ninci açıklayıcı değişken dizisinde (kümesinde) ni i denemedeki

“başarı” sayısını göstersin. πˆ ise model uyumu için tahmin edilen başarı olasılığını i göstersin. niπˆ ise uydurulmuş (beklenen) başarı sayısını ifade eder. Binom rassal i

bileşeni ile birlikte oluşturulan bir GLM’ e göre, i. dizideki (kümedeki) uyum için Pearson artığı aşağıdaki şekildedir:

167

[

ˆ (1 ˆ )

]

ˆ i i i i i i i n n y e π π π − − =

Her bir fark; gözlemlenen değer ve uydurulmuş değer arasındaki farkın, gözlemlenen değer için tahminlenen binom standart sapmasına bölünerek elde edilir. Model uyumunun test edilmesi için kullanılan Pearson istatistiği; 2 =

2

i

e X

şeklindeki eşitlikle sağlanır: Her bir Pearson artığının karesi X2’ nin bir bileşenidir. Binom indeksi (ni ), büyük olduğunda Pearson artığı (ei ) yaklaşık bir binom

dağılımına sahiptir.

Model ele alındığında bu artığın yaklaşık beklenen değeri sıfırdır. Fakat standart normal bir değişkenden daha küçük bir varyansa sahiptir. Eğer model parametrelerinin sayısı, örnek lojitlerle karşılaştırıldığında küçük ise Pearson artıkları standart normal sapmalar şeklinde işleme tabi tutulur ki mutlak değerler 2’ den büyüktür ve bu uyumsuzluğa işaret etmektedir (Agresti, 1996; Bircan, 2004:185- 208). Uyumsuzluğun gösterilmesinde “Grafiksel Gösterimler” de oldukça fayda sağlamaktadır. Gözlemlenen ve uydurulmuş oranların, her biri karşılıklı olarak çizilerek ( ya da açıklayıcı değişkenlerle karşılıklı olarak çizilerek) karşılaştırılması bunlardan biridir(Agresti, 2002). Uydurulmuş değerler (beklenen değerler) çok küçük olduğunda X2 ve G2 istatistiklerinin geçersiz olduğu daha önce belirtilmişti. Benzer şekilde artıklarda bu durumda sınırlı bilgi vermektedir.

4.3.3. Etkinin Teşhis Edilmesindeki Ölçüler

Açıklayıcı değişkenlerin çoğunda ya da birinde aşırı uç bir değer söz konusu olduğunda ilgili gözlem çok büyük bir etkiye sahip olabilmektedir. Bir ya da iki gözlem silindikten sonra (bu gözlemlerle kurulan modelin uyumu yanıltıcı gözüküyorsa) uyumun raporlanması daha bilgi verici nitelikte olabilir. Birçok ölçüm etkilerin çeşitli özelliklerinin tanımlanmasını sağlamaktadır. Bu ölçümlerin çoğu veri setinden bazı gözlem/gözlemlerin atılmasının belirli karakteristikleri üzerindeki etkisi ile ilişkilidir. Bu ölçümler cebirsel anlamda bir gözlemin kaldıraç gücü ile ilişkilidir ki şapka matrisi olarak adlandırılan bir köşegen matrisi oluşturan

168

elemandır48(Şapka matrisi bir matris olup örnek lojitlere uygulandığında model için tahminlenen lojit değerleri vermektedir)(Agresti, 2002). Daha büyük bir kaldıraç gücüne sahip bir gözlem daha büyük bir etkiye sahiptir. Kaldıraç güçleri için formüller ve etkinin teşhis edilmesindeki ölçümler oldukça karışıktır. Bu nedenle de burada ele alınmamaktadır. Lojistik regresyon için kullanılan çoğu yazılım bu teşhisleri sağlamaktadır(Stokes, Davis ve Koch,1991).

Her bir gözlem için etki ölçümleri aşağıdaki maddeleri kapsamaktadır (Agresti, 2002):

1. Modeldeki her bir parametre için, bir gözlem silindiğinde parametre tahmini de değişir. Bu değişim (standart hataya bölünür) Dfbeta olarak adlandırılır.

2. Bir gözlemin silinmesi ile parametreler için oluşturulan ortak bir güven aralığındaki değişimin bir ölçümü söz konusudur. Bu güven aralığı yer değiştirme teşhisi “c” ile gösterilir.

3. Gözlem silindiğinde X2 veya G2 şeklindeki uyum istatistiklerinde de değişim söz konusudur.

Her bir ölçüm için daha büyük bir gözlemin etkisi sonucunda daha büyük bir değer elde edilir. Aynı zamanda, model oluşturulduğunda yaklaşık bir standart dağılıma sahip ve mutlak değeri kısmen daha büyük olan Pearson artığı (ei ) için bir

düzeltme oluşturmak amacıyla kaldıraç (leverage) değerler kullanılır. Bunlar iki yönlü tablolardaki bağımsızlığın belirlenmesi amacıyla ikinci bölümde ele alınan ayarlanmış artıklar ile aynı amaca hizmet etmektedir.