• Sonuç bulunamadı

2.3. İKİLİ LOJİSTİK REGRESYON

2.3.2. Regresyon Katsayılarının Kestirimi

2.3.2.1. En Çok Olabilirlik Yöntemi (Maximum Likelihood Estimation)

Doğrusal Regresyon Analizinde model parametrelerimizi En Küçük Kareler Tekniği ile tahmin edebilirken, Lojistik regresyon analizinde açıklanan ve açıklayıcı değişkenler arasında olan ilişkinin doğrusal olmamasından dolayı modelin parametreleri En Küçük Kareler Tekniği ile öngörülemez. İki kategorili bağımlı değişkenli lojistik modeller için katsayıların tahmini En Çok Olabilirlik Yöntemi (Maximum Likelihood), Yeniden Ağırlıklandırılmış İteratif En Küçük Kareler Tekniği (Reweighted Iterative Least Square) ve Minimum Lojit Ki-Kare Yöntemi (Minimum Logit Chi Square) ile tahmin edilir (Tatlıdil, 1996:295; Berenson ve Levine, 1996:148).

En çok olabilirlik yöntemi, örneklem büyüklüğü sonsuza yaklaştıkça en çok olabilirlik kestiricisi tutarlı ve yeterlidir, tahmin gücü yüksek sonuçlar vermektedir. Büyük örneklemlerle çalışıldığında elde edilen standart hatalar, diğer tahmin

yöntemlerindeki kadar küçük çıkmaktadır. Aynı zamanda tahminlerin örneklem dağılımı da normal dağılıma uymuştur. Yani normal dağılım ve ki-kare dağılımlarının güven aralıkları ve p değerlerini hesaplamak için de kullanılabilir. Örneklem büyüklüğü küçük olduğunda da en çok olabilirlik kestirimi kötü sonuçlar vermez, bu yüzden küçük örneklerde de araştırmacılar tarafından alternatif tahmin yöntemi bulunmadığında kullanılmaktadır (Allison, 2012: 20).

En Çok Olabilirlik Yöntemi ile tahmin yapılabilmesi için ilk önce olabilirlik fonksiyonunun oluşturulması gerekir. İlgili olayın olma olasılığı maksimum yapılmaya çalışılır; amaç tahmin edilen logit bağımlı değişkenin değerleri ile gözlem değerleri arasındaki benzerliğin maksimum yapılmasıdır. En çok olabilirlik tekniği, veri setine ulaşma olasılığını en yüksek seviyeye getirerek bilinmeyen parametreler hakkında öngörüde bulunmamızı gerçekleştirir.

Katsayıların kestirimi yapıldıktan sonra modeldeki değişkenlerin önemliliği test edilir. Modeldeki bağımlı değişkenler ile bağımsız değişkenler arasındaki ilişkinin önemli olup olmadığına bakılır. Değişken modelde olduğunda ve olmadığında elde edilen kestirim değerlerine bakılır. Modelde olduğunda daha doğru kestirimler elde edilmişse değişkenin önemli olduğuna karar verilir. Bunun için Olabilirlik Oranı, Wald Testi veya Skor Testi kullanılır.

2.3.2.2. Olabilirlik Oranı Testi (Likelihood Ratio Test)

Modele dahil edilmesi gereken bağımsız değişkenleri belirlemek, değişkenin modeldeki etkisini ölçmek, bağımsız değişkenlerin istatistiksel olarak anlamlılığını belirlemek için ki-kare dağılımı gösteren G istatistiğinden yararlanılır.

Log-olabilirlik fonksiyonu ile gözlemlenen ve tahmin edilmiş değerlerin karşılaştırılması (2.16) eşitliği ile yapılır;

D = - 2ln (İlgilenilen Modelin Olabilirliği Doymuş Modelin Olabilirliği ) (2.16)

- 2ln katının alınması dağılımı bilinen değerler elde edilmesini sağlar. Bu sonuç hipotez testinin yorumlanması için gereklidir. Bu test Olabilirlik Oranı Testi (Likelihood Ratio Test) olarak adlandırılır.

Doğrusal regresyonda oluşan hata kareleri toplamına karşılık gelen D (Deviance) değeri uyum iyiliğinde kullanılır. Değişkenli model ile değişkensiz model için farklı D değerleri bulunur. Hesaplanan G istatistiğine göre açıklayıcı değişkenin önemli olup olmadığına karar verilir (Ryan, 1997:320).

G = D (Değişkensiz Model) - D (Değişkenli Model) (2.17) İki D değeri için doymuş modelin olabilirlikleri ortaktır ;

G = - 2ln ( Değişkensiz Modelin Olabilirliği Değişkenli Modelin Olabilirliği ) (2.18)

(2.18) eşitliği ile G istatistiği hesaplanır (Hosmer ve Lemeshow, 2000:13). Bir bağımsız değişken olduğunda ilk önce sabit terimin olduğu model oluşturulur. Daha sonra sabit terim ile beraber bağımsız değişkenin olduğu model oluşturulur. Hesaplanan iki değer arasındaki fark -2 ile çarpılarak testin değeri hesaplanır.

G istatistiği doğrusal regresyon analizinde kullanılan F testi ile aynı işlevi görmektedir. Modelin anlamlılığının test edilmesi için G istatistik değeri (n-1) serbestlik derecesi ile ki-kare tablo değeri bulunarak karşılaştırma yapılır.

H0: βi = 0 (Teorik model veriyi iyi temsil etmektedir / Model anlamlıdır.) H1: βi ≠ 0 (en az bir βi sıfırdan faklıdır i = 1,2,..,n) (Teorik model veriyi iyi

temsil etmemektedir / Model anlamsızdır.)

hipotezleri test edilir. Model için hesaplanan G test istatistiği belirlenen güvenilirlilik seviyesinde (n-1) serbestlik derecesinde χ2 dağılımına sahiptir.

Hesaplanan istatistik değeri, tablo değerinden daha büyük veya eşit ise H0 hipotezi kabul edilir ve modelin anlamlı olduğuna karar verilir.

Lojistik modelin χ2 dağılımı gösteren sapma ölçütü çeşitli modeller arasında seçim yapmak için kullanılır. En küçük sapmayı gösteren model en iyi model olarak kabul edilir (Collet, 2003).

2.3.2.3. Wald Testi

Çoklu doğrusal regresyon analizinde parametrelerin anlamlılığını test etmede kullanılan t testine benzer. t testi ile Wald testi aynı formda olmalarına rağmen Wald

testi t dağılımı göstermeyip z dağılımı göstermektedir. Wald testi, modelde bulunan tüm katsayıların istatistiksel olarak anlamlı olup olmadığını belirler.

Beta katsayılarının en çok olabilirlik kestirimlerinden yararlanılır. Eğim parametresi β1'in en çok olabilirlik kestiriminin (Maximum Likelihood Estimations) standart hatasına bölünmesi ile Wald Test İstatistiği elde edilir.

W = S(ββĵ

j

̂ ) (2.19)

Wald istatistiği, β1'in en çok olabilirlik kestiriminin karesinin standart hatasının

karesine bölünmesiyle ki-kare dağılımına uymaktadır.

W = β 2 j ̂ S(β̂ )j 2 ~ χ 2 (2.20)

Yokluk hipotezi altında Wald test istatistiği standart normal dağılıma uyar. H0: βi = 0 (Parametre anlamsızdır.)

H1: βi ≠ 0 ( i = 1,2,…,n) (Parametre anlamlıdır.)

Hipotezler belirlenen güvenilirlik seviyesi ve n serbestlik derecesinde χ2 dağılımına ait tablo değerine bakılarak değerlendirme yapılır. Hesaplanan Wald

istatistik değeri, tablo değerinden büyük veya eşitse H1 hipotezi kabul edilir, değişkenlerin istatistiksel olarak anlamlı olduğu söylenir.

Agresti (1996) küçük örneklemler için olabilirlik oran testinin wald istatistiğinden daha uygun olduğunu belirtmiştir. Wald testi örneklem hacminin gerektiği kadar büyük olduğunda istatistiksel olarak anlamlıdır.

2.3.2.4. Skor Testi

Skor testinin en büyük avantajı hesaplama işlemlerini kısaltmasıdır. Skor testi matris hesaplamalarını içeren çok değişkenli bir testtir. Elde edilen test istatistiği standart normal dağılıma uymaktadır. Skor testinde hesaplama işlemleri hızlı yapılır, bu yüzden bazı istatistik yazılımlarında (SPSS) adımsal yöntemlerde modele alınacak veya çıkartılacak bağımsız değişkenlerin seçilmesinde skor testi kullanılmaktadır. Skor testi eşitlik (2.21) ile gösterilir.

ST = ∑ni=1xi(yi−y̅) √yi(1−y̅) ∑ni=1(xi−x̅)2

(2.21)

Benzer Belgeler