• Sonuç bulunamadı

YOKSULLUĞUN ÖLÇÜMÜNDE KULLANILAN YÖNTEMLER

2.1 LOGĐT ve SIRALI LOGĐT MODELLER

2.1.2 Sıralı Logit Modeller

Bazı çok seçenekli bağımlı değişkenler için doğal bir sıralama vardır. Tahvil derecelendirmesinin “kredi verilebilirlik” olarak adlandırılan gözlenemeyen sürekli bir ölçü olarak ifadesi, bir ders için harfli notlama sisteminin öğretim üyesinin öğrencilerin ders içeriğini anlama derecesinin bir yansıması olarak tanımlanması,

“alerjik tepki derecesi” olarak adlandırılan gözlenemeyen sürekli ölçümün, hastaların ilaç miktarına verdikleri tepkiye bağlı olarak tepkisiz, az tepkili, aşırı tepkili ve ölüm olarak sınıflandırılması, bu duruma verilebilecek örnekler arasındadır (Kennedy, 2006: 289). Ya da bazı kantitatif değişkenler sadece belirli aralıklarda gözlemlenebilir. Bunlara gelir, tüketim düzeyleri veya hanelerin sahip olduğu evin değeri ile ilgili sorular ya da iş veya gelir memnuniyeti ile ilgili sorular örnek olarak verilebilir. Diğer taraftan, likert ölçeğine göre hazırlanan sorular ve bu sorulara verilen cevaplar, anketin doğası gereği sıralı formda elde edilebilmektedir. Bu şekilde elde edilen cevapların analiz edilmesinde ve yukarıda verilen diğer örneklere benzer durumlarda literatürde sıralı logit ya da sıralı probit modelleri kullanılmaktadır. Bu çoklu cevap modelleri, kişisel veya belirli karakteristiklerin bir fonksiyonu olarak mümkün sonuçların her birinin olasılığını tanımlamak için geliştirilmiştir. Sınırlı sayıda bilinmeyen parametreye sahip bu olasılıkları tanımlamak önemli bir amaçtır (Verbeek, 2008: 213). Sıralı cevap modelleri ve sıralı olmayan modeller arasında önemli bir fark mevcuttur. Sıralı cevap modelleri genellikle daha hassastır fakat cevapların sıralı bir mantığı varsa sadece bu modellere başvurulabilir. Nedeni, alternatifler arasından seçim yapmayı sağlayan bir gizli değişkenin olduğunu farz etmektir. Diğer bir deyişle, sonuçlar alternatiflerin sıralanmasına duyarlı olmaktadır. Sıralanmayan modeller alternatiflerin numaralandırılmasına duyarlı değildir. Birçok durumda, her bir alternatifin tesadüfi bir fayda düzeyine sahip olduğu farz edilmektedir ve bireylerin en yüksek faydayı sağlayan alternatifi seçecekleri varsayımı geçerlidir (Verbeek, 2008: 213).

Bağımlı değişken hem kategorik hem de ordinal olduğunda, sıralı logit veya probit olasılık tahmin edicileri kullanılmaktadır. Sıralanmış bağımlı değişkenin olduğu durumlarda EKKY modellerinin kullanımı uygun görülmemektedir (Koop,

2008: 278). Çünkü, EKKY regresyon teknikleri, EKKY regresyon varsayımlarının bazılarını ihlal etmektedir. EKKY varsayımları sağlanamazsa; nominal veya ordinal sınırlı bağımlı değişkenin anlamsız tahminleri oluşabilir; tutarsız tahmin edilen standart hatalara, t ve F istatistiklerine göre yanlış hipotezler test edilebilir; uyum iyiliği ölçüsü R2 yanlış tahmin edilebilir. Bunlar gibi sebepler nedeniyle, sıralı logit ve sıralı probit modellerinin kullanılması önerilmektedir. Sıralı logit ve probit modeller, Walker ve Duncan (1967) ile McKelvey ve Zavoina (1975) tarafından geliştirilmiştir. Modellerin tahmini için en yüksek olabilirlik yöntemi kullanılmaktadır. Sıralı probit model normal olasılık dağılımına dayanırken, sıralı logit model standardize edilmiş logistik olasılık dağılımından türetilmektedir (Akın, Deveci ve Üçdoğruk, 2000: 1; Kennedy, 2006: 286). Sıralı logit modelini sıralı probit modelinden ayıran özellik, hataların logistik olarak dağılmasıdır. Bağımlı değişken kalitatif olduğunda, çeşitli sınırlı bağımlı değişkenli modeller söz konusudur.

Bunlardan en çok kullanılanı multinomial probit veya multinomial logistik regresyondur. Ancak multinomial probit ve multinomial logit sıralamayı göz ardı ettiğinden, bağımlı değişkenin ordinal olması durumunda uygun tahmin ediciler değildir. Sıralı logit veya probit modeller, iki değerli logit/probit modelden hareketle ikiden fazla kategorili bağımlı değişkenleri oluşturarak türetilmektedir.

1’den m’ye kadar sıralanmış m alternatif arasından seçim yapıldığı düşünülsün. Eğer bu alternatifler mantıksal olarak sıralanmışsa, sıralı cevap modelleri olarak adlandırılan modeller kullanılabilir. Bu modeller bir gizli değişkene dayanmaktadır (Verbeek, 2008: 213). y gizli değişkeninin, −∞ ve ∞ aralığında yer i* aldığı farzedildiğinde, modelin yapısı aşağıdaki gibidir (Greene, 2003: 736):

i i

i x

y* = β +ε (34)

Tek bir bağımsız değişkenli durumda ise model,

i i

i x

y* =α +β +ε (35)

şeklindedir. i, gözlemi, ε tesadüfi hatayı göstermektedir. Đki değerli sonuçlar için ölçüm modeli, y ’ın J tane kategoriye sahip olduğu durumda genişletilebilir (Long, * 1997: 116):

m

yi = eğer τm−1 ≤ y < τ*i m ise, m = 1,….., J (36)

Burada y değişkeni, J tane farklı kategoriden biriyle ölçülmektedir. J tane sabit i kesme parametresi vardır. β, sabit kesme terimi içermeyen eğim parametre vektörüdür. τ1 ve τJ−1 kesme noktaları tahmin edilebilmektedir. Bu kesme noktalarına eşik değerleri de denilmektedir. τ12 <...<τJ−1J yazılabilir. Bilinmeyen τJ ‘ler için,τ0 = −∞ ve τJ = ∞ olmaktadır (Koop, 2003: 219). Sonuç olarak m alternatifini seçme olasılığı, gizli değişken y ın τi* m−1 ve τm iki sınır değeri arasında olma olasılığıdır. εi, sıralı probit modelde standart normal dağılımı, sıralı logit modelde logistik dağılımı ifade etmektedir. m=2 olduğunda bağımlı değişkenin iki değerli olduğu seçim modelleri kullanılmaktadır (Verbeek, 2008: 213). Ölçüm modelini göstermek için şöyle bir örnek verilebilir (Long and Freese, 2001: 138): “Çalışan bir anne çocuğuyla olan ilişkisinin sıcaklığını ve güvenliğini, çalışmayan bir anne kadar sağlayabilir” ifadesine verilen cevaplar; 1. Kesinlikle katılmıyorum (SD), 2.

Katılmıyorum (D), 3. Katılıyorum (A) ve 4. Kesinlikle Katılıyorum (SA) şeklinde olmaktadır. Sürekli gizli değişken, çalışan annelerin iyi anne olabildiği fikrine katılma eğilimi olarak düşünülebilir. Gözlemlenen cevap kategorileri ölçüm modeliyle gizli değişkene bağlı olmaktadır. kaldığı dağılım bölgesiyle ilişkili olarak x’in verilen değerleri için y=m i gözlemleme olasılığı,

Pr (y = m | x) = Pr(τm−1 ≤ y < τ* m | x) (37)

dir. xβ + ε , y da yerine konulduğunda ve bazı cebirsel işlemler yapıldığında, *

Pr (y = m | x) = F (τm − xβ) − F (τm−1 − xβ) (38)

elde edilmektedir. F, ε için kümülatif dağılım fonksiyonudur. F, sıralı probit için Var(ε)=1 olan normal dağılıma, sıralı logit için Var(ε) = π2/3 olan logit dağılıma sahiptir. y=1 olduğunda, (38) numaralı denklemin sağındaki ikinci terim çıkartılabilir, çünkü F(−∞ − xβ) = 0 dır ve y =J olduğunda aynı denklemin birinci terimi F (∞−xβ) = 1 e eşit olmaktadır (Long and Freese, 2001: 139).

(35) numaralı model, farklı y kategorileri için regresyon fonksiyonlarının paralel olduğunu varsaymaktadır. Sıralı logit modellerde kategoriler birbirine paraleldir varsayımı kullanılmaktadır (Üçdoğruk ve Akın, 2000: 3). Bu varsayım, sıralı logit modelde oransal fark varsayımı (proportional odds assumption) olarak bilinmektedir. (38) denklemi kullanılarak, sıralı regresyon modeli şöyle yazılabilir (Long, 1997: 121):

Pr (y = 1 | x) = F (τm − xβ)

Pr (y = m | x) = F (τm − xβ) − F (τm−1 − xβ) m = 2,….., J − 1 Pr (y = J | x) = 1 − F (τm−1 − xβ)

Bu denklemler kümülatif olasılıkların hesaplanmasında kullanılmaktadır. (39)’daki gibi basit bir forma sahip olmaktadır.

Pr(y ≤ m | x) = F(τm−xβ) m = 1,……, J − 1 (39)

Yukarıdaki denklem, sıralı regresyon modellerinin, eğim katsayılarının her bir denkleme göre aynı olduğunu farzeden, J-1 tane iki değerli regresyona eşit olduğunu göstermektedir.

Değerlerin sırasını göz önüne alan sıralı logit model kümülatif olarak aşağıdaki biçime sahiptir (Emeç ve Gülay, 2007: 6;

http://staff.washington.edu/glynn/olr.pdf):

logit(p1 )= log(p1 / 1 – p1) = α 1 + βx (40)

logit(p1 + p2)= log(p1 + p2)/ (1 – p1 – p2) = α2 + βx (41)

logit(p1 + p2 +…+ pJ)= log(p1 + p2 +..+ pJ)/(1 – p1 – p2-..-pJ)_ = αJ + βx (42)

ve p1 + p2 + … + pJ+1 = 1

Burada,

p1 = Pr(y=1)= exp(α 1 + βx )/ 1 + exp(α 1 + βx)

p1+p2=Pr(y≤2)= exp(α 2 + βx )/ 1 + exp(α 2 + βx)

….

p1+p2+…+pJ=Pr(y ≤ J)= exp(αJ+ βx )/ 1 + exp(αJ + βx)

Bu model oransal fark modelidir. y ≤ m olayının fark oranı (odds ratio), m kategoriden bağımsızdır. Fark oranın tüm kategoriler için sabit olduğu varsayılmaktadır. (40), (41) ve (42) numaralı modeller, farkların pay kısmındaki olasılıkları ardı ardına toplayarak kümülatif logitler oluşturmaktadır (Üçdoğruk ve Akın, 2000: 4). Sıralı logit modelin en zor kısmı, katsayıların yorumudur. Katsayıları yorumlamanın değişik yolları bulunmaktadır (Emeç ve Gülay, 2007: 6):

1) Standartlaştırılmış katsayıları hesaplamak

2) Tahmin edilen olasılıkları (predicted probabilities) hesaplamak

3) Tahmin edilen olasılıklardaki faktör değişmeyi (factor change) hesaplamak 4)Tahmin edilen olasılıklardaki yüzde değişmeyi (percent change) hesaplamak

Aşağıda sıralı logit modellerin yorumunda kullanılan hesaplamalar açıklanmaya çalışılacaktır. Sıralı regresyon modellerinde y* = xβ + ε şeklindedir ve xk’ya göre y* daki marjinal değişim,

∂y*/∂xk= βk (43)

olarak hesaplanmaktadır. y* gizli değişken olduğundan ve onun ölçümü bilinmediğinden, y* ın tahminlenen standart sapmasıyla, standartlaştırma yapılmaksızın marjinal değişim yorumlanamamaktadır (Long and Freese, 2001:

154). Bu standart sapma şu şekilde bulunmaktadır:

) ˆ (

) ˆ(

ˆ *2 βˆ' β ε

σ Var x Var

y = + (44) )

( ˆ x r

Va , gözlemlenen x’ler için kovaryans matrisidir. βˆ , en yüksek olabilirlik tahminidir ve sıralı probit için Var(ε)=1, sıralı logit için Var(ε)=π2/3 dür. xk için y* ın standartlaştırılmış katsayısı,

*

* /

k y s k

y β σ

β = (45)

olarak yazılabilir. Diğer değişkenler sabit tutulduğunda, xk ‘daki bir birimlik artışın y* ı, βksy*standart sapma kadar arttırması beklenmektedir. Tam standartlaştırılmış katsayı,

βSk = σkβky*= σk y* s

βk (46)

şeklinde yazılabilir. Diğer değişkenler sabit tutulduğunda, xk ‘daki bir standart sapmalık artışın y* ı, βsk standart sapma kadar arttırması beklenmektedir. Sıralı logit modelde katsayılar tahminlenen olasılıklara göre yorumlanabilir. Bu olasılıkları hesaplamak için aşağıdaki formül kullanılmaktadır (Long, 1997: 130):

Pr (y = m | x) = F(τm − xβ)- F(τm−1 − xβ) (47)

Modelde bir çok değişken olduğu zaman, sonuç olasılıklarındaki değişimin ölçülmesi, her bir değişkenin etkisini özetlemek için yararlı olmaktadır. Tahminlenen olasılıklardaki değişimler, modeldeki bütün değişkenlerin düzeylerine bağlı olarak olasılıktaki marjinal değişim ve olasılıktaki kesikli değişim şeklinde verilebilmektedir (Long and Freese, 2001: 162). Olasılıktaki marjinal değişim aşağıdaki gibi hesaplanmaktadır:

∂ Pr(y = m | x)/ ∂xk= [∂F(τm − xβ)/∂xk] − [∂F(τm−1 − xβ)/ ∂xk] (48)

Bu ifade, diğer bütün değişkenler sabit tutulduğunda, Pr(y=m|x)’in, xk ’ya göre eğimidir. Olasılık eğrisi hızlı bir şekilde değiştiği zaman veya bağımsız değişken kukla olduğu zaman, marjinal değişim yanıltıcı olabileceği için kesikli değişim kullanılmaktadır. Kesikli değişim, xk ‘nın başlangıç değerinden (xS) son değerine (xE) (xk = 0 dan xk = 1 e değişmektedir) değişim için tahminlenen olasılıktaki bir değişim olarak ifade edilmektedir. Olasılıktaki kesikli değişim aşağıdaki gibi hesaplanmaktadır :

∆Pr(y = m|x)/∆xk =Pr(y = m | x, xk = xE)−Pr(y = m | x, xk = xS) (49)

Pr(y=m|x, xk), verilen x için y=m olasılığıdır. Kesikli değişim şöyle yorumlanmaktadır: xk, xS’den xE’ye değiştiği zaman, diğer bütün değişkenler sabit tutulduğunda, m sonucunun tahminlenen olasılığı ∆Pr(y=m|x)/∆xk kadar değişmektedir. Kesikli değişim değeri, xk’nın başlangıç değerine, xk’daki değişim miktarına ve diğer değişkenlerin değerlerine bağlı olmaktadır. Kukla bağımsız değişkenler için değişim, değişkenin her iki değerine göre hesaplanabilmektedir.

Örneğin, yaş için kesikli değişim, kadın ve erkeğe göre ayrı ayrı hesaplanabilir (Long and Freese, 2001: 163).

Sıralı logit modelde katsayılar ayrıca fark oranları kullanılarak yorumlanabilir. Sıralı logit model fark oranına göre aşağıdaki gibi tanımlanmaktadır (Long, 1997: 138):

≤ m|> m (x) = exp(τm − xβ) (50)

xk’daki bir birimlik değişimin etkisi,

≤ m|> m (x, xk + 1) / Ω≤ m|> m (x, xk)= e−βk =1/eβk (51)

şeklindedir. Yorumu ise şöyledir : xk’daki bir birimlik değişim için sonucun m’den küçük veya eşit olmasının farkı, diğer bütün değişkenler sabit tutulduğunda, exp(−βk) faktör kadar değişmektedir. Fark oranının değeri m’in değerine bağlı değildir. Bu durum, paralel regresyon varsayımına neden oransal fark varsayımı dendiğini göstermektedir. Bu nedenle fark oranı, şöyle yorumlanabilir: xk’daki bir birimlik değişim için, düşük sonucu yüksek sonuçla karşılaştırmanın farkı, diğer bütün değişkenler sabit tutulduğunda, exp(−βk) faktör kadar değişmektedir (Long, 1997:

139).

xk’daki δ kadarlık değişimin etkisi,

≤ m|> m (x, xk + δ)/Ω≤ m|> m (x, xk)= exp(−δ × βk) =1 / exp(δ × βk) (52)

olarak hesaplanabilir. Yorumu, xk ‘daki δ kadarlık artış için, düşük sonucu yüksek sonuçla karşılaştırmanın farkı, diğer bütün değişkenler sabit tutulduğunda, exp(−δ × βk) faktör kadar değişir şeklinde yapılabilir (Long and Freese, 2001: 166). Kısaca, logit modellerin katsayı yorumlarında fark oranı faktör değişmedir. Kukla değişkende diğer tüm değişkenler sabit iken exp(βk), fark oranını veya faktör değişimini vermektedir. Yüzde değişme ise kantitatif değişkenlerde, (exp(βk – 1)*100) ile bulunmaktadır (Üçdoğruk, Akın ve Emeç, 2001: 4).