• Sonuç bulunamadı

Lojistik Regresyon analizi özellikle sosyal bilimler alanında verilerin sınıflandırılması ve atama işlemlerinde son dönemlerde en çok kullanılan bir istatiksel yöntemdir. Lojistik regresyon, bağımlı değişkenin sürekli ya da nicel bir değişken olmadığı, bir diğer deyişle kategorik ya da sınıflamalı olduğu durumlar için uygun bir analiz türüdür. (Long’dan aktaran Çokluk vd., 2010, s. 49).

Lojistik regresyon analizinde amaç, verilerdeki bireylerin hangi gruba ait olduğunu saptamada kullanılabilecek bir denklemi kurmaktır ve kategorik halde bulunan bağımlı değişkenin değerini tahmin etmektir. Yani lojistik regresyon analizinde hem sınıflandırma yapılır hem de bağımlı ve bağımsız değişkenler arasındaki neden-sonuç ilişkisi araştırılır (Çokluk vd., 2010, s. 49).

Diğer analizlerde bağımlı değişken diğer regresyon analizlerinde sürekli iken lojistik regresyon analizinde bağımlı değişken kategoriktir. Bağımsız değişkenlerde bir sınırlama yoktur kategorik, süreli veya her ikisi olabilirler. Kullanılan analizin bağımsız değişkeni tek ise lojistik regresyon, bağımsız değişken birden fazla ise çoklu lojistik regresyon analizi denir (Agresti, 2002, s. 55).

Tablo 3

Regresyon Analizi Türleri

Bağımlı değişken Bağımsız Değişken Analiz adı

1 1 Basit regresyon analizi

1 2 ya da 2+ Çoklu regresyon analizi

2 ya da 2+ 1 Çok değişkenli regresyon

analizi

2.4.1.Lojistik Regresyon Analizinde Değişken Seçimi

Lojistik regresyon analizi; sürekli, kesikli, ikili ya da bunlardan herhangi bir karışımı olan veri gruplarından kategorik bir sonuç tahmin etmeyi mümkün kılar. Lojistik regresyon modelinde;

37 b) Sadece sürekli bağımsız değişkenler

c) Hem kategorik hem de sürekli bağımsız değişkenler bulunabilir.

Bir regresyon eşitliğine girecek değişken sayısı ne kadar fazla olursa bağımlı değişkendeki varyasyonu o kadar az hata taşımaktadır. Bağımsız değişkenlerin her birini gözlemlemenin yükü ve gözlemleri belirli bir süre içerisinde yapmanın zorlukları bağımsız değişken sayısını azaltmayı mecbur kılabilir. Bu sebeple tahminin doğruluğu olabildiğince yüksek tutulmalı ve gerek maddi zorluklar gerekse çok sayıda değişken ile ilgili veri elde etmenin getirebileceği sistematik hataları olabildiğince azaltacak sayıda bağımsız değişkenle çalışılması önem arz etmektedir (Çırak, 2012).

Lojistik regresyon denkleminde yer alan tüm bağımsız değişkenlerin, bağımlı değişkeni açıklamak için etkili olması her zaman mümkün olmamaktadır. Hatayı açıklayamayan değişkenlerin denklemde tutulması lojistik regresyon denkleminin etkinliğini ve tahmin gücünü düşürmektedir (Çırak, 2012).

2.4.2.Lojistik Regresyon Analizinde Yöntem Seçimi

Lojistik regresyon analizi standart (direkt, tam, enter ) ve adımsal (aşamalı, stepwise) olmak üzere iki temel yöntemle uygulanır. Adımsal yöntemler de kendi içerisinde ileriye doğru (forward ) ve geriye doğru (backward) yöntemler olmak üzer ikiye ayrılır (Çırak, 2012).

Standart (Direkt, Tam, Enter ) Yöntem: Tüm ortak değişkenler (covariates) bir blog şeklinde

regresyon modelinde yer alır ve her bir blog için parametre tahminleri yapılır. Bu yöntemde veriler tesadüfi değişimlerden etkilenmektedir ve modelin aynı örneklerle test edilmesine rağmen her seferinde aynı sonuçları vermemesinden dolayı bazı araştırmacılar bu yöntemin sadece teori test etmede uygun olabileceğini düşünmektedirler (Çokluk vd., 2010, s. 80).

Adımsal (Aşamalı, Stepwise ) Yöntem: Adımsal yöntemler ileriye doğru (forward) ve geriye

doğru (backward) olmak üzere ikiye ayrılır. İleriye doğru yöntemlerde analize önce sadece sabit terim dahil edilerek başlanır. Daha sonra belirlenmiş bir ölçüte göre modeller tek tek değişkene eklenir. Ölçüt, puan istatistikleridir. Yani en önemli puan istatistiğine sahip olan değişken ilk önce modele girer. Bu işlem anlamlı puan istatistiği olan değişken kalmayıncaya kadar devam eder. Her adımda analiz dışında bırakılması gereken değişken olup olmadığı incelenir. Bu üç şekilde yapılır “olabilirlik oran istatistiğini kullanarak”, “durum indeksi kullanarak” ya da “Wald istatistiği kullanarak” gerçekleşir (Özdamar, 2004).

38

İlk yol olabilirlik oran istatistiğini (likehood ratio statistics) kullanmaktır. Bu yöntemde mevcut model, bağımsız değişkenin dışarıda bırakıldığı model ile karşılaştırılır. Bağımsız değişkenin dışarıda bırakılması, gözlenen verilerin model uyumunda anlamlı farka neden oluyorsa bu bağımsız değişkenin modelde kalması sağlanır. Bu sayede modelin uyumu iyileşecektir. Eğer bağımsız değişkenin çıkarılması modelde çok küçük farklara sebep oluyorsa o zaman bu değişken elenir. Durum indeksi kullanarak yapılan test ise aritmetik olarak olabilirlik oran istatistiğinin daha az duyarlı şeklidir. Bu nedenle de olabilirlik oran istatistiğine göre kullanımı çok fazla önerilmez (Field’den aktaran Çokluk, 2010, s. 82). Son yol Wald istatistiğinin kullanılmasıdır. Her bir bağımsız değişken için lojistik regresyon katsayısının anlamlılığını test etmede sık olarak kullanılan bir testtir (Çokluk, 2010, s. 82). İleriye doğru yöntemlerin tersi geriye doğru yöntemlerdir. Bu yöntemde de ileriye doğru yöntemlerde kullanılan aynı eleme ölçütleri kullanılır. İleriye doğru yöntemlerde modele önce sadece sabit terim alınarak başlanıyordu anacak geriye doğru yöntemlerde modele tüm yordayıcı değişkenler alınarak başlanır. Daha sonra modelin gelişmesine olan etkilerine göre yordayıcı değişkenlerin modelde kalmasına ya da çıkarılmasına karar verilir. İlk önce modelin gelişmesine en az fayda sağlayan değişken çıkartılarak işleme devam edilir (Çokluk, 2010, s. 82).

Lojistik regresyon analizi, bağımlı değişkenin ölçüldüğü ölçek türüne ve bağımlı değişkenin seçenek sayısına göre üçe ayrılmaktadır. (Özdamar, 2004) :

İkili Lojistik Regresyon (Binary LRA) Analizi: İkili lojistik regresyon analizinde bağımlı

değişken iki kategorili cevaba sahip olduğu analizdir (Evet- Hayır, Var-Yok gibi). Bu kategorili değişken sayısal veya nümerik değişken olabilir. Bağımlı değişken ile bağımsız değişkenin sahip olduğu ilişki saptanarak sınıflandırmada kullanılacak tahmini regresyon denklemi oluşturulur daha sonra bu denklemden yararlanarak tahmin işlemi uygulanır (Özdamar, 2004).

Sıralı Lojistik Regresyon (Ordinal LRA) Analizi: Sıralı Lojistik regresyonda bağımlı

değişkenin üç kategorili cevaba sahip olduğu analizdir (hafif-orta- ağır). Değişkenlerin cevapları sıralı (ordinal) olmalıdır (Özdamar, 2004).

Çok kategorili/ İsimsel Lojistik Regresyon (Multinominal LRA) Analizi: İsimsel lojistik

regresyon yöntemi cevapların şekli olarak ikili lojistik regresyonu ile birbirine benzer ancak bu regresyonda cevapların bir sırayı takip etmesi şart değildir (Örneğin bir meslek tercihinde sınıflar; mühendislik, bankacılık, reklamcılık). İsimsel Lojistik Regresyon da parametre

39

tahminleri en küçük kareler yöntemine göre yapılır. Yapılan tahminler en büyük benzerlik tahminleridir (Özdamar, 2004).

Lojistik regresyon analizi bağımsız değişkenlerin dağılımına yönelik herhangi bir sayıltının karşılanmasını gerektirmez ancak bazı gerekliliklerin bulunması gerekir (Tabachnick ve Fidell’ den aktaran Çokluk vd., 2010, s. 75). Bunlar:

• Tüm kategorik değişken çiftleri, tüm hücrelerde beklenen frekansın 1’den büyük olduğundan ve beklenen frekansın 5’den küçük olduğu gözenek sayısının %20’yi geçmediğinden emin olunarak değerlendirilmelidir.

• Analize dahil edilen değişkenler arasında çoklu bağlantı problemi varsa, bu sorunu devre dışı bırakmak adına bir ya da birden fazla değişkenin modelden çıkarılması önerilir.

• Lojistik regresyon sonucu ortaya çıkan model, uç değerlere karşı da hassastır. Bu durum, gerçekte bir kategoride yer alan bir deneğin, değişkenin bir değer kategorisinde görünmesine neden olabilir. Standardize edilmiş hatalar uç değerleri belirlemek üzere özenle incelenmelidir.

Benzer Belgeler