• Sonuç bulunamadı

En Küçük Kareler (EKK) Yöntemi

1.6. Ölçüm ve Analiz Teknikleri

1.6.3. Stokastik Sınır Analizinin Veri Zarflama Analizi ile KarĢılaĢtırılması

1.6.3.3. En Küçük Kareler (EKK) Yöntemi

Regresyon analizlerinde en sık kullanılan yöntemlerden olan En Küçük Kareler yöntemi alman matematikçi C. F. Gauss tarafından geliĢtirilmĢtir. ÇalıĢmamızda bu yöntemle yapılan analizde bir bağımlı ve iki bağımsız değiĢken kullanılacağından üç değiĢkenli bir regresyon fonksiyonu oluĢturulacaktır. (Kutlar, 2012: 113-133)

Basitliğin sağlanması amacıyla klasik ekonomi hesaplamalarında Cobb-Douglas ”üretim fonksiyonu”nda “Y” tek çıktısının maksimizasyonu X1 ve X2 girdileri kullanılarak yapılmaktadır (Cooper, Tone, 1997: 82).

72

VerilmiĢ üstel denklem doğrusal (log-doğrusal) hale getirildiğinde aĢağıdaki Ģekilde yazılabilir:

(1.51) Burada β`lar gerçek (üretim fonksiyonu) parametreleri için tahmin edici olarak görevlendirilmektedir. Logaritmik denklemlerde tahmin parametreleri doğrusal regresyon denkleminden farklı olarak eğimi değil, esneklik katsayılarını vermektedir. Regresyondaki istatiksel hatalar (aynı zamanda kalıntı değerleri) ise v ile gösterilmiĢtir. Ġstatiksel hata terimleri sonradan her bir Y değerlerine vi~iid1 N (0, ζv2) dağılımlarından örnekleme yolu ile seçilerek eklenebilinmektedir. Kalıntı değerleri bağımsız olup, sıfır ortalama ve sabit varyans dağılımına sahiptir. (1.51) formülü doğrudan gözlenemediği için bunun yerine örnek regresyon denklemi kullanılmaktadır. Bu durumda denklem aĢağıdakı gibi yazılabilmektedir:

̃ ̃ ̃ ̃ ̃ (1.52) ̃ ̃ (1.53) Burada LnYi, gerçek çıktı, Ln i ise tahmini çıktı değerleridir. N sayıda gözem için kalıntı değerlerinin toplamı sıfıra eĢit olacağından en küçük kareler kriteri uygulanmaktadır.

∑ ̃ ∑ ̃ (1.54) Kalıntı değerler toplamının karesini minimum yapmak için bağımsız değiĢkenlere (esneklik parametreleri β 0, β 1, β 2) göre türevleri alınır. Kalıntı değerlerin tahminin standart hatası σ2`nin karekökü alındığı zaman ortaya çıkar. σ2

, Xi veri olarak alındığı zaman Yi ve ui`nin Ģartlı varyansıdır. Tahmin edilen parametrelerin standart hatalarının yanı sıra, korelasyon katsayılarının karesi R2 ve düzeltilmiĢ R 2

regresyon sonucu elde edilen parametrelerin uygunluğunun ölçülmesi için kullanılan ölçütlerdendir. Çoklu determinasyon katsayısı R2

ve R 2 değeri, Xi`lerdeki değiĢmelerle, Yi`deki değiĢmenin açıklanabilirlik oranını gösterir ve aĢağıdaki Ģekilde ifade edilir (Kutlar, 2012: 139):

∑ ̄ ; ̅ ∑ ̄ (1.55)

1

73

Regeresyon denkleminde tahmin edilen parametrelerin gerçek değere ne kadar yakın olduğu ve güvenirliği de hesaplanmaktadır. Bunun için t dağılımı kullanılmaktadır. Elde edilmiĢ tahmin sonuçlarının sıfır hipotezini doğrulayıp doğrulamadığını belirten t istatistiği 1960`lardan once R. A. Fisher, J. R. Newman ve P. Pearson tarafından geliĢtirilmiĢtir (Kutlar, 2012: 141). t değeri tahminci ile gerçek parametre farkının tahmincinin standart hatasına bölünmesi ile aĢağıdaki Ģekilde elde edilir.

( ̃ ̃) (1.56) β için güven aralığının bulunmasında anlamlık düzeyi α değeri ikiye bölünür ve t istatistik tablosunda istenilen anlamlık düzeyi tα/2, n-k serbestlik derecesinde elde edilen tablodaki t değeridir. P anlamlık düzeyi aĢağıdaki Ģekilde hesaplanır.

( ̃ ̃) (1.57) ̃ ( ̃) ̃ ( ̃) (1.58) Yapılan analizlerde kullanılan serbestlik derecesi 20`den fazla ve anlamlık düzeyi 0,05 olarak kabul edildiğinde, t değerinin mutlak değeri 2`den büyük olduğu durumda sıfır hipotezi reddedilir. Tahmin edici mutlaka sıfırdan farklı ve anlamlı olarak kabul edilir. Ġstatistiki testlerin sonuçları değerlendirilirker H0 sıfır hipotezinin reddedilebileceği en düĢük ihtimal düzeyini ifade eden p ihtimal değeri göz önünde bulundurulur. Regresyon sonucu elde edilen p değeri verilen anlamlık düzeyini aĢmıyor ise sonuç anlamlı, aĢıyor ise anlamsız olduğu söylenebilmektedir.

Çoklu regresyon analizlerinde t testi yanıltıcı olabilmektedir. Bu durumda F istatistiği ile varyans analizi yapılmaktadır. F istatistiği sadece değiĢkenlerin olduğu parametrelerle ilgilidir ve sabit ile ilgili herhangi sınama sözkonusu değildir. F istatistiği aĢağıdakı Ģekilde hesaplanmaktadır:

(1.59) Formül (1.59)`da k parametre, n ise gözlem sayısını göstermekle k-1 pay, n-k paydanın serbestlik derecesidir. Varyans analizi sonucunda F istatistiği değeri F tablosunda verilen α anlamlık düzeyindeki kritik değerden büyük ise sıfır hipotezi reddedilir, değil ise kabul edilir.

74

Analiz kapsamında kullanılan gözlemlerden Bakü, Gence ve Sumkayıt`ın verilerinin diğerlerinden çok farklı olması regresyon denkleminin yönünü etkileyebilmektedir. Bu durum tüm ortalamaları değiĢtirebilmektedir. Bu nedenle analizde farklı varyansın olabilme ihtimalinin araĢtırılması için White Testi uygulanmıĢtır. Bu testte aĢağıdaki hipotezler test edilmektedir (Kutlar, 2012: 196).

H0: Kalıntı değerleri farklı varyansa sahip değildir. H1: Kalıntı değerleri farklı varyansa sahiptir.

Uygulama zamanı kalıntı değerlerinin karesi sabit, Xi ve Xi2 değiĢkenleri üzerine regrese edilmektedir. Regresyon sonucu elde edilen R2 değerinin gözlem sayına çarpımından elde edilen değer elde edilen serbestilik derecesinde %5 anlamlık düzeyinde, sıfır hipotezinin aynı varyans olduğu durumda X2

(chi-kare) dağılımı ile uyumluluğu araĢtırılacaktır. (Kutlar, 2012: 196) White testi uygulanarak yapılan analiz denklemlerinde kalıntı değerleri karesi (Σui2) bağımlı değiĢken olarak ele alınmıĢtır. Birinci analizde Toplam Personel Sayısı (LnPERS), Toplam Yatak Sayısı (LnTYS), LnPERS2, LnTYS2, LnPERSxLnTYS, ikinci analizde ise toplam personel sayısının toplam yatak sayısına olan oranı (LnPERS/LnTYS ) ve (LnPERS/LnTYS)2 bağımsız değiĢkenler olarak kullanılmıĢtır. Farklı varyans sorununun bulunduğu durumlarda EKK yöntemi ile tahmin edilen regresyon denkleminde elde edilmiĢ t ve F istatistikleri güvenirliklerini yitirirler. Bu durumda sağlıklı sonuçlara ulaĢılamamaktadır.

Kamu hastanelerinin verileri kullanılarak yapılan analizde girdiler arasında doğrusal iliĢkinin varlığı ve yoğunluğu olduğu görülmektedir. Bu durumda bağımsız değiĢkenler arasında çoklu doğrusallığın olması mühtemel görülmektedir. Çoklu Doğrusallığın ortaya çıkarılması için Varyans Büyüten Faktör (Variance Inflation Factor(VIF)) denklemi kullanılmıĢtır. Bu denklem aĢağıdaki gibi ifade edilmektedir. Bağımsız değiĢkenler arasında iliĢki 0`ra yakın olduğu durumlarda VIF değeri 1 olur. Bağımsız değiĢkenler arasındaki iliĢki %80`in üzerinde (VIF>5) olduğu durumlarda ciddi bir tama yakın doğrusallığın olduğu kabul edilmektedir. (Kutlar, 2012: 217).

Ekonometrik analizlerde kullanılan kesit ve zaman serileri Ģeklinde ard arda dizilen gözlemler arasındaki iliĢkinin olması otokolerasyon veya ardıĢık bağımlılık anlamına gelmektedir. En Küçük Kareler metodunda kabul edilen varsayımlardan biri de rassal

75

değiĢken ui`nin ardıĢık değerlerinin birbirinden bağımsız olması ve ui`nin aldığı değerin bir önceki dönemlerden etkilenerek değer almamasıdır.

Analizde ardıĢık bağımlılığın olup olmadığını tespit etmek için Durbin-Watson d istatistiği kullanılmakta, stokastik değiĢkenin peĢ peĢe gelen birinci farklarının kareleri toplamının, bu değiĢkenin kareleri toplamına bölünmesi Ģeklinde ifade edilmektedir. d değerinin alt sınırı dL ve üst sınırı dU Ģeklinde ifade edilmekte olup, n gözlem sayısıyla ve bağımsız değiĢken sayısı ile de sınırlanmıĢtır. d `nin alacağı değer 0 ≤ d ≤ 4 arasında değiĢir (Kutlar, 2012: 232). Durbin-Watson d istatistiği analizinde aĢağıdakı gibi hipotezler test edilmektedir

H0 = Pozitif veya aynı yönlü otokolerasyon yoktur. H0* = Negatif veya aynı yönlü otokolerasyon yoktur.

d 0`a yaklaĢtıkça pozitif, 4`e yaklaĢtıkça negatif otokolerasyon olduğu kabul

edilmektedir. Eğer d yaklaĢık olarak iki civarında değer alırsa, ardıĢık bağımlılığın olmadığı kararı verilmektedir (Kutlar, 2012: 232).