• Sonuç bulunamadı

2.2. Kuramsal Çerçeve

2.2.2. Klasik Test Kuramı

2.2.2.1. Likert Tipi Ölçeklerin Psikometrik Özelliklerinin Klasik Test

Tutumların ölçülmesinde izlenen en popüler yaklaşım ölçülecek tutuma ilişkin bir ölçeğin hazırlanması ve hedef gruba uygulanmasıdır. İlk tutum ölçeklerinden biri Bogardus tarafından (1925) geliştirilen “toplumsal uzaklık ölçeği”dir. Bogardus’un ölçeğini sırasıyla Thurstone’un “eşit görünümlü aralıklar” ölçeği ve Likert’in (1932) “dereceleme toplamlarıyla ölçekleme” teknikleri izlemektedir. Ölçek oluşturmadaki işlemler bakımından diğerlerine göre daha ekonomik olması sebebiyle bu tekniklerden en yaygın kullanılanı Likert tipi yani, dereceleme toplamlarıyla ölçeklemedir (Koch, 1983; Tezbaşaran, 1997). Bu tekniğe uygun bir ölçekten alınan toplam puan, genel olarak, ölçekteki maddelere gösterilen tepkilere verilen ağırlıkların toplamından, yani puanların toplamından oluşur. Bu yöntemde bireylere genellikle “kesinlikle katılıyorum”, “katılıyorum”, “kararsızım”, “katılmıyorum” ve “kesinlikle katılmıyorum” gibi bir dizi tutum ifadelesi sunulur. Cevaplayıcı ölçekteki maddelere tepkide bulunurken, bu maddenin kapsamına ilişkin tutumunun derecesini belirtir. Ölçekte tepki kategorileri farklı sayılarda olabilir. Önemli olan tutumun iki kutuplu boyutunu temsil edecek artan-azalan şekilde seçilmesidir. Cevaplayıcı yargıcı olarak ifadeleri değerlendirmez, daha ziyade kendi tutumunu yansıtır. Dolayısıyla Likert tipi ölçekler denek tepkilerine dayalı, bireyleri ölçekleme tekniklerinden bir tanesidir. (Tezbaşaran, 1997; Erkuş, 2012).

Likert tipi ölçekler, diğerlerine kıyasla sezgilere daha çok dayalıdır. Bireyin kendisi hakkında bilgi vermesi esasına dayanır. Bireyin kendisini başkalarından daha çok tanıdığı ve anladığının yanı sıra kendisi hakkındaki bilgileri eksiksiz olarak ve çarpıtmadan verdiği sayıtlılarına dayanır. Likert tipi ölçek geliştirme yöntemi, tutum ölçmek amacıyla geliştirilmiş olmasıyla birlikte; ilgi, inanç gibi diğer psikolojik değişkenlerin ölçülmesine de

elverişlidir. Bu bakımdan tepki kategorileri katılma-katılmama durumunun yanı sıra sıklık ya da önem belirten ifadeler de içerebilir (Tezbaşaran, 1997; Erkuş, 2012).

KTK’ya göre geliştirilen araştırma özyeterliği Likert tipi on birli dereceleme ölçeğindedir. Ölçeğin psikometrik özelliklerinin nasıl belirleneceği maddeler ve ölçek bağlamında ayrı ayrı aşağıda açıklanmaktadır.

Likert tipi ölçeklerde madde düzeyinde psikometrik özelliklerin belirlenmesinde kullanılan bazı teknikler şu şekildedir (Tezbaşaran, 1997) :

1. Madde ayırıcılık gücü: Bir ölçme aracını oluşturan maddelerin, o ölçme aracı ile ölçülmeye çalışılan özelliğe yüksek düzeyde sahip olanlarla düşük düzeyde sahip olanları ayırabilme gücüdür. Madde geçerliğinin bir ölçüsüdür. Madde ayırıcılık gücünü belirlemede en sık kullanılan iki yöntem, korelasyon ve iç tutarlık ölçütüne (t-testine) dayalı analiz teknikleridir.

Korelasyona dayalı analizde, maddelerin ayırt edicilik gücü, her bir tutum cümlesi için elde edilen madde puanları ile ölçek puanları arasındaki korelasyon katsayısı ile hesaplanır (madde-ölçek korelasyonu). Bilindiği üzere ölçek puanı aynı zamanda ilgili maddeden alınan puanı da içerir, bu nedenle madde ayırıcılık gücü hesaplanırken, söz konusu maddenin puanı hariç tutularak ölçek puanının yeniden hesaplanması seçeneği söz konusudur. Madde ve ölçek puanları arasındaki korelasyon katsayılarının hesaplanması için Pearson momentler çarpımı korelasyonu kullanılır:

1 1 1 2 2 2 2 1 1 1 1 . ( ).( ) ( ) . ( ) n n n i i i n n n n i i i i n X Y X Y xy n X X n Y Y

r

          

Belirtilen korelasyon katsayısı hem madde hem ölçek puanlarının sürekli değişken olduğu sayıltısına dayalıdır. Pearson momentler çarpımı korelasyonu ile elde edilen korelasyon katsayısı hem madde ayırıcılık güdü indeksi hem de madde geçerlik katsayısı olarak yorumlanabilmektedir. Belirtilen katsayı -1,00 ile +1,00 arasında değişen değerler almaktadır. Elde edilen korelasyon katsayısı negatif veya sıfıra yakın maddeler ölçeğin bütünü ile ölçülmek istenen özelliği ölçme konusunda yetersiz; katsayı değeri pozitif ve yüksek olan maddeler ise ölçeğin bütünü ile ölçülmek istenen özelliğin iyi ölçebilen maddeler olarak yorumlanır. Maddelerin madde-ölçek korelasyon katsayılarının işaretlerinin

pozitif ve değerlerinin yüksek olması, ölçeğin tek boyutlu olması aynı zamanda geçerliğinin ve güvenirliğinin yüksek olması bakımından önemli görülmektedir.

İç tutarlık ölçütüne (t-testi) dayalı analizde her bir bireyin ölçekteki maddelere verdiği tepkiler toplanarak toplam puan elde edilir. Bireylerin ölçek puanları belirlendikten sonra bu puanlar büyükten küçüğe doğru sıralanır. Elde edilen bu puan dağılımından üst ve alt %27’lik gruplar seçilir. Üst grupta yer alan bireyler, ölçeğin bütünü ile ölçülen özelliğe olumlu yönde sahip olanları, alt gruptaki cevaplayıcılar ise olumsuz yönde sahip olanları göstermektedir. Daha sonra üst ve alt gruplardaki bireylerin her bir madde için madde puanları ortalamaları belirlenir ve bu ortalamalar arasındaki farkların anlamlı olup olmadığı t-testi ile belirlenir:

ü: üst grup, a: alt grup

X: Grubun madde puanları aritmetik ortalaması

S2: Grubun madde puanları varyansı ve n: Gruptaki cevaplayıcı sayısı

Bu işlem sonucunda t değeri anlamlı olan maddeler, olumlu tutum ile olumsuz tutuma sahip olan bireyleri iyi ayırt edebilen maddeler olarak kabul edilir ve ölçeğin nihai formunda kullanılmak üzere seçilir (Tezbaşaran, 1997).

2. Maddelerin ölçtüğü tutum düzeyi: Bireyler Likert tipi ölçeklerdeki maddelere tepkide bulunurken, her bir maddenin kapsamına ilişkin tutumlarının derecelerini belirtirler. Bireylerin bir maddeye ilişkin olarak bildirdikleri tutum derecelerinin aritmetik ortalaması “maddenin ölçtüğü tutum düzeyi” olarak adlandırılır. Örneğin, beşli dereceleme Likert tipi tutum ölçeklerinde bir maddenin ölçtüğü tutum düzeyi 1 ile 5 arasında değişen değerler alır. Bir madde için kestirilen “maddenin ölçtüğü tutum düzeyi” değerinin yüksek olması bireylerin o maddenin kapsamına ilişkin olumlu, düşük olması ise olumsuz tutuma sahip olduğunu gösterir.

Likert tipi ölçeklerde ölçek düzeyinde psikometrik özelliklerin belirlenmesinde kullanılan bazı teknikler şu şekildedir (Tezbaşaran, 1997) :

2 2 ( ) ( ) . ü a ü a ü a X X t S S n n  

1. Güvenirlik: Bir ölçme aracının duyarlı, birbiri ile tutarlı ve kararlı ölçme sonuçları verme gücüdür. Güvenirliği düşük ölçeklerin uygulanması sonucunda elde edilen ölçme sonuçları kendi içinde ve bir uygulamadan diğerine tutarlı sonuçlar vermez, ölçmelerin içerdiği tesadüfi hata miktarı fazladır. Ölçme sonuçlarının tutarlı olmayışı, bu ölçme sonuçlarına dayalı olarak bireyler hakkında verilecek kararların doğruluğunu olumsuz yönde etkiler. Likert tipi ölçeklerde güvenirlik kestiriminde en sık kullanılan yöntemler: Cronbach alfa iç tutarlık güvenirliği ve test tekrar test güvenirlik yöntemleridir. Cronbach alfa iç tutarlık katsayısı şu şekilde hesaplanmaktadır:

Formülde k soru sayısı, madde varyansı, testin varyansını ifade etmektedir. Cronbach alfa katsayı, ölçekteki maddelerin iç tutarlığının bir ölçüsüdür. 0,00 ile 1,00 arasında değişen değerler alır ve katsayı değeri 1,00’a yaklaştıkça ölçekteki maddelerin birbirleri ile tutarlı olduğu ve aynı özelliği ölçtüğü yorumu yapılır.

Likert tipi ölçeklerin güvenirliğini belirlemede kullanılan bir başka yöntem test-tekrar test güvenirliğidir. Bu güvenirlik belirleme yönteminde, ölçek farklı zamanlarda aynı gruba iki kez uygulanır ve elde edilen puanlar arasındaki Pearson momentler çarpımı korelasyon katsayısı ile ölçeğin güvenirliği belirlenir. Bu korelasyon katsayısının pozitif yönde yüksek değer alması, ölçme aracının kararlılık anlamında güvenilir olduğu şeklinde yorumlanır. 2. Geçerlik: Bir ölçme aracının, bu araçla ölçülmek istenen özelliği başka özellikleri karıştırmadan ölçebilme gücüdür. Likert tipi ölçeklerde geçerliğin belirlenmesinde en sık kullanılan yöntemler: yapı, kapsam ve ölçüte dayalı geçerliklerdir.

Yetenek, zekâ, ilgi, tutum, güvensizlik vb. özellikler psikolojide yapı olarak adlandırılırlar. Yapı, birbirleriyle ilgili olduğu düşünülen belli öğelerin ya da öğeler arasındaki ilişkilerin oluşturduğu bir örüntüdür. Bu tür özelliklerin ölçülmesinde öncelikle psikolojik yapı operasyonel olarak tanımlanır, gözlenebilen davranışlar olarak ifade edilir. Başka bir ifadeyle tanımlanmış yapıdan sınanabilen denenceler çıkarılır ve bu denenceler üzerinden deneysel ve istatistiksel çalışmalar yapılır. Eğer bir ölçme aracı, temelini oluşturan kuramsal yapıyı ölçüyorsa, bu ölçme aracının yapı geçerliğine sahip olduğu söylenebilir. Bir ölçeğin iç tutarlık ölçüsüne bakılarak yapı geçerliğine ilişkin yorum yapılabilir. Ancak iç tutarlık katsayısı ölçeğin yapı geçerliğine ilişkin ipucu vermekle birlikte ölçeğin alt boyutlarının sayısı hakkında bilgi vermez. Ölçülmek istenen yapının kaç boyutlu olduğu faktör analizi ile

2 1 2 (1 ) 1 i i x k S k k S  

2 i S Sx2

belirlenebilir. Yapı geçerliğinin belirlenmesinde en sık kullanılan yöntem faktör analizidir (Crocker ve Algina, 1986; Tekin, 2009).

Kapsam geçerliği, bir bütün olarak ölçeğin ve ölçekteki maddelerin amaca hizmet etme derecesinin bir ölçüsüdür. Bir ölçeğin kapsam geçerliği, ölçekteki maddelerin ölçülecek davranışları örnekleme derecesine ve ölçekteki her bir maddenin ölçmek istediği davranışı ne derece iyi ölçtüğüne bağlıdır. Ölçeğin kapsam geçerliğinin belirlenmesinde genellikle uzman görüşlerinden ve bu konuda yapılmış kuramsal çalışmalardan yararlanılmaktadır (Tekin, 2009).

Ölçüte dayalı geçerlik ise, ölçekten alınan puanlarla; ölçülen özellikle ilişkili olduğu düşünülen ölçüt puanları arasındaki korelasyonun hesaplanması ile incelenir. Ölçüte dayalı geçerlik, ölçüt puanlarının elde edildiği zamana göre ikiye ayrılır. Ölçüt puanları, geçerliği incelenen ölçme aracıyla aynı zamanda ya da ölçme aracından önce elde edilmişse eş zaman (uygunluk) geçerliği olarak ifade edilir. Yordama geçerliğinde ise ölçüt puanlarının, geçerliği incelenen ölçme aracı puanlarından ileri bir zamanda elde edilmektedir (Tekin, 2009). Her iki durumda da elde edilen korelasyon katsayısının büyüklüğü ölçme aracının ölçüte dayalı geçerliğinin derecesi olarak yorumlanır.

Yukarıda sözü edilen madde ve test istatistiklerinin KTK’da gruba bağımlı olması (sample dependency), bireylerin test puanlarının kendilerine uygulanan test maddelerine bağımlı olması (test dependency), testlerin genellikle orta yetenek düzeyindeki bireyler temel alınarak geliştirilmesi, ölçme hatalarına ilişkin varyansın tüm grup için aynı kalması yani yetenek düzeylerine göre değişmemesi kuramın başlıca sınırlılıklarıdır. Ayrıca KTK, bir test maddesi ile karşılaşan cevaplayıcının nasıl bir performans göstereceği hakkında bilgi vermez (Hambleton ve Swaminathan, 1985; Hambleton vd., 1991). İki kuramın modelleri arasındaki bu farklılıklardan öne çıkanları Tablo 1’de özetlenmiştir (Hambleton ve Jones, 1993):

Tablo 1. KTK ve MTK Modelleri Arasındaki Başlıca Farklılıklar

Alan KTK MTK

Model Doğrusal (linear) Doğrusal olmayan (nonlinear)

Düzey Test Madde

Sayıltılar Zayıf (test verisi ile karşılanması kolay)

Güçlü (test verisi ile karşılaması zordur)

Madde-Yetenek İlişkisi Belirli değildir Madde karakteristik fonksiyonları Yoktur, madde ve birey Vardır, model veriye uyumluysa

Madde İstatistikleri p, r b, a, c (üç parametreli model) ve ilgili madde bilgi fonksiyonları Örneklem Büyüklüğü

(Madde Parametre Kestirimi İçin)

200 ile 500 arası (genellikle) MTK modeline bağlı olmakla birlikte, daha geniştir (genellikle 500’den fazla)

Kaynak: (Hambleton ve Jones, 1993)

Tablo 1 incelendiğinde kuramların, modellerinin matematiksel altyapıları; temel aldıkları ölçme düzeyleri; parametrelerin değişmezliği; kestirilen parametrelerin çeşitliliği; gerekli örneklem büyüklükleri açısından farklılaştıkları görülmektedir.

Yukarıda sözü edilen sınırlılıkların giderilmesi ve iki kuram arasındaki farklılıklar sebebiyle araştırma özyeterlik ölçeğinin psikometrik özellikleri hem KTK hem de MTK’ya göre belirlenmiştir. Her iki kurama göre kestirilen parametrelerinin karşılaştırılabilmesi için ölçeğin psikometrik özellikleri arasındaki korelasyonlar incelenmiştir.

Benzer Belgeler