• Sonuç bulunamadı

2.3. Eğitimde Ölçme ve Değerlendirme

2.3.4. Ölçme Aracında Bulunması Gereken Nitelikler

Ölçme aracının hatalardan arınmış olması beklenir. Ölçme sırasında hatalar yapılacak olursa, ölçmenin nesnellik ilkesi zedelenir. Bunun için iyi bir testin (ölçme aracının) aşağıdaki özelliklere sahip olması gerekir.

2.3.4.1. Geçerlik

Ölçme aracının ölçmeyi amaçladığı özelliği, başka bir özellikle karıştırmadan, doğru olarak ölçebilme derecesidir. Başka bir ifadeyle, ölçme aracının kullanılış amacına hizmet etmesidir. Mesela, sadece derste ulaşmak istediğimiz kazanımlar ölçülmeli; ölçmeye başka şeyler karıştırılmamalıdır.

Testlerin; 1- Kapsam, 2- Yordama, 3- Yapı, 4- Görünüş, bakımlarından geçerli olmaları beklenir. Testlerin geçerliği istatistiksel olarak da sağlanabilir. Ancak, öğretmenlerin bu tür hesaplamalar yapması beklenmez. Bu nedenle, bir testin geçerliğini artırmak için öğretmenlere şu tavsiyelerde bulunulabilir (Temel, 2010):

a) Hazırladığınız her sorunun, dersin kazanımlarından en az bir tanesi ile ilişkili olmasını sağlayınız.

b) Test planı yapmayı alışkanlık haline getiriniz. Sınav öncesi işlevsel bir test planı hazırlayınız.

c) Her sınavda sorularınızı değiştiriniz.

19

e) Olumsuzlukları ortaya çıkmadan önlemenin kolaylığını, ortaya çıktıktan sonra da telafi etmenin zorluğunu düşünerek; sorunun niteliği ve sınav ortamı bakımlarından kopya çekmeye fırsat vermeyiniz.

f) Öğrencilerinizi sınavdan önce sorular vererek yetiştirmeyiniz.

2.3.4.2. Güvenirlik

Güvenirlik, bir ölçme aracının ölçme sonuçlarındaki kararlılık derecesidir (Özgüven, 1994, s.83). Diğer bir anlatımla, bir ölçme aracının, aynı özelliği ölçmek için her uygulandığında yaklaşık aynı sayısal sonucu vermesidir. Yani, ölçmeler arasındaki tutarlılıktır. Güvenirlik bir test veya ölçme aracının ölçtüğü niteliği ne kadar doğru ölçtüğü ile ilgilidir. Buna göre güvenirlik, bir ölçmenin rastgele hatadan arınmış olması olarak tanımlanabilir (Balcı, 1995, s.116). Ölçme hatası az olan testin güvenirliği yüksek, ölçme hatası fazla olan testin güvenirliği ise düşüktür.

Güvenirlik kelimesi ölçmede, bazen duyarlılık bazen de ölçülen değişkende kararlılık anlamında kullanılmaktadır (Cureton, 1965; Cronbach, 1970, s. 151-193; Turgut, 1992, s. 27; Aktaran: Öncü, 1999, s.45). Güvenirliğin bu iki anlamını birlikte düşündüğümüzde onu şöyle tanımlayabiliriz: Ölçme aracının duyarlı ve tutarlı ölçme yapması niteliğine ölçme aracının güvenirliği denir.

Güvenirlik, sayısal değer alan "güvenirlik katsayısı" adı verilen bir katsayı ile ifade edilir. Güvenirlik katsayısı ölçümlerdeki hatayı değil hatasızlığı belirtir. Yani güvenirlik katsayısı yüksekse ölçme aracının hatalardan arınıklık derecesinin yüksek olduğu söylenir. Güvenirlik katsayısının yüksek olması ölçme hatasının düşük olmasının ifadesidir.

Ölçme araçlarının güvenirlik düzeylerini belirlemek için farklı yöntemler kullanılır. Eğitim bilimlerinde kullanılan yöntemlerin en önemlileri şunlardır:

1. Testin Tekrarı Yöntemi (Test-Tekrar Test Yöntemi) 2. Eşdeğer Formlar Yöntemi (Paralel Testler Yöntemi) 3. İç Tutarlılık

a) Testi Yarılama Yöntemi

20 c) Cronbach Alfa Katsayısı

d) Hoyt’un varyans Analizi 4. Puanlayıcı Güvenirliği Metodu

2.3.4.2.1. Test Tekrarı Yöntemi

Aynı testi aynı gruba farklı zamanlarda iki kez uygulama yöntemidir. İki uygulamadan elde edilen puanlar arasındaki korelasyon katsayısı hesaplanır. Hesaplanan bu sayı güvenirlik katsayısı olarak kabul edilir. Bu sayı +1’e ne kadar çok yakınsa güvenirlik de o kadar yüksektir. Başarı testlerinde pek kullanılmaz, daha çok zekâ, yetenek, kişilik, tutum testlerinde kullanılır. Çünkü başarı testlerinde bilgi ölçülür. Bilgi unutulur, hatırlanır, çabuk değişir (Aktaran: Öncü, 1999, s.50).

2.3.4.2.2. Eşdeğer Formlar Yöntemi

Birbirine paralel yani aynı davranışı ölçen, fakat farklı sorulardan oluşan iki paralel testin aynı öğrenci grubuna uygulanmasına dayanan yöntemdir. Öğrencilerin, birbirine eşdeğer iki farklı testten aldıkları puanlar arasındaki korelasyon katsayısı hesaplanır. Korelasyon katsayısının yüksek olması uygulanan iki testin aynı özelliği benzer ölçtüğünü dolayısıyla güvenilir olduğunu gösterir. Bu metot, güvenirliğin tahmininde iyi bir metot olduğu halde, eşdeğer araçların hazırlanmasındaki güçlüklerden ve testin iki farklı oturumda uygulanması zorunluluğundan dolayı pek seyrek uygulanmaktadır (Turgut ve Baykul, 1992, s.32).

2.3.4.2.3. İç Tutarlılık

İç tutarlılık sadece bir defa uygulanan testlerin güvenirliğinin hesaplanmasında kullanılır. Testi oluşturan tüm maddelerin birbiriyle olan uyumuna bakılır.

2.3.4.2.3.1. Testi Yarılama Yöntemi

Test güvenirliğini tahmin etmede en çok kullanılan yöntemdir. Çünkü bu yöntem tek bir test formu, tek bir öğrenci grubu ve tek bir test uygulaması gerektirir. Bu yöntemle test güvenirliğini tahmin etmede, uygulanmış olan test iki eşdeğer yarıya bölünerek öğrencilerin

21

testin iki yarısından aldıkları puanlar arasındaki korelasyon hesaplanır ve daha sonra bu hesaplanan korelasyondan testin bütünlüğünün güvenirliği kestirilir (Tekin, 2007, s.60).

2.3.4.2.3.2. Kuder – Richardson 20 (KR- 20) ve 21(KR-21) Yöntemi

İç tutarlılık güvenirliğini hesaplamak için kullanılan formüllerdir. Bu formüllerle elde edilen katsayı yüksekse test maddeleri birbirleriyle tutarlıdır. Yani test içinde ilgisiz, hatalı soru bulunmamaktadır. Kullanım şartı şu iki özelliğe bağlıdır:

- Testin ölçtüğü özellik açısından homojen olması, yani aynı özelliği ölçüyor olması, - Testteki soruların doğruysa 1, yanlışsa 0 şeklinde puanlanması gerekir.

KR-20 formülü, testteki her bir maddenin güçlük indekslerinin belirlenebilmesi durumunda kullanılır.

KR-21, madde güçlük indekslerinin hesaplanamadığı durumlarda testteki tüm maddelerin güçlük derecelerinin birbirine yakın ya da eşit olduğu varsayımıyla bu formül kullanılır.

KR-21 her zaman KR-20’den küçüktür ve güvenirliğin alt sınırıdır. Bunun nedeni; testi oluşturan madde güçlükleri arasındaki farklılıklara duyarlı olmamasıdır.

q S q p n n r KR x x             1

2. 1 : 20                              2 2 1 1 : 21 x x S x nx n n r KR Burada ; dir.

r x= Testin güvenirliği n= Testteki Soru Sayısı

S x= Test Puanlarının Standart Sapması ̅x= Puanların Aritmetik Ortalaması

22 2.3.4.2.3.3. Cronbach Alfa Yöntemi

Cronbach alfa katsayısı, test maddelerinin tüm çeşitleriyle kullanılabilir (Worthen, White, Fan ve Sudweeks,1999). Güvenirlik kestirimleri ile ilgili çalışmalarda, Cronbach'ın alfa katsayısı, yalnızca iki değerli [O,1] ölçümlenmiş maddelerle veya ağırlıklı olarak [1,2,3,4,5] şeklinde ölçümlenmiş maddelerle kullanılabilir(Bademci, 2006).

2.3.4.2.3.4. Hoyt’un Varyans Analizi

Hoyt (1941)’un Varyans Analizi Yöntemi, KR-20 veya  katsayısı ile tamamen aynı sonucu verir (Akt: Mehrens ve Lehmann, 1991, s.256). “İstatistik” adlı çeviri kitabında bu yöntemin nasıl kullanıldığını detaylı bir şekilde açıklamaktadır.

2.3.4.2.4. Puanlayıcı Güvenirliği Metodu

Yazılı, sözlü sınav gibi puanlaması subjektif olan araçlarda kullanılır. Cevap kağıtları birden çok puanlayıcı tarafından puanlanarak, arasındaki korelasyon hesaplanır (Akdağ, 2015). Öğretmenlerden uyguladıkları sınavların sonuçlarına dayalı güvenirlik hesaplamaları yapmaları pek beklenen bir durum değildir. Bu nedenle öğretmenlere güvenirliği artırmak için şunlar önerilebilir (Temel, 2010):

1-Sınavlarınızda olabildiğince fazla sayıda ve değişik türde davranışları ölçen sorular sorunuz. 2-Öğrencilerinizi yeterince tanıyınız. Soruları onların düzeylerini dikkate alarak hazırlayınız. 3-Sınav süresini sınıfınızdaki zayıf öğrencileri göz önüne alarak belirleyiniz.

4-Soruların kısa, öz, açık ve anlaşılır olmasına özen gösteriniz.

5-Sınavları öğrencilerin kendi durumlarını görmelerine yarayan bir ayna olarak görünüz. Uygulamalarınızla öğrencileri buna inandırınız.

6-Puanlamada nesnel olabilmek için mutlaka cevap anahtarı hazırlayınız.

7-Soru kağıdının/kitapçığının başına mutlaka bir yönerge koyunuz. Bu yönergede soru sayısı, cevaplama süresi, cevaplamada dikkat edilecek hususlar vb. konuları açıklayınız.

23 2.3.4.3. Nesnellik

Bir testi kim, ne zaman, nerede, hangi koşullar altında puanlarsa puanlasın sonuç değişmez ise test nesneldir. Cevap anahtarı kullanmak, optik okuyuculardan yararlanmak, kağıtları iki defa okumak, farklı kişilerin puanlaması gibi uygulamalar nesnelliği artırmaktadır (Temel, 2010).

2.3.4.4. Kullanışlılık

Hazırlanması, çoğaltılması, uygulanması, puanlanması, yorumlanması için harcanan emek, zaman ve para bakımlarından ekonomik olan test kullanışlıdır (Temel, 2010).

2.3.4.5. Örnekleyicilik

Test, dersin konularını ve kazanımlarını örneklemelidir. Farklı konulardaki soru sayısı arttıkça, yoklanan davranışlar çeşitlendikçe testin örnekleyiciliği artar (Temel, 2010).

2.3.4.6. Ayırt Edicilik

Sorular, ölçülecek davranışlara sahip olanlarla olmayanları ayıracak nitelikte olmalıdır. Sorular, bilen öğrenci ile bilmeyeni, az bilen ile yanlış öğrenmiş olanı ayırabilmelidir (Temel, 2010).

Benzer Belgeler