• Sonuç bulunamadı

2.2. Eğitimde Ölçme ve Değerlendirme

2.2.3. Ölçme Aracında Bulunması Gereken Nitelikler

2.2.3.1. Geçerlik

Bir ölçme aracının, ölçmeyi amaçladığı özelliği, başka herhangi bir özellikle karıştırmadan, doğru olarak ölçebilme derecesi geçerlilik olarak tanımlanabilir (Demirel, 2002). Geçerlilik, ölçme aracının kullanılış amacına hizmet etme derecesidir.

Eğitimde, psikomotor beceriler dışındaki öğrenmeleri doğrudan ölçme olanağı yoktur. Eğitimde kullanılan testler ile ya öğrencilerin bazı psikomotor becerilerinin, ya onların bazı bilişsel güçlerinin, ya da onların ilgi tutum gibi bazı duyuşsal özelliklerinin ölçülmesine çalışılır. Psikomotor beceriler ölçülecekse, testte bu becerileri oluşturan hareketler ile bunlar arasındaki uyumun gözlenmesine çalışılır. Bilişsel güçler ölçülecekse, bu yeterliklere sahip olmayı belirleyen bazı davranışların gözlenmesine çalışılır. Duyuşsal özellikler ölçülecekse bu kez de, bu özelliklerin varlığına işaret sayılabilecek davranışlara bakılır. Öğrenciler böyle hareketleri yapma veya bu davranışları gösterme durumunda bırakılır ve onların bu hareket veya davranışları yapıp yapmadıklarına bakılır (Özçelik, 1997).

Geçerliliğin farklı anlamları da vardır, başka bir ifadeyle farklı geçerlikler vardır. Bunlar; kapsam geçerliği, yordama geçerliği, uygunluk geçerliği, yapı geçerliği ve görünüş geçerliğidir.

2.2.3.1.1. Kapsam Geçerliği

Ölçme aracının, ölçülmek istenen davranışlar kümesinin tamamını ölçüp ölçemediğidir. Örneğin, bir ölçme aracı, ölçülmesi plânlanan davranışlardan bazılarını ölçmüyorsa veya ölçülmek istenen davranışları ölçüyor, fakat bunların dışında başka davranışları da ölçüyorsa bu aracın kapsam geçerliği düşüktür. Ölçme aracının bir

konudaki davranışların tamamını kapsayıp kapsamayacağı, ölçmenin kullanılış amacına bağlıdır. Ölçme sonuçları, programı veya öğretimi değerlendirme veya öğrenme eksiklerini saptama amacıyla kullanılacaksa konuyla ilgili tüm davranışları; öğrenci başarısını değerlendirme amacıyla kullanılacaksa, önemli görülerek seçilen davranışları kapsamak durumundadır. Ölçme aracının kapsam geçerliğinin sağlanması için belirtke tablosu hazırlanır.

Kapsam geçerliği, bir bütün olarak testin ve testteki her bir maddenin amaca ne derece hizmet ettiğidir, o testteki toplam maddelerin ölçülecek davranışı ve konu içeriğini örnekleme derecesine ve testteki her bir maddenin ölçmek istediği davranışı ne derece iyi ölçtüğüne bağlıdır. Bir dersteki başarıyı ölçmek için düzenlenen bir testin, o dersin hedeflerini ve içeriğini yeterlice kapsayıp kapsamadığı önemli bir sorundur (Tekin, 2007). Bir testin kapsam geçerliğini sağlamak çok zor ve zahmetli bir süreçtir. Bununla birlikte kapsam geçerliği diğer geçerlilik türleri ile karsılaştırıldığında en önemli geçerlik türüdür (Demircioğlu, 2007).

2.2.3.1.2. Yordama Geçerliği

Yordama, bir tahmindir. İstatistiksel teknikler kullanılarak ve bilinenlerden yararlanılarak bilinmeyen durumlar hakkında yapılan geleceğe yönelik tahminlerde bulunma işlemidir (Tekin, 2007). Bir tahminin yordama olabilmesi için, geleceğe dönük olması ve belli bilgiler temelinde bazı teknikler kullanılarak yapılmış olması gerekir.

Eğitimde yordama, bir öğrencinin ya da öğrenci grubunun gelecekte ne düzeyde başarılı olacağını tahmin etmek için kullanılır (Demircioğlu, 2007). Genellikle öğrencilerin belli bir programa alınmaları, onların belli bir testten aldıkları notlara bakarak karara bağlanır.

2.2.3.1.3. Yapı Geçerliği

Yapı, birbiriyle ilgili olduğu düşünülen belli öğelerin ya da öğeler arasındaki ilişkilerin oluşturduğu bir örüntüdür. Psikolojide, yapı sözcüğü; atılganlık, güvensizlik, içe dönüklük, dışa dönüklük gibi tanımlanabilir belli kişilik özellikleri için kullanılır. Bu özelliklerin ölçülmesi için araç geliştirmede tutulan yollardan birisi, önce söz konusu özellik ya da özelikleri belirlemek, yani yapıyı tanımlamak; sonra da tanımlanmış yapıdan sınanabilir denenceler çıkarmak ve çıkarılan denenceleri sınamak için deneysel ve istatistiksel çalışmalar yapmaktır. Eğitimde de sıkça söz konusu edilen ve ölçülmeye çalışılan bazı özellik ya da değişkenler vardır ki, aslında onlar da birer kavramsal yapıdır.

Yapı geçerliliği için; bir testte yer alan her madde, testin bütün ile ilişkili olmalıdır. Testin tamamı ile bir bütünlük içinde bulunmalıdır. Testin ölçmeyi hedeflediği amaçlardan en az bir tanesi ile ilişkili olmalıdır. Testin bütününün amacından bağımsız bir madde olmamalıdır (Yılmaz, 2004).

2.2.3.1.4. Görünüş Geçerliği

Görünüş geçerliği, bir testin gerçekten ne ölçtüğüyle değil, onun ne ölçüyor göründüğüyle ilgilidir. Adından da anlaşılacağı gibi, bir testin görünüşte neyi ölçüyor göründüğü ile ilgilidir. Testin bütünü için söz konusu edilen görünüş geçerliği, testteki her bir soru için de söz konusudur. Testteki her bir soru da, görünüş geçerliğine sahip olmak için, ölçmek istediği şeyi ölçüyor görünmelidir (Tekin, 2007).

2.2.3.2. Güvenirlik

Güvenirlik, aynı şeyin bağımsız ölçümleri arasındaki kararlılıktır; ölçülmek istenen belli bir şeyin, sürekli olarak aynı sembolleri almasıdır; aynı süreçlerin izlenmesi ve aynı ölçütlerin kullanılması ile aynı sonuçların alınmasıdır; ölçmenin, tesadüfî yanılgılardan arınık olmasıdır (Karasar, 2004).

Öncü’ye (2004) göre ölçeğin taşıması gereken özelliklerden birisi olan güvenirlik, bir ölçme aracıyla aynı koşullarda tekrarlanan ölçümlerde elde edilen ölçüm değerlerinin kararlılığının bir göstergesidir.

Bir ölçme aracı neyi ölçüyorsa ya da neyi ölçmek için hazırlanmışsa onu kararlı bir şekilde ölçmelidir. Buna ölçme aracının güvenirliği denir. Güvenirlik, yapılan ölçmelerin hatalardan arınıklık derecesidir. Güvenilir bir ölçme aracı, aynı özellikle ilgili olarak arka arkaya yapılan ölçmelerde yaklaşık olarak aynı sayısal sonucu verir. Güvenilir, bir test, aynı gruba iki ya da üç kez uygulandığında, gruptaki her bir kişi, bütün uygulamalarda yaklaşık olarak aynı puanı almalıdır (Tekin, 2007).

“Ölçme aracının duyarlı, tutarlı ve kararlı sonuçlar vermesi güvenirliğin bir göstergesidir.” (Demircioğlu, 2007). Gay (1985) ise güvenilir olmayan bir ölçeğin kullanışsız olduğu düşüncesindedir.

Ölçme araçlarının güvenirlik düzeylerini belirlemek için farklı yöntemler kullanılır.

Eğitim bilimlerinde kullanılan yöntemlerin en önemlileri şunlardır:

1. Test Tekrarı Yöntemi (Test-Tekrar Test Yöntemi) 2. Eşdeğer Formlar Yöntemi (Paralel Testler Yöntemi) 3. Testi Yarılama Yöntemi

4. Kuder-Richardson (KR-20 ve KR-21) Yöntemi

2.2.3.2.1. Test Tekrarı Yöntemi

Testin tekrarı yöntemi, bir ölçme aracının aynı denek grubuna aynı koşullarda, önemli derecede hatırlamaları önleyecek kadar uzun, fakat ölçülecek özellikte önemli değişmeler olmasına izin vermeyecek kadar kısa bir zaman aralığında iki kez uygulanmasıdır (Özçelik,1981). İki uygulamadan elde edilen ölçüm değerleri korelasyon katsayısı ölçeğin güvenirlik katsayısıdır (Bruning ve Kintz, 1983).

2.2.3.2.2. Eşdeğer Formlar Yöntemi

Paralel formlar yönteminde aynı davranış kalıplarını temsil edebilecek farklı maddeler örneklenerek iki eşdeğer form oluşturulmaktadır (Gay,1985). İki formun eşdeğer olabilmesi için, formların kapsamlarının, yapısının, zorluk derecesinin, talimatların, puanlamanın, madde sayısının ve yorumlamanın aynı olması gerekir. Eşdeğer iki form aralıksız olarak aynı anda ya da aralıklı olarak farklı iki zamanda uygulanır. Formlar arasındaki korelasyon hesaplanır ve güvenirlik katsayısı olarak yorumlanır (Öncü, 1994).

2.2.3.2.3. Testi Yarılama Yöntemi

Yöntem, formu iki eş parçaya bölerek, iki yarının deneklere aynı anda uygulanması sonrası, deneklerin yarılardan aldıkları puanlar arasındaki korelasyon ile güvenirlik tahmini yapılmasını sağlar (Carmines ve Zeller, 1982).

2.2.3.2.4. Kuder-Richardson (KR-20 ve KR-21) Yöntemi

İçsel tutarlılığın güvenirliğini belirlemek için en sık kullanılan yöntemlerden birisi de Kuder-Richardson yaklaşımıdır (Gürsakal, 2001). Yöntem tüm maddelerin birbirleriyle ve ölçeğin tamamıyla iç tutarlılığını tahmin etme amacı üzerine kuruludur (Gay, 1985). Bu nedenle yöntem, ölçekteki tüm maddelerin aynı değişkeni ölçtüğü varsayımına dayanır (Öncü,1994). Yöntemin uygulanmasında veri seti, ölçekteki maddelerden alınan cevaplar istenilen özelliği taşıyorsa “1” puan, istenilen özelliği taşımıyorsa veya boş bırakılmışsa “0” puan verilerek oluşturulur. Bu yöntemle, iç tutarlılığa yönelik güvenirlik kestiriminde bulunmada belirli kriterler dikkate alınarak Kuder-Richardson 20 veya 21 formüllerinden uygun olanı kullanılır.

Benzer Belgeler