EĞİTİMDE ÖLÇME VE DEĞERLENDİRME

(1)

EĞİTİMDE ÖLÇME VE DEĞERLENDİRME DERSİ NOTU

9. HAFTA

(2)

ÖLÇMENİN STANDART HATASI

▪ Ölçülen özelliğin gerçek değerine G, ölçme sonuçlarına Ö ve ölçmenin standart hatasına Se olarak alınırsa,

G=Ö± Se

Burada,

𝑺 _𝒆 = 𝒔 𝟏 − 𝒓

Se : Ölçmenin standart hatası

(3)

• Güvenirlik ile standart hata ters orantılıdır.

• %68 olasılık, G=Ö± 1Se

• %95 olasılık, G=Ö± 2Se

• %99 olasılık, G=Ö± 3Se

Örnek: Ölçme hatası 5 olan bir testte, ölçülen test puanı 60 olan bir öğrencinin gerçek puanını %68, %95 ve %99 olasılıkla tahmin edersek gerçek puan hangi aralıklarda olur?

• %68 olasılıkla 60-(1x5) ve 60+(1x5) yani 55 ve 65 arasında

(4)

Güvenirliği Artırmak için Ne Yapılmalı?

➢ Testteki soru sayısını artırmak

➢ Şans başarısını azaltmak

➢ Sorular açık ve anlaşılır olmalı

➢ Öğrenci seviyesine göre soruyu sormak

➢ Teste kolay sorularla başlamak

➢ Sınav koşullarının tüm öğrencilere eşit olması

➢ Tüm öğrencilere yeterli zaman verilmesi

➢ Sınav sorularının orta güçlükte olması

(5)

GEÇERLİK

➢ Geçerlik, testin son derece önemli bir özelliğidir. Bir testin ölçmek istediğini ne ölçüde ölçtüğü, geçerlik olarak adlandırılır.

Başka bir ifadeyle, bir testin amacını gerçekleştirme derecesine testin geçerliği denir.

➢ Eğer bir test geçerli değilse, o test üzerinden elde edilen veriler, amacına uygun sonuçlar vermez.

(6)

➢ Geçerlik, testin değil, test sonuçlarının karakteristik özelliğidir.

Bir testin geçerliği hakkında yüksek geçerli, çok az geçerli veya normal olarak geçerli olduğu şeklinde ifadeler kullanılabilir.

Fakat, bir test hiçbir zaman tam olarak geçerli veya tamamen geçersiz olamaz.

(7)

➢ Bir araştırmacı, yapacağı geçerlik çalışması ile, kullanılan ölçme aracıyla hangi özelliğin ölçüleceği, toplanan verilerin ölçülecek özellikleri açıklama konusunda yeterli olup olmadığı gibi birtakım sorulara cevap aramaktadır (Baykul, 2000; Turgut ve Baykul, 2015).

Geçerlik türleri temel olarak dört grup altında ele alınmaktadır.

❖ Kapsam Geçerliği

(8)

1. Kapsam Geçerliği

➢ Kapsam geçerliği, ölçme aracının ölçülecek değişkene göre olması gereken tüm içeriği uygun şekilde karşılayıp karşılamadığına bakar.

➢ Kapsam geçerliği belirlenirken, öncelikle alan uzmanlarından test ile ölçülmek istenen konuların dağılımının yer aldığı belirtke tablosu olarak adlandırılan bir tablo ile test maddelerinin karşılaştırmaları ve kapsama derecesini (her bir madde için Likert tipi bir ölçekle bu bilgi uzmanlardan alınabilir) belirtmeleri

(9)

Belirtke Tablosu Örneği

(10)

➢ Ayrıca, eğer araştırmacı, aynı konuları içeren ve kapsam geçerliği daha önce belirlenmiş bir teste sahipse, bu teste dayanarak yeni geliştireceği bir testin geçerliğini belirleyebilir.

Bunun için araştırmacının tek yapması gereken bu iki testi cevaplayıcılara (öğrencilere, araştırma örneklemine, katılımcılara) uygulamaktır. Yapılan bu iki uygulama arasında elde edilen korelasyon yeni geliştirilen testin kapsam geçerliğinin derecesini verir (Tan, 2016; Baykul, 2000; Crocker ve Algina, 2000).

(11)

2. Ölçüt Dayanaklı Geçerlik

➢ Ölçüt dayanaklı geçerlik, üzerinde çalışılan ve geçerliği

belirsiz olan, yeni ve daha kullanışlı olduğu öne sürülen

bir ölçme aracının, güvenirliği ve geçerliği iyi olduğu

ispatlanmış bir ölçme aracıyla yakın sonuçlar verip

vermediğine göre yorumlanması temeline

dayanmaktadır.

(12)

➢ Burada geçerliği ispatlanmış olan bir test, ölçüt olarak kabul edilerek, geçerliği tartışılan ve aynı değişkeni ölçmeyi amaçlayan yeni önerilen bir testten alınan puanlar ile arasındaki korelasyon katsayısı hesaplanır ve bu katsayı ölçüt dayanaklı geçerliği kontrol etmek için kullanılır (Tan, 2016; Baykul, 2000).

➢ Ölçüt dayanaklı geçerlik uygunluk geçerliği ve kestirim (yordama) geçerliği olarak ikiye ayrılmaktadır.

(13)

➢ Geçerlik yöntemleri arasında bir geçerlik katsayısı veren tek yöntem ölçüt dayanaklı geçerliktir

➢ Bir ölçüte dayalı geçerlik, ölçütün elde edildiği zamana göre uygunluk geçerliği ve kestirim (yordama) geçerliği olmak üzere ikiye ayrılır.

Uygunluk Geçerliği,

Uygunluk geçerliği, yeni geliştirilecek bir testin, aynı özelliği

(14)

Kestirim (Yordama) Geçerliği,

Kestirim (yordama), çoklu regresyon analizi gibi bazı

istatistiksel yöntemler kullanılarak bilinenlerden hareketle

bilinmeyen durumlar ile ilgili yapılan öngörüdür. Kestirim

(yordama) geçerliği ise bir ölçme aracının gelecekteki

performansı ve başarıyı kestirme derecesidir.

(15)

3. Yapı Geçerliği

➢ Sosyal bilimler alanında ve özellikle psikometri alanında, kapsam ve ölçüt dayanaklı geçerlik yöntemleri karmaşık latent (gizli) yapıların çoğunda yeterli değildir. Bu tür karmaşık yapıların örnekleri arasında zeka, kişilik, yaratıcılık, empati düzeyi, yetenek ve ruh hali bulunur. Bu yapılar birbirleriyle ilişkili olabileceği düşünülen başka alt yapıların birleşimi ile oluşur.

(16)

➢ Bir ölçme aracıyla ilgili yapı geçerliğinin varlığından bahsedilebilmesi için, maddelerin birbirleriyle ilişkili olması gerekmektedir.

➢ Cronbach ve Meehl (1955), yapı geçerliği kavramının altında yatan argümanı birçok açıdan araştırmışlardır. Ölçme aracının yapı geçerliğinin belirlenmesinde, açıklayıcı faktör analizi, doğrulayıcı faktör analizi, yapısal eşitlik modeli gibi yöntemler tercih edilmektedir (Tan, 2016).

(17)

4. Görünüş Geçerliği

Bir testin, ölçmek istediği özelliği hangi derecede ölçüyor göründüğüdür.

Örneğin, kapağında eğitim istatistiği yazan bir testin eğer içindeki sorular da eğitim istatistiği soruları ise testin görünüş geçerliği vardır.

(18)

Eğitimde Kullanılan Ölçme Araçları

➢Yazılı Yoklamalar

➢Sözlü Sınavlar

➢Doğru-Yanlış Testleri

➢Çoktan Seçmeli Testler

➢Performans Değerlendirme

(19)

Yazılı Yoklamalar

➢ Soruların (Maddelerin) yazılı olarak verildiği ve öğrencilerin de yazılı olarak cevaplarını verdikleri sınav türüdür.

➢ Soru (madde) sayısı genellikle azdır (10’dan küçük).

➢ Hazırlanması kısa, puanlanması uzun sürer.

➢ Özellikle yoruma açık sorularda kesin doğru, kesin

(20)

➢ Yansız ve objektif puanlama yapmak zordur.

➢ Yazılı anlatımın gücü ve kompozisyon yazma becerilerinin ölçülmesinde yaygın bir şekilde kullanılır.

➢ Yazılı sınavlarda şans başarısı yoktur.

(21)

Yazılı Yoklamada Kullanılan Soru(Madde) Tipleri

➢Kısa Cevaplı Sorular (Maddeler): Cevapları kısa ve sınırlı olan sorulardır.

➢Uzun Cevaplı Sorular (Maddeler): Cevaplamada sınır olmayan uzun ve üst düzey becerileri ölçen sorulardır.

➢Zorunlu Cevaplı Sorular (Maddeler): Cevaplanması

(22)

Yazılı Sınav Çeşitleri

➢ Klasik Yazılı Sınavlar: Bilginin yanında üst düzey davranışları da ölçebilmek için hazırlanan cevabı uzun olan sorular içeren sınavlardır.

➢ Tercihli Sınavlar: İçerisinde tercihli maddelerin bulunduğu sınavlardır.

➢ Kura Sınavları: Sınava giren öğrencilere kura çekerek soruların dağıtılması şeklinde uygulanan sınavlardır.

➢ Açık Kitap Sınavları: Öğrencilerin sınav sorularını cevaplarken

(23)

Yazılı Sınav Sorularının Hazırlanması

➢ Soruların geneli için bir yönerge hazırlanmalıdır.

➢ Yönergeler açık ve anlaşılır olmalıdır.

➢ Her bir sorunun cevaplanması diğer sorulardan bağımsız olmalıdır.

➢ Cevabı genel ve uzun olan az sayıda soru yerine kısa ve cevabı sınırlandırılmış çok soru sorulmalıdır.

➢ Maddelerde ifade ve yazım hatası bulunmamalıdır.

➢ Maddelerin dağılımı zorluk ve kolaylık bakımından dengelenmeli

(24)

Yazılı Sınavların Puanlanması

➢ Puanlamanın sorudan soruya ve öğrenciden öğrenciye değişmesi ölçüm sonucuna hata karışmasına neden olur.

➢ Öğrencilerin isimleri kapatılarak yanlılık önlenir.

➢ Yazı güzelliği, anlatım gücü gibi değişkenlere puan verilmemelidir.

➢ Kağıtlar okunduktan sonra karıştırılarak yeniden bir okuma yapılmalıdır.

➢ Öğrencilerin kağıtlarının önce “iyi,orta,zayıf” gibi sınıflara ayrılması sonra da bu sınıflardaki kağıtların kendi içinde puanlanması

şeklinde uygulanır.

(25)

Rubrik (Dereceli Puanlama Anahtarı)

Açık uçlu madde türlerinin puanlanmasındaki sübjektiflik etkisi dereceli puanlama anahtarı kullanılarak en aza indirilmeye çalışılır.

Örnek: Soru (madde): İstatistik nedir? Varyans hesaplama yöntemleri nelerdir? (16puan)

(26)

Sözlü Sınavlar

➢ Sınav sorularının yazılı veya sözlü sorulduğu, öğrencilerin cevaplarını ise her zaman sözlü olarak verdikleri sınavlardır. Genel özellikleri bakımından yazılı yoklamalara benzer.

➢ Okuma-yazma becerilerine sahip olmayan ya da okuma-yazma gerektiren sınavların yapılabileceği kadar okuma-yazma

becerilerinin gelişmemiş olduğu okul öncesi ve ilköğretimin ilk yıllarında sözlü sınav yapılabilir.

➢ Ana dilin ve yabancı dilin sözlü olarak ölçülmesi istendiğinde sözlü

(27)

Sözlü Sınavların Özellikleri

➢ Sözlü uygulamalarında öğrencilerin kılık-kıyafeti, ses tonu ve fiziksel hareketleri gibi ölçme dışı özelliklere puan verilmesi geçerliği

düşürür.

➢ Sözlü sınavlarda aynı soruların sınıfta o soruları duymuş olan sorulması geçerliği düşürür.

➢ Sınav kaygısı yüksektir. Geçerliği düşürür.

➢ Kopya çekme olasılığı yok denecek kadar azdır.

➢ Uygulaması zaman alır.

(28)

Kısa Cevaplı Sorular

Öğrencilerin bir kelime, bir sembol, bir sayı ya da kısa bir cümle ile cevap verebildikleri sorulardır.

İki tip soru kullanılır:

❖ Soru biçiminde olanlar

❖ Boşluk doldurmalı olanlar

Genellikle Bilgi, kavrama, uygulama basamağı davranışlarının ölçülmesinde kullanılırlar.

(29)

Kısa Cevaplı Testlerin

Avantaj ve Dezavantajları

Avantajlar Dezavantajlar

(30)

Doğru-Yanlış Testleri

➢Doğru yanlış türündeki sorular için kullanılır. Her iki seçeneği seçme olasılığı %50’dir.

➢Eğitimin tüm basamaklarında uygulanabilir.

➢Bilgi düzeyindeki öğrenmeleri test etmek için kullanılır.

➢Bir sınavda çok sayıda doğru-yanlış maddesi

sorulabildiği için sınavın geçerliğini yükseltir.

(31)

➢Objektif puanlanabildiğinden, puanlama güvenirliği yüksektir.

➢Hazırlanması ve puanlanması kolay olduğundan kullanışlıdır.

➢Her maddede bir davranışı ölçecek biçimde bir tek fikir verilmelidir.

➢Doğru-yanlış ifadeler ders kaynağından aynen

(32)

Doğru-Yanlış Testlerinin Avantaj ve Dezavantajları

(33)

Çoktan Seçmeli Testler

➢Çoktan seçmeli testlerde, öğrenciye soru sorulur ve bu sorunun cevabını verilen seçenekler arasından seçmesi istenir.

➢Bilgi, kavrama, uygulama, analiz ve

değerlendirme basamağındaki davranışların

ölçülmesinde geçerli ölçmeler yapılabilir.

(34)

➢ Sınav süresinin çoğu sorunun okunarak cevabın bulunması ve işaretlenmesi için kullanılır.

➢ Yazı güzelliği ve kağıt düzeni vs. özelliklerin puanlamaya karışma ihtimali yoktur.

➢ Puanlama yanlılığı olmadığı için geçerliği yüksektir.

➢ Bir çoktan seçmeli testte çok soru sorulabileceği için

duyarlılığı (dolayısıyla güvenirliği) yüksek ölçmeler

yapılır ve

(35)

Çoktan Seçmeli Test Soruları Hazırlanırken Önemli Hususlar

➢ Seçeneklerde kullanılan rakamlar seçenekler arasında büyükten küçüğe doğru veya küçükten büyüğe doğru sıralanmalıdır.

➢ Soruyu olumsuz yapan ifadenin ya da “en iyi”, “en çok” gibi ifadelerin altı çizilmeli ya da koyu yazılmalıdır.

➢ Seçeneklerde birbirinin tersi olan ifadeler kullanılmamalıdır.

➢ Testteki tüm soruların seçenek sayıları eşit olmalıdır.

➢ Çeldiriciler soruyu bilmeyenleri yanıltmalı, bilenleri

(36)

➢Kolay olduğunu düşündüğünüz soruları testin ilk soruları olarak oluşturunuz.

➢Doğru cevaplar seçeneklere yaklaşık olarak aynı sayıda dağıtılmalıdır.

➢Aynı seçeneğin doğru olması durumu ardı ardına 3 defadan fazla olmamalıdır.

➢Testin doğru cevap anahtarı kurallı bir sırada (Örneğin,

AAABBBCCDDEE gibi) olmamalıdır.

(37)

Çoktan Seçmeli Testlerinin Avantaj ve Dezavantajları

(38)

Yararlanılan Kaynaklar

Airasian, P. (1994). Classroom assessment, Second edition, NY: McGraw-Hill.

APA, American Psychological Association. (1995). Standards for educational and psychological testing.Washington, D. C.: Author.

Atılgan, H., Doğan, N., Kan,A. (2014). Eğitimde Ölçme ve Değerlendirme (Ed. Hakan Atılgan).

Ankara: Anı Yayıncılık.

Baykul, Y. (1999). İstatistik Metotlar ve Uygulamaları. Ankara: Anı Yayıncılık.

Baykul, Y. (2000). Eğitimde ve Psikolojide Ölçme: Klasik Test Teorisi ve Uygulaması. Ankara:

OSYM.

Brown, F. (1983). Principles of educational and psychological testing, Third edition, NY: Holt Rinehart, Winston.

Büyüköztürk, Ş., Akgün, Ö.E., Karadeniz, Ş., Demirel, F., Kılıç, E. (2014). Bilimsel Araştırma Yöntemleri. Ankara: Pegem Akademi Yayıncılık.

Fraenkel,j.L., Wallen, N. (2009). How to Design and Evaluate Research in Education (7th Edt.) New York: McGraw-Hill.

Komisyon (2016). Pedagojik Formasyon için Ölçme ve Değerlendirme. 2. Baskı.Anı Yayıncılık.

Tan, Ş. (2016).Öğretimde Ölçme ve Değerlendirme. 12.Baskı. Pegem Akademi.

Turgut, F. (1995). Eğitimde Ölçme ve Değerlendirme Metotları. Ankara:Nüve Matbaası.

EĞİTİMDE ÖLÇME VE DEĞERLENDİRME