• Sonuç bulunamadı

Bulguları genel olarak özetlemek gerekirse, ayrı ayrı yapılan analizde en fazla dört olmak üzere belirlenen uyumsuz elemanların olduğu ve bir bütün olarak alınan analizde bu durum düzelmiş ve hiç uyumsuz eleman belirlenmemiştir. Bu konu ile ilgili olarak Luzn ve Linacre (1998), puanlayıcılar arasında uyumsuz öğrencilerin performansı konusunda uyumsuzlukları gösterebileceğini belirtmişlerdir. Başka bir deyişle, analizlerde belirlenen uyumsuz kişilerin gözlenen yazma başarısı değerlendiren kişiler bağlı olarak büyük ölçüde farklılaşabilir.

Puanlama kategorilerinde ise “yazım” kategorisinin en cömert puanlanan kategori olması Matsuno (2006) tarafından çalışmasıyla desteklenmektedir. Karakaya (2015) çalışmasında bu durumu yazıların dışsal özelliklerine değerlendirme sırasında çok önem verilmemesiyle açıklamıştır. Aynı şekilde “anlatım (word choice)” kategorisinin en katı puanlanan kategori olmasına bazı çalışmalarda da rastlanılmıştır (Alharby, 2006; Matsuno, 2006 ve Schaefer, 2008; Lumley ve Mcnamara, 1995). Bunun nedeni “anlatım” kategorisinin, “yazım” kategorisinden daha soyut olması olabilir. Ayrıca anlatım kategorisi kişinin bilgi birikimi ve dildeki okuma düzeyine göre değişebilir. Farklı puanlayıcılar çalışmanın yapıldığı dilde farklı anlatım tarzlarına sahip olabilirler ve bir puanlayıcı için güzel olabilecek bir anlatım diğer bir puanlayıcı için sığ ve yetersiz kalabilir. Ayrıca Matsuno (2006) çalışmasında bu yüzeyle ilgili olarak farklı bir boyut olması açısından aynı katılık düzeyinde olan

kategorilerin istatistiksel olarak gereksiz olabileceğini belirtmiştir. Fakat yaptığı çalışmada aynı değerde çıkan kategorilerin uyum içi ve uyum dışı istatistikleri istenilen aralıkta olduğundan ve her kategorinin ölçmesi gereken farklı bir bilgi olduğundan bu kategorilerin gerekliliğine karar verilmiştir. Aynı şekilde çalışmadaki kategorilerden bazıları aynı düzeyde zorlukta olmasına rağmen yüzeydeki diğer elemanlarla uyum içinde olması ve mantıksal olarak farklı bilgiler ölçmelerinden dolayı çıkarılmamıştır.

Puanlayıcı türü katılıkları hakkında ayrı ayrı yapılan analizlerde tüm analizlerde öz puanlayıcıların daha cömert oldukları görülmektedir. Öz değerlendirme puanlarının akranlara göre daha cömert olduğu sonucu bazı araştırmalar (Farrokhi, Esfandiari ve Dalili, 2011; Farrokhi, Esfandiari ve Schaefer, 2012; Karakaya, 2015; Lejk ve Wyvill, 2001; Topping, 2003) tarafından desteklenmektedir. Farrokhi, Esfandiari ve Schaefer (2012) çalışmalarında öz, akran ve öğretmen puanlamaları karşılaştırıldığında, öğrencilerin akranlarını kendilerini puanlamalarına göre daha yanlı ve katı puanladıklarını belirtmişlerdir. Bir bütün olarak alınan, ikinci ve üçüncü analizlerde akran ve öğretmen yaklaşık olarak aynı düzeyde katılığa sahipken, birinci analizde akranların öğretmenlere göre daha esnek puanlama yaptıkları söylenebilir. Akran değerlendirmelerinin öğretmen değerlendirmeler göre daha esnek olduğu sonucu alan yazında Farrokhi, Esfandiari ve Dalili (2011), Farrokhi, Esfandiari ve Schaefer (2012) tarafından desteklenirken, Karakaya (2015) çalışmasında akran değerlendirmelerinin öğretmenlere göre daha katı olduğunu belirtmiştir. Öz, akran ve öğretmen puanları arasında birinci analizde geniş olan aralıkların uygulamalar ilerledikçe daraldığı ve tüm puanlayıcı türleri orta düzeyde ve birbirlerine yakın hale geldiği gözlemlenmiştir. Bağcı-Kılıç ve Çakan (2007) çalışmalarında benzer bir sonuca rastlamışlardır. Bu da puanlayıcıların zamanla sürece alıştıkları ve daha tutarlı puanlamalara ulaştıkları şeklinde yorumlanabilir. Yani yapılan bilgilendirmelerin ve pratiklerin puanlama türlerinde bir tutarlığa ve olumlu etkiye yol açtığı kanısına varılabilir. Analizlerde ki-kare değerleri yüzeyler içinde yer alan elemanlar arasındaki değişimlerin istatistiksel olarak anlamlı olup olmadığını göstermekte ve genel olarak her yüzeyde ki- kare değeri anlamlı bulunmaktadır. Bu da öğrenci, kategori ve görev yüzeyleri için istenilen bir durumken, puanlayıcı türünde öz, akran ve öğretmen puanları arasında istatistiksel olarak anlamlı olan farklılıklar olduğunu, bunun da değerlendirmenin güvenirliğini negatif yönde etkileyebileceği şeklinde yorumlanabilir. Güvenirlik katsayı Rasch ölçme modelinin öğrenci performansını, kategorilerin puanlanma durumlarını ve puanlayıcı türlerinin katılıklarını ne kadar güvenilir olarak ayırdığını göstermektedir (Akın

ve Baştürk, 2012). Fakat analizlere bakıldığında yine önemli bir indeks olan ve Cronbach alpha katsayısına eş değer nitelikteki güvenirlik değerlerinin puanlayıcı türü yüzeyinde gayet yüksek olduğu görülmektedir. Yapılan bu çalışmada güvenirlik değerlerinin yüksek olması analizin ortaokullardaki yazma becerilerinin değerlendirilmesinde öz, akran ve öğretmen puanları hakkında önemli bilgiler sağlayabileceği şeklinde yorumlanabilir. Güvenirlik katsayısının yüksek olmasına rağmen ki-kare değeri anlamlı olduğundan değerlendirmelerin istatistiksel olarak anlamlı farklılaştığı durumlarda Karakaya (2015) puanlayıcıların bu uygulamalar ve DPA’lar konusunda eğitilebileceklerini ve öz, akran değerlendirme uygulamalarına sınıflarda daha fazla önem verilebileceğini önermiştir. Buna ek olarak Sluijsman ve Moerkerke (1999) de öz ve akran değerlendirmelerinde yüksek bir performans elde etmek için eğitimlerin gerekli olduğunu belirtmiştir. Bu çalışmada da her hafta yapılan eğitimler ve uygulamalarla bu durum kapatılmaya çalışılmıştır. Fakat ki kare değerlerinin anlamlı olması uygulama süresinin bir eğitim dönemiyle kısıtlı olmasından kaynaklanıyor olabilir.

Ayrı yapılan analizler ve bir bütün olarak alınan analizde, öz ve akran değerlendirmelerin süreci başına göre daha katı düzeye gelerek, öğretmenlere ve dolayısıyla orta düzeye yaklaşmaları puanlayıcılar arası uyum ve güvenirliği arttırmasını sağlamıştır. Verilen eğitimler ve sınıfta toplu yapılarak uygulamalar da bu duruma katkı sağlamış olabilir yorumu yapılabilirken, süreç içerisinde her hafta yapılan tekrarların ve öğrencilerin değerlendirme ölçütlerine daha dikkat ederek yaptıkları çalışmaların yol açmış olabileceği söylenilebilir. Ayrıca yapılan analizlerde birinci ve ikinci hafta uygulanan görevin aynı zorlukta olduğu, fakat üçüncü haftaki görevin daha kolay olduğu görülmektedir. Bu da aynı şekilde öğrencilerin süreçteki gelişimleri ile yorumlanabileceği gibi yazma becerisi ne kadar karmaşık bir beceri de olsa, dereceli puanlama anahtarına ve görevlere alışma ve fazla pratik yapma ile de açıklanabilir. Bu sonucu, Eckes (2008) “Puanlayıcılar ne kadar iyi eğitilirse, puanlayıcılar arası güvenirlik o kadar yükselecektir.” görüşü ile doğrulamaktadır. Bu sonuçlardan yola çıkarak öz ve akran değerlendirme uygulamalarının eğitimler verildiğinde öğretmen puanlamaları kadar etkili olduğu söylenebilir. Baştürk (2008) çalışmasında akran değerlendirmenin üç sebepten daha iyi olduğunu belirtmiştir. Sebeplere bakıldığında birincisi öğrencilerin puanlama ölçütlerinden istenilen seviyeyi kavraması ve öğrenciler ne kadar fazla puanlama yaparlarsa, o kadar fazla doğru değerlendirmelerde bulunacaklarını anlamalarıyken, ikincisi ise sınıfta sürekli bir değerlendirme ve uygulama döngüsü olduğundan, sürekli olarak sınıf içi aktivitelere

adapte olmalarıdır. Yani iki görev (değerlendirme ve bu çalışma için kompozisyon yazma) öğrencilerin sınıf aktivitelerine aktif bir şekilde katılmalarını sağlamıştır. Son olarak, puanlamalar gerçek sınıf ortamlarında gerçekleştiğinden, öğrenciler içeriksel ve konuyla bağlantılı olarak nasıl daha iyi kompozisyon yazabileceklerini öğrenebilirler. Öğrenciler kompozisyonlarını ne kadar iyi organize ederlerse, değerlendirmelerin üzerlerindeki etkilerinin o kadar fazla olacağını bilirler (Baştürk, 2008). Bu şekli ile öz ve akran değerlendirme uygulamaları aynı zamanda öğretim materyali olarak da düşünülebilirler (Lindblom-Ylänne, Pihlajamäki ve Kotkas, 2006).

Benzer Belgeler