• Sonuç bulunamadı

KRİTER ESASLI TESTLERDE BULANIK MANTIK İLE ÖLÇÜM YÖNTEMİNİN UYARLAMALI BİLGİSAYAR TESTLERİNDE KULLANILMASI

N/A
N/A
Protected

Academic year: 2021

Share "KRİTER ESASLI TESTLERDE BULANIK MANTIK İLE ÖLÇÜM YÖNTEMİNİN UYARLAMALI BİLGİSAYAR TESTLERİNDE KULLANILMASI"

Copied!
106
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

T.C.

GAZİ ÜNİVERSİTESİ EĞİTİM BİLİMLERİ ENSTİTÜSÜ EĞİTİM BİLİMLERİ ANABİLİM DALI

KRİTER ESASLI TESTLERDE BULANIK MANTIK İLE

ÖLÇÜM YÖNTEMİNİN UYARLAMALI BİLGİSAYAR

TESTLERİNDE KULLANILMASI

DOKTORA TEZİ

Hazõrlayan ATİLA BOSTAN

(2)

T.C.

GAZİ ÜNİVERSİTESİ EĞİTİM BİLİMLERİ ENSTİTÜSÜ EĞİTİM BİLİMLERİ ANABİLİM DALI

KRİTER ESASLI TESTLERDE BULANIK MANTIK İLE

ÖLÇÜM YÖNTEMİNİN UYARLAMALI BİLGİSAYAR

TESTLERİNDE KULLANILMASI

DOKTORA TEZİ

Hazõrlayan Atila BOSTAN

Danõşman

Prof. Dr. Halil İbrahim YALIN

(3)

i

Atila BOSTAN’õn “Kriter Esaslõ Testlerde Bulanõk Mantõk İle Ölçüm Yönteminin Uyarlamalõ Bilgisayar Testlerinde Kullanõlmasõ” başlõklõ tezi 07 Kasõm 2007 tarihinde jürimiz tarafõndan Eğitim Bilimleri Anabilim Dalõnda Doktora tezi olarak kabul edilmiştir.

Adõ Soyadõ İmza

Üye : Prof.Dr. Hali İbrahim YALIN ……….

Üye : Prof.Dr. Hafize KESER ……….

Üye : Prof.Dr. Bilal GÜNEŞ ……….

Üye : Doç.Dr. Ahmet MAHİROĞLU ……….

(4)

ii ÖNSÖZ

Eğitim-öğretim süreçlerinde bilgisayar teknolojisinin sunduğu imkanlardan faydalanmak, bu süreçlerin hedeflerine daha kõsa sürede ve daha maliyet-etkin şekilde ulaşmasõnõ temin etmektedir. Eğitim-öğretim hayat döngüsünün ayrõlmaz bir parçasõnõ oluşturan ölçme sürecinin de bilgisayar teknolojisinden faydalanmasõ, ölçme işleminin daha maliyet-etkin olmasõnõ sağlayacaktõr. Ağõrlõklõ olarak öğrenci başarõsõnõn belirlenmesi, değerlendirilmesi ve yorumlanmasõnda kullanõlmakta olan bilgisayar işlem ve bilgi yönetim gücünden, son zamanlarda özellikle etkileşimli-uyarlamalõ bilgisayar testleri aracõlõğõ ile öğrenci başarõsõnõn ölçülmesinde de faydalanõlmaktadõr. Bu araştõrmada, uyarlamalõ bilgisayar testlerine bulanõk mantõk hesap yönteminin sağlayabileceği katkõ ve birden fazla kazanõmla ilişkili olan sorularõn uyarlamalõ testlerde etkin kullanõmõ incelenmiştir. Çalõşmanõn eğitim ölçmesi ve gelişen teknolojinin eğitimde kullanõlmasõna katkõda bulunmasõ umulmaktadõr.

Gerek tez öncesi ders aşamasõnda ve gerekse bu tezin hazõrlanmasõnda yakõn desteğini benden esirgemeyen Prof. Dr. Halil İbrahim YALIN’a, çalõşmalarõmda takõlõp kaldõğõm noktalarda her zaman farklõ bakõş açõlarõ getirerek araştõrmanõn devam etmesini destekleyen ve hedeflediğim amaçlara ulaşmamda sürekli rehberlik yapan Prof. Dr. Hafize KESER’e ve sorgulayõcõ kritik ve yorumlarõ ile bu araştõrmanõn olgunlaşmasõnõ sağlayan Doç.Dr.Ahmet MAHİROĞLU’na teşekkürlerimi sunarõm.

Ayrõca, araştõrma çalõşmalarõna ayõrdõğõm zaman için daima anlayõş gösteren, başta eşim Zeliha olmak üzere, kõzõm Seda ve oğlum Hakan’a şükranlarõmõ belirtir, bu eğitim programõnõ tamamlamamda ve araştõrmamõ sonuçlandõrmamda sürekli yanõmda hissettiğim destek için teşekkür ederim.

Atila BOSTAN

(5)

iii ÖZET

KRİTER ESASLI TESTLERDE BULANIK MANTIK İLE ÖLÇÜM YÖNTEMİNİN UYARLAMALI BİLGİSAYAR TESTLERİNDE

KULLANILMASI Bostan, Atila

Doktora, Eğitim Teknolojisi Bilim Dalõ Tez Danõşmanõ: Prof. Dr. Halil İbrahim YALIN

Ankara - 2007

Bu araştõrmada, öğrenci yeterliliklerinin belirlenmesinde bulanõk mantõk hesaplama yöntemi kullanõmõnõn kazanõm ölçmesine katkõsõ ve bu ölçme yönteminin uyarlamalõ bilgisayar testlerinde kullanõlabilirliği araştõrõlmõştõr. Ayrõca, birden fazla kazanõm ile ilişkili olan sorularõn öğrenci yeterliliği ölçmesine etkisi de incelenmiştir. İlköğretim yedinci sõnõf Fen Bilgisi ders müfredatõndan seçilen yedi adet kazanõmõn ölçülmesini hedefleyen sorular, öncelikle ilişkili olduklarõ kazanõmlar ile bulanõk değerlikler kullanõlarak eşleştirilmiş ve bu değerler öğrenci kazanõmõ ölçülmesinde kullanõlmõştõr. Araştõrma uygulamasõnda kontrol gruplu ön test-son test deneme modeli kullanõlmõştõr. Sorular öğrencilere, bu araştõrma için geliştirilen uyarlamalõ bilgisayar test uygulamasõ aracõlõğõ ile sorulmuştur. Uyarlamalõ bilgisayar test uygulamasõ, deney gruplarõndan birinde orta zorluk seviyesinden başlatõlmõş, diğer deney grubunda ise başlangõç zorluk seviyesi her öğrenci için kendisi tarafõndan belirlenmiştir. Bulanõk mantõk değerliklerinin netleştirilmesinde ise “En yüksek değer merkezi” ile “Ağõrlõk merkezi” yaklaşõmlarõ karşõlaştõrõlarak öğrenci kazanõm yeterliliği ölçülmesinde bu yaklaşõmlarõn uygunluğu yorumlanmõştõr.

Sonuç olarak; Özellikle otomatik sistemler aracõlõğõ ile kendi kendine öğrenme ve uzaktan öğretim tekniklerinde öğrenci kazanõmlarõnõn ölçülmesinde ve öğrenciye geri bildirim sağlanmasõnda etkin olarak kullanõlabileceği değerlendirilen uyarlamalõ testlerde, bulanõk mantõk değerliklerinin kullanõlmasõnõn mümkün olduğu, bu yöntemin soru bankasõ oluşturulmasõnda ve öğrenci başarõsõnõn yorumlanmasõnda uyarlamalõ test amaçlarõnõ desteklediği değerlendirilmiştir.

(6)

iv ABSTRACT

MEASUREMENT IN CRITERION BASED TESTS WITH UTILIZATION OF FUZZY LOGIC AND USAGE OF THIS METHODOLOGY IN COMPUTERIZED

ADAPTIVE TESTS BOSTAN, Atila

Doctorate Dissertation, Educational Technology Adviser: Prof. Dr. Halil İbrahim YALIN

Ankara 2007

In this research, the contribution of fuzzy logic calculation methodology in student achievement measurement process is studied and the employment of this measurement approach in computerized adaptive tests is researched. In addition, the effect of multi-achievement related questions on measurement is also addressed.

Initially, the questions which are designed to test the selected seven achievements from primary school seven grade curricula were coupled with the fuzzy values. Afterwards, these fuzzy values were used to compute the student achievement level. In this research application, Pretest-Posttest with Control Group experimental model was benefited as the research methodology. The questions were directed to the students by means of an adaptive software which had been explicitly coded for this research. Students in one of the experimental groups took the test beginning with medium difficulty level, while in the other group, students selected the difficulty level on their own appreciation at the beginning of the test. “Center Of The Maximum Value” and “Center of Gravity” approaches to the defuzzification of fuzzy values were tested and compared in student achievement measurement process. Consequently, using fuzzy logic in adaptive tests which were assessed to be used effectively in self learning and distance education via automated systems is found to be plausible. It is also evaluated that the technique used in this research is supporting the adaptive test goals.

(7)

v

İÇİNDEKİLER

Sayfa

JÜRİ ÜYELERİNİN İMZA SAYFASI ... i

ÖNSÖZ ... ii

ÖZET ... iii

ABSTRACT ... iv

TABLOLAR LİSTESİ... vii

ŞEKİLLER LİSTESİ ... viii

BÖLÜM I ... 1

GİRİŞ ... 1

1.1. Kavramsal Çerçeve ... 4

1.1.1. Karar Verme ve Ölçme ... 4

1.1.2. Ölçme Teorisi ... 6

1.1.3. Eğitim Ölçmesinde Testler... 8

1.1.4. Norm, Kriter ve Alan Esaslõ Testler ... 9

1.1.5. Bulanõk Mantõk... 13

1.1.6. Bulanõk Kümeler ... 15

1.1.7. Soru-Cevap Teorisi... 18

1.1.8. Uyarlamalõ Bilgisayar Testleri ... 21

1.2. Problem ... 22 1.3. Amaç ... 28 1.4. Önem... 29 1.5. Sayõltõlar ... 29 1.6. Sõnõrlõlõklar ... 30 BÖLÜM II... 31 YÖNTEM ... 31 2.1. Araştõrma Modeli... 31 2.2. Çalõşma Grubu... 31 2.3. Veriler ve Toplanmasõ... 32

2.3.1. Test Sorularõnõn Kazanõmlarla İlişkilendirilmesi ... 34

2.3.2. Bulanõk Değerlerle İşlemler ... 37

2.3.3. Çõkarõm Mekanizmasõ (Uzman Sistem Tasarõmõ) ... 42

2.3.4. Soru Seçim Algoritmasõ ... 43

2.3.5. Uygulama ... 45

2.3.5.1. Mimari Yapõ Ve Ana Bileşenler ... 46

2.3.5.2. Kullanõcõ Profilleri ... 47

2.3.5.3. Sorularõn Girilmesi... 48

2.3.5.4. Uygulamanõn Yapõlmasõ... 49

BÖLÜM III ... 51

BULGULAR VE YORUMLAR ... 51

3.1. Öğrenci Grup Dağõlõmlarõ ve Ön-Test, Son-Test Farklõlaşmasõ ... 51

3.2. Uyarlamalõ Bilgisayar Testlerinde Bulanõk Mantõğõn Kullanõlmasõ... 61 3.3. Öğrenci kazanõmõ ölçmede bulanõk mantõk hesap yönteminin etkisi nedir? 62

(8)

vi

Sayfa 3.4. Yeterlilik Hesaplamasõnda En Uygun Bulanõk Mantõk Netleştirme

Yaklaşõmõ Hangisidir? ...66

3.5. Sorulan Soru Miktarlarõ ...69

3.6. Başlangõç Güçlük Seviyesinin Öğrenci Tarafõndan Belirlenmesi 74 3.7. Birden Çok Kazanõmla İlişkili Sorular ...75

BÖLÜM IV ...76

SONUÇ VE ÖNERİLER ...76

4.1. Sonuç...76

4.2. Öneriler ...77

4.2.1. Kendi Kendine Öğrenme Boyutu ...77

4.2.2. Fen Bilgisi Alanõ Dõşõnda Kullanõlmasõ...78

4.2.3. Değişik Eğitim Seviyeleri İçin Uygulamanõn Tekrarõ...78

4.2.4. Alan Uzmanlarõnõn Tecrübesi ...78

4.2.5. Kriter Esaslõ Test Uygulamalarõnda Denenmesi ...79

4.2.6. Kõsõtlõ İletişim Ortamlarõnda Kişiselleştirilmiş Sõnav Uygulamasõ ....79

KAYNAKÇA...80

EKLER ...83

EK-1 Ön-Test, Son-Test Öğrenci Başarõ Karşõlaştõrma Grafikleri...83

EK-2 Soru-Kazanõm İlişki Ağõrlõklarõ. ...91

EK-3 Bilgisayar Uygulamasõ Ekran Örnekleri...94

(9)

vii

TABLOLAR LİSTESİ

TABLOLAR Sayfa

Tablo-01 Ölçülmesi Hedeflenen Kazanõmlar...33

Tablo-02 Sorularõn İlişkili Olduğu Diğer Kazanõmlar...33

Tablo-03 Bulanõk Küme ve Üyelik Fonksiyon Karakteristikleri (Alan İlişkisi)...34

Tablo-04 Toplama İşlemi (Örnek-1)...39

Tablo-05 Toplama İşlemi (Örnek-2)...39

Tablo-06 Toplama İşlemi (Örnek-3)...40

Tablo-07 Toplama İşlemi (Örnek-4)...41

Tablo-08 Kontrol Grubu Ön Test Doğru Cevap Miktarõ Frekans Dağõlõmõ ...52

Tablo-09 Birinci Deney Grubu Ön Test Doğru Cevap Miktarõ Frekans Dağõlõmõ...53

Tablo-10 İkinci Deney Grubu Ön Test Doğru Cevap Miktarõ Frekans Dağõlõmõ ....54

Tablo-11 Ön Test Cevaplarõ Kazanõm İlişkisi...56

Tablo-12 Ön Test Kazanõmlarõ Gruplar Arasõ Doğru Cevap Miktarlarõ Varyans Analizi...57

Tablo-13 Kontrol Grubu Son Test Doğru Cevap Miktarõ Frekans Dağõlõmõ Özet Tablosu ...59

Tablo-14 Kontrol Grubu Ön Test Son Test Doğru Cevap Kaşõlaştõrmasõ ...60

Tablo-15 Kontrol Grubu Ön Test Son Test Doğru Cevap Korelasyonu ...60

Tablo-16 Deney Gruplarõ Son Test Soru Miktarõ ve Cevap Dağõlõmlarõ...62

Tablo-17 Son Tes Kazanõmlarõ Gruplar Arasõ Başarõ Puanlarõ Varyans Analizi...63

Tablo-18 Son Test kazanõmlarõ Gruplar Arasõ Farklõlõk Kontrolü ...64

Tablo-19 En Yüksek En Düşük Kazanõm-Başarõ Yüzdesi ve Farklarõ...65

Tablo-20 En Yüksek Değer Merkezi -Ön Test Başarõ Puanlarõ Karşõlaştõrmasõ...66

Tablo-21 Enyüksek Değer Merkezi-Ön Test Başarõ Puan Korelasyonlarõ ...67

Tablo-22 Ağõrlõk Merkezi-Ön Test Başarõ Puanlarõ Karşõlaştõrmasõ...68

Tablo-23 Ağõrlõk Merkezi-Ön Test Başarõ Puan Korelesyonlarõ ...68

(10)

viii

ŞEKİLLER LİSTESİ

ŞEKİLLER Sayfa

Şekil-1 Üyelik Değer Grafiği Uzun)...17

Şekil-2 Üyelik Değer Grafiği (Yaşlõ)...17

Şekil-3 Üyelik Değer Garfiği (Kõsa,Orta,Uzun)...17

Şekil-4 Klasik Küme Sõnõflamasõ (Kõsa,Orta,Uzun)...18

Şekil-5 Bulanõk Kümeler ve Üyelik Fonksiyon Grafikleri /Alan İlişkisi ...35

Şekil-6 Netleştirme Algoritmalarõ ...42

Şekil-7 Veri Tabanõ Tablo ilişkileri...46

GRAFİKLER Grafik-01 Toplama İşlemi (Örnek-1)...39

Grafik-02 Toplama İşlemi (Örnek-2) ...40

Grafik-03 Toplama İşlemi (Örnek-3)...40

Grafik-04 Toplama İşlemi (Örnek-4)...41

Grafik-05 Kontrol Grubu Ön Test Doğru Cevap Miktarõ Frekans Dağõlõm Grafiği...52

Grafik-06 Birinci Deney Grubu Ön Test Doğru Cevap Miktarõ Frekans Dağõlõm Grafiği ...53

Grafik-07 İkinci Deney Grubu Ön Test Doğru Cevap Miktarõ Frekans Dağõlõm Grafiği...55

Grafik-08 Kontrol Grubu Son Test Doğru Cevap Miktarõ Frekans Dağõlõm Grafiği...58

Grafik-9 Birinci Deney Grubu Soru Sorulma Sayõsõ Kazanõm Başarõsõ İlişkisi ...70

Grafik-10 Birinci Deney Grubu Soru Sorulma Miktarõnõn Kazanõmlara dağõlõmõ ve Doğru Cevaplanma Miktarlarõ...71

Grafik-11 İkinci Deney Grubu Soru Sorulma Sayõsõ Kazanõm Başarõsõ İlişkisi ...72

Grafik-12 İkinci Deney Grubu Soru Sorulma Miktarõnõn Kazanõmlara dağõlõmõ ve Doğru Cevaplanma Miktarlarõ...73

Grafik-1.01 Kontrol Grubu 1’inci Kazanõm Ön test-Son test öğrenci başarõlarõ ...83

Grafik-1.02 Kontrol Grubu 2’nci Kazanõm Ön test-Son test öğrenci başarõlarõ ...83

Grafik-1.03 Kontrol Grubu 3’üncü Kazanõm Ön test-Son test öğrenci başarõlarõ....84

Grafik-1.04 Kontrol Grubu 4’üncü Kazanõm Ön test-Son test öğrenci başarõlarõ....84

Grafik-1.05 Kontrol Grubu 5’inci Kazanõm Ön test-Son test öğrenci başarõlarõ ...84

Grafik-1.06 Kontrol Grubu 6’ncõ Kazanõm Ön test-Son test öğrenci başarõlarõ ...85

Grafik-1.07 Kontrol Grubu 7’nci Kazanõm Ön test-Son test öğrenci başarõlarõ ...85

Grafik-1.08 1’inci Deney Grubu 1’inci Kazanõm Ön test-Son test öğrenci başarõlarõ ...85

Grafik-1.09 1’inci Deney Grubu 2’nci Kazanõm Ön test-Son test öğrenci başarõlarõ...86

(11)

ix

Sayfa

Grafik-1.10 1’inci Deney Grubu 3’üncü Kazanõm Ön test-Son test öğrenci

başarõlarõ...86 Grafik-1.11 1’inci Deney Grubu 4’üncü Kazanõm Ön test-Son test öğrenci

başarõlarõ...86 Grafik-1.12 1’inci Deney Grubu 5’inci Kazanõm Ön test-Son test öğrenci

başarõlarõ...87 Grafik-1.13 1’inci Deney Grubu 6’ncõ Kazanõm Ön test-Son test öğrenci

başarõlarõ...87 Grafik-1.14 1’inci Deney Grubu 7’nci Kazanõm Ön test-Son test öğrenci

başarõlarõ...87 Grafik-1.15 2’nci Deney Grubu 1’inci Kazanõm Ön test-Son test öğrenci

başarõlarõ...88 Grafik-1.16 2’nci Deney Grubu 2’nci Kazanõm Ön test-Son test öğrenci

başarõlarõ...88 Grafik-1.17 2’nci Deney Grubu 3’üncü Kazanõm Ön test-Son test öğrenci

başarõlarõ...88 Grafik-1.18 2’nci Deney Grubu 4’üncü Kazanõm Ön test-Son test öğrenci

başarõlarõ...89 Grafik-1.19 2’nci Deney Grubu 5’inci Kazanõm Ön test-Son test öğrenci

başarõlarõ...89 Grafik-1.20 2’nci Deney Grubu 6’õncõ Kazanõm Ön test-Son test öğrenci

başarõlarõ...89 Grafik-1.21 2’nci Deney Grubu 7’nci Kazanõm Ön test-Son test öğrenci

(12)

BÖLÜM I GİRİŞ

Günümüze kadar eğitimsel ölçme konusunda sergilenen çabalar bilimsel ölçme prensip ve tekniklerinin eğitim alanõna uyarlanabilmesi boyutunu araştõrmõştõr. Bu konuda teori ve uygulamalar geliştirilmiştir.

Eğitimsel ölçmede bilimsel yöntemlerden faydalanõlmasõ konusunda bir çok araştõrma ve uygulama yapõlmõş ve halen devam etmektedir. Özellikle bilgisayar teknolojisinde yaşanan hõzlõ gelişmelerle doğru orantõlõ olarak hayatõn diğer alanlarõnda olduğu gibi bu teknolojinin, eğitimsel ölçme alanõnda kullanõlmasõ hõzla yaygõnlaşmaktadõr.

Eğitim ölçmesi konusunda uzman görüşlerine göre testlerde bilgisayar kullanõlmasõ, testlerin oluşturulmasõndaki konular ve alternatif test yöntemleri en önde gelen hususlardõr. En az ilgi çeken eğitim ölçme konularõ ise çift dilde test ve sağlõk alanõnda ölçme olarak tespit edilmiştir (Plake, 187:374).

Bir taraftan bahse konu teknolojinin eğitimsel ölçmeye sağlayabileceği destek araştõrõlõrken, diğer taraftan mevcut geliştirilmiş uygulamalarõn eğitimi ve ölçmeyi nasõl etkilediği de incelenmektedir. Bir çeşit döngü olarak ifade edilebilecek bu etkileşim, bilgisayar teknolojisinin sağladõğõ destek ile eğitim ölçmesinde test kullanõmõnõn artmasõ ve özellikle öğrencilerin davranõş ve kazanõm değerlendirmesinde testlerin belirleyici olarak kullanõlmasõ, “test için eğitim” (Baker, 1987:363) kavramõnõ gündeme getirmiştir. Ayrõca, uygulanan testlerde, çeşitli çekincelerle, tercih edilen soru tiplerinin gerçekçi bir ölçmeyi ne derecede sağladõğõ konusu da incelenmektedir.

Bilgisayar teknolojisinin değerlendirmeye yardõmcõ olarak kullanõlmasõnõn olumsuz ve olumlu etkileri mevcuttur. Bir yandan, eskiden kullanõlan testlere göre daha görsel, daha az törensel ve daha az suni (daha doğal) olmasõ, değerlendirme boyutunun eğitim içeriğine entegrasyonunu cesaretlendirebilir, ancak diğer yandan,

(13)

yeni teknolojinin testlerde kullanõlmasõ konusunda yaptõğõmõz araştõrmalar oldukça olumsuz sonuçlara işaret etmektedir. Kõsa cevap ve çoktan seçmeli soru türleri çoğunlukla kullanõlmaktadõr, dolayõsõ ile test edilen performansõn belirleyici rolü çok düşüktür (Baker, 1987:365).

Eğitimsel ölçme alanõnda bilgisayar teknolojisinin kullanõlmasõ konusunda karşõlaşõlan problemlerin özellikle geneli (tüm konular ve uygulama tipleri için) kapsayan prensip ve çözümlerin oluşturulamamasõndan kaynaklandõğõ derlendirilmektedir. Belirli eğitim konularõnda ve kõsõtlamalõ uygulamalarla çalõşmalar yapõlmõştõr. Teknolojinin eğitim ölçmesine olabilecek katkõsõ eğitim içeriğinin test kapsamõ ile eşitlenmesi, sorularõn otomatik üretimi, kriter ve norm esaslõ değerlendirmelerin daha etkin yapõlabilmesi, öğrenci performansõnõn yorumlanmasõ ve öğrenciye özel testlerin oluşturulmasõ başlõklarõ altõnda incelenmiştir. Yapõlan bu incelemelerde testler genellikle tek konu ile sõnõrlandõrõlmõş ve sadece bu eğitim konusu için prensip ve uygulamalar geliştirilmiştir.

Test maddesi geliştirmede etki alanõ (domain) belirleme ve düzenlemede birçok prensip öne sürülmüştür. Amaçlarõn belirlenmesi, içerik sõnõrlamalarõ, yanlõş cevap şõkkõ üretimi (çoktan seçmeli testler için) veya (üretim görevleri için) tepki kriteri, soru biçimleri, talimatlar ve örnek sorular bunlardan en önemlileridir. Bu yaklaşõmlar tek etki alanõ için incelenmiş ve birbiri ile ilişkili çoklu konu alanlarõnda test uygulamalarõ problemine değinilmemiştir (Baker, 1987:356). Ancak, bilgisayar teknolojisinde artan sürat ve kapasite ile özellikle yapay zeka uygulamalarõ konusunda yaşanan gelişmeler, genel ve birden fazla konuyu içeren düzenlemelerin yapõlabilmesinin mümkün olabileceğini gündeme getirmektedir. “Bilgisayar teknolojisi uzun bir süredir test değerlendirmesi ve yönetiminde kullanõlmaktadõr. Bu teknolojide yaşanan gelişmeler etki alanõ sõnõrlamasõnõn üstesinden gelebilecek gibi görünüyor” (Baker, 1987:359).

Özellikle uzman bilgisinin kullanõlmasõ konusunda yapay zeka ve uzman sistem algoritmalarõndan faydalanan yazõlõmlarõn geliştirilmesi ve bu yaklaşõmõn eğitimsel ölçmede kullanõlmasõ konusunda halen araştõrmalar devam etmektedir.

Bilgisayarõn eğitim ölçmesinde kullanõlmasõ konusunda; uzman bilgisinin ifade edilmesi ve bilgisayar algoritmalarõnda bu bilginin kullanõlmasõ (Buchanan,

(14)

1981) hususu araştõrõlmõş olmasõna rağmen uygulamalar geniş konularda değil, genelde çok dar konularda yapõlabilmiştir, “örneğin çõkarma konusunda (Brown, 1984). Ancak, bilgisayar programlamasõ (Johnson,1983), bulaşõcõ hastalõklar (Clancey, 1982), öykü oluşturma (Dehn, 1981) ve metin anlama (Dyer, 1982; Frederiksen, 1985) gibi daha karmaşõk alanlarda çabalar mevcuttur. Net tanõmlanamamõş konu alanlarõnda (bulanõk içerik-fuzzy content) yöntem geliştirme konusunda ise çalõşmalar devam etmektedir”(Aktaran: Baker, 1987:359).

Bilgisayarõn insan beyninin düşünce ve çõkarõm yapma gücüne erişebilmesi şu an için bir hayal olsa bile bu konuda ve özellikle kõsõtlanmõş alanlarda elde edilen gelişmeler hiç de azõmsanacak düzeyde değildir. Bu emarelere bakarak böyle bir hayalin bir gün gerçekleşebileceği umut edilmektedir. Bilimsel çalõşma ve araştõrmalarõ yönlendiren, onlara yaratõcõlõk ve ivme veren aslõnda insanõn hayal gücüdür. Bir başka deyişle, insan hayal edebildiği yenilikleri araştõrmaktadõr. Bilgisayarlarõn insan düşünme sistemini taklit edebileceğini hayal ederken, bu hayalin eğitim alanõna nasõl yansõyabileceği konusunda aşağõda örnek bir alõntõ sunulmuştur.

Bilgisayar yazõlõmlarõnõn klasik çõraklõk eğitiminin özelliklerini maliyet etkin bir şekilde kazandõğõnõ hayal edin. Çõrak eğitimi çok yüksek seviyede kişiselleştirilmiştir. Çõrak ustasõndan ilgili bilgi ve becerileri geliştirmesi için gerçekten ihtiyacõ olan bilgi ve etkileri alõr. Usta, sadece genel prensip ve temel eğilimleri bilen birisi değil, aynõ zamanda kendi konusu ve ticaretinde mali boyutlarõ da kapsayacak şekilde gerçek bir uzmandõr. O, değişik amaçlar ve değişik durumlarda uygulanacak denenmiş eğitim stratejilerine de hakimdir. Ek olarak, usta her bir çõrağõn gelişme durum ve sürati konusunda detaylõ bilgiye sahiptir ve tecrübesi ile her çõrak için uygulanacak eğitim stratejisini özelleştirir. Son olarak, ideal bir usta sadece belirtilen bilgi ve becerilere sahibi olmanõn yanõnda aynõ zamanda her bir çõrağõ motive ederek uzmanlõk alanõnda gelişmeyi sürekli kõlabilecek kadar zekidir. (Klopfer, 1989:37).

Yukarõda Klopfer’den alõnan bölümde belirtildiği şekilde, etkili eğitim öğrencinin ihtiyaçlarõna ve öğrenme stiline uyarlanmõş olan eğitimdir. Eğitimle iç içe geçmiş bir şekilde yer alan ve belirli bir döngü içerisinde eğitim süreci ile tekrarlanan ölçmenin de, benzer şekilde öğrenci özelliklerine göre uyarlanabildiği ölçüde etkisi artacaktõr. Uzman yönlendirmesi ile takviye edilmiş ve yeterince kişiselleştirilmiş

(15)

ölçme yöntemleri ve araçlarõ ile eğitimsel ölçmenin etkinliğinin artõrõlmasõ mümkün görünmektedir.

1.1. Kavramsal Çerçeve

Araştõrma probleminin tanõmlanmasõ ve yapõlan uygulamada kullanõlan teknik ile ilgili; kavramlar, tanõmlamalar ve yapõlmõş çalõşma referanslarõ bu bölümde sunulmuştur.

1.1.1. Karar Verme ve Ölçme

Karar vermek günlük hayatõn içerisine gömülü olan bir işlevdir. İnsanlar günlük hayatlarõnda birçok kararlar verirler ve insanõn karar verebilmesi için bilgiye ihtiyacõ vardõr. Ölçmenin görevi de karar vericilere karar vermede yardõmcõ olacak geçerli ve ilgili bilgiyi sunmaktõr. “Eğitim ve davranõş bilimcileri araştõrma ve uygulama karalarõnõ vermede ölçmeyi gerekli bir unsur olarak görmektedir.” (Mehrens, 1991:5) Ayõrt edicilik psikolojisi tamamen bireysel farklõklar üzerine kurulmuştur. Bireysel farklõlõklar önemli olduğu için bunlarõ ölçebilmemiz ve kararlarõmõz verirken bu bilgiyi kullanabilmemiz gereklidir. Dolayõsõ ile karar vermede doğrudan kullanõlacak bilgiyi temin edecek olan ölçme işlevi, kararõn doğru ve geçerli olmasõ için önemlidir. Tüm bilim dallarõ için önemli olan ölçme, eğitim ve davranõş bilimlerinde de gerekli olan en temel unsurlardan biridir. “Genel olarak eğitimsel ölçmenin doğasõ bilimsel ölçme ile aynõdõr (Thorndike, 1918)” (Aktaran : Carrol, 1987:89).

“Ölçme, bilimin sorduğu sorularõn hemen hemen tümüne verilecek cevaplar için temel teşkil eder, burada bilim sadece fiziksel bilimi değil aynõ zamanda davranõş ve yaşam bilimini de ifade etmektedir” (Thorndike, 1991: 9).

(16)

Ölçme sonuçlarõnõn karar vermede değil, eğitimi geliştirmede kullanõlmasõnõ savunanlar vardõr (Mehrens, 1991:5). Bu tamamen bir yanlõş algõlama problemidir. Ölçme sonuçlarõnõn eğitimsel kararlara esas oluşturmasõ, ölçme hedefinin eğitimi geliştirmek olmasõnõ gerektirmez. Ölçme, “hangi konu, ne zaman ve nasõl öğretilecek veya çalõşõlacak?” ve benzeri gibi eğitimsel kararlara destek olmak amacõ ile yapõlabilir. Burada eğitimi geliştirmek ölçmenin doğrudan bir hedefi değil, dolaylõ olarak bir sonucudur. Ölçmenin hedefi eğitimi geliştirmek amacõ ile verilecek kararõ desteklemektir. Verdiği kararlar ile eğitimi geliştirmeye çalõşan, eğitim planlayõcõsõ veya uygulayõcõsõdõr, ölçme işlevi veya süreçleri değildir. “Kararõ veren ölçme süreçleri değil, insanõn kendisidir.” (Thorndike, 1991: 8).

Verilen kararlar, karar vermede kullanõlan bilgilerin dolaylõ sonuçlarõdõr. Bu ilişki çerçevesinde karar vermede kullanõlan bilginin miktarõ ve niteliği verilecek kararõn doğruluğunu belirleyecektir. Doğru ve yeterli miktarda bilginin mevcut olmasõ tek başõna uygun kararõn verilmesi için yeterli değildir. Aynõ zamanda doğru kararõn verilmesini sağlayacak çõkarõm mekanizmalarõnõn da uygun kullanõlmasõ gerekli olmaktadõr.

“Bilginin miktarõ ve niteliği arttõkça verilecek karar da daha isabetli olacaktõr. Şüphesiz sadece bilginin varlõğõ onun en iyi şekilde kullanõlacağõnõ garanti etmez. Karar vericinin, bilgiyi nasõl kullanacağõnõ ve bilginin hangi kararlarõ destekleyip desteklemediğini bilmesi gereklidir”(Thorndike, 1991: 2). Karar verme işlevini destekleyecek bilginin temin edilmesinde ölçme açõndan bazõ zorluklar bulunmaktadõr. “Kolay erişilebilen/ölçülebilen özellikleri ölçmek değil, karar vermeye yardõmcõ olacak özellikleri ölçmek önemlidir” (Thorndike, 1991: 11).

“…Eğitimsel ürünler genelde birden fazla unsurun etkili olduğu karmaşõk şeylerdir. Şüphesiz yaptõğõmõz şey, herhangibir özelliğin miktarõnõ ölçmektir. Her bir ölçüm ürünün çok küçük bir parçasõnõ ve çok soyut bir değerlendirmesini temsil etmektedir (Thorndike, 1918)” (Aktaran : Carrol, 1987:89). Dolayõsõ ile yapõlan ölçmede aslõnda neyin ölçüldüğü çok net olmamasõna karşõn yeterince dikkat harcanarak yapõlan ölçmenin uygulamada büyük önemi olduğu belirtilmektedir (Carrol, 1987:93). Ayrõca eğitimsel ölçme araçlarõnõn genelde bir sõfõr noktasõ

(17)

bulunmamakta ve ölçüm birimlerini tam olarak tanõmlamak mümkün olamamaktadõr. “Eğitimsel ve psikolojik ölçme mükemmel olmaktan uzaktõr.” (Thorndike, 1991:16). Eğitimsel ve psikolojik ölçüm araçlarõnda, tanõmõ gereği birimler eşit kabul edilmiş olsa bile, birimlerin mutlak eşitliği hiçbir şekilde sağlanamaz. Bu sebepten ölçüm sonuçlarõnõn toplanmasõ, çõkartõlmasõ, karşõlaştõrõlmasõ her zaman bir miktar şüphe ile karşõlanacaktõr.

“Yanlõş veya hatalõ kararlar dayandõklarõ verinin geçersiz olduğunu gösterir. Dolayõsõ ile bu veriler kullanõlmamalõdõr.” (Mehrens, 1991:5-6) görüşünü öne sürenler mevcuttur. Örneğin; verilen seçim kararlarõ doğru olmadõğõ için seçme testlerinin kullanõlmamasõnõ istemek. Bu tür bir çõkarõmda bulunmak hatalõdõr. Zaten karar verme işleminde kararõ veren kişi belirli bir miktarda riski üstlenmek zorundadõr, çünkü verilecek karar sonuçlarõnõn ne olacağõ garanti edilemez. En iyi karar ilgili tüm bilgiler õşõğõnda verilen karardõr. İlgili tüm bilginin hazõr bulunmasõ verilecek kararõn uygun olmasõnõ garanti etmez, ancak uygun olma ihtimalini artõrõr. Karar vermede en temel hata, kararlarõn tam olmayan veya hatalõ veriler õşõğõnda oluşturulmasõdõr. En iyi kararõn verilebilmesi için genelde değişik kaynaklardan edinilmiş geçerli verilerin temin edilmesi gereklidir. Eksik veya yanlõş veri kullanõmõ şüphesiz yanlõş kararlara sebep olacaktõr.

“Duymak istemediğimiz haberleri getiren elçiyi öldürmek yerine istenmeyen sonuçlarõ doğuran politika ve işlemler üzerinde düşünmeliyiz” (Thorndike, 1991:8).

1.1.2. Ölçme Teorisi

İnsan zihnine ait ölçme işleminin zorluğu hususunda, psikolojik ve eğitimsel ölçmenin kurucularõndan olan Thorndike “Zihni ve sosyal ölçüm teorisine giriş” isimli kitabõnda zihni ve sosyal ölçmenin genel hatalarõ olarak aşağõdaki üç tespiti belirtmektedir.

(18)

1. Ölçümde kullanõlacak olan birimlerde mükemmeliyet (tamlõk) eksikliği. 2. Ölçülen olaylarõn sabit olmamasõ (dinamik olmasõ).

3. Yapõlacak ölçmenin çok fazla karmaşõklõğõ (Thorndike, 1913) (Aktaran: Carroll, 1987:91-92).

Ayrõca, ölçmede kullanõlan ölçeğin seçimindeki keyfilik, mutlak/bağõl ölçek, kesikli/sürekli ölçek ve mutlak/değişken sõfõr noktasõ eğitimsel ölçme alanõnõn temel problemleri arasõnda sayõlabilir.

Eğitimsel ölçme için Thorndike tarafõndan; ideal ölçme aracõ, çok kötüden mükemmele kadar eğitim ürününün değişik niteliklerdeki örneklerini içeren ve bu örnekler arasõnõ eşit aralõklara bölen rakamsal değerler atanmõş ölçek olarak belirtilmektedir (Aktaran: Carroll, 1991:92). Testlerde kullanõldõğõ gibi birbirinden tamamen farklõ sorulara rakamsal değerler verilerek yapõlan ölçümlerde ölçek problemi daha net olarak ortaya çõkmaktadõr (Carroll, 1991:92).

Bu ölçekleme probleminin üstesinden gelebilmek amacõ ile yüzdelik dilim ölçeği öne sürülmüştür. Yüzdelik dilim ölçeği yaklaşõmõnõn arkasõnda yeteneklerin ve okul kazanõmlarõnõn insanlar arasõnda normal dağõlõm karakterinde dağõlmõş olduğu kabulü yatmaktadõr. Böylelikle başarõ ölçeklendirmesi için kullanõlan ölçek aralõklarõnõn eşit seviyede başarõya işaret etmesi sağlanmaya çalõşõlmaktadõr. Bu konuda yüzdelik dilimlere dayanan hesaplama yöntemleri ile test sonuçlarõnõn okul başarõ ölçeklerine dönüştürülmesini temin eden formüller geliştirilmiştir. Yüzdelik dilim ölçeğine benzer şekilde doğru cevap sayõsõnõ hata ihtimal eşdeğerlerine çeviren matematiksel çözümlemeler de yine normal dağõlõm esas alõnarak geliştirilen bir başka dönüşüm yaklaşõmõdõr.

Normal dağõlõm esas alõnarak üretilen dönüşüm sistemleri aynõ test veya ölçüm içerisinde tutarlõ olmasõna karşõlõk sõfõr noktasõnõn eksikliği sebebi ile farklõ ölçümlerin mukayesesi aşamasõnda uygun sonuç vermemektedir. Bu husus gündeme mutlak sõfõr noktasõ tanõmlamasõ problemini getirmiştir. “Herhangi bir uygulamanõn mutlak değerini belirleyebilmek için bir mutlak sõfõr noktasõ tanõmlanmalõdõr. Bu da

(19)

sõfõr kabiliyete işaret eden uygulamayõ belirlemekle yapõlabilir. Bundan sonra diğer uygulamalar bu uygulama ile karşõlaştõrõlõr” (Monroe, 1987).

Eğitimsel ve sosyal alanda gerek mutlak sõfõr noktasõ tanõmlanmasõnõn mümkün olamamasõ ve gerekse bağõl karşõlaştõrmalarõn ihtiyacõ büyük ölçüde karşõlamasõndan dolayõ, bağõl sõfõr noktasõ kullanõlmasõ daha yaygõnlaşmõştõr. Bu alandaki literatürde bağõl sõfõr noktasõ kullanõmõ norm esaslõ ölçme olarak da adlandõrõlmaktadõr. Burada norm aslõnda ölçmede kullanõlacak olan bağõl sõfõr noktasõna işaret etmektedir. Norm esaslõ ölçmenin karşõsõnda ise başarõnõn belirli bir baraj değere göre tanõmlandõğõ kriter esaslõ ölçme geliştirilmiştir. Bu ölçme yaklaşõmõnda performans veya kazanõmõn belirli bir seviyenin üzerinde olup olmadõğõna bakõlmaktadõr.

1.1.3. Eğitim Ölçmesinde Testler

Eğitimsel ölçme son yüzyõl içerisinde dikkat çekmeye başlamasõna rağmen eğitim kazanõmõnõn resmi olarak ölçülmesi yüzyõllar öncesine kadar gitmektedir. Çinliler tarafõndan birinci yüzyõlda, birçok açõdan günümüzdeki uygulamalara benzeyen sõnavlar yapõldõğõ ve değerlendirme sistemlerinin kullanõldõğõ bilinmektedir (Dubois,1970)(Aktaran: Carrol,1987:90). Çinlilerin kullandõğõ bu teknikler 1800’lü yõllarõn başlarõnda Avrupa ve Amerika’da devlet memuru seçimlerinde kullanõlan sõnavlar için örnek teşkil etmiştir.

Batõ dünyasõnda eğitim alanõnda düzenli ölçmeler 1800’lü yõllarõn sonlarõnda başlamõştõr. Uzunca bir süreden beri orta öğretim ve üniversitelerde anlatõm tipi ve sözlü ölçmeler yapõlõyor olmasõna rağmen ilk kez 1897 yõlõnda Rice tarafõndan okuma becerisi üzerine yazõlõ sõnavlarõn Boston’da yapõldõğõ bilinmektedir (Thorndike, 1991:3). 19’ncu yüzyõlõn sonlarõnda yeni gelişmekte olan psikoloji bilimi, insan davranõşlarõnõ ölçme konusunda araştõrmalar yapmaya başlamõştõr. Ebbinghaus tarafõndan 1896 yõlõnda, öğrencilerde zihinsel yorgunluğu ölçmek üzere boşluk doldurma testleri geliştirilmiştir. Ayrõca Pearson tarafõndan insan

(20)

davranõşlarõndaki farklõlõklarõ açõklamak üzere yapõlan korelasyon çalõşmalarõ da bu döneme rastlamaktadõr.

İnsan davranõşlarõndaki farklõlõklar konusunda 19’ncu yüzyõlõn ikinci yarõsõnda başlayan çalõşmalar üç grup altõnda tasnif edilebilir. Birinci grup: Okullarda öğrenci performansõnõ değerlendirme konusunda tarafsõzlõk ve geçerlilik araştõrmalarõ. İkinci olarak: İnsan davranõşlarõndaki anomalilerin hastalõklarla ilişkilendirilmesi konusundaki incelemeler ve üçüncü olarak : Kamu çalõşanlarõnõn yönetimi ve beceri belirleme işlemlerini sõnavlar aracõlõğõ yapma çalõşmalarõ olarak ifade edilebilir. Özellikle kamu çalõşanlarõnõn seçiminde test uygulamalarõ bu dönemde yaygõnlaşmõştõr.

Eğitimsel ve psikolojik ölçmenin modern uygulamalarõ yirminci yüzyõlõn hemen başlarõnda geliştirilmeye başlanmõştõr. Her ne kadar modern uygulamalarõn başlangõcõ için belirli bir olay gösterilemese de, davranõşlarõn ölçülmesinde Benet-Simon zihni kabiliyet ölçeğinin yayõmlanmasõ çoğunluk tarafõndan modern uygulamalarõn başlangõcõ olarak kabul görmektedir. Daha sonra Thorndike’õn önderlik ettiği araştõrmacõlar özellikle okul öğrenmesini yorumlamak üzere ölçekler geliştirmişlerdir.

1.1.4. Norm, Kriter ve Alan Esaslõ Testler

“Rakamlar nereden geldiklerini bilmezler. İşte bunun için, test sonuçlarõ yapõlan ölçme türü ve ölçüt tipi dikkate alõnmaksõzõn, sadece rakam olarak nitelenebilir” (Carroll, 1987:93). Test sonuçlarõnõn yorumlanmasõ açõsõndan mutlak ve göreli yorumlama farklõlõk arz etmektedir. İnsanlar test sonuçlarõnõ genellikle, mutlak bir anlam taşõdõklarõ varsayõmõ ile yorumlamak eğilimindedir. Örneğin eğitimciler farklõ testler için tek geçme notu (100 üzerinden 60 puan gibi) tespit ederler. Öyle ki, bir öğrenci Türkçe testinden 62 ve matematik testinden 58 puan aldõysa; bu öğrencinin Türkçe testinde matematikten daha başarõlõ olduğu çõkarõmõ yapõlõr. Bu çõkarõmdaki problem, test sonuçlarõnõn mutlak değerlerinin

(21)

karşõlaştõrmaya alõnmasõndadõr. Eğer öğrencinin Türkçe’den başarõlõ olduğu (geçtiği), matematikten başarõsõz olduğu (kaldõğõ) yorumlarõ da yapõlõrsa, bu durumda (1) başarõlõ sayõlabilmek için gereken kazanõm/performans miktarõnõn belirlenmiş olduğu, (2) her iki testte de bu miktarlarõn eşit olduğu kabulleri yapõlmõş olur. Bu kabullerin hepsi tartõşmaya açõktõr.

Test sonuçlarõnõn mutlak değerlerinin yorumlanmasõnda, yukarõda verilen örnekte olduğu gibi, çok sayõda ve tartõşmalõ kabuller yapõldõğõ için, ölçme uzmanlarõ test sonuçlarõnõ belirli bir grubun (norm grubu) test sonuçlarõnõ referans olarak alõp, yorumlar yapma fikrini geliştirmişlerdir. Örneğin öğrencinin Türkçe testinden almõş olduğu 62 puan, onun kendi sõnõfõ içerisinde yüzde 50’lik dilime girmesini sağlamõş olabilir. Bir başka deyişle öğrenci kendi sõnõf arkadaşlarõnõn yüzde 50’sinden daha iyi bir başarõ sağlamõştõr. Bunun yanõnda matematikten aldõğõ 58 puan onun kendi sõnõfõ içerisinde yüzde 80’lik dilime girmesini sağlamõş olabilir.

Norm esaslõ ölçmeler, öğrencinin neyi, ne kadar öğrendiği konusunda bir bilgi sağlamadõklarõ gerekçesi ile eleştirilmektedir. Bu eleştiriyi yapanlar test sonuçlarõnõn mutlak değerlerinin kullanõlmasõ taraftarõ olanlardõr. Norm esaslõ ölçmeye karşõlõk, sonuçlarõ mutlak değere dayalõ olarak yorumlama yaklaşõmõna kriter esaslõ ölçme ismi konmuştur. Test sonuçlarõnõn kriter esaslõ yorumlamaya tabi tutulabilmesi için testlerin belirli özellikleri taşõmasõ gereklidir. Benzer şekilde norm esaslõ yorumlama yapõlabilecek testlerin de kendilerine özel vasõflarõn bulunmasõ gerekir. Test niteliklerindeki bu farklõlaşma norm ve kriter esaslõ ölçme ayrõmõnõn test türlerinden kaynaklandõğõ çağrõşõmõnõ yapsa da asõl ayõrõm test sonuçlarõnõn yorumlanmasõndadõr.

Norm ve kriter esaslõ ölçme arasõndaki ayrõmõn zihinlerde daha da netleşmesi için şöyle söylenebilir; “Eğer bir şahsõn performansõnõ belirli bir grup içerisindeki bireylerin performansõ ile karşõlaştõrarak ölçüyorsak, yaptõğõmõz ölçüm norm esaslõdõr. Eğer performansõ özel bir davranõş alanõ veya uzmanlõk ölçütü ile karşõlaştõrarak ölçüyorsak, bu ölçüm de kriter esaslõdõr.”. Bir başka örnekle, öğrencinin arkadaşlarõ (akranlarõ veya öğrenci gibi olanlar)’nõn ne kadarõnõn bu öğrenciden daha az başarõlõ olduğu ile ilgileniyorsak bu norm esaslõ ölçmedir. Kriter

(22)

esaslõ ölçmede ise ilgilendiğimiz şey öğrencinin ne yapabildiğidir. Norm esaslõ ölçmede şu şekilde ifade kullanõlõr: “ Tam sayõlarla toplama işlemi yapmada Ali sõnõfõn yüzde 80’inden daha başarõlõdõr.” Benzer şekilde kriter esaslõ ölçmede ise: “ Ali tamsayõlarla toplama işlemi testinde sorularõn yüzde 75’ine doğru cevap vermiştir.”, ve bu ifadeye genellikle bu oranõn “yeterli, yetersiz, başarõlõ sayõlabilir, mükemmel v.b.” olduğuna dair yorumlarõmõzõ da eklenir.

Kriter esaslõ ölçmenin kendi içerisinde belirli bir standart veya standartlar grubu içerdiği konusunda tartõşmalar devam etmektedir. Öyle ki, acaba biz performansõ belirli kesme değere/değerlere göre mi yorumlamaktayõz? Kriter esaslõ ölçme ifadesini ilk olarak kullanan Glaser kriter esaslõ ölmeyi anlattõğõ bir makalesinde “...en az (düşük) seviyeyi davranõşsal olarak tanõmlamamõz gereklidir.” (Glaser,1963)(Aktaran: Mehrens, 1991:17) demektedir. Glaser ve Nitko ise kriter esaslõ testler için “...sonuçlarõnõn belirli performans standartlarõ ile direkt olarak karşõlaştõrõlabilmesi amacõyla oluşturulan testlerdir.” (Glaser, 1971) (Aktaran: Mehrens, 1991:17) açõklamasõnõ yapmaktadõr. Buna rağmen Nitko “ ...kriter esaslõ ifadesi bir geçme puanõ veya bir kesme değer ile karõştõrõlmamalõdõr.” (Nitko, 1980) (Aktaran: Mehrens, 1991:17) görüşünü öne sürmektedir. Kriter esaslõ ölçümlerin bir başka savunucusu olan Propham “ Kriter demek, performans standardõ demektir.” (Propham, 1969:2) (Aktaran: Mehrens, 1991:17) ifadesini kullanmõştõr. Bu görüşler kriter tanõmlamasõnda belirsizliğin devam ettiğini gösterse de, kriter esaslõ ölçme ile kast edilen oldukça net bir şekilde anlaşõlmaktadõr.

“İçsel bir standart veya kesme değer olup olmadõğõ tartõşmasõna rağmen. Herkes, kriter esaslõ yorumlama ile dikkatin “Johnny’nin ne yapabildiği”nde olduğu ve karşõlaştõrmanõn da davranõşsal alan ile yapõldõğõ konusunda hemfikirdir” (Mehrens, 1991:17) . Tanõmlamalar konusundaki tartõşmalara rağmen, ölçme uzmanlarõ norm ve kriter esaslõ ölçme arasõndaki ayrõmõn, sonuçlarõn yorumlanmasõnda olduğu konusunda uzlaşmaktadõr. Gerçekte, belirli bir standart veya kesme değeri çağrõştõrmadõğõ için “alan esaslõ” ifadesinin daha geçerli bir tanõmlama olduğunu kabullenenler her geçen gün artmaktadõr (Mehrens, 1991: 17-18). Bazõ uzmanlar ise testlerin alan esaslõ olarak ifade edilmesine, alanõn net olarak

(23)

tanõmlanamayacağõnõ ve testlerde kullanõlan sorularõn bu alanõ temsil edebilecek derecede rastlantõsal bir örneği olamayacağõnõ öne sürerek karşõ çõkmaktadõr. “Anlamlõ olabilmesi için, test sonuçlarõ diğer öğrencilerin test sonuçlarõyla karşõlaştõrõldõğõ kadar test içeriği (alanõ) ile de ilişkilendirilmelidir.” (Ebel, 1962:19) (Aktaran: Mehrens, 1991: 18).

Bir yetenek, uzmanlõk veya kazanõm ölçeği oluşturabilmek için, aynõ özelliği ölçen ve zorluk, karmaşõklõkta farklõlõk gösteren, bir seri görev belirlenmeli ve bu görevlerin bir örnek grup tarafõndan doğru olarak yerine getirilme oranlarõ tespit edilmelidir. Bu oranlarõn sõralanmasõ ile yetenek ölçeği oluşturulmuş olur. (Carroll,1987:93).

Her erişim testi belirli bir alanõ örneklemektedir ve içerisinde davranõşsal bir unsur içermektedir. İster norm esaslõ ve isterse kriter esaslõ olsun, testlerin içerik geçerliliğinin sağlanabilmesi için belirli bir alanda olmalarõ zorunludur. İçerik geçerliliği çok yüksek olan testler ise, kapsamõn çok daralmasõ ile, alan esaslõ olmaktan uzaklaşarak amaç esaslõ hale gelmektedir. Herhangi bir alan seçilir ve bu alandan yine herhangi bir tanõmlanmõş yöntem ile sorular belirlenir ise, test sonuçlarõndan sorularõn yüzde 75’ini doğru yanõtlayan bir bireyin alanõn yüzde 75’ini bildiği çõkarõmõ yapõlamaz. Burada çõkarõmõn yapõlamamasõnõn sebebi soru seçiminin tam olarak rastsal olamamasõdõr. Tamamen kriter esaslõ ölçme yapmaya ihtiyaç duyduğumuz durumlar aslõnda oldukça azdõr. Örneğin, bir kişinin daktiloda dakikada 60 kelimelik yazma sürati, ölçme esnasõnda kullanõlan kelimelerin (bunlarõn içerdiği harf kombinasyonlarõ ve uzunluklarõnõn) alanõ (seçilen lisan) gerçekten temsil edip etmediğinden bağõmsõz olarak, faydalõ bir bilgi içermektedir. Benzer şekilde bir kişinin sorulan iki haneli tamsayõlarõn yüzde 80’ini doğru olarak topladõğõ bilgisi, sayõlarõn nasõl seçildiğinden bağõmsõz olarak, kullanõlabilir bir bilgi içermektedir.

“Hiçbir süreç veya teknik ölçeğin tek boyutlu olmasõnõ garanti edemez. Hemen hemen tüm görev serileri arasõnda korelasyon mevcuttur. Değişik seviyeler için belirlenmiş olan görevler değişik özellikleri ölçüyor olabilir.” (Carroll, 1987:93). Ölçmenin norm veya kriter esaslõ olmasõnõn ötesinde, test sonuçlarõyla ulaşõlmasõ hedeflenen, elde edilen veriler ile testin ilgili olduğu alan arasõnda bir ilişki kurmak ve bu ilişkinin derecesini belirlemektir. İster norm ve isterse kriter esaslõ olsun test

(24)

hazõrlarken dikkat etmemiz gereken en önemli unsur, testin belirli bir içeriği kapsamasõdõr.

1.1.5. Bulanõk Mantõk

Mantõk bilimi geçerli ve sağlõklõ kabul edilen insan düşünce ve çõkarõm sistemini inceleyerek bu sistemin kurallarõnõ belirlemeye çalõşmaktadõr. Bir başka deyişle, mantõk bilimi insan düşünce ve doğru karar verme sistemini modellemek istemektedir. Bu modellemeyi yapabilmek için, insan düşünce sistemini ve çõkarõm mekanizmasõnõ yansõttõğõ kabul edilen konuşma dili (lisan) yapõsõ ve kelimelerin anlamsal ilişkileri incelenmiş ve bunlara ait kural sistemleri açõklanmaya çalõşõlmõştõr. “...Mantõk geçerli işlemler ile ilgilenir ve insanlarõn kullandõğõ konuşma dilini yansõtmak zorundadõr. Öyle ki anlamsal taraflarõ cebirsel taraflarõndan çok daha önemlidir.” (Mamdani, 1987:XV).

Ünlü araştõrmacõ ve filozof Aristo’ya atfedilerek Aristo mantõğõ veya klasik mantõk olarak da adlandõrõlan mantõk sistemi “doğru” ve “yanlõş” olmak üzere iki değerlik (0 veya 1) üzerine kurulmuştur. Klasik mantõk ile birçok mantõk işlemi açõklanmõş, yapõlan fonksiyon ve işlem (ve, veya, değil, eşitlik, denklik, çõkarõm) tanõmlamalarõ ile klasik mantõğõn matematiksel temelleri oluşturulmuştur.

Ancak zaman içerisinde, klasik mantõğõn üzerine kurulmuş olduğu kabullerin insan düşüncesini, bilgiyi ve dolayõsõ ile konuşma dilini tam olarak yansõtmaya yeterli olmadõğõ görülmüş ve genişletilmiş mantõk olarak adlandõrõlan ve doğruluk değeri olarak “doğru” ve “yanlõş”õn yanõ sõra, “bilinmiyor” veya “karar verilemez” değerliğini de içeren mantõk sistemi öne sürülmüştür. Bu esnada tartõşmaya açõlan mantõksal değerlik sistemlerine, iki veya üç değerliğe dayanan mantõk işlemlerinin insan düşünce sistemini yeterince açõklayamadõğõ gerekçesi ile bulanõk mantõk yaklaşõmõ da eklenmiştir.

Bulanõk mantõk yaklaşõmõ mantõksal değerliğin “doğru” ve “yanlõş” (0 veya 1) arasõnda sürekli ve herhangi bir değer olabileceği kabulüne dayanmaktadõr. Konuşma

(25)

dilinde sõklõkla kullanõlan ve kesin değerler değil, ara değerlere işaret eden “oldukça doğru”, “biraz doğru” ve “çok doğru” v.b. ifadeler bu kabulün çõkõş noktasõnõ oluşturmaktadõr.

Gerçekte, konuşma dilinde nicelik mantõğõna dayanan ve varlõk belirten ifadelerin sayõsõndan daha çok sayõda niteleyici kelime bulunmaktadõr. “Bazõ”, “neredeyse tamamõ”, “büyük kõsmõ” v.b. Bu değerlikler karakteristik olarak bulanõktõr ve bulanõk mantõk sisteminde yer almaktadõr. (Mamdani, 1987:XVI).

Bulanõk mantõk en temelde bilgiyi ve insan düşünce sistemini yansõtabilmek için tasarlanmõştõr. Genel insan düşünce sistemini modelleyebilmenin zorluklarõ veya mevcut bilgi ve teknolojiler ile henüz bu seviyeye ulaşõlamamasõndan dolayõ, düşünce sistemleri belirli uzmanlõk alanlarõ ile sõnõrlandõrõlarak tanõmlanmaya çalõşõlmõştõr.

“...bu tür sistemlerin büyük oranda karmaşõk olmasõ, mekanik sistemlere uygulandõğõnda yeterince etkili sonuçlar veren ancak, insan davranõşlarõnõn önemli rol oynadõğõ sistemlerde doğru sonuçlar vermekten çok uzak olan klasik metotlardan oldukça farklõ metotlarõn kullanõlmasõna ihtiyaç göstermektedir.” (Zadeh, 1975).

Bilgi ve özellikle belirli alanlar içerisindeki çõkarõm mekanizmalarõ bunlarõ kullanan ve bunlarla işlemler yürüten uzmanlardan elde edilebilir. Dolayõsõ ile, özellikle otomasyon alanõnda uzman sistemler; bilişim mühendisliği, sistem mühendisliği ve yapay zeka alanlarõnda hõzla gelişen bir alan olarak ortaya çõkmaktadõr.

İnsan makine etkileşiminde klasik mantõğõn üstesinden gelemediği bulanõklõğõn nedenleri aşağõda üç madde olarak sunulmuştur.

1. Sistem hakkõnda yeterli bilgiyi toplamak ve işlemede yetersizlikler. 2. İnsan ve çalõşma ortamõ arasõndaki ilişkilerin belirsizliği

3. İnsan düşünce süreçlerinin belirsizliği (Evans, 1992:8).

“İnsan faktörleri açõsõndan, bulanõklõk veya belirsizlik bilişsel süreçlerin her seviyesinde ortaya çõkmaktadõr ve bunun için insan davranõşlarõnõn doğal bir unsurudur.” (Singleton, 1987:13). Belirli ve tanõmlõ olan insan özelliklerinin sayõlarla ifadesi ve ilişkilerin klasik mantõkla modellenmesi mümkün olmasõna rağmen,

(26)

insanlar belirsizlik durumlarõnõ bulanõk kümeler mantõğõnõn açõkladõğõ sisteme daha yakõn bir yaklaşõmla işlemektedir. İnsan davranõş uzmanlarõ “yüksek iş yükü”, “büyük başarõ”, “olağan üstü gayret” v.b. belirsiz kavramlarõ anlamakta ve bularla mantõksal işlemler yapabilmekteyken, bu mantõk işlemlerini geleneksel mantõk işlemleri ile modelleyememektedir. “Raslantõsallõktan daha ziyade, bulanõk mantõk ile belirsizliğin yorumlanmasõ ve bulanõk bilginin matematiksel olarak modellenmesini sağlayan bulanõk küme teorisi insan esaslõ müphemlikle işlemler yapmada güçlü bir araç olabilir.” (Evans, 1992:3).

Herkes belirsizliklerle iç içedir ve bu belirsizlikler herhangi birisi tarafõndan anlaşõlabilmektedir. Eğer bu tip belirsizlik matematiksel olarak mühendislik işlemlerinde kullanõlabilirse etkileri ölçülemez boyutta olacaktõr. Sadece iki değerlikli bilgiyi işleyebildiği söylenen bilgisayarlar ile insanlar arasõndaki farkõn insanlarõn belirsizlik durumlarõnda da işlemler yapabilmesi olduğu söylenmektedir, fakat artõk bu çok önemli insan kabiliyeti bulanõk mantõk yaklaşõmõ ile bilgisayarlara ve mühendislik işlemlerine aktarõlmõş durumdadõr (Sugeno, 1992:1).

1.1.6. Bulanõk Kümeler

Bulanõk kümeler mantõğõ 1965 yõlõnda Zadeh tarafõndan öne sürülen matematiksel bir kavramdõr. “Bulanõk küme mantõğõnõn arkasõnda insan ve bilgisayar ilişkisini geliştirme isteği sezinlenmektedir.”(Sugeno, 1992:1). Bilgisayar ve insan çõkarõm/işlem yapma sistemlerinde benzerlikler olduğu kadar farklõlõklar, zayõf ve üstün taraflar, mevcuttur. Eğer bu iki sistemin üstün taraflarõnõ birbirini destekleyecek şekilde kullanabilirsek çok daha etkili sonuçlar alabilmemiz mümkün olacaktõr. Bütün bunlarõn ötesinde bulanõk kümelerin en önemli özelliği, insan düşünme sisteminde bulunan, belirsizlik işleme kabiliyetidir. Bundan dolayõ uygulama alanlarõ insan yaşamõ ile direkt olarak ilişkilidir.

…“insan simülasyonu” olarak da adlandõrõlabilecek, bulanõk kümelerin uygulama alanlarõnõn insan düşünme sistemi ve davranõşlarõ ile sõkõ ilişkisi vardõr. Bundan dolayõ, özellikle insanõn incelenmesi iyi sonuçlar alabilmek için çok önem arz etmektedir. Bulanõk mantõk için en büyük hedef; insanlarõn iyi taraflarõnõ almak ve yetersiz olduklarõ alanlarõ takviye etmektir. (Sugeno, 1992:7).

(27)

Belirsizlik ile ilgilenen bilim dallarõndan birisi de olasõlõktõr. Ancak olasõlõk sistemleri ve kurallarõnõn belirli doğruluk ve geçerlik seviyesinde kullanõlabilmesi için yine belirli miktarda ve nitelikte verinin bulunmasõ gereklidir. Bu tip verinin çok az olduğu, mevcut veri miktarõnõn anlamsõz olduğu veya olaylarõn varlõklarõnõn net olmadõğõ durumlarda olasõlõk bu belirsizliği işleyememektedir.

Bulanõk küme yaklaşõmõnõn ortaya çõkmasõnda aşağõda belirtilen amaçlara ulaşmak hedeflenmiştir (Sugeno, 1992:6).

1. İnsan tecrübesi, sağduyusunu makinelerin işleyebileceği bir yapõda ifade etmek.

2. İnsan duygularõ veya lisanõnõ modellemek.

3. İnsan desen (örüntü) algõlama, genel çõkarõm ve anlama işlemlerini taklit etmek.

4. Bilgiyi insanlarõn kolaylõkla anlayabileceği bir yapõya çevirmek. 5. Büyük miktarlardaki bilgiyi sõkõştõrmak.

6. İnsan psikolojisi veya davranõşõ modelleri yapmak. 7. Sosyal sistemleri modellemek.

Bulanõk küme yaklaşõmõnõ daha iyi anlayabilmek için “uzun” ve “yaşlõ” ifadelerini ele aldõğõmõzda; eğer 140 cm. ila 200 cm. arasõndaki insan boylarõ uzun olarak niteleniyorsa, herhangi bir insan boyunun uzun olarak nitelenme değerliğini bulabileceğimiz bir fonksiyon uzman görüşleri ile oluşturulabilir. Bu fonksiyona “üyelik fonksiyonu”, veya “karakteristik fonksiyon” adõ verilir. Şekil-1 ve Şekil-2’de uzun ve yaşlõ ifadeleri için örnek üyelik fonksiyonlarõ grafiksel olarak gösterilmiştir. Grafiklerin yatay eksenleri boy ve yaş’õ dikey eksenleri ise üyelik fonksiyon değerini ifade etmektedir. Üyelik fonksiyonu değeri 0 ila 1 arasõnda olup, bildirilen uzunluk veya yaşõn, “uzun” veya “yaşlõ” bulanõk kümelerine ait olma değerliğini ifade etmektedir.

(28)

Şekil-1 Üyelik Değer Grafiği Uzun) Şekil-2 Üyelik Değer Grafiği (Yaşlõ)

Yukarõdaki şekillerde “uzun” ve “yaşlõ” bulanõk ifadelerinin belirlenmiş üyelik fonksiyonlarõ gösterilmiştir. Bu fonksiyon 0 ila 1 değerleri arasõnda sürekli ve tanõmlõdõr. Yani 140 cm ila 200 cm arasõnda ölçülen herhangi bir boyun “uzun” bulanõk kümesine ait olmasõnõn değerliğini hesaplayabiliriz (örneğin 180 cm için 0,8 değerlikte “uzun” kabul edilme gibi). Veya 30 ila 80 yaşlarõ arasõndaki insanlarõn “yaşlõ” bulanõk kümesine ait olma değerliğini hesaplayabiliriz (örneğin 40 yaş için 0,4 değerlikte “yaşlõ” kabul edilme gibi).

Anlaşõlacağõ gibi, herhangi bir alanda tanõmlanabilecek bulanõk küme miktarõ ve üyelik fonksiyonu sõnõrsõzdõr (sonsuzdur). Ancak, bütün bu bulanõk kümelere karşõlõk kelime (grup adõ) ile bire bir ifade bulmak mümkün olmadõğõ gibi, bulanõk kümelerin her zaman bir kelime ile de ifadesi gerekli değildir. Örneğin Şekil-1’de verilen boy sõnõflandõrma grafiğinin “orta” ve “kõsa” boy bulanõk kümelerini de içerecek şekilde düzenlersek Şekil-3’teki gibi bir grafik elde ederiz.

Şekil-3 Üyelik Değer Garfiği (Kõsa,Orta,Uzun) 0 0,5 1 140 160 180 200 Boy (cm) Üy elik De ğer i Uzun 0 0,5 1 20 40 60 80 Yaş (Yõl) Üy elik De ğer i Yaşlõ 0 0,5 1 140 160 180 200 Boy (cm) Üy elik De ğer i Uzu n Kõsa Orta

(29)

Klasik küme teorisi ile karşõlaştõrma yapabilmek için Şekil-3’te ifade edilmeye çalõşõlan boy kümeleri bilgisini yaklaşõk olarak klasik küme yaklaşõmõ ile ifade etmeye çalõşõrsak 4’te ki çizimi elde ederiz. Burada önemli olan Şekil-3’te (bulanõk küme yaklaşõmõnda) ifade edilen bazõ küme özelliklerinin Şekil-4’te uygulanan klasik küme tekniğinde ifade edilememesidir.

Şekil-4 Klasik Küme Sõnõflamasõ (Kõsa,Orta,Uzun)

Klasik kümenin fonksiyon olarak ifadeleri ise aşağõdaki gibidir.

   ∉ ∈ = E x E x x xE ; 0 ; 1 ) (

{ }

0,1 :xxE (Karakteristik fonksiyon) X... Evren

E ... Evrenin alt kümesi {0,1}.... 0 ve 1 kümesi

1.1.7. Soru-Cevap Teorisi

Yetenek ve kazanõm testleri son zamanlarda özellikle soru-cevap teorisinin (Item Response Theory-IRT) katkõlarõ ile büyük gelişim kaydetmiştir. Soru-cevap teorisinin de içinde olduğu son yaklaşõmlar izlenen davranõşõ, davranõşõn altõnda

0 1 140 160 180 200 Boy (cm) Üy elik De ğer i Uzun Kõsa Orta

(30)

yatan özellikle ilişkilendiren matematiksel formüller öne sürmektedir. “Soru-cevap teorisi; test maddelerindeki performansõ, altta yatan yetenek ile ilişkilendirmede kullanõlan matematiksel fonksiyonlar ailesidir.” (Plake, 1987:375).

Eğer uygun bir soru-cevap fonksiyonu bulunabilirse, belirli bir yetenek seviyesindeki kişinin herhangi bir soruyu doğru yanõtlama olasõlõğõ tespit edilebilir. Bunun için benzer şahõslara benzer sorular sorulmasõ gerekli değildir. Olasõlõğa dayalõ bu tarz çõkarõmlar yapabilme kabiliyeti, özellikle eşitleme, ön-eşitleme, program değerlendirmesi ve uyarlamalõ test alanlarõnda olmak üzere, eğitimsel ölçmede büyük anlam taşõmaktõr.

Test uygulamalarõnda test güvenliğinin sağlanmasõ ve testlerin güncel halde tutulabilmesi için aynõ testin birden fazla form ile düzenlenmesi çok yaygõndõr. Test geliştirme çabalarõnõn ne derecede başarõlõ olduğundan bağõmsõz olarak, çoğaltõlan bu değişik formlarõn zorluk dereceleri arasõnda farklarõn olmasõ kaçõnõlmazdõr. Aynõ testin değişik formlarõ uygulanan kişilerin başarõsõnõn değerlendirilmesinde doğru cevap sayõlarõnõn veya doğru cevap yüzdelerinin kullanõlmasõ, testler arasõndaki zorluk derecesi farkõndan dolayõ yanõltõcõ olacaktõr. Örneğin; bir test formundaki 25 doğru cevaplõk ham skor, aralarõnda zorluk derecesi farkõ olduğu için, diğer formdaki 25 doğru cevaplõk ham skor ile aynõ derecede bir kabiliyete işaret etmeyebilir. Dönüştürülmüş puanlarõn eşitliği aynõ seviyede bir kabiliyeti göstermesi maksadõyla bu formlardan elde edilen puanlarõn ortak bir ölçekte ifade edilmesi ve dönüştürülmesi için istatistiksel işlemler geliştirilmiştir. Dönüştürme ve eşitleme işlemi yapõldõktan sonra kişilerin hangi form ile test edildiklerinin önemi kalmaz. Klasik eşitleme metotlarõ yaygõn olarak kullanõlõyor olmasõna rağmen soru-cevap teorisi esaslõ yöntemler de yaygõnlõk kazanmaktadõr.

“Soru-cevap metotlarõna dönüşümün bir sebebi de soru-cevap esaslõ eşitlemelerin makul uzunluktaki eşitleme zincirlerinde klasik eşitleme metotlarõna göre daha geçerli ve daha tutarlõ olmalarõ olabilir (Peterson, 1983)”(Aktaran: Plake, 1987:375-376). Burada kast edilen eşitleme zincirine bir örnek verilecek olursa; A\B\C ve D farklõ test formlarõ olsun, öyle ki, B formu A’ya , C formu B’ye ve D formu da C’ye eşitlenmiş olsun. Bu durumda eşitliğin doğasõ gereği A formunun D

(31)

formuna eşit olduğunu kabul etmemiz gerekli olacaktõr. Test uygulamalarõ zaman içerisinde yaygõnlaştõkça bu tür eşitlik zincirleri oluşturulmasõ kaçõnõlmazdõr.

Örtüşen sorular tekniği klasik eşitleme metotlarõndan bir tanesidir. Bu metot eski ve yeni formlarda örtüşen sorular bulunmasõna dayalõdõr. Bu sorular eski ve yeni test formlarõ arasõnda ilişkiyi oluşturmak üzere tasarlanmõş içerik ve zorluk seviyesinin küçük bir özetini oluşturan maddelerden oluşmaktadõr, genellikle mini-test (veya çapa-mini-test) olarak adlandõrõlõr. Bu yüzden, klasik metotta eşitlemenin yapõlabilmesi için eşitleme işleminden önce toplam puan ve bu mini-test puanlarõnõn hesaplanmasõ ve uygulamanõn eksiksiz gerçekleştirilmesi gerekli olmaktadõr. Bu ihtiyaç test uygulamasõ ve sonuçlarõnõn yayõnlanmasõ arasõnda oldukça uzun bir zamana ihtiyaç göstermektedir.

Soru-cevap tekniği “ön eşitleme” (test uygulamasõndan önce puanlarõ ortak bir ölçeğe yerleştirme) uygulamasõnõn kullanõlmasõna imkan tanõmaktadõr. Çünkü, soru-cevap tekniğinde analiz edilen (veya ayarlanan) ve ortak ölçeğe uyarlananlar sorularõn kendisidir. Yeni sorular ayarlanmõş sorular havuzuna bir ön test işleminden sonra eklenirler. “Bu ön test uygulamasõ bazõ sorularõn kullanõlan test formuna dahil edilmesi ancak, bunlarõn puan hesaplamasõnda kullanõlmamasõ ile gerçekleştirilir.” (Plake, 1987:376). Puan hesaplamasõ için kullanõlacak olan sorular daha önceden ayarlandõğõ için her bir şahõs için ortak ölçeğe dönüşüm tablosu zaten hazõr durumdadõr. Ön test sorularõnõn ortak ölçeğe ayarlanmasõ işlemi ise her şahsõn test puanõ hesaplandõktan sonra gerçekleştirilir. Bu sorular daha sonra işlevsel olarak kullanõlmak üzere soru havuzuna eklenir. Böylece test formlarõnõn eşitlenmesi için kullanõlan algoritmalarõn ihtiyaç duyduğu zaman test uygulamasõndan önce kullanõlarak test sonuçlarõnõn hesaplanmasõ çok daha kõsa sürede gerçekleştirilebilir. Soru-cevap tekniği “kişiden bağõmsõz soru ayarlamasõ ve sorudan bağõmsõz yetenek/kazanõm ölçmesi” (Linn, 1989:2) olarak özetlenebilir.

(32)

1.1.8. Uyarlamalõ Bilgisayar Testleri

Soru-cevap tekniğinin bir diğer önemli uygulamasõ da çevrim içi uyarlamalõ bilgisayar testlerinde kullanõlmak üzere soru havuzlarõnõn geliştirilmesidir. Uyarlamalõ test uygulamasõnda alõnan cevaplar sonraki soru veya soru setinin belirlenmesinde kullanõlabilir. Belirli bir miktarda doğru cevap, daha yüksek veya eşit seviyede kabiliyet gerektiren sorularõn ve belirli miktarda yanlõş cevap, daha az kabiliyet gerektiren sorularõn seçilmesini temin edebilir. Bu şekilde kişilerin kabiliyet veya kazanõm miktarlarõ daha az soru ile tespit edilebilir. “Bu yüzden, sõnavlar kişiselleştirilerek, öğrencilerin uygun olmayan gelişim seviyelerindeki çok sayõda sorudan oluşan test bataryalarõnõ tamamlamalarõna gerek kalmamaktadõr (Green, 1983).” (Aktaran: Plake, 1987:376).

Sonuç olarak klasik test teorisi kullanõlarak bu tür testlerin ortak bir ölçekte buluşturulmasõ ve sonuç karşõlaştõrmasõnõn yapõlmasõ mümkün değildir. “Soru-cevap tekniğinde bahsedilen yöntemin kullanõlmasõ teorik olarak mümkün görülse de özellikle bazõ uygulamalarda bu tekniğin geçerliliği tartõşõlmaktadõr (Dorans, 1984)” (Aktaran: Plake, 1987:376).

“Bazõ büyük uygulamalar belirli bir araştõrma sürecinden geçtikten sonra bu tekniği kullanmaya başlamõştõr. Örneğin; Test Of English as a Foreign Language (TOEFL), California Test of Basic Skills (CTBS).” (Plake, 1987:376). Soru-cevap tekniği ile ayarlamasõ yapõlmõş sorulardan oluşan ve aynõ sorularõn aynõ form içerisinde tekrarlanma olasõlõğõ çok düşük olan bir soru havuzundan seçilen sorularla hazõrlanmõş uyarlamalõ bilgisayar testlerinin, kişi başõna sorulmasõ gereken soru miktarõnõ azaltacağõ kesindir.

“Genellikle eşit güvenirlik derecesinde uyarlamalõ bir test için klasik test bataryasõnda kullanõlanõn yarõsõ kadar soruya ihtiyaç vardõr.” (Mehrens, 1991:528). Ayrõca, oluşturulacak her bir soru bataryasõ diğerinden farklõ olacağõ için test uygulamasõnõn aynõ zaman dilimi içerisinde yapõlmasõ ihtiyacõ da ortadan kalkacaktõr.

(33)

1.2. Problem

Öğretmenlerin kendi alanlarõnda uzman olduklarõ kadar birer iletişim uzmanõ olmalarõ ve pedagojik formasyona sahip olmalarõ beklenmektedir. Bu beklentilerin arkasõnda yatan amaç ise onlara tahsis edilen uzmanlõk konularõnõ öğrencilere en iyi şekilde aktarmanõn yanõnda, öğrencilerde oluşan kazanõmlarõ ve sergiledikleri öğrenme performansõnõ uygun şekilde ölçerek onlarõn (dolayõsõ ile uygulanan eğitim sisteminin) başarõsõ konusunda rasyonel çõkarõmlarda bulunabilmeleridir. Sõnõf ortamõnda, direkt iletişim kurmak suretiyle, öğretmenler özellikle başarõnõn ölçülmesi ve öğrencide oluşan öğrenmenin şekli konusunda bir yargõya varabilirler. Bir başka deyişle, karşõlõklõ soru cevap ve/veya sözlü yoklamalar ile öğretmen öğrencinin gerçekleştirdiği öğrenmeler hakkõnda bir değer yargõsõ üretebilir. Öğretmen bütün bunlarõ yaparken, canlõ iletişimin sağladõğõ fayda ile öğrenciden aldõğõ tepkiyi anõnda değerlendirerek bir sonraki etkinin (sorunun) ne olacağõna karar vermekte ve aslõnda aldõğõ tepkileri kendi içsel ölçeğinde değerlendirmeye tabi tutmaktadõr ve bazõ çõkarõmlarda bulunmaktadõr. Öğretmen beceri eksikliği, sõnõf mevcutlarõndan kaynaklanan yeterli miktarda iletişim kurulamamasõ, genele uygulanacak kriter ve normlarõn tanõmlanamamasõ ve özellikle kişisel faktörlerden kaynaklanan tarafsõzlõğõn muhafaza edilememesi gibi olumsuz etkiler dõşarõda bõrakõlõrsa bu şekilde yapõlan değerlendirmeler belki de en uygun değerlendirme sistemi olabilir.

Yukarõda sayõlan olumsuz etkilerden kurtulabilmek için günümüzde standartlaştõrõlmõş testler kullanõlmaktadõr. Eğitimsel ölçmede kullanõlmakta olan testlerin neredeyse tamamõ etki tepki prensibinin oluşturduğu ve tepkilerin yanlõş veya doğru olarak değerlendirildiği (0 veya 1 değeri ile ölçümlenen) sorulardan oluşmaktadõr (Carrol, 1987:94). Bu değerlendirme stilinde genellikle (mevcut uyarlamalõ bilgisayar testlerini dõşarõda bõrakõrsak) sorularõn tümünün her öğrenci tarafõndan yanõtlanmasõ beklenmektedir ve her soru için beklenen öğrenci tepkisinin ölçeklenen değeri soru ağõrlõk katsayõsõ ile ifade edilmektedir. Klasik test yöntemleri ile öğrencilerde oluşan öğrenme konusunda çõkarõmlarda/yorumlarda bulunabilmek için hangi verilerin toplanmasõ gerektiği, bu veriler ve öğrencilere ne derecede güvenilebileceği, toplanan verilerin örtüşmek suretiyle aynõ boyutu ölçmesi veya

(34)

birbirini zayõflatmasõ hususlarõnõn açõklõğa kavuşturulmasõ gerekli olmaktadõr (Mislevy, 1994:1).

“Ayrõca psikometrik ölçme teorisine göre; hiçbir ölçüm kesin değildir ve biz insanlarla uğraşmaktayõz, plastikle değil. İnsan düşünme sistemi ile ilgilendiğimiz için hep çõkarõm/yorum yapmak zorunda kalacağõz.” (Baker, 1987:344). Bu ifadeden de anlaşõlacağõ gibi öğrenmeyi kesin bir değer ile ölçmemiz, ve bu değeri herhangi bir yoruma tabi tutmadan kullanmamõz mümkün değildir. “İnsanlar kesin ölçüm sistemlerinin bulanõk hedefleridir” (Baker, 1987:344).

Eğitimin değerlendirilmesi, eğitim yönteminin uyarlanmasõ ve bireysel davranõş değişiklikleri ile kazanõmlarõn sorgulanarak eksikliklerin giderilmesine imkan vermesi açõsõndan önemlidir. Hedeflenen davranõş değişikliklerinin oluşup oluşmadõğõnõn öğrenilmesi, müteakip eğitim faaliyetlerinin şekillendirilmesinde kilit bir aşama oluşturmaktadõr. Eğitimin planlama, icra ve değerlendirilme süreçlerini çok kesin zaman ve dönemler ile ayõrmanõn mümkün olmadõğõ günümüz eğitim programlarõnda, kazanõmlarõn ölçülmesi sürekli bir döngü içerisinde tekrarlanan süreçlerin içsel bir parçasõnõ oluşturmaktadõr. Eğitimin hedeflerine ulaşma derecesinin ve eksik kalan boyutlarõnõn bilinmesi en az eğitimin icrasõ kadar önem taşõmaktadõr.

Eğitim aşamalarõnõn öğrenci ihtiyaçlarõ ve tercihleri doğrultusunda kişiselleştirilmesi, eğitim etkinliğini artõracak temel prensiplerden birisi olarak kabul edilmektedir. Birey ihtiyaçlarõna uyarlanmõş bir eğitim döngüsü içerisinde ölçme sürecinin kişiselleştirilmemesi düşünülemez. Günümüzde, özellikle bilgi işleme teknolojisinin eğitim alanõnda yoğun olarak kullanõlmasõ, eğitimde ölçme işlemlerinin de her öğrenci için özelleştirilmesine imkan tanõmaktadõr. Daha önceleri, özellikle öğrenci sayõsõnõn fazla olmasõ sebebi ile ölçme işleminin bireye özel olarak icra edilmesi zaman ve diğer kaynaklar açõsõndan uygulanamaz bulunmasõna rağmen, günümüzde bilgi işleme sistemlerinin sağladõğõ hesaplama gücü, sunum yeteneği ve veri bankalarõ üzerinde etkileşimli çalõşma algoritmalarõ kişiselleştirilmiş ölçme işlemini uygulanabilir duruma getirmiştir. Hiç şüphesiz, bireye özgü bir ölçme,

(35)

şahsõn eğitim kazanõmlarõnõ edinme seviyesi konusunda daha etkin çõkarõmlarda bulunmaya imkan tanõyacaktõr.

Uyarlamalõ sõnav tekniği, bilgi işleme sistemi altyapõsõnõn kullanõmõ ile son zamanlarda önemli ölçüde uygulama alanõ bulmaktadõr. Her öğrenci için farklõ soru serilerinin otomatik ve etkileşimli olarak belirlenmesine imkan tanõyan bu yaklaşõm, öğrenci kazanõmlarõnõn birbirleri ile (öğrenciler arasõnda) karşõlaştõrõlmasõndan daha ziyade, öğrencilerin belirli kriter/alanlardaki yeterliliklerini ölçmede faydalõ bulunmaktadõr. Zira, uyarlamalõ sõnav tekniği ile öğrencinin bilgi seviyesinin çok altõnda zorluk derecesindeki sorularla sõnav motivasyonunun kaybedilmesi ve dikkat dağõlmasõnõn önüne geçilmekte, aynõ zamanda bilgi seviyesinin çok üstündeki sorular ile kendine güven ve moralinin olumsuz etkilenmesi önlenmeye çalõşõlmaktadõr. Bu teknikte sorular öğrenci kazanõmlarõ konusunda net çõkarõmlar elde edecek şekilde özelleştirildiği için öğrenci yeterlilikleri daha etkin tespit edilebilmektedir. Ölçme için ihtiyaç duyulan toplam zamanõn azalmasõ ve sõnav yönetiminde daha esnek uygulamalara (bir seferde ve toplu halde sõnav uygulamasõ yerine) imkan tanõmasõ bu tekniğin uygulanmasõnda önemli ek faydalar olarak göze çarpmaktadõr. Bütün bunlarõn yanõnda, bilgi işlem sistemi altyapõsõnõn hazõr bulunmasõ ile bu tekniği destekleyecek soru bankasõnõn varlõğõ-idamesi (yeni sorularõn eklenmesi ve uygulama sonuçlarõna göre yeniden düzenlenmesi) okul gibi ortamlarda bu tekniğin kullanõlmasõnõn önünde önemli engelleri oluşturmaktadõr. Ancak, ölçme işleminin planlanmasõ, tekrarlanmasõ ve yorumlanmasõnda sistemin kendi kendine yeterliliği bu tekniğin özellikle bireysel eğitim setleri (tutorial) içerisinde kullanõlabilmesine imkan tanõmakta ve bu teknikle, uzaktan eğitim gibi öğretmen öğrenci etkileşiminin sağlanmasõnda zorlukla karşõlaşõlan durumlarda öğrenci kazanõmlarõ standart ölçme testlerine nazaran daha etkin belirlenebilmektedir.

Klasik eğitim süreci içerisinde öğrenci kazanõmlarõnõn ölçülmesi ve değerlendirilmesinde öğretmen kanaati ve klasik isimlendirmesi ile “sözlü sõnav” olarak bilinen etkileşimli ve kişiselleştirilmiş sõnavlarõn önemi yadsõnamaz. Sözlü sõnavlar kişisellik boyutu bir tarafa bõrakõlõp, öğretmen öğrenci etkileşimi açõsõndan incelendiğinde, öğrenci kazanõmlarõnõn ölçülmesinde öğretmenin uzmanlõk

(36)

tecrübesinin bu sõnav tekniğinde önemli bir yeri olduğu görülmektedir. Öğretmen alanõnda sahip olduğu uzmanlõk seviyesi ile orantõlõ olarak, etkileşimli ve uyarlamalõ sõnavõ yönetmekte ve öğrenci kazanõmlarõ konusunda çõkarõmlarda bulunabilmektedir. Bu teknikte öğretmenlerce kullanõlan çõkarõm algoritmasõnõn matematiksel bir modelini tam olarak oluşturabilmek, diğer bir çok uzman sistemde olduğu gibi, mümkün değildir. Öğretmen bahse konu etkileşimli sõnavõ yönetirken ve kazanõm yeterlilikleri hakkõnda çõkarõmlara ulaşõrken sõnav esnasõndaki duygusal iletişim, öğrenci ile sõnav öncesi yaşanmõş tecrübeler ve matematiksel olarak ifade edilemeyecek daha bir çok etken tesiri ile kararlar vermektedir. Böyle bir süreç için matematiksel model oluşturmada, model karmaşõklõğõnõn yanõnda, bu modele girdi teşkil edecek bir çok boyutun ölçülmesindeki (belirli sayõsal değerlerle ifade edilmesi) zorluk önemli bir engeldir. Özellikle uzman bilgi ve becerisine dayanan benzer problemler için bulanõk mantõk çõkarõm sistemi oldukça başarõlõ sonuçlar elde etmiştir. Otomatik sistemlerde, sayõsal değerlerle ölçülmesi mümkün olmayan veya ölçülmesine gerek olmayan nitelikler bulanõk değerler ile tanõmlanarak uzman tecrübesi daha başarõlõ olarak taklit edilebilmektedir. Öğretmenin alanõndaki uzmanlõk birikimi ve sorulan soruya örencinin vermiş olduğu yanõt, müteakip sorunun seçilmesinde ve öğrencinin sergilemiş olduğu kazanõm yeterliliğinin belirlenmesinde önemli rol oynamaktadõr. Sözlü sõnavlarda öğretmenler tarafõndan kullanõlan bu özelliklerin otomatik sistemler tarafõndan da yeterli etkinlikte kullanõlabilmesi eğitim ölçmesine önemli katkõlar sağlayacaktõr.

Eğitim kazanõmlarõnõn ölçülmesinde kullanõlacak sorularõn tek alan ve tek kazanõmõ ölçmesi ideal olarak belirlenmiştir. Ancak, hazõrlanan her sorunun doğru cevaplandõrõlmasõ için aslõnda birden fazla alanda yeterliğe ihtiyaç göstermesi kaçõnõlamaz bir gerçektir. Bu problem karşõsõnda, sorularõn doğru yanõtlanmasõ için ihtiyaç duyulan ve temelde ölçülmesi hedeflenen yeterlilik alanõnõn dõşõnda kalan diğer yeterliliklerin daha önceden kazanõlmõş olduğu kabulü sorularõnõn tek boyutu ele aldõğõ varsayõmõna uygulanabilirlik kazandõrmaktadõr. Fakat, bu kabul yanlõş cevap alõnmasõ durumunda eksik olan yeterlilik boyutunun yanlõş tespit edilmesine ve birden fazla alanda yeterlilik sergilenmesine karşõlõk bunlardan sadece birisinin ölçmeye yansõmasõna sebep olmaktadõr. Bir başka ifade ile; yanlõş cevaplarõn aslõnda

Referanslar

Benzer Belgeler

Erciyes Oniversilesi T1p FakOitesi GogOs ve Kalp-Damar Cerrahisi Anabifim Dafl'nda 1982·1988 y1ffan arasmda Perthes Sendromu tams1yla takip ve tedavi edilen 16

Temel Elektrik Devre

Servis Kalitesi için verilen kesin değere (7.2) göre bulanıklaştırma yaptığımızda aldığımız sonuç:... AFYON

Prolog dilinde aritmetik bir ifadenin de˘ gerlendirilmesi i¸ cin a¸sa˘ gıdaki hangi komut kullanılır?(To force evaluation of an arithmetic term in Prolog, you must use the

IFN-gamma, IL-12, IL-15, IL-18 E... İmmünoloji Toplam Soru Sayısı: 38 9 Aşağıdaki seçeneklerden hangisinde, T helper 2 grubu sitokinler doğru olarak verilmiştir? ).. Cevap:

Laboratuvara geç gelen öğrenciler deneye alınmayacaktır.. Telafi deneyi

Test Adı: 6.SINIF 1.DENEME SÖZEL BÖLÜM Hazırlayan: Bağcılar Prof.. Fuat

AYDIN YAYINLARI.. Spor salonunda her üyeye bir adet havlu verilmektedir. Spor salonunda havlular 7’şerli pakette ve her pakette soldan sağa doğru sırasıyla 2 adet pembe, 1