Araştırma Özyeterlik Ölçeğinin Psikometrik Özelliklerinin Klasik Test Kuramı Ve Madde Tepki Kuramına Göre İncelenmesi

(1)

(2)

(3)

ARAŞTIRMA ÖZYETERLİK ÖLÇEĞİNİN PSİKOMETRİK ÖZELLİKLERİNİN KLASİK TEST KURAMI VE MADDE TEPKİ

KURAMINA GÖRE İNCELENMESİ

MENEKŞE UYSAL

YÜKSEK LİSANS TEZİ

EĞİTİMDE ÖLÇME VE DEĞERLENDİRME ANABİLİM DALI

GAZİ ÜNİVERSİTESİ EĞİTİM BİLİMLERİ ENSTİTÜSÜ

(4)

TELİF HAKKI ve TEZ FOTOKOPİ İZİN FORMU

YAZARIN Adı: Menekşe Soyadı: UYSAL

Bölümü: Eğitimde Ölçme ve Değerlendirme İmza:

Teslim tarihi:

TEZİN

Türkçe Adı: Araştırma Özyeterlik Ölçeğinin Psikometrik Özelliklerinin Klasik Test Kuramı ve Madde Tepki Kuramına Göre İncelenmesi

İngilizce Adı An Investigation of Psychometric Properties of Research Self-Efficacy Scale According to Classical Test Theory and Item Response Theory:

(5)

ETİK İLKELERE UYGUNLUK BEYANI

Tez yazma sürecinde bilimsel ve etik ilkelere uyduğumu, yararlandığım tüm kaynakları kaynak gösterme ilkelerine uygun olarak kaynakçada belirttiğimi ve bu bölümler dışındaki tüm ifadelerin şahsıma ait olduğunu beyan ederim.

Yazar Adı Soyadı: Menekşe UYSAL İmza: ………..

(6)

Jüri onay sayfası

Menekşe UYSAL tarafından hazırlanan “Araştırma Özyeterlik Ölçeğinin Psikometrik Özelliklerinin Klasik Test Kuramı ve Madde Tepki Kuramına Göre İncelenmesi” adlı tez çalışması aşağıdaki jüri tarafından oy birliği / oy çokluğu ile Gazi Üniversitesi Eğitimde Ölçme ve Değerlendirme Anabilim Dalı’nda Yüksek Lisans tezi olarak kabul edilmiştir.

Danışman: Prof. Dr. Şener BÜYÜKÖZTÜRK

(Eğitimde Ölçme ve Değerlendirme Anabilim Dalı, Hasan Kalyoncu Üniversitesi)…………

Başkan: Prof. Dr. Hülya KELECİOĞLU

(Eğitimde Ölçme ve Değerlendirme Anabilim Dalı, Hacettepe Üniversitesi)………...

Üye: Doç. Dr. İsmail KARAKAYA

(Eğitimde Ölçme ve Değerlendirme Anabilim Dalı, Gazi Üniversitesi) ………..

Tez Savunma Tarihi: 12/02/2015

Bu tezin Eğitimde Ölçme ve Değerlendirme Anabilim Dalı’nda Yüksek Lisans/ Doktora tezi olması için şartları yerine getirdiğini onaylıyorum.

Prof. Dr. Servet KARABAĞ Eğitim Bilimleri Enstitüsü Müdürü

(7)

TEŞEKKÜR

Çalışmanın her aşamasında desteğini benden esirgemeyen, hem araştırmamı hem de geleceğimi şekillendirmeme yardımcı olan, her konuda örnek aldığım, desteğine; varlığına her zaman ihtiyaç duyacağım danışmanım ve çok değerli hocam Sayın Prof. Dr. Şener BÜYÜKÖZTÜRK’e çok teşekkür ediyorum.

Yüksek lisans ders ve tez dönemlerinde edindiğim bilgi ve deneyimlere katkı sağlayan Gazi Üniversitesi Eğitimde Ölçme ve Değerlendirme Anabilim Dalı’nda görev yapan kıymetli hocalarım ve araştırma görevlisi arkadaşlarıma teşekkür ediyorum.

Tezimin yazım sürecinde kıymetli görüş ve önerilerini benimle paylaşan değerli hocalarım Doç. Dr. Nilüfer KAHRAMAN ve Prof. Dr. Hülya KELECİOĞLU’na teşekkür etmek istiyorum.

Tezim konusunda beni motive ettikleri, değerli fikirlerini benimle paylaştıkları ve her zaman yanımda oldukları için çok kıymetli arkadaşlarım Halime YILDIRIM ve Sinem ŞENFERAH’a teşekkür etmek istiyorum.

Hayatım boyunca desteklerini hep hissettiğim, emeklerinin karşılığını hiçbir şekilde ödeyemeyeceğim annem Nesrin UYSAL ve babam Ekrem UYSAL’a; en değerli varlığım, kardeşim Emre UYSAL’a teşekkür etmek istiyorum.

(8)

ARAŞTIRMA ÖZYETERLİK ÖLÇEĞİNİN PSİKOMETRİK

ÖZELLİKLERİNİN KLASİK TEST KURAMI VE MADDE TEPKİ

KURAMINA GÖRE İNCELENMESİ

(Yüksek Lisans Tezi)

MENEKŞE UYSAL

GAZİ ÜNİVERSİTESİ

EĞİTİM BİLİMLERİ ENSTİTÜSÜ

Şubat 2015

ÖZ

Bu araştırmanın amacı, araştırma özyeterlik ölçeğinin madde (madde ayırıcılık gücü, maddenin ölçtüğü özellik düzeyi) ve ölçek (ölçek puanı, güvenirlik ve geçerlik) özelliklerini klasik test kuramı (KTK) ve madde tepki kuramına (MTK) göre incelemektir. Çalışmada, ölçeğin belirtilen iki kurama göre kestirilen psikometrik özellikleri ve bireylerin araştırma özyeterlik algıları arasındaki ilişkiler incelenmiştir. Çalışmaya, Ankara ilindeki kamu ve vakıf üniversitelerinden farklı sınıf düzeylerinden 549 eğitim fakültesi öğrencisi katılmıştır. Çalışma var olan bir durumu ortaya koymayı amaçlayan betimsel düzeyde, tarama türünde bir araştırmadır. Ayrıca psikometrik özelliklerin iki farklı kurama göre incelenmesini ve sonuçlarının karşılaştırılmasını içerdiği için bilgi üretmeye dönük temel bir araştırma niteliğine de sahiptir. 18 maddelik ölçeğin psikometrik özellikleri belirlenmeden önce kuramlara ilişkin sayıltılar kontrol edilmiştir. Araştırma özyeterlik ölçeği ile toplanan verilerin yaklaşık normal dağılım özelliği gösterdiği, ölçeğin ölçtüğü yapının tek boyutlu olduğu dolayısıyla ölçek maddelerinin yerel bağımsız olduğu görülmüştür. Araştırmanın sonuçları, ölçek maddelerinin her iki kurama göre de iyi ayırt edici olduğunu göstermiştir. Belirtilen iki kurama göre kestirilen madde ayırıcılık güçleri arasında pozitif yönde yüksek düzeyde bir ilişki bulunmuş, dolayısıyla benzer oldukları yorumu yapılmıştır. Ölçek maddelerinin ölçtükleri özellik düzeyleri incelendiğinde öğrencilerin genellikle yüksek düzeydeki kategorilere tepki verdikleri görülmüştür. Ölçülen özellik düzeyleri açısından iki

(9)

yorumu yapılmıştır. Öğrencilerin her iki kurama göre kestirilen araştırma özyeterlik düzeyleri incelendiğinde aralarında yüksek düzeyde pozitif yönde bir ilişki olduğu görülmüş ve benzedikleri yorumu yapılmıştır. Ölçeğin yapı geçerliği, daha önce araştırma deneyimine sahip olan ve olmayan öğrencilerin iki kurama göre kestirilen araştırma özyeterlik algıları arasındaki farkın manidarlığı ile incelenmiş ve iki kurama göre de araştırma deneyimine sahip grup lehine manidar bir farklılık olduğu görülmüştür. Ölçüte dayalı geçerlik için yapılan analiz sonuçlarına göre, ölçek puanları ve araştırmaya yönelik kaygı ölçeğinden alınan puanlar arasında negatif yönde orta düzeyde, ölçek puanları ve algılanan akademik başarı arasında ise pozitif yönde orta düzeyde manidar ilişki bulunmuştur. Son olarak ölçeğin güvenirliği iki kurama göre de incelenmiştir. KTK’ya göre ölçeğin güvenirliği Cronbach alfa iç tutarlık katsayısı ile incelenmiş ve 0,930 olarak hesaplanmıştır. Ölçeğin MTK’ya göre güvenirliği test ve madde bilgi fonksiyonları aracılığıyla incelenmiştir. Test bilgi fonksiyonu değerleri incelendiğinde, testin orta ve düşük araştırma özyeterlik düzeyleri için daha fazla bilgi verdiği, dolayısıyla bu düzeylerde daha az hata ile ölçme yapıldığı görülmektedir. Ölçülen özelliğin farklı düzeyleri için kestirilen güvenirlik katsayılarının bir ortalaması kabul edilen marjinal güvenirlik katsayısı oldukça yüksek bulunmuştur. Sonuç olarak ölçeğin iki kurama göre de kestirilen güvenirlik katsayılarının benzer olduğu ve ölçek puanlarının güvenilir olduğu yorumu yapılmıştır.

Bilim kodu:6.015

Anahtar Kelimeler: Klasik test kuramı, Madde tepki kuramı, Derecelendirilmiş tepki modeli.

Sayfa Adedi: xiii+118

(10)

AN INVESTIGATION OF PSYCHOMETRIC PROPERTIES OF

RESEARCH SELF-EFFICACY SCALE ACCORDING TO

CLASSICAL TEST THEORY AND ITEM RESPONSE THEORY

(M.S Thesis)

Menekşe Uysal

GAZI UNİVERSITY

GRADUATE SCHOOL OF EDUCATIONAL SCIENCES

February 2015

ABSTRACT

The aim of this study is to examine the item (item discrimination power, item location) and scale (scale scores, reliability and validity) properties of research self-efficacy scale according to classical test theory (CTT) and item response theory (IRT). In this study, it was examined the relationships between the psychometric properties of scale and students’ research self-efficacy perceptions estimated according to two measurement frameworks stated. A total of 549 students at different class levels and from public and foundation universities’ educational faculties participated in the study. It was aimed to reveal a substantial situation in the study, and the method of study is survey in descriptive level. Also since it included the comparison of results and research of psychometric properties of scale estimated by two different frameworks, at the same time the study has a basic informative research features. Before determining the psychometric properties of scale having 18 items, assumptions related to measurement theories were tested. It was seen that data collected with research self-efficacy scale were distributed approximately normally, the construct that the scale measures was unidimensional and thereby the items of scale were local independent. According to results of this study, it was seen that items of scale have high item discrimination values in terms of the both measurement frameworks. There was a high level correlation between item discrimination values estimated by these theories, thereby it was commented that they were similar to each other. When examined level of the feature scale

(11)

there was a high level correlation in terms of measured attribute levels between both of theories. When examined research self-efficacy levels of students estimated both of theories, there was a high correlation between them and it was commented that they were similar to each other. Structural validity of the scale was examined by the significance of difference between research self-efficacy perceptions of students who have previous research experience as opposed to those who do not and there is a significant difference in favor of students who have previous research experience according to both theories. The analysis for criterion related validity showed a negative correlation at a medium level between the scale scores and the scores of the research anxiety scale, and a positive correlation at a medium level between the scale scores and perceived academic achievement. Finally, reliability of scale is examined I

n terms of both theories. According to CTT, reliability of scale was examined by Cronbach alpha internal consistency and computed as 0,930. According to IRT, reliability of scale was examined by test and item information functions. When examined test information function, it was seen that test gave more information at low and medium levels of research self-efficacy and it measured with less error. It was found that marginal reliability coefficient assumed as the mean of reliability coefficients estimated for different levels of measured attribute was very high. Finally, it was commented that the reliability coefficients estimated by both theories were similar and scale scores were reliable.

Science Code: 6.015

Key Words: Classical test theory, Item response theory, Graded response model. Page Number: xiii + 118

(12)

İÇİNDEKİLER

ÖZ ... v

ABSTRACT ... vii

TABLOLAR LİSTESİ... xi

ŞEKİLLER LİSTESİ ... xii

SİMGELER VE KISALTMALAR LİSTESİ ... xiii

BÖLÜM I ... 1 GİRİŞ ... 1 1.1. Problem Durumu... 1 1.2. Amaç ... 5 1.2.1. Problem İfadesi ... 5 1.2.1.1. Alt Problemler ... 5 1.3. Önem ... 6 1.4 Sınırlılık ... 6 BÖLÜM II ... 9

İLGİLİ ARAŞTIRMALAR ve KURAMSAL ÇERÇEVE ... 9

2.1. İlgili Araştırmalar ... 9

2.2. Kuramsal Çerçeve ... 17

2.2.1. Araştırma Özyeterliği ... 17

2.2.2. Klasik Test Kuramı... 18

2.2.2.1. Likert Tipi Ölçeklerin Psikometrik Özelliklerinin Klasik Test Kuramına Göre Kestirilmesi ... 20

2.2.3. Madde Tepki Kuramı ve Modelleri... 25

2.2.3 1. Samejima’nın Derecelendirilmiş Tepki Modeli ... 35

2.2.3.2. Likert Tipi Ölçeklerin Psikometrik Özelliklerinin Madde Tepki Kuramına Göre Kestirilmesi ... 37

(13)

3.1. Araştırmanın Modeli... 41

3.2. Çalışma Grubu ... 41

3.3. Veri Toplama Araçları... 44

3.3.1. Araştırma Özyeterlik Ölçeği ... 44

3.3.2. Araştırmaya Yönelik Kaygı Ölçeği ... 45

3.4. Verilerin Analizi ... 46

3.4.1. Normal Dağılım ... 48

3.4.2. Tek boyutluluk ... 49

3.4.3. Yerel Bağımsızlık ... 50

3.4.4. Model Uyumu ... 51

3.4.5. Alt Problemlerin Test Edilmesi ... 54

BÖLÜM IV ... 57

BULGULAR ve YORUM... 57

4.1.Birinci Alt Probleme İlişkin Bulgular ... 57

4.2. İkinci Alt Probleme İlişkin Bulgular ... 60

4.3.Üçüncü Alt Probleme İlişkin Bulgular ... 64

4.4.Dördüncü Alt Probleme İlişkin Bulgular ... 65

4.5. Beşinci Alt Probleme İlişkin Bulgular ... 67

BÖLÜM V... 73 SONUÇ ve ÖNERİLER ... 73 5.1.Sonuçlar ... 73 5.2. Öneriler ... 75 KAYNAKLAR ... 77 EKLER... 82

(14)

TABLOLAR LİSTESİ

Tablo 1. _{KTK ve MTK Modelleri Arasındaki Başlıca Farklılıklar} 24 Tablo 2. Çalışmaya Katılan Öğrencilerin Sınıf Düzeylerine Göre

Dağılımı 42

Tablo 3. Çalışmaya Katılan Öğrencilerin Devam Ettikleri Programlara

Göre Dağılımı 43

Tablo 4. Araştırma Özyeterlik Ölçeğinin Uygulanması ile Elde Edilen

Puanlara İlişkin Betimsel İstatistikler 48

Tablo 5. Araştırma Özyeterlik Ölçeği Maddeleri Kategorilerine İlişkin

Beklenen ve Gözlenen Tepki Frekansları Oranları 52 Tablo 6. Araştırma Özyeterlik Ölçeği Maddelerinin KTK ve MTK’ya

göre Kestirilen Ayırıcılık Gücü Değerleri 58

Tablo 7. Araştırma Özyeterlik Ölçeği Maddelerinin KTK ve MTK’ya _{göre Kestirilen Ayırıcılık Gücü Değerlerine İlişkin Betimsel} İstatistikler

59

Tablo 8. Araştırma Özyeterlik Ölçeği Maddelerinin KTK ve MTK’ya

göre Ölçtükleri Özellik Düzeyleri 60

Tablo 9. Araştırma Özyeterlik Ölçeği Maddelerinin KTK ve MTK’ya

göre Ölçtükleri Düzeylere İlişkin Betimsel İstatistikler 63 Tablo 10. Çalışma Grubunun MTK ve KTK’ya göre Kestirilen Araştırma

Özyeterlik Düzeylerine İlişkin Betimsel İstatistikler 64 Tablo 11. Araştırma Deneyimine Sahip Olan ve Olmayan Öğrencilerin _{KTK’ya göre Belirlenen Araştırma Özyeterlik Ölçeği T-testi}

Sonuçları

66

Tablo 12. Araştırma Deneyimine Sahip Olan ve Olmayan Öğrencilerin _{MTK’ya göre Belirlenen Araştırma Özyeterlik Ölçeği T-testi} Sonuçları

66

Tablo 13. Farklı Özellik Düzeyleri için MTK’ya Göre Kestirilen Test Bilgi

(15)

ŞEKİLLER LİSTESİ

Şekil 1. İki farklı cevaplayıcı grup için üç maddeye ilişkin madde

karakteristik eğrileri 27

Şekil 2. Çok kategorili bir maddede kategori ve sınırların gösterimi 32 Şekil 3. Beş kategorili bir madde için kategori sınır tepki fonksiyonu 32 Şekil 4. Beş kategorili bir madde için madde kategori tepki fonksiyonu 33

Şekil 5. Ölçek puanlarına ilişkin dağılım 49

Şekil 6. Araştırma özyeterlik ölçeği öz değerleri saçılma grafiği 50 Şekil 7. Madde bilgi fonksiyonu grafiği (düşük ayırıcılık değerine sahip

madde) 68

Şekil 8. Madde bilgi fonksiyonu grafiği (yüksek ayırıcılık değerine sahip

madde) 69

(16)

SİMGELER VE KISALTMALAR LİSTESİ

KTK Klasik Test Kuramı MTK Madde Tepki Kuramı CTT Classical Test Theory IRT Item Response Theory p Madde güçlük indeksi rjx Madde ayırt edicilik gücü θ Yetenek, özellik, örtük özellik -2lnL -2 log likelihood N Birey sayısı X Aritmetik ortalama ss Standart sapma sd Serbestlik derecesi p, α Anlamlılık düzey

(17)

BÖLÜM I

GİRİŞ

Bu bölümde araştırmanın problemine, amacına ve önemine ve sınırlılığına ilişkin bilgilere yer verilmiştir.

1.1. Problem Durumu

Psikoloji insanların ev, okul, iş gibi sosyal ortamlarda nasıl davranacağını belirleyen özelliklerin (attributes) çalışıldığı alandır. Bu özellikler, psikolojik yapı olarak adlandırılır ve doğrudan ölçülemezler. Eğitim ve psikolojide ilişkili davranışların sınıflandırılmasında soyut tanımlamalara işaret eden yapılar temel bir rol oynar. Crocker ve Algina (1986), bu yapıların olmaması durumunda birey davranışlarının sınıflandırılması, adlandırılması ve karmaşık davranışları içeren durumların gözlemlenmesi çabalarının boşa çıkabileceğini belirtmektedir.

Bir psikolojik yapının ölçülebilmesi için öncelikle yapı ile gözlenebilir göstergeleri olan davranışlar arasındaki kuralların belirlenmesi, yani operasyonel tanımın yapılması gerekir. Bu bağlamda hedeflenen yapının ölçülebilmesinin o yapıya ilişkin davranış örneklerini yeterince içeren bir ölçme aracıyla mümkün olduğu ifade edilebilir. Ölçme işlemi her zaman ölçülecek niteliğin tanımlanmasıyla başlar. Ölçme, araç gerektirir. Ölçme araçları, ölçülecek özelliğin gözlenip sayılarla ifade edilmesini kolaylaştırır (Turgut ve Baykul, 2010). Ölçme aracı kullanmak, gözlemin duyarlılığını artırması ve ölçme işlemini kolaylaştırması açısından gerekli ve yararlıdır. Çünkü ölçme araçlarının çoğu önceden bölmelenmiştir ve ölçme sonucu hemen okunup sayı olarak ifade edilebilir (Tekin, 2009).

Ölçme bir amaç için yapılır ve amaç genellikle ölçme konusu özellik hakkında kişiler, olaylar ya da nesnelerle ilgili değerlendirme yapmak ve değerlendirme sonucuna dayalı

(18)

olarak karar vermektir. Kararın doğruluğu ve yerindeliği ölçme aracının geliştirildiği amaca hizmet etmesi, mümkün olduğunca az hata ile ölçme yapması, tutarlı sonuçlar vermesi, geliştirme, uygulama ve puanlama açısından kullanışlı olmasına bağlıdır (Tekin, 2009). Crocker ve Algina (1986)’ya göre test puanları genellikle insanlar hakkında çıkarım yapmak için kullanılır. Ölçme yapan kişi başarı, ilgi, tutum gibi psikolojik yapılarla ilgili test sonuçlarından faydalanarak cevaplayıcının şu anda var olan ya da gelecekte sergileyebileceği daha geniş bir davranış alanı hakkında çıkarım yapmak ister. Test sonuçlarının sorumlu bir şekilde kullanımı, testi kullanan kişinin neden bu testi kullandığına ilişkin inandırıcı, güçlü gerekçeleri olmasını ve diğer değerlendirme süreçlerinden ziyade bunu neden seçtiğini açıklamasını gerektirir. Yanı sıra, testi uygulayan kişi, aynı testi aynı kişilere benzer şartlarda uyguladığında aynı sonuçları alacağından emin olmak ister. Test sonuçlarının bu şekilde tekrarlanabilirliği ya da tutarlılığına “güvenirlik” denir (Crocker ve Algina, 1986). Bir testten elde edilen puanların güvenirliğinin yüksek olması, cevaplayıcıların puanları arasında bir tutarlık olduğunu gösterir, ancak elde edilen sonuçların savunulabilir olduğunu garanti etmez. Bunun için, aynı zamanda, puanların geçerli de olması gereklidir. Cronbach (1971) geçerliği testi geliştiren ya da uygulayan bireyin testten elde edilecek çıkarım türlerini desteklemek için kanıt toplama süreci olarak tanımlamaktadır (aktaran, Crocker ve Algina, 1986). Geçerlik çalışmalarını planlamak için, öncelikle istenilen çıkarımlar açıkça saptanmalı, sonrasında deneye dayalı çalışmalar ile bu tür çıkarımlar yapmak için test sonuçlarının kullanışlılığına ilişkin kanıtlar toplanmalıdır (Crocker ve Algina, 1986; Messick, 1981).

Test hazırlamada genel amaç, istenilen kullanım için gerekli güvenilir ve geçerli test puanlarını sağlayacak minimum uzunluktaki testi elde etmektir. Bu amaca, ilgilenilen alanı temsil ettiği düşünülen geniş bir madde havuzundan geçerlik ve güvenirliğe en iyi katkıyı yapan maddelerin seçilmesiyle ulaşılır. Yeni bir test hazırlanırken (ya da var olan test kısaltılırken), madde setinin son hali genellikle madde analizi olarak bilinen bir süreç vasıtasıyla belirlenir. Madde analizi, bir test maddesine öğrencilerin verdikleri tepkilerin bazı istatistiksel özelliklerinin hesaplanması ve incelenmesini tanımlamak amacıyla kullanılan bir terimdir. İstenilir nitelikte bir test oluşturmak, kaliteli madde seçilmesi ile olur. Maddenin kalitesini belirlemenin yolu da madde analizidir. Birçok test geliştirme uzmanına göre, madde analizinin hareket noktası madde güçlüğü, ayırt ediciliği ve cevapların seçeneklere dağılımının belirlenmesidir (Crocker ve Algina, 1986; Doğan ve Tezbaşaran,

(19)

açısıyla uzman görüşüne dayalı mantıksal yolla veya istatistiksel yöntemlerle değerlendirilebilir (Erkuş, 2012).

Bireyler hakkında karar vermek için kullanılan ölçme araçlarının kullanılabilirliği ilgilenilen ölçme aracının psikometrik özellikleri (madde ve ölçek özellikleri) ile yakından ilgilidir. Bir bütün olarak ölçme aracı ve maddelerin her birine verilmiş olan cevapların analizi ile elde edilen bilgiler, testin mevcut durumunu değerlendirmek ve ölçümlerin güvenirliği ve geçerliliğini artırmaya yönelik girişimler için de yarar sağlar (Tekin, 2009).

Bir psikolojik ölçme aracının psikometrik özelliklerini belirlemede farklı kuramlar ve bu kuramlara dayalı farklı yöntem ve teknikler mevcuttur (Nartgün, 2002). Ölçmeyle ilgili üç temel kuram: klasik test kuramı (KTK), madde tepki kuramı (MTK) ve genellenebilirlik kuramıdır. Bu kuramlar arasında yer alan genellenebilirlik kuramı, KTK’nın ve varyans analizinin bir uzantısı olarak bilinir. Kuramın en önemli üstünlüğü hata kaynaklarının sebep olduğu varyansı ayrı ayrı ve aynı anda açıklayabilmesidir. Örneğin, KTK’ya göre bir araştırmacı altı öğrencinin on maddelik bir başarı testine verdikleri cevapların iki farklı puanlayıcı tarafından puanlanması halinde her bir puanlayıcının verdiği puan için iç tutarlılık katsayısını mı? yoksa puanlayıcılar arası tutarlılığı mı? hesaplaması gerektiğine karar vermelidir. KTK’da bu hata kaynaklarını aynı anda kestirmek mümkün olmamaktadır. Fakat genellenebilirlik kuramında aynı anda her iki durumun ayrı ayrı ve birlikte ölçme güvenirliğine etkisi kestirebilmektedir (Güler, 2009; Güler, Uyanık Kaya ve Teker Taşdelen, 2012). Bu çalışma KTK ve MTK model ve yöntemleriyle sınırlı olduğu için çalışmada bu kuramla ilgili detay bilgilere yer verilmemiştir.

KTK, gerçek puan kuramı olarak da bilinir. KTK’da odaklanılan ölçme aracından elde edilen gözlenen puanıdır. Bireyin gözlenen puanı, ölçme aracı maddelerine verdikleri tepkilerin ağırlıklandırılmış toplamlarıdır. Yetenek ya da başarı değerlendirmede, bu toplam aynı zamanda doğru cevap sayısıdır. KTK gerçek puan temellidir. Bu model bireyin gizil değişken üzerindeki konumunu gözlenen puanı ile ilişkilendirir. Modeli anlayabilmek için, açıklanması gereken bir varsayım söz konusudur: bir ölçme aracı bireye sonsuz kez uygulandığında, her bir uygulamadan elde edilen gözlenen puanların ortalaması gözlenen puanların beklenen değeridir ve bu ortalama bireyin gerçek puanı kabul edilir. Herhangi bir uygulama sonucu elde edilen gözlenen puan bu ortalamaya eşit olmayacaktır ve bu ortalama ile gözlenen puan arasındaki fark hata olarak isimlendirilir. Kuramın temeli bunun üzerine kurulmuştur (De Ayala, 2009; Baykul, 2010)

(20)

Ölçmeyle ilgili bir diğer temel kuram MTK’dır. MTK istatistiksel kestirimlerin bir kuramı olarak düşünülebilir. MTK, bireylerin ve maddelerin örtük olarak nitelendirilmesini, gözlenen tepkilerin yordayıcısı olarak kullanır. MTK’da bireyler ve maddeler aynı ölçek üzerinde konumlanırlar. Madde, bir yetenek ölçeği boyunca farklı düzeyde yeteneğe sahip bireyleri farklılaştırabilmelidir. Maddenin bunu yapabilme yetisi bireylerin konumları ya da özellik düzeyleri hakkındaki belirsizliği azaltır. MTK’da bireyler örtük özellik üzerindeki konumlarına göre nitelendirilirken, maddeler en azından konumlarına ve bireyler arasındaki farkı ayırt edebilme güçlerine göre nitelendirilirler. Maddeleri ve bireyleri nitelemekte kullanılan ve kuram kapsamında kestirilen bazı parametreler şunlardır: a parametresi (madde ayırıcılık gücü), b parametresi (madde konum parametresi), θ ölçülen özellik düzeyi gibi. MTK’nın özü, gözlenen madde tepkileri üzerinden bireylerin örtük özellik üzerindeki konumlarının ve maddelerin örtük niteliklerinin lojistik ya da çok terimli regresyonudur (De Ayala, 2009).

Bu çalışmada psikometrik özellikleri KTK ve MTK’ya göre belirlenmeye çalışılacak olan ölçme aracı; Büyüköztürk, Atalay, Sozgun ve Kebapçı (2011) tarafından geliştirilen araştırma özyeterlik ölçeğidir. Özyeterlik, sosyal öğrenme kuramında öne çıkan psikolojik bir yapıdır. Bandura (1994) algılanan özyeterliği bireylerin yaşamlarını etkileyen olaylar üzerinde etkisi olan belli performans düzeylerini gerçekleştirebilme konusunda kendi yeteneklerine olan inançları olarak tanımlamaktadır. Bireyin belli bir performansı göstermesi için gerekli etkinlikleri düzenleyip başarılı bir biçimde gerçekleştirme kapasitesi hakkında kendine ilişkin yargısıdır. Özyeterlik inançları, insanların nasıl düşüneceğini, hissedeceğini, kendilerini nasıl motive edeceklerini ve nasıl davranacaklarını belirler (Bandura, 1994). Bu nedenle de ölçülmesi önemli görülen psikolojik özelliklerden birisidir ve bu amaçla geliştirilen ölçme araçları mevcuttur.

Webster (1984)’e göre araştırma, gerçek ve ilkeleri ortaya çıkarmak ya da koymak amacıyla bazı bilgi alanlarında yapılan sistematik, dayanıklı çalışma ve incelemedir (Webster’dan aktaran Büyüköztürk, Çakmak, Akgün, Karadeniz ve Demirel, 2012). Araştırma süreci problemlere geçerli ve güvenilir çözümler aramak ve bilgiye sistematik bir şekilde erişmek olarak açıklanabilir. Araştırma becerileri okul öncesi eğitimden, yükseköğretime kadar bireyin okul yaşamı ve hayat performansında önemli bir yere sahiptir ve bireyin araştırma sürecindeki performansının en önemli belirleyicilerinden birisi bireyin kendi araştırma yeteneğine ilişkin özyeterlik inancıdır (Büyüköztürk vd., 2011).

(21)

Sonuç olarak, bu çalışmada, Büyüköztürk vd. (2011) tarafından geliştirilen araştırma özyeterlik ölçeğinin psikometrik özellikleri KTK ve MTK’ya göre belirlenip karşılaştırılmıştır. Böylece ölçeğin iki kurama göre kestirilen psikometrik özelliklerinin ilişkili olup olmadığı incelenebilmiştir. Ölçeğin psikometrik özelliklerinin iki kurama göre de kestirilmesinin, ölçekten elde edilebilecek puanların yorumlanmasına da katkı sağlayacağı düşünülmektedir. Ölçeğin geçerliği, güvenirliği ve madde özelliklerinin her iki kurama göre belirlenmesiyle, ölçekten elde edilen puanlara bakılarak verilen kararların isabetliliğinin artacağı beklenmektedir.

1.2. Amaç

Bu araştırmanın amacı, araştırma özyeterlik ölçeğinin madde ve ölçek özelliklerini klasik test kuramı ve madde tepki kuramına göre incelemektir.

1.2.1. Problem İfadesi

Çalışmada, “Araştırma özyeterlik ölçeğinin psikometrik özelliklerinin klasik test kuramı ve madde tepki kuramına göre kestirilen değerleri arasında nasıl bir ilişki vardır?” sorusuna cevap aranmaktır.

1.2.1.1. Alt Problemler

1. Araştırma özyeterlik ölçeği maddelerinin klasik test kuramı ve madde tepki kuramına göre kestirilen madde ayırıcılık güçleri arasında bir ilişki var mıdır?

2. Araştırma özyeterlik ölçeği maddelerinin ölçtükleri düzeylerin (b parametresi) klasik test kuramına ve madde tepki kuramına göre kestirilen değerleri arasında bir ilişki var mıdır?

3. Çalışma grubunun araştırma özyeterlik ölçeğinden klasik test kuramına ve madde tepki kuramına göre kestirilen özyeterlik düzeyleri arasında bir ilişki var mıdır? 4. Araştırma özyeterlik ölçeğinin klasik test kuramına ve madde tepki kuramına göre

geçerliği nasıldır?

5. Araştırma özyeterlik ölçeği puanlarının klasik test kuramı ve madde tepki kuramına göre kestirilen güvenirlikleri nasıldır?

(22)

1.3. Önem

Bu çalışmanın amacı, araştırma özyeterlik ölçeğinin KTK ve MTK’ya uygun yöntem ve tekniklerle kestirilen madde ve ölçek özelliklerinin karşılaştırılmasıdır. Bireylerin çeşitli psikolojik özelliklerini belirlemek amacıyla geliştirilen ölçme araçlarının çoğunluğunun uygulamalardaki kolaylıklardan dolayı KTK’ya göre geliştirildiği görülmektedir. Ancak KTK’nın MTK ile karşılaştırıldığında bazı sınırlılıkları mevcuttur (Hambleton, Swaminathan ve Rogers, 1991; De Ayala, 2009). KTK’da test ve madde istatistikleri gruba; bireylerin puanları ise kendilerine uygulanan teste bağlıdır. KTK’da testler genellikle orta yetenek düzeyindeki bireyler temel alınarak geliştirilmekte ve ölçme hataları tüm grup için aynı kalmaktadır. KTK, bir test maddesine cevaplayıcıların nasıl tepkide bulunabileceği hakkında bilgi vermez. MTK’da belirli bir durumda en iyi bilgiyi verecek ölçek geliştirilebilir, çünkü MTK, test ve madde bilgi fonksiyonları aracılığıyla ölçülen özellik ölçeği üzerinde her bir noktada ne kadar kesinlikle ölçme yapıldığı hakkında bilgi verir. Ölçmeyi yapan kişinin amacına göre her noktada, yani ölçülen özelliğin her düzeyinde ya da kesme puanlarında daha kesin ölçme sonuçları elde edilebilmesi için maddeler, bilgi fonksiyonları incelenerek teste eklenebilir ya da çıkarılabilir. MTK’nın testten bağımsız yetenek kestirimi yapma iddiası doğrultusunda farklı testi alan cevaplayıcıların karşılaştırılmasının mümkün olduğu iddia edilmektedir. Sözü edilen bu sınırlılıklarından dolayı KTK’ya göre elde edilen ölçme sonuçlarının kullanılabilirliği belirli ölçüde kısıtlanmaktadır. Bir ölçme aracının psikometrik özelliklerinin KTK’ya ve KTK’ya göre daha güçlü varsayımları olan MTK’ya göre belirlenip karşılaştırılması, farklı kuramlara dayalı yöntemlerle belirlenen değerlerin uyumunun belirlenmesi açısından önemlidir. Bir ölçeğin psikometrik özelliklerinin belirlenmesi kadar bu psikometrik özelliklerin mümkün olduğunca doğru bir şekilde belirlenmesi de önemlidir. Ölçme aracının psikometrik özelliklerinin MTK ve KTK’ya göre ayrı ayrı kestirilmesi ve karşılaştırılması sonucunda ölçeğin ve maddelerin kestirilen parametrelerine dayalı olarak ölçeğin uygulanması ile elde edilen sonuçların kullanılabilirliğinin de artması beklenmektedir.

1.4 Sınırlılık

Bu araştırmada psikometrik özellikleri belirlenmek üzere veri toplama aracı olarak kullanılan araştırma özyeterlik ölçeği Likert tipi on birli dereceleme ölçeğindedir. Ancak MTK ile madde ve birey parametrelerinin kestirilmesinde kullanılan MULTILOG (ver.7.03)

(23)

kategorilerdeki frekans dağılımları nedeniyle kategoriler birleştirilmiş ve ölçeğe ilişkin tüm analizlerin dört kategori üzerinden yapılmasına karar verilmiştir.

(24)

(25)

BÖLÜM II

İLGİLİ ARAŞTIRMALAR ve KURAMSAL ÇERÇEVE

Bu bölümde konuyla ilgili yapılan araştırmalar ilgili araştırmalar başlığında anlatılmaktadır. Kuramsal çerçeve başlığında ise ölçülmek istenen yapı olan araştırma özyeterliği kısaca açıklanmış, ardından KTK ve MTK kısaca anlatılıp, Likert tipi ölçeklerin psikometrik özelliklerinin bu kuramlara göre nasıl kestirileceği açıklanmaya çalışılmıştır.

2.1. İlgili Araştırmalar

Alanyazın incelendiğinde, psikolojik özellikleri ölçmek üzere geliştirilen ölçme araçlarının çoğunluğunun psikometrik özelliklerinin, uygulamadaki kolaylıklar sebebiyle, KTK’ya göre incelendiği görülmektedir. Daha az sayıda olmakla birlikte ölçme araçlarının psikometrik özelliklerinin KTK’ya göre daha güçlü varsayımları olan MTK’ya göre de incelendiği görülmektedir. Öte yandan iki kurama göre yapılan psikometrik analiz sonuçlarının karşılaştırıldığı çalışmalar da bulunmaktadır (Gelbal, 1994; Fan, 1998; Stage, 1998; Kelecioğlu, 2001; Nartgün, 2002; Karakılıç, 2009).

Bu kapsamda yürütülen çalışmalara bakıldığında, iki kategorili (dichotomusly) “1-0” puanlamanın söz konusu olduğu testlerle ilgili bulguları dikkat çeken araştırmalar aşağıda verilmektedir.

Gelbal (1994), MTK kapsamındaki Rasch modeli ve KTK’ya göre kestirilen madde ve yetenek parametrelerinin benzerliklerini incelemiştir. Çalışmada Türkçe ve matematik testindeki maddelerin KTK ile kestirilen madde güçlük indekslerinin birim normal değerlerinin Rasch modeli ile kestirilen bg parametreleriyle ilişkili olduğu; değişik yöntemlerle kestirilen yetenek ölçüleri arasındaki korelasyonların özellikle Türkçe testinde oldukça yüksek olduğu bulunmuştur.

(26)

Stage (1998) çalışmasında İsveç Akademik Yetenek Testi’nin (SweSAT) bir alt testi olan kelime bölümüne ilişkin verileri kullanmıştır. Bu kelime alt testindeki 20 maddenin ön uygulaması 1996 yılında yapılmış elde edilen bulgular doğrultusunda teste kalan maddeler 1997 yılında da kullanılmıştır. Bu çalışmanın amacı söz konusu 20 madde için KTK ve MTK’ya göre kestirilen madde parametrelerini karşılaştırmak ve ön uygulamada kestirilen madde parametrelerinin asıl uygulamayla ne kadar kararlı olduğunu incelemektir. Madde parametreleri ön uygulama ve asıl uygulamada ortak olan maddeler için ayrı ayrı kestirilmiştir. Sonuç olarak KTK ve MTK’ya göre kestirilen madde güçlük indeksleri ve madde ayırıcılık gücü değerlerinin ilişkili olduğu tespit edilmiştir. Benzer şekilde ön uygulamada her iki kurama göre kestirilen madde parametrelerinin de asıl uygulamadakilerle ilişkili olduğu sonucuna varılmıştır. Elde edilen bulgular incelendiğinde madde ayırıcılık değerleri arasındaki ilişkilerin madde güçlüğüne göre daha düşük düzeyde olduğu görülmüştür.

Kelecioğlu (2001) çalışmasında Türkçe ve matematik alt testleri için, KTK’ya göre hesaplanan madde güçlük indeksi (p) ve madde ayırıcılık gücünü (r) kullanarak, geçiş formülleri ile MTK’nın iki parametreli lojistik modelinde yer alan madde güçlük (b) ve madde ayırıcılık gücü (a) parametrelerini kestirmiştir. Bu uygulama yapılırken, KTK’daki p ve r ile MTK’daki b ve a parametreleri, boş bırakılan cevapların yanlış ve atlanmış olarak göz önüne alınmasına göre iki biçimde hesaplanmıştır. Bu iki hesaplama biçiminin MTK’daki madde parametrelerinin KTK’dan elde edilmesini etkileyip etkilemediğine bakılmıştır.Sonuç olarak Türkçe puanları dağılımının matematik puanları dağılımına göre normale daha yakın olduğu; her iki alt test için puanlama farkı gözetilmeksizin b parametrelerinin kestirilen değerleri ile geçiş formüllerinden hesaplanan değerlerine ait korelasyonların a parametresine ait korelasyonlardan daha yüksek olduğu görülmüştür. Ayrıca Türkçe testinden elde edilen parametrelerin matematik testinden elde edilenlere göre daha yüksek bir korelasyon katsayısına sahip olduğu görülmüştür. Türkçe testinde boşların yanlış ve atlanmış olarak değerlendirilmesiyle hesaplanan a ve b parametreleri ile geçiş formüllerinden elde edilen parametreler arasındaki korelasyonlar farkı manidar bulunmazken, matematik testine ait bu farklar 0,05 düzeyinde manidar bulunmuştur. Bu bulgu, puan dağılımı normale yaklaştıkça geçiş formülleriyle elde edilen değerlerin kestirilen parametre değerine yaklaştığı şeklinde yorumlanmıştır.

(27)

Skills) cevap veren tüm cevaplayıcı gruptan, cinsiyet; yetenek düzeyi gibi bazı özelliklere göre her bir alt test için seçilen biner kişilik yirmi örneklem grubundan elde edilen verilerle KTK ve MTK’ya göre madde istatistiklerini hesaplayarak karşılaştırmıştır. Çalışmada, KTK’ya göre kestirilen madde güçlük indeksi ile bir, iki ve üç parametreli MTK modellerine göre kestirilen b parametreleri arasındaki ilişkiler ve KTK’ya göre kestirilen madde ayırıcılık gücü değerleri ile iki ve üç parametreli MTK modellerine göre kestirilen a parametreleri arasındaki ilişkiler incelenmiştir. Sonuç olarak her iki kurama göre kestirilen madde güçlük değerleri arasında yüksek korelasyonlar bulunurken, madde ayırıcılık güçleri arasında bazı şart ve örneklemlerde görece daha düşük ilişkiler bulunmuştur. Buna ek olarak ham puanlar ile yetenek puanlarının da yüksek düzeyde ilişkili olduğu görülmüş; KTK ve MTK’ya göre kestirilen madde ve ölçek parametrelerinin birbirleri ile tutarlı bulgular ortaya koyduğu sonucuna ulaşılmıştır. Farklı örneklemlerden elde edilen madde güçlük indekslerinin değişmezlik özelliklerini koruduğu, ancak madde ayırıcılık gücü değerlerinin değişmezlik özelliğini farklı örneklem grupları için daha az koruduğu sonucuna da ulaşılmıştır.

Macdonald ve Paunonen (2002)’in yaptıkları çalışma, bir önceki çalışmanın genişletilmiş bir tekrarı niteliğindedir. Çalışmada Monte Carlo simülasyon tekniği ile üretilen test verilerinin, madde ve birey istatistikleri KTK ve MTK’ya göre kestirilmiş ve sonuçlar karşılaştırılmıştır. Çalışmada KTK ve MTK’ya göre kestirilen madde ve birey istatistiklerinin karşılaştırılabilirlikleri, değişmezlikleri ve ne derece doğru oldukları incelenmiştir. Çalışma kapsamında testin uzunluğu, madde güçlük ve ayırt edicilik değerleri bakımından farklılaşan test durumları için 100 tane simülasyonel test ve her biri 1000’er kişiden oluşan cevaplayıcı grubu oluşturulmuştur. Çalışmanın öne çıkan üç ana bulgusu şu şekildedir: (1) her iki kurama göre kestirilen madde güçlük parametreleri ve birey parametreleri tüm şartlarda yüksek derecede karşılaştırılabilirler, ancak madde ayırt edicilik parametreleri yalnızca bazı şartlar altında karşılaştırılabilirdir. (2) MTK’dan elde edilen madde ayırt edicilik ve güçlük parametreleri, cevaplayıcıların seçkisiz örneklemleri arasında yüksek derecede değişmezdir. KTK’dan elde edilen madde parametreleri de örneklemler arasında değişmez özelliğe sahip kestirimlerdir. (3) her iki kurama göre de madde güçlük ve birey parametreleri tüm durumlarda yüksek derecede doğru bir şekilde kestirilmiştir. Ancak MTK ile kestirilen madde ayırt edicilik parametresi tüm koşullarda doğru iken, KTK ile kestirilen madde ayırt edicilik parametresi yalnızca bazı koşullar altında doğrudur. Bu çalışmanın sonuçları MTK’nın madde parametrelerindeki değişmezlik özelliğini desteklemektedir. Daha da önemlisi MTK, simülasyon ile elde edilmiş çok sayıda test

(28)

durumunda doğru madde ve birey parametre kestirimleri yapmıştır. Benzer şekilde KTK’da da değişmeyen madde parametreleri elde edilmiş; sadece madde güçlük ve birey parametreleri tüm durumlarda doğru kestirimler verirken, madde ayırt edicilik parametresi bazı koşullarda doğru olarak kestirilebilmiştir.

Fan (1998)’in çalışmasına benzer olarak, Çıkrıkçı Demirtaşlı (2002)’nın çalışmasında, Raven Standart İlerlemeli Matrisler Testi (RSİMT) maddelerinin madde güçlük indeksleri ve madde ayırt edicilik değerleri her iki kurama göre kestirilip karşılaştırılabilirlikleri ve bu parametrelerin yüksek ve düşük yetenek düzeylerine göre ne derece değişmezlik özelliği gösterdiği incelenmiştir. Madde istatistikleri her iki kurama göre düşük yetenek düzeyi, yüksek yetenek düzeyi ve tüm grup için ayrı ayrı hesaplanmıştır. MTK’da madde güçlük ya da konum parametresi olarak bilinen b parametresi bir, iki ve üç parametreli modellere göre ayrı ayrı kestirilmiştir. Madde ayırıcılık gücü değeri, MTK’da iki ve üç parametreli lojistik modellere göre a parametresinin kestirilmesi yoluyla; KTK’da ise madde-toplam puan korelasyonu (nokta çift serili) ile hesaplanmıştır. Araştırmadan elde edilen bulgular MTK ve KTK’ya dayalı olarak kestirilen madde güçlük indekslerinin birbirleri ile karşılaştırılabilir olduğunu ve bu tür karşılaştırmalarda özellikle üç parametreli modelin KTK ile en yüksek düzeyde ilişkiyi sağladığını ortaya koymuştur. KTK’da kestirilen madde güçlük indeksi, her bir MTK modelinde kestirilen b parametresi ile 0,90’nın üzerinde korelasyona sahiptir. Sonuç olarak KTK ile hesaplanan madde güçlük indeksinin MTK modelleri ile özellikle üç parametreli model ile oldukça karşılaştırılabilir olduğu, ancak KTK ile hesaplanan madde ayırıcılık gücünün daha az karşılaştırılabilir olduğu yorumu yapılmıştır. Hem KTK hem de MTK (özellikle iki ve üç parametreli modellerde) madde güçlük indeksleri örneklemler arası değişmezlik özelliği sergilerken, madde ayırt edicilik indeksi örneklemler arasında farklı değerler almıştır.

Doğan ve Tezbaşaran (2003) yaptıkları çalışmada MTK’nın, KTK’ya üstünlüğü olarak kabul edilen madde parametrelerinin değişmezliği özelliğini gösterip göstermediğini incelemişlerdir. Farklı örneklemlerden KTK’ya göre elde edilen madde güçlük (p) ve madde ayırıcılık (rjx) istatistikleri ile evren parametreleri arasındaki ilişkilerin yanı sıra, farklı

örneklemlerden ve evrenden MTK’nın bir, iki ve üç parametreli modellerine ait b parametreleri; iki ve üç parametreli modellerine ait a parametreleri ile evren değerleri arasındaki ilişkiler çalışma kapsamında incelenmiştir. Çalışmada Orta Öğretim Kurumları Öğrenci Seçme ve Yerleştirme Sınavı verilerinden yararlanılmıştır. Araştırma evrenden;

(29)

örneklem seçilmesi ile yürütülmüştür. Verilerin analizi üç adımda gerçekleştirilmiştir. Birinci adım: evren ve yukarıda sözü edilen örneklemler için betimsel istatistikler hesaplanmıştır. İkinci adım: Evrendeki verilerin MTK ile çalışmaya uygunluğu test edilmiştir. Bu amaçla tek boyutluluk, yerel bağımsızlık ve dağılımın normalliğine bakılmıştır. Üçüncü adım: Madde istatistikleri ve parametreleri hesaplanıp; madde parametreleri, istatistikleri ve evren değerleri arasındaki ilişki incelenmiştir. Elde edilen sonuçlara göre her iki kuram için, elde edilen madde istatistikleri ve parametrelerinin örneklem değişmelerinden etkilendiği; dolayısıyla, parametre değişmezliği açısından kuramların herhangi birinin avantaj sağlayamadığı, madde güçlük değerlerinin genel olarak madde ayırıcılık değerlerinden yüksek korelasyon verdiği gözlenmiştir. Elde edilen korelasyonların anlamlılığı dikkate alındığında, KTK’nın değişmezliği sağlanmasına rağmen MTK’nın özellikle a parametreleri açısından değişmezliği sağlayamadığı; korelasyonlar arası farklar dikkate alındığında her iki kuramın da değişmezliği sağlayamadığı görülmüştür. Son olarak madde ayırıcılık gücü değerleri arasındaki korelasyonların madde güçlük değerleri arasındaki korelasyonlardan düşük olması bakımından iki kuramın birbirine benzediği yorumu yapılmıştır.

Kan (2006) çalışmasında OKS (Orta Öğretim Kurumları Sınavı) Türkçe alt testi madde istatistiklerini KTK ve MTK’ya göre analiz etmiştir. Araştırmanın amacı, KTK ve MTK’ya göre kestirilen madde istatistikleri arasında nasıl bir ilişki olduğunu ortaya koymaktır. Her iki teoriye göre kestirilen madde istatistikleri arasındaki ilişkiyi belirlemek için Spearman Brown sıra farkları korelasyon katsayısı kullanılmıştır. Elde edilen korelasyon katsayıları incelendiğinde Türkçe alt testinin belirtilen iki ölçme kuramına dayalı olarak kestirilen madde istatistiklerinin büyük benzerlik gösterdiği yorumu yapılmıştır.

Courville (2004), Fan (1998)’in çalışmasının bir benzeri niteliğinde olan çalışmasında çoktan seçmeli, ikili puanlanan maddelerden oluşan bir değerlendirme testinin verilerini kullanmıştır. Çalışmanın amacı KTK ve MTK’ya göre kestirilen madde ve birey istatistiklerinin karşılaştırılabilirliklerini ve her iki kurama göre kestirilen parametrelerin farklı cevaplayıcı grupları arasında değişmezliğini araştırmaktır. Elde edilen korelasyon katsayıları yorumlandığında, belli şartlara göre seçilen örneklem gruplardan her iki kurama göre elde edilen madde ve birey istatistiklerinin benzer olduğu sonucuna ulaşılmıştır. Ayrıca MTK’nın KTK’ya üstünlüğü kabul edilen değişmezlik özelliğinin çalışmadaki örneklem grupları için her iki kuramda da sağlandığı görülmüştür.

(30)

Çıtak Gözen (2007) ise çoktan seçmeli bir testte yer alan madde seçeneklerinin iki kategorili (1-0) puanlama, uzman yargısına dayalı seçenek ağırlıklandırma ve deneysel seçenek ağırlıklandırma yöntemleriyle puanlanması durumunda testin güvenirliğinin ve geçerliğinin KTK ve MTK’ya göre nasıl etkilendiğini belirlemeye çalışmıştır. Araştırmanın bulguları, MTK’da yetenek ölçeği üzerindeki parametrelerin ağırlıklı puanlamaların kullanıldığı duruma göre daha doğru kestirildiğini göstermiş, bu puanlama yönteminin test geçerliği açısından da daha etkili olduğu sonucuna ulaşılmıştır. KTK’da ise deneysel ağırlıklandırmanın kullanıldığı durumda güvenirliğin daha yüksek kestirildiği, ancak tüm puanlama yöntemlerinin test geçerliği üstünde benzer etkiyi yaptığı belirlenmiştir.

Çoklu ya da çok kategorili puanlamanın (polytomously) söz konusu olduğu ölçme araçları için psikometrik özelliklerin MTK’ya göre incelendiği çalışmalardan biri olan Childs ve Chen (1999)’in araştırmasında madde ve ölçek parametreleri, Samejima’nın “derecelendirilmiş tepki modeli (graded response model)” ve Muraki’nin “genelleştirilmiş kısmi puanlama modeli”ne göre MULTILOG ve PARSCALE olmak üzere iki farklı program kullanılarak kestirilmiştir. Elde edilen bulgulara göre parametrelerin modeller ve programlar bakımından farklılık göstermediği tespit edilmiştir.

Karakılıç (2009), öğrencilerin beden eğitimi dersine yönelik tutumlarını ölçmeye yönelik Likert tipi bir ölçek hazırlama çalışması kapsamında, ölçeğin psikometrik özelliklerinin KTK ve MTK’ya göre incelenmesi ve karşılaştırılmasını amaçlamıştır. Çalışmada ölçeğin 50 maddelik deneme formu için madde ayırt edicilik değerleri, korelasyona dayalı analiz ve iç tutarlık katsayısına göre analiz yöntemleri ile KTK’ya; derecelendirilmiş tepki modeli kapsamında a parametresi ile MTK’ya göre kestirilmiştir. KTK ve MTK’nın derecelendirilmiş tepki modelinin sayıltılarını sağlayan 30 madde seçilmiş ve bu maddelerin yaklaşık %94’ünün ortak olduğu görülmüştür. Belirtilen yöntemlere göre seçilen maddelerin ayırt edicilikleri arasındaki ilişkiler incelendiğinde, iç tutarlılık ölçütüne dayalı analiz yöntemi ve derecelendirilmiş tepki modelinden elde edilen madde ayırt edicilik değerleri arasında diğerlerine göre biraz daha düşük olmakla beraber pozitif yönde ilişkiler gözlenmiştir. Söz konusu üç yönteme göre seçilen maddelerle oluşturulan üç farklı ölçekten elde edilen puanların güvenirlikleri, Cronbach alfa iç tutarlık katsayısı ve marjinal güvenirlik katsayıları ile incelenmiştir. Ölçeğin deneme formunun ve üç farklı yöntemle seçilen maddelerle oluşturulan ölçeklerin alfa ve marjinal güvenirlikleri yüksek bulunmuştur. Buna ek olarak, deneme ölçeği ve diğer ölçeklerin Cronbach alfa ve marjinal güvenirlikleri

(31)

seçilen maddelerle oluşturulan üç farklı ölçeğin test bilgi fonksiyonları incelenmiş ve derecelendirilmiş tepki modeli ile geliştirilen ölçeğin diğer iki yöntem ile geliştirilmiş ölçeklerden daha fazla bilgi verdiği görülmüştür.

Ölçeğin nihai halinin uygulanmasıyla elde edilen verilere dayanılarak, KTK’daki madde analizi tekniğiyle elde edilen madde ayırt edicilik değeri ve maddenin ölçtüğü ortalama tutum düzeyi değerleri ile derecelendirilmiş tepki modeline göre kestirilen maddelerin (a) ve (b) parametreleri arasında ilişki olup olmadığı incelenmiştir. Her iki kurama göre kestirilen madde ayırt edicilikleri değerleri arasında pozitif yönde anlamlı bir ilişki; maddenin ölçtüğü ortalama tutum düzeyi değeri ile derecelendirilmiş tepki modeli ile kestirilen (b) parametreleri arasında ise negatif yönde anlamlı bir ilişki tespit edilmiştir.

Flannery, Reise ve Widaman (1995) ise Marsh (1990) tarafından geliştirilmiş olan benlik algısını ölçmeye yönelik derecelendirilmiş altı kategorili “Self-Description Questionnare II” ölçeğinin madde ve test özelliklerini MTK’ya göre incelemiştir. Çalışmadan elde edilen sonuçlara göre ölçekte yer alan maddelerin düşük ve orta düzeyde benlik algısına sahip bireyleri ayırmada oldukça başarılı olduğu, ayrıca bazı maddelerin ölçülen özellik ve ölçeğin bütününe sağladıkları katkıların aynı olduğu ve bu maddelerin aynı özellikleri ölçtükleri belirlenmiştir.

Matteucci ve Stracqualursi (2006)’nin yaptıkları çalışmada temel istatistik dersinde bir dönem boyunca uygulanan açık uçlu maddeler içeren üç testin bulguları kullanılmıştır. Test maddelerine verilen yanıtlar doğruluğuna ve tamamlanan becerilere göre puanlanmıştır. Çalışmada a parametreleri yani maddelerin ayırıcılık güçleri ile ilgilenildiği için MTK modellerinden kısmi puanlama modeli yerine derecelendirilmiş tepki modeli kullanılmış, madde parametreleri, madde bilgi eğrileri ve standart hatalar incelenmiştir. Her bir maddeye ilişkin cevaplar yanıtlanma düzeyine göre derecelendirilmiştir. Sonuç olarak modelin veriye uyum sağlaması ile madde özellikleri analiz edilmiş, her bir maddenin ayırıcılık güçleri yorumlanmıştır. Kompleks uygulamalar gerektiren maddelerin daha fazla bilgi verici olduğu ve bireysel farklılıkları yakalamada çok iyi olduğu görülmüştür.

Uyar, Öztürk Gübeş ve Kelecioğlu (2013)’nun yaptıkları çalışmada, Uluslararası Öğrenci Değerlendirme Programı (PISA) 2009 kapsamında uygulanan okumaya yönelik tutum anketinden elde edilen madde puanlarının derecelendirilmiş tepki modeli ile incelenmesi amaçlanmaktadır. Tutum anketinde 11 madde bulunmaktadır ve bu maddelere öğrencilerin “hiç katılmıyorum (1)” ve “tamamen katılıyorum (4)” arasında tepkide bulunmaları

(32)

istenmiştir. Tutum maddeleri, çok kategorili MTK modellerinden Likert tipi ölçekler için uygun olan derecelendirilmiş tepki modeli ile incelenmiştir. Veri analizinin ilk aşamasında verilerin MTK varsayımlarını sağlayıp sağlamadığı belirlenmiş; ikinci aşamada ise MULTILOG (ver.7.03) bilgisayar programında derecelendirilmiş tepki modeli ile madde kalibrasyonu yapılmıştır. Araştırmanın sonucunda, model-veri uyumunun sağlandığı görülmüştür. Çalışmada kestirilen madde parametreleri, madde bilgi fonksiyonları ve test bilgi fonksiyonu detaylı bir şekilde incelenmiştir. Elde edilen bulgulara göre; okumaya yönelik tutumları açısından öğrencileri en iyi ayırt eden dolayısıyla en çok bilgi veren maddenin 3. madde, en kötü ayırt eden ve en az bilgiyi veren maddenin ise 9. madde olduğu sonucuna ulaşılmıştır.

Koch (1983), yaptığı çalışmada Likert tipi bir tutum ölçeğinin madde ve birey parametrelerini geleneksel yolla yani KTK’ya göre ve MTK’ya göre kestirip karşılaştırmıştır. Gerçek veriler ile yapılan çalışmanın bulgularına göre geleneksel yolla ve derecelendirilmiş tepki modeline göre kestirilen madde ve birey parametreleri arasında yüksek düzeyde ilişkiler söz konusudur. Geleneksel yolla kestirilen madde ortalamaları ve Samejima’nın derecelendirilmiş tepki modeline göre kestirilen b parametreleri arasında negatif yönde yüksek düzeyde, madde ayırıcılık güçleri ve a parametreleri arasında ise pozitif yönde yüksek düzeyde ilişkiler tespit edilmiştir. Bu çalışmanın asıl amacı Likert tipi ölçeklerde derecelendirilmiş tepki modelinin kullanışlılığını araştırmaktır. Elde edilen bulgular doğrultusunda derecelendirilmiş tepki modelinin tutum ölçüleri için kullanılabilir olduğu ve dahası tutumun her bir düzeyinde ölçmenin kesinliği ile ilgili bilgi fonksiyonları vermesi açısından daha avantajlı olduğu yorumları yapılmıştır.

Nartgün (2002) yaptığı çalışmada, aynı tutumu ölçemeye yönelik Likert tipi ölçek ile metrik ölçeğin madde ve ölçek istatistiklerini KTK ve MTK’ya göre incelemiştir. Elde edilen bulgulara göre ilgili ölçeklerin belirtilen kuramlara göre kestirilen madde ayırt edicilik güçlerinin ilişkili olduğu, ilgili ölçeklerde yer alan maddelerin ölçtükleri tutum düzeylerinin, tutum ölçümlerinin belirtilen kuramlara göre kestirilen değerlerinin birbiri ile yüksek düzeyde benzer olduğu, ilgili ölçeklerin ölçüt grup geçerliklerine ve güvenilir ölçme sonuçlarına sahip oldukları sonucuna varılmıştır.

Buna göre ölçme araçlarının madde ve test parametrelerinin kestirilmesinde KTK’nın yanı sıra MTK’ya göre de kestirildiği çalışmalar mevcuttur. Anılan parametrelerin maddelerin

(33)

Büyüköztürk vd. (2011) tarafından geliştirilen araştırma özyeterlik ölçeğinin psikometrik özelliklerinin KTK ve MTK’ya göre kestirilmesi ve sonuçlarının karşılaştırılması araştırılmaya değer bulunmuştur.

2.2. Kuramsal Çerçeve

Bu çalışmada psikometrik özellikleri belirlenecek ölçek Likert tipi on birli dereceleme ölçeğindedir. Ölçekle ölçülmeye çalışılan araştırma özyeterliğiyle ilgili kısaca bilgi verildikten sonra, ölçeğin psikometrik özelliklerinin belirleneceği KTK ve MTK kısaca anlatılıp, Likert tipi ölçeklerin psikometrik özelliklerinin bu kuramlara göre nasıl kestirileceği açıklanmaya çalışılacaktır.

2.2.1. Araştırma Özyeterliği

Bandura (1997)’ya göre özyeterlik, bireyin belli durumlar ya da koşullar altında, belirli görevleri yerine getirmedeki yeteneğine olan güveninin düzeyidir; performansın çıktı ya da sonuçlarından önce, gerçekleşecek performansa ilişkin kişisel inançlarıdır (Schneider, 2011). Bireyin özyeterlik inancı ile başarısı ve kişisel iyi oluşu arasında pozitif bir ilişki vardır. Özyeterlik inancı yüksek olan bireyler, zor görevleri sakınılacak tehditler olarak algılamaktan ziyade, başa çıkılacak meydan okumalar olarak görürler ve kendilerine zorlayıcı hedefler koyup, başarısızlık halinde vazgeçmeden çabalarını artırarak sürdürürler. Hedeflerine bağlıdırlar. Başarısızlığı yetersiz çaba ya da bilgi eksikliği gibi, edinilebilir becerilere bağlarlar. Stres ve depresyon eğilimleri düşüktür. Özyeterlik inancı düşük bireyler ise zor görevlerden kaçarlar, yetenekleri ile ilgili inançları çabuk kırılır ve bir engelle karşılaştıklarında nasıl başaracaklarından ziyade karşılaştıkları olumsuzluklara odaklanırlar. Yetersiz performanslarını düşük yeteneğe bağlarlar ve stres ve depresyon eğilimi bu bireylerde fazladır (Schunk, 1990; Bandura, 1994). Bandura (1994)’ya göre bireylerin özyeterlik inançları nasıl düşüneceklerini, hissedeceklerini, kendilerini nasıl motive edeceklerini ve nasıl davranacaklarını belirleyen önemli bir etkendir. Bu çalışmada psikometrik özellikleri belirlenmeye çalışılacak olan ölçme aracı araştırma özyeterlik ölçeğidir. Bireylerin araştırmaya ilişkin özyeterliklerinin belirlenmesi akademik başarılarının ve günlük hayat performanslarının yordanabilmesi açısından önemli görülmektedir(Büyüköztürk vd., 2011).

(34)

Araştırma özyeterliği bireyin alanyazın tarama, veri analizi gibi görevleri başarılı bir şekilde tamamlamasına ilişkin yeteneğine olan güveni olarak tanımlanabilir. Bireyin verilen bir araştırma görevini yerine getirebilmesine ilişkin algısıdır (Büyüköztürk vd., 2011). Araştırma özyeterliğini etkileyen başlıca faktörler: bireyin akademik araştırma eğitimi ortamına ilişkin algısı (perception of the academic research training environment), araştırma deneyimleri, ilgisi, lisans veya yüksek lisans programındaki sınıf düzeyi ve danışman-öğrenci ilişkisidir (Bieschke, 2006; Büyüköztürk vd., 2011). Forester, Kahn ve Hesson-McInnis (2004)’a göre araştırma özyeterliğinin uygun bir şekilde değerlendirilmesi öğrencilerin kendi zayıf ve güçlü yanlarını keşfetmelerine yardımcı olabilir. Bu bağlamda üniversite öğrencilerinin araştırma özyeterliklerini belirlenmesi amacıyla Büyüköztürk vd. (2011) tarafından araştırma özyeterlik ölçeği geliştirilmiştir ve bu çalışmada, geliştirilen bu ölçeğin psikometrik özellikleri KTK ve MTK’ya göre belirlenmeye çalışılmıştır.

2.2.2. Klasik Test Kuramı

KTK eğitim ve psikoloji alanlarındaki gerçek dünyada var olan bazı yapıları ölçme yolu ile kuramsal yapılara bağlar ve açıklanmalarına yardımcı olur(Baykul, 2010).

Eğitim ve psikoloji alanlarındaki ölçmelerde bir özelliğe ilişkin “gerçek değer” bulunmak istenir. Ancak ölçmeye karışan, çeşitli hatalar sebebiyle gerçek değer doğrudan elde edilemez ve gözlenen puanlar yardımıyla kestirilmeye çalışılır. Bu kestirmeyi yapabilmek için bazı istatistiksel kuramlar geliştirilmiştir. Bunlardan birisi KTK’dır ve “gerçek puan” kuramı olarak da bilinir. Kuramın temeli psikoloji ve eğitime dayanır, kendine özgü sayıltıları, teoremleri ve bunların sonuçları vardır (Baykul, 2010).

KTK’da bireyin bir teste ilişkin gözlenen puanının (X); gerçek puanı (T) ve tesadüfi hata puanının (E) toplamından oluştuğu varsayılmaktadır.

X = T + E

Bu denklem, KTK’nın temel denklemidir. Hata puanı bireyin gerçek puanının olduğundan daha fazla ya da daha az gözlenmesine sebep olur. Bireyin gerçek puanı aynı testin sınırsız uygulaması sonucunda aldığı puanların ortalamasıdır. Ancak pratikte bu mümkün olmadığı için hata puanına ilişkin kestirimler ve gözlenen puan aracılığıyla bireylerin gerçek puanları ile ilgili tahminde bulunulabilir (Crocker ve Algina,1986).

(35)

KTK’nın önemli varsayımları şunlardır: bir evrendeki herhangi sayıdaki ölçmeler için hata puanlarının beklenen değeri sıfıra eşittir ve gerçek puanlar ile hata puanları arasındaki korelasyon sıfırdır. Bir evrendeki iki farklı ölçmeden birine ilişkin hata puanları ile diğerine ilişkin gerçek puanlar arasındaki korelasyon sıfırdır ve iki farklı ölçmeye ait hata puanları arasındaki korelasyon da sıfıra eşittir (Lord ve Novick,1968; Crocker ve Algina, 1986). Crocker ve Algina (1986)’ya göre test teorisinin temel ilkeleri, bilimsel araştırma sürecinde hipotezdeki her bir değişkenin nasıl kontrol edileceği ya da ölçüleceğinin belirlenmesi için operasyonel tanımlarının yapılması ve kullanılacak ölçme aracı ya da ölçme işleminin duyarlığı ve doğruluğunun test edilmesiyle yakından ilişkilidir. Bir ölçme aracı her şeyden önce, ölçülecek özellik ya da özellikleri, ölçülmesi söz konusu olmayan başka özellikleri karıştırmadan, tam ve doğru bir şekilde; yanı sıra tutarlı bir biçimde ölçebilmelidir. Yani ölçme aracının geçerli ve güvenilir olmalıdır. Geçerlik incelenirken, o ölçme aracının ölçmeyi amaçladığı değişkeni ne derece ölçebildiğine kanıt aranır, bireyin elde edeceği puana ölçülmek istenen değişkenin dışındaki niteliklerin karışması geçerliği düşürür. Ayrıca KTK’nın temel denkleminden de anlaşılacağı gibi tüm ölçmeler kaynağı ve yönü belli olmayan tesadüfi hatalar içerir. Ölçme aracının güvenirliği ölçümlerin tesadüfi hatalardan arınık olma derecesi olarak tanımlanır ve güvenirlik arttıkça ölçümlerin tutarlılığı da artar. Dolayısıyla ölçme aracından alınan puanların yorumlanabilmesi için aracın geçerlik ve güvenirliğinin bilinmesi gerekmektedir. Bununla birlikte test maddelerine verilmiş olan cevapların analizi, test geliştirmede ve testi daha iyi bir hale getirmede güçlü ve etkili bir araçtır. Bir testteki maddelerin işe yarayıp yaramadığı; yaramıyorsa bunun nedenini anlamak ve gerekli düzeltmeleri yapmak için maddeye verilen tepkilerin analiz edilmesi, yani madde düzeyinde de psikometrik özelliklerin belirlenmesi gerekmektedir (Tekin, 2009, Tan, 2012). Aracın geliştirilme ya da pilot testinin doğru yapılmaması, eğitim ve sosyal bilimler alanlarındaki araştırmalarda, zaman zaman rastlanıldığı gibi, yanlış sonuçlara dayalı çatışmalara ve sorunlara yol açabilir (Crocker ve Algina, 1986).

KTK 1900’lü yılların başından itibaren test geliştirme, uygulama ve değerlendirme gibi ölçme uygulamalarında geniş bir kullanım alanı bulmuştur (Hambleton vd., 1991). KTK’da bireylerin belirli bir psikolojik özelliğe sahip oluş dereceleri, her bir birey için ayrı ayrı olmak üzere, o özelliği ölçmek için hazırlanmış ölçme aracının maddelerine verilmiş olan tepkilerin toplamıdır. Bireyin ölçme aracından aldığı yüksek puan ölçülmek istenen özelliğe yüksek düzeyde sahip olduğunun, düşük puan ise ilgili özelliğe düşük düzeyde sahip olduğunun bir göstergesidir. KTK’da daha çok güvenirlik gibi test düzeyindeki bilgilerle

(36)

ilgilenilir. Bununla birlikte KTK madde ayırıcılık gücü değeri, madde puanlarının ortalaması gibi madde düzeyinde bilgilerin de elde edilmesine imkân sağlamaktadır. Test ve madde düzeyindeki bilgilerin yani, ölçme aracının psikometrik özelliklerinin (güvenirlik, geçerlik, madde ortalaması, madde ayırıcılık gücü değeri vb.) elde edilmesi için, verilerin elde ediliş biçimine bağlı olarak kuram kapsamında çeşitli yöntem ve teknikler geliştirilmiştir (Fan, 1998).

2.2.2.1. Likert Tipi Ölçeklerin Psikometrik Özelliklerinin Klasik Test Kuramına Göre Kestirilmesi

Tutumların ölçülmesinde izlenen en popüler yaklaşım ölçülecek tutuma ilişkin bir ölçeğin hazırlanması ve hedef gruba uygulanmasıdır. İlk tutum ölçeklerinden biri Bogardus tarafından (1925) geliştirilen “toplumsal uzaklık ölçeği”dir. Bogardus’un ölçeğini sırasıyla Thurstone’un “eşit görünümlü aralıklar” ölçeği ve Likert’in (1932) “dereceleme toplamlarıyla ölçekleme” teknikleri izlemektedir. Ölçek oluşturmadaki işlemler bakımından diğerlerine göre daha ekonomik olması sebebiyle bu tekniklerden en yaygın kullanılanı Likert tipi yani, dereceleme toplamlarıyla ölçeklemedir (Koch, 1983; Tezbaşaran, 1997). Bu tekniğe uygun bir ölçekten alınan toplam puan, genel olarak, ölçekteki maddelere gösterilen tepkilere verilen ağırlıkların toplamından, yani puanların toplamından oluşur. Bu yöntemde bireylere genellikle “kesinlikle katılıyorum”, “katılıyorum”, “kararsızım”, “katılmıyorum” ve “kesinlikle katılmıyorum” gibi bir dizi tutum ifadelesi sunulur. Cevaplayıcı ölçekteki maddelere tepkide bulunurken, bu maddenin kapsamına ilişkin tutumunun derecesini belirtir. Ölçekte tepki kategorileri farklı sayılarda olabilir. Önemli olan tutumun iki kutuplu boyutunu temsil edecek artan-azalan şekilde seçilmesidir. Cevaplayıcı yargıcı olarak ifadeleri değerlendirmez, daha ziyade kendi tutumunu yansıtır. Dolayısıyla Likert tipi ölçekler denek tepkilerine dayalı, bireyleri ölçekleme tekniklerinden bir tanesidir. (Tezbaşaran, 1997; Erkuş, 2012).

Likert tipi ölçekler, diğerlerine kıyasla sezgilere daha çok dayalıdır. Bireyin kendisi hakkında bilgi vermesi esasına dayanır. Bireyin kendisini başkalarından daha çok tanıdığı ve anladığının yanı sıra kendisi hakkındaki bilgileri eksiksiz olarak ve çarpıtmadan verdiği sayıtlılarına dayanır. Likert tipi ölçek geliştirme yöntemi, tutum ölçmek amacıyla geliştirilmiş olmasıyla birlikte; ilgi, inanç gibi diğer psikolojik değişkenlerin ölçülmesine de

(37)

elverişlidir. Bu bakımdan tepki kategorileri katılma-katılmama durumunun yanı sıra sıklık ya da önem belirten ifadeler de içerebilir (Tezbaşaran, 1997; Erkuş, 2012).

KTK’ya göre geliştirilen araştırma özyeterliği Likert tipi on birli dereceleme ölçeğindedir. Ölçeğin psikometrik özelliklerinin nasıl belirleneceği maddeler ve ölçek bağlamında ayrı ayrı aşağıda açıklanmaktadır.

Likert tipi ölçeklerde madde düzeyinde psikometrik özelliklerin belirlenmesinde kullanılan bazı teknikler şu şekildedir (Tezbaşaran, 1997) :

1. Madde ayırıcılık gücü: Bir ölçme aracını oluşturan maddelerin, o ölçme aracı ile ölçülmeye çalışılan özelliğe yüksek düzeyde sahip olanlarla düşük düzeyde sahip olanları ayırabilme gücüdür. Madde geçerliğinin bir ölçüsüdür. Madde ayırıcılık gücünü belirlemede en sık kullanılan iki yöntem, korelasyon ve iç tutarlık ölçütüne (t-testine) dayalı analiz teknikleridir.

Korelasyona dayalı analizde, maddelerin ayırt edicilik gücü, her bir tutum cümlesi için elde edilen madde puanları ile ölçek puanları arasındaki korelasyon katsayısı ile hesaplanır (madde-ölçek korelasyonu). Bilindiği üzere ölçek puanı aynı zamanda ilgili maddeden alınan puanı da içerir, bu nedenle madde ayırıcılık gücü hesaplanırken, söz konusu maddenin puanı hariç tutularak ölçek puanının yeniden hesaplanması seçeneği söz konusudur. Madde ve ölçek puanları arasındaki korelasyon katsayılarının hesaplanması için Pearson momentler çarpımı korelasyonu kullanılır:

1 1 1 2 2 2 2 1 1 1 1 . ( ).( ) ( ) . ( ) n n n i i i n n n n i i i i n X Y X Y xy n X X n Y Y

r

          



Belirtilen korelasyon katsayısı hem madde hem ölçek puanlarının sürekli değişken olduğu sayıltısına dayalıdır. Pearson momentler çarpımı korelasyonu ile elde edilen korelasyon katsayısı hem madde ayırıcılık güdü indeksi hem de madde geçerlik katsayısı olarak yorumlanabilmektedir. Belirtilen katsayı -1,00 ile +1,00 arasında değişen değerler almaktadır. Elde edilen korelasyon katsayısı negatif veya sıfıra yakın maddeler ölçeğin bütünü ile ölçülmek istenen özelliği ölçme konusunda yetersiz; katsayı değeri pozitif ve yüksek olan maddeler ise ölçeğin bütünü ile ölçülmek istenen özelliğin iyi ölçebilen maddeler olarak yorumlanır. Maddelerin madde-ölçek korelasyon katsayılarının işaretlerinin