• Sonuç bulunamadı

DENEYSEL ARAŞTIRMALAR

ANALİZ VE DEĞERLENDİRME 1 VERİLERİN TANIMLANMAS

5. TANIMLAYICI İSTATİSTİKLER

Tek bir soru ile elde edilen verileri, yani tek bir değişken ya da özelliğe ilişkin verileri özet bilgiler haline getirmek ve tanımlamak amacıyla yapılan işlemlere tanımlayıcı istatistikler denir. Bunlar, mutlak sayılar, frekans dağılımları, toplam sayılar, oran ve yüzdeler ile merkezi yerleşim ve dağılım ölçülerinden oluşur.

Mutlak sayılar, adından da anlaşılacağı üzere ölçü ya da sayımların mutlak büyüklük ve değerlerinden ibarettir. Verileri tanımlamak ya da özetlemek açısından fazla bir önem ifade etmez. Frekans dağılımları ise; deneklerin tek bir değişken ya da özellik açısından (yaş, cinsiyet, tansiyon arteryel, kan biyokimyası v.b) sınıflara kümelere ya da gruplara ayrılarak listelenmesi işlemidir. Yani, verilerin marginal çizelgelere dönüştürülmüş halidir. Her bir frekansa/ sınıfa kaç birey/ denek düştüğünü gösteren çizelgelerdir. Bu çizelgedeki bireylerin toplam sayısını ya da her sınıftaki bireylerin toplam sayısını veya bu bireylerin büyüklüklerinin toplam büyüklüğünü gösteren sayılara toplam adı verilir. Her sınıfın genel toplam içindeki payının yüzde olarak ifadesine ise oran/ yüzde denir.

5.1. ORTALAMALAR/Merkezi Yerleşim Ölçüleri

Adından da anlaşılacağı üzere, verilerin dağılımının orta noktasını, merkezini gösteren ölçülerdir. Bunlar, verinin elde edildiği grubu temsil eden ya da tanımlamaya yarayan ölçülerdir. Bunlardan Aritmetik ortalama/mean,

ortanca/median, tepe değeri/ mod en çok bilinenlerdir. Geometrik ortalama

ve harmonik ortalama ise pratikte sık kullanılmaz. Bu nedenle de, üzerinde durulmamıştır.

Aritmetik Ortalama (mean): Verilerin toplam büyüklüğünün birey/

denek sayısına bölünmesi ile elde edilen ölçüdür. Gruplanmış/ sınıflanmış ve sınıflanmamış serilerde farklı farklı formüllerle hesaplanır (Bakınız Ek 2 sayfa XIII).

Ortanca (median): Veriler küçükten büyüğe doğru saraya dizildiğinde,

verileri ortadan iki eşit parçaya bölen sıraya gelen bireyin büyüklüğü/ değeridir.

büyüklüktür.

Normal dağılıma uyan verilerde (eşit aralıklı/ standart birimlerle azalıp çoğalanlar, sürekli değişkenler) aritmetik ortalama, ortanca ve tepe değeri birbirine eşittir. Bu nedenle, bu tür veriler yalnızca aritmetik ortalama ile tanımlanırlar ve bunlarda ortanca ve tepe değeri söz konusu değildir. Binomial, multinomial ve poisson dağılımına uyan kesikli özelliklerde ise bu değerler farklı farklıdır. Bu tür verilerde, aritmetik ortalamanın bir anlamı yoktur, kullanılmaz. Bu nedenle de, ortanca ve tepe değeri ile tanımlanırlar.

Ortalamalar verilerin merkezini, verilerin yerleşiminin nokta özelliğini gösteren ölçülerdir. Bu nedenle de, veriler hakkında tam fikir vermeyen ve onları çok kaba bir şekilde temsil eden ölçülerdir. Yalnızca ortalamaya bakarak, verilerin dağılımının niteliğini, bireylerin birbirine olan farklarını ve ortalamaya olan uzaklıklarını anlamak/ kestirmek olanaklı değildir. Dolayısı ile, ortalamanın, grubu/ deneklerin tüm bireylerini ne kadar temsil ettiği anlaşılamaz/ bilinemez. Bunu kestirebilmek/ bilebilmek için, değişkenliğin (varyans) ve standart sapmanın (standart deviation) hesaplanması, bilinmesi gerekir.

5.2. RANGE VE VARİANCE/ Merkezi Dağılım Ölçüleri

Bir veri grubunun dağılımının niteliğini gösteren ölçülerdir. Bunları hesaplamak suretiyle, bireylerin, deneklerin birbirinden farlılıklarını (range ve variance ile) ortalamanın tüm bireyleri ne kadar temsil ettiğini (standart sapma ile) ve üzerinde çalışılan örneklemin ait olduğu evreni ne kadar temsil ettiğini (standart hata ile) kestirebilmek olanaklı hale gelir.

Verinin/ serinin en büyüğü ile en küçüğü arasındaki farka range denir. Grubun tüm bireyleri bu aralıkta dağılır. Range küçüldükçe/ daraldıkça veriler birbirine yaklaşır ve homojenleşir. Aksinde ise, veriler arasındaki farklılıklar derinleşir ve nonhomojen bir dağılım gösterirler.

Bir dağılımın niteliğini gösteren temel ölçü varyans’tır. Varyans (değişkenlik), bir veri grubundaki/ serideki bireylerin/ birim verilerin ortalamadan ne kadar saptığını gösteren ölçüdür. Her bir bireyin ortalamadan farkları karesinin toplamının, birey sayısına bölünmesi (V = Σ (x - x̄)2 / n)

formülü ile hesaplanır. Formülünden de görüleceği üzere, bir matematik işlemdir. Dolayısı ile yalnızca sürekli değişkenlere uygulanabilir. Standart sapma ve standart hata ise, varyans üzerinden ya da varyanstan yola çıkılarak hesaplanan ölçülerdir.

Standart sapma (Standart deviation), bir grubun/serinin ortalamasının, grubun tüm bireylerini ne oranda/ yetenekte temsil ettiğini gösteren ölçüdür. İster evrenin tümünden isterse örneklemden elde edilsinler, ortalamalar tek başına bir anlam ifade etmezler. Bu nedenle, ortalamalar mutlaka standart sapması ile birlikte verilmelidir. Çünkü; standart sapma bireylerin/ birim

verilerin ortalama etrafında hangi uzaklıkta yerleştiğini göstermek suretiyle, dağılımın niteliğini açıklar. Standart sapma büyüdükçe, bireylerin hem birbiri arasındaki hem de ortalama ile olan farklılıkları büyür, derinleşir (geniş range, nomhomojen dağılım). Buna karşılık, standart sapma küçüldükçe, birey ölçüleri, büyüklükleri arasındaki farklılıklar azalır. Birey ölçüleri hem birbirine hem de ortalamaya yaklaşır, dolayısı ile de veriler ortalama etrafında dar bir dağılım gösterir (dar range, homojen dağılım). Standart sapma küçüldükçe, range daraldıkça ortalamanın tüm bireyleri temsil etme/ tanımlama yeteneği artar. Aksi durumda ise azalır.

Standart sapma variansın kare kökünü almak suretiyle hesaplanır

(SS =

V=

Σ (x - x̄)2/n. Yani matematik bir işlemdir ve yalnızca sürekli değişken

niteliğindeki verilerde hesaplanabilir.

Sürekli değişkenlerde bir bireyin/birimin normal kabul edilebilmesi için güven aralığı sınırları (x̄ ± 2SS) içinde kalması gerekir. Bu sınırların içinde kalan farklılıkların hepsi şansa/ olasılığa bağlı ya da tesadüfi farklılıklar olarak kabul edilir. Büyüklüğü, ölçüsü bu sınırların dışında taşan birimin ise anormal/ yanlış olduğuna karar verilir. Sürekli değişkenlerin bu özelliğine, normal dağılım gösterme özelliği denir. Biyoloji ve sağlık bilimlerindeki verilerin büyük çoğunluğu sürekli değişken, yani normal dağılım özelliği gösteren verilerdendir. Bu nedenle de, bu değerlendirmeye çok sık başvurulur. Bunu hesaplamanın diğer bir yolu ya da ölçüsü ise standart puandır (SP). Her bireyin büyüklüğünün ortalamadan farkının standart sapmaya bölünmesi ile elde edilen bu ölçü, (SP = x - x̄ / SS) her bireyin ortalamadan kaç standart sapma saptığını göstererek, birim verinin faklılığının güven aralığı içinde mi (normal/ şansa bağlı değişiklik) yoksa dışında mı (anormal) olduğunu değerlendirmeye yarar. Böylece, birim verinin gruba göre yeri belirlenmiş olur.

Standart sapma ile ilişkili diğer bir ölçü, değişim katsayısıdır (DK). Standart sapmanın ortalamaya bölünmesi (DK = SS / x̄) ile elde edilen bu ölçü, farklı gruplardan elde edilen verilerin birbiri ile kıyaslanmasında/ karşılaştırılmasında kullanılır.

5.3. Örneklem Yanılgısının Ölçülmesi/ Genelleme

Evrenin tamamını kapsayan, yani tam sayımla yürütülen ve evrenin tüm bireylerini içine alan çalışmalardan elde edilen ortalamalar, doğrudan doğruya evreni temsil eden, tanımlayan gerçek sonuçlardır. Bu şekilde elde edilen ortalamaların standart sapması ile birlikte verilmesi yeterlidir. Evreni temsil edip, etmediği ya da ne kadar temsil ettiğini test etmeye gerek yoktur. Oysa, örmeklem üzerinde yapılan çalışmalardan elde edilen ortalamalar evreni temsil eden gerçek ortalamalar değildir ve evren ortalamasından farklıdır. Çünkü; evrenden seçilen farklı farklı örneklemden elde edilen

ortalamalar, örnekleme dayalı olması nedeniyle, hem birbirinden hem de evren ortalamasından farklılık ve sapma gösterirler. Bunlardan hangisinin evreni en iyi temsil ettiği bilinemez. Bu nedenle de, örneklem üzerinde yürütülen çalışmalardan elde edilen sonuçlardan hareketle, evrenin ortalamasının kestirilmesine/ tahmin edilmesine gerek vardır. Diğer bir anlatımla, örneklemden elde edilen ortalamanın evrene genellemesine gereksinim ve zorunluluk vardır. Bu genellemede/ hesaplamada ise, dağılım ölçülerinden olan standart hata (standart eror) kullanılır. Bu bilgilerden anlaşılabileceği gibi, standart hata örneklemden kaynaklanan yanılgının bir ölçüsüdür. Örneklem ortalamasının hangi sınırlar içinde evreni temsil ettiğini gösterir ya da örneklem ortalamasından hareketle evren ortalamasını kestirmeye/ hesaplamaya yarar. Standart hata; standart sapmanın veri sayısının kare köküne bölünmesi ile elde edilir (SH = SS / √n).

Yukarıdaki bilgilerden de anlaşılacağı üzere, örneklem üzerinde yapılan çalışmalardan elde edilen ortalamalardan hareketle ve standart hata yardımı ile evren ortalaması hesaplanabilmekte/ kestirilebilmektedir. Kestirmeye dayalı olması nedeniyle de, kesin ve net bir sayı olamaz; ancak örneklem ortalamasına bağlı olarak ifade edilebilir. İşte evren ortalamasının örneklem ortalamasından ne kadar büyük (+) ne kadar küçük (-) olabileceğini gösteren bu değere güven aralığı denir. Bu aralık, doğrudan doğruya standart hataya bağlı bir aralıktır. Yani, standart hata büyüdükçe genişler aksine küçüldükçe daralır ve örneklem ortalamasının, evren ortalamasını temsil etme yeteneği/ niteliği artar. Bu nedenle de, güven aralığının dar olması arzu edilir. Buna karşılık güven aralığı (x̄ ± SH) daraldıkça evren ortalamasının bu sınırlar içinde kalma olasılığı azalır. Dolayısı ile de, güvenirliği azalır. Arada ters bir ilişki vardır. Evren ortalaması %95 olasılıkla x̄ ± 1.96 SH aralığında %99 olasılıkla ise x̄ ± 2.58 SH aralığında kalır. Bu sınırları (%95 olasılık %99 olasılık) seçmek araştırıcının tercihindedir. Genellikle %95 güvenirlik sınırı kullanılır.