BİYOİSTATİSTİK
Biyoistatistik; tıp ve sağlık bilimleri alanlarında veri toplanması, özetleme, analiz ve değerlendirmede istatistiksel yöntemleri kullanan bir bilim dalıdır.
BİYOİSTATİSTİK NİÇİN GEREKLİDİR?
1. Biyoistatistiğin prensip ve yöntemlerinin uygulamasının bilinmesi Sadece Biyolojik ve tıbbı bilimlerin anlaşılması için değil aynı zamanda sağlık personelinin etkili bir pratiğinin yapılması içinde gereklidir.
2. Biyolojik, laboratuar ve klinik verilerdeki yaygınlık nedeni ile bunların anlaşılmasında ve yorumlanmasında Biyoistatistik bilimi gereklidir.
Doktor;
laboratuvar test sonuçlarını,
klinik vizitlerde hastanın durumunu,
fizyolojik, gözlem ve ölçümlerdeki varyasyonları göz önüne alarak bir yorumlama getirmek zorundadırlar.
Aşağıdaki aşamalarda karar için mutlaka, biyoistatistiksel bilgi gerekmektedir;
Ø Tanı Ø Prognoz
Ø Tedavilerin etkinliğinin belirlenmesinde
Ø Hastalık etiyolojilerinin (Risk faktörlerinin ) belirlenmesinde TEMEL KAVRAMLAR
İnsidans: Takip araştırmalarından elde edilen riskin ölçütü olan bir hızdır.
Prevelans: Kesitsel araştırmalardan elde edilen durumun büyüklüğünü ölçmede kullanılan bir hızdır. İnsidansa eşdeğer değildir.
Hız(Rate): Bir olayın oluş olasılığı olarak tanımlanır.
Oran(Ratio): İki farklı karakterin birbirilerine göre relatif sıklıklarıdır. Ör: Hekim başına düşen hasta sayısı bir orandır.
Risk faktörleri: Hastalığın ortaya çıkışını artan bir olasılıkla sağlayan faktör veya faktörlere risk faktörleri adı verilir.
Sağlık istatistikleri;
Toplumun sağlık düzeyini göstermede kullanılan özet ölçütlerdir.
Beklenen yaşam uzunluğu, belirli hastalıklar nedeni ile ölüm hızları, hastalanma hızları, anne ölüm hızları, bebek ölüm hızları, doğurganlık hızları, kanser insidansları, okul çağı çocukları diş çürüklüğü prevalansı, ağız kanserleri insidansı gibi.
Populasyona ait verilerin özetlenmesinde kullanılan özet ölçütler parametre olarak tanımlanır.
Değişken; yapılan ölçümlerde kişilerde değişik değerler gözlenmesi durumudur. Yaş, cinsiyet, doğum sırası, vücut sıcaklığı, yaşam uzunluğu, hastalık şiddeti gibi biyolojik karakteristiklerin hepsi birer değişkendirler.
Veri
Çalışmalar sonucunda elde edilecek olan yahut elde edilen verilerin ölçüm biçimine (veri tipleri) hakim olunmalıdır. Verilerin düzenlenmesi ölçüm düzeyleri seçilecek istatistiksel teste karar vermede, tanımlayıcı istatistikleri oluşturmada hayati öneme haizdir.
Nitel Veriler
Gözlemlerin sınıflara (kategorilere) ayrılarak açıklandıği veri çeşididir. Kategoriler isimseldir.
Örneğin cinsiyet (kadın/erkek), sağlık durumu (iyi-orta-kötü), başarı durumu (kötü-iyi) gerilim düzeyi (düşük-orta-yüksek), eğitim durumu (okur-yazar değil, ilkokul mezunu, ortaokul mezunu, lise mezunu, lisans mezunu, yüksek lisans mezunu, doktora mezunu)..
Niceliksel (Sayısal) Veri Tipi
Ölçüm, sayım yada hesaplama sonucu sayısal değerlerle ifade edilen veri tipidir. Bu veri tipi de 2 grupta incelenebilir.
1. Kesikli veri tipi 2. Sürekli veri tipi
1. Kesikli Veri Tipi ; Belirli bir aralıktaki sayımla elde edilen veri tipidir. Örneğin madende çalışan işçilerin akciğerlerindeki leke sayısı (2, 3, 4, 31,..) günde içilen sigara sayısı (4, 8, 32, 22, …) gibi görüldüğü benzer biçimde kesikli veriler tam değerler alıyor
yani virgül içerikli (3.23) gibi bir değerle karşımıza çıkmıyorlar. Bu veri tipinde ortalama, standart sapma, varyans, tepe değeri, … Benzer biçimde tanımlayıcı istatistik yöntemleri verideki yer konum gibi özellikleri göstermede kullanılabilir. Ek olarak mesala gmeşhurk içilen sigara örneğini ele alalım ortalaması 8.33 gibi virgüllü bir değer olarak karşımıza çıkabilir.
2. Sürekli Veri Tipi ; Bu tip veriler ölçümle bilirlenmiş değerlerdir gerek tam sayı gerekse virgüllü sayılarla karşımıza çıkabilir. Başka bir değişle sayı kısaca üzerindeki tüm değerleri alabilir. Örneğin bir okuldaki kız öğrencilerin kiloları (56,23, 43,21, 48.54,
…), bir hastanede polikliniği ziyaret eden hastaların boy ölçümleri (183.11, 167.32, 178.22, … ) bu verilerin haricinde yaş değişkeni her ne kadar kesikli bir veri gibi gaslıkse de devamlı bir veridir. Niceliksel verilerde çalışılırken averaj, standart sapma, yaygınlık ölçüleri ve ayrıca çıkarımsal istatistik tiplerinden özellikle parametrik testler çoğunlukla kullanılır.
Verilerin Sınıflandırılması
• Özellikle denek sayısı fazla olduğunda;
– Veriler üzerinde yapılacak hesaplamaları kolaylaştırır, – Verilerin kolay anlaşılır biçimde sunulmasını sağlar.
• Sınıflandırma kuralları:
1) Sınıf sınırları kesin olmalı, sınıflar birbirine karışmamalıdır. Örneğin: • 10‐14, 14‐19, 19‐
24 şeklindeki sınıflandırma yanlıştır. • 10‐14, 15‐19, 20‐24 şeklindeki sınıflandırma doğrudur.
2) Sınıflama, bütün verileri içine almalıdır. Hiçbir değer dışarıda kalmamalıdır.
3) Sınıf aralıklarının eşit olması bazı analizler için yararlı olabilir. Ama her zaman eşit olması gerekmez. Örneğin: • 10‐14, 15‐20, 21‐35 gibi.
4) Sınıf sayısının 8‐15 arasında olması tavsiye edilir.
•Sınıf aralığı büyük alınırsa: Sınıf sayısı azalır, böylece sınıfların hassasiyeti azalmış olur. El de edilecek bilgi kaba olur.
•Sınıf aralığı küçük alınırsa: Sınıf sayısı çok artabilir, bu kez verileri kolay biçimde ve özet ol arak incelemek zorlaşır.
•En iyisi verileri uygun şekilde özetleyecek ve dağılım hakkında yeterli bilgiyi verecek kadar sınıf sayısı olmasıdır.
Örnek: Aşağıdaki verileri sınıflandırma kurallarına uygun olarak sınıflandırınız. Frekans tablosu oluşturunuz.
VERILER
68 84 75 82 68 90 62 88 76 93 73 79 88 73 60 93 71 59 85 75 61 65 75 87 74 62 95 78 63 72 66 78 82 75 94 77 69 74 68 60 96 78 89 61 75 95 60 79 83 71 79 62 67 97 78 85 76 65 71 75 65 80 73 57 88 78 62 76 53 74 86 67 73 81 72 63 76 75 85 77
SINIFLAR FREKANS f 53-58=53 54
55 56 57 58
/ / 2
59-64= 59 60 61 62 63 64
/ / / / / / / / / / / /
12
65-70 71-76 77-82 83-88 89-94 95-100
Tanımlayıcı Ölçütler
Üzerinde durulan bir çalışmada amaç; elde edilen veri setini bir ya da birkaç ölçü ile özetlemektir. Kullanılan her ölçü dağılımın bir özelliğini belirtir.
Frekans dağılımlarını tanımlayıcı özellikler iki genel başlık altında toplanır.
Yer gösterici Ölçüler Ortalama
Ortanca Tepe değeri Yaygınlık Ölçüleri Standart sapma Varyans
Varyasyon katsayısı Standart hata
1- Yer Gösterici Ölçüler
A- Ortalamalar: Dağılımın orta noktasını gösteren, dağılımı oluşturan bireylerin değerlerini tek bir değerle temsil edilmesini sağlayan ölçüdür.
Aritmetik Ortalama 1. Sınıflandırılmamış Verilerde:
Denek değerlerinin toplamının denek sayısına bölümü ile elde edilir.
Aşırı değerlerden etkilenir.
X n
n
i
x
i
== 1
Örnek:
2. Sınıflandırılmış Verilerde Aritmetik Ortalama
Tepe Değeri
Tepe değeri dağılımda en fazla tekrar edilen değerdir. Veriyi sınıflandırdığımızda, çoğunlukla en yüksek frekansa sahip tek bir sınıf vardır.
En yüksek frekansa sahip tek bir sınıfın olduğu dağılımlara tek tepeli dağılım denir.
Bu durumda tepe değeri frekansı en fazla olan sınıfın sınıf değeridir.
Tek tepeli dağılımlarda tepe değeri ile aritmetik ortalama arasındaki fark büyüdükçe dağılımın çarpıklığı artar. Bir dağılımda birden çok tepe değeri olabilir.
Ortanca (Medyan):
» Sıralanmış verilerin ortasında yer alan değerdir.
» Denek sayısı tek ise (n+1)/2’ inci
» Denek sayısı çift ise (n/2) ve (n+2)/2’inci değerlerin ortalaması
Ortanca dağılımın tam ortasındaki değer olarak tanımlanır. Başka bir deyişle ortanca öyle bir değerdir ki, dağılımdaki değerlerin %50’si ortancaya eşit ve/veya daha küçük,
%50’si ortancaya eşit ve/veya daha büyüktür. Bu nedenle ortanca dağılımdaki aşırı değerlerden etkilenmez.
• Eğer dağılımda aşırı gözlemler bulunuyorsa, ortalama yerine ortancanın kullanılması daha doğrudur.
Ortancayı hesaplayabilmek için önce gözlem değerleri küçükten büyüğe doğru sıralanır.
• Sonra ortanca, gözlem sayısına bağlı olarak yukarıda verilen formüllerden hesaplanır.
Örnek: Aritmetik ortalama ve ortancayı hesaplayınız.
SINIFLAR f
15-17 2
18-20 1
21-23 4
24-26 2
27-29 6
30-32 8
33-35 5
36-38 10
39-41 2
42-44 5
45-47 2
48-50 2
51-53 2
54-56 1
57-59 1
Çözüm:
SD=
Ü𝐷+𝐴𝐷2
×= 𝐴 +
∑𝑓𝑏𝑛
.c X=37+
(−38)53
.3 X=37+(-2,15)
SINIFLAR f b fb SD Yf i SAD 15-17 2 -7 -14 16 2 14,5 18-20 1 -6 -6 19 3 17,5 21-23 4 -5 -20 22 7 20,5 24-26 2 -4 -8 25 9 23,5 27-29 6 -3 -18 28 15 26,5 30-32 8 -2 -16 31 23 29,5 33-35 5 -1 -5 34 28 32,5 36-38 10 0 0 37 38 35,5 39-41 2 1 2 40 40 38,5 42-44 5 2 10 43 45 41,5 45-47 2 3 6 46 47 44,5 48-50 2 4 8 49 49 47,5 51-53 2 5 10 52 51 50,5 54-56 1 6 6 55 52 53,5 57-59 1 7 7 58 53 56,5
n=53 ∑fb=-
38
X=34,85
Ortanca=L+(
𝑛 2−𝑌𝑓𝑖
𝑓
).c Ortanca=35,5+(
26,5−2810
).3 Ort=35,5-0,45
Ort=35,05
Örnek Sorular:
1. Biyoistatistik nedir?
2. Biyoistatistiğin sağlık hizmetlerinde kullanımlarını yazınız.
3. Veri nedir?
4. Veri çeşitleri hakkında bilgi veriniz.
5. Sayısal veri nedir, örneklendiriniz.
6. Sınıflandırma ne için yapılır?
7. Aritmetik ortalama ve ortancayı hesaplayınız.
SINIFLAR f
15-17 2
18-20 1
21-23 4
24-26 2
27-29 6
30-32 8
33-35 5
36-38 10
39-41 2
42-44 5
45-47 2
48-50 2
51-53 2
54-56 1
57-59 1
8.