ANT 339
İSTATİSTİĞE GİRİŞ VIII. HAFTA
PROF. DR. BAŞAK KOCA ÖZER
Medyan (M)
• Nümerik değişkenlerle merkezi eğilimin bir diğer ölçütüdür.
• Bir istatistik serisinde tam ortaya düşen ve seriyi iki eşit parçaya bölen gözlem değeri
• Bir yarımdaki değerler medyana eşit ya da küçük olabilir, bir yarımdaki değerler medyana eşit ya da büyük olabilir.
• Özellikle ekstrem değerler içeren serilerde kullanılmaktadır.
• Ordinal veri için en iyi ortalama
• Çarpık oranlar için en uygun ortalama
• Hesaplanması güçtür çünkü veri sıralandırılmış olmalıdır
• Ekstem veriden etkilenmez
2
Örnek: üniversitelerde ücretler rektörden, sözleşmeli işçi/memurlara kadar geniş yaygınlık gösterir. Eğer araştırmacı üniversitedeki
ortalama ücreti hesaplarsa, ücretlerin yüksek olduğu gibi yanlış bir izlenime kapılabilir çünkü yüksek ücretler bazı üyelere verilmektedir.
Bu durumda araştırmacı medyanı kullanmalıdır.
Medyan / Ortanca
• Medyan herhangi bir veri setindeki orta değer, ortancadır.
• Aşırı uç değerler etkilemez.
• Daha sağlam bir ölçüdür.
• Gözlem değerleri küçükten büyüğe doğru
sıralandığında Medyan ortada kalan gözlemdir.
• N yada n tek sayı ise ortada kalan gözlem
• N yada n çift sayı ise ortadaki iki gözlemin ortalaması
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
Median = 5 Median = 5
Eğer gözlem sayısı tek ise (n+1)/2.
gözlemdir
Eğer gözlem sayısı çift ise n/2. ile (n+2)/2. gözlemin ortalamasıdır.
Medyanın bulunması
• Medyan küçük örneklem sayılı gruplarda kolaylıkla belirlenebilir.
• Büyük örneklem gruplarında önce frekans dağılım grupları oluşturulur.
1. değerler küçükten büyüğe dizilir.
2. Eğer tek sayıda örnek varsa medyan tam ortada yer alan değerdir.
Ör: 6,8,5,101,9
Küçükten büyüğe dizilir 5, 6, 8, 9, 101
Medyan en ortada yer alan değer olan 8’dir.
Medyanın bulunması
1. değerler küçükten büyüğe dizilir.
2. Eğer tek sayıda örnek varsa medyan tam ortada yer alan değerdir.
3. Eğer örneklem sayısı çift ise; medyan ortada yer alan iki değer arasında yer alır [(n/2). değer ve (n/2)+1. değer]
Ör: 1, 3, 90, 2, 10, 26, 44, 73
Küçükten büyüğe dizilir 1, 2, 3, 10, 26, 44, 73, 90
Medyan en ortada yer alan değerler olan (4. ve 5.)
(10+26)/2= 18’dir.
Medyanın bulunması
Aşağıdaki serilerde medyanı bulunuz.
1. 30, 90, 80, 150, 5, 0, 160 2. 47, 83, 97, 200, 5, 6
N tek sayıda
medyan ortada değer 80’dir.
N çift sayıda olduğundan, (47+83)/2=65’dir.
0, 5, 30, 80, 90, 150, 160
5, 6, 47, 83, 97, 200
Frekans dağılımlarında medyanın hesaplanması
• Örneklem sayısının büyük olduğu durumlarda değerleri küçükten büyüğe sıralamak oldukça güçtür.
• Böyle durumlarda öncelikle gerçek limitler yardımıyla frekans dağılımları oluşturularak medyan hesaplanmalıdır.
1. Kategoriler küçükten büyüğe dizilir
2. Gerçek limitlerle kategoriler oluşturulup, frekansları belirlenir 3. 50. persentili içeren kategori bulunur. P50 örneklem sayısını 2’ye
bölünmesiyle elde edilir.n=150 ise, P50=75’dir. İki ardıl frekans kategorisi 60 ve 80’dir.
4. Kategori aralık genişliği (W) belirlenir
5. Formülde n= örneklem sayısı, lp= P50yi içeren grubun alt limiti, cp= P50ye kadar ki kümülatif frekans, fp= P50yi içeren frekans, W= frekans dağılım aralıklarının genişliği
6. Formül yardımıyla medyan hesaplanır.
M= lp+ [((0.5*n)-cp)/fp]W
Mod
• Bir seride en çok tekrarlanan değer.
• Nominal veri için en iyi ortalama
• Bir örneklemde bazen olmaz bazen de birden çok olabilir.
• Kolay belirlenir
• Mod değerinin de medyan da olduğu gibi en önemli üstünlüğü en büyük ve en küçük
değerleri dikkate almaması nedeniyle uç değerlerden etkilenmemesidir.
9
Mod
Mod=
Formülde,
• bs: Mod sınıfının en düşük değeri
• d1: Mod sınıfı ile bir önceki sınıf arasındaki sınıf sıklığı farkı
• d2: Mod sınıfı ile bir sonraki sınıf arasındaki sınıf sıklığı farkı
• c: sınıf aralığı genişliği bs + d1 x c
d1 + d2
Örnek: Veri seti için medyanı hesaplayınız.
Sınıf Sıklığı Sınıf Aralığı (fi)
1-5 14
6-10 7
11-15 8
16-20 8
21-25 10
26-31 4
Mod = 1 + 14 x 4 =3,66 14+7
Tanım gereği mod 1.
sınıftadır. Çünkü burada yer alan veri setinde 1.
sınıf en yüksek sıklığa sahiptir.