• Sonuç bulunamadı

Harf Değerleri Bir veri kümesinin özetlenmesinde geleneksel olarak örneklem ortalaması

N/A
N/A
Protected

Academic year: 2021

Share "Harf Değerleri Bir veri kümesinin özetlenmesinde geleneksel olarak örneklem ortalaması"

Copied!
5
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

Harf Değerleri

Bir veri kümesinin özetlenmesinde geleneksel olarak örneklem ortalaması

ve standart sapması kullanılır.

Bu tahmin ediciler normallik varsayımı altında en etkin tahmin edicilerdir. Ancak veri setinin dağılımı normal değilse ya da veri setinde aykırı değerler varsa bu tahmin edicilerin etkinlikleri hızla düşer. Bu nedenle örneklem ortalaması ve standart sapması dayanıklı (robust) tahmin ediciler değillerdir.

Harf değerleri,

 Veri kümesinin konumunun ve yayılma miktarının robust tahmin edicilerini elde etmeye ve

 Veri kümesindeki aykırı değerleri belirlemeye yardımcı olur.

Harf değerleri veri kümesini özetlemek için sınıflama ve sıralamayı kullanmaktadır.

Sınıflama ve Sıralama:

(2)

Derinlik (Depth): Bir örneklemdeki gözlem değerinin derinliği, o gözlemin yukarıdan aşağı olan sırası ile aşağıdan yukarı olan sırasının küçük olanıdır.

Rank: Gözlem değerinin rankı o gözlemin yukarıdan aşağı olan sırasıdır.

Sıra istatistiklerinin en popüler olanı medyandır.

Örnek: ise ve olur.

ise ve olur.

Not: Uç değerler veri kümesindeki en küçük ve en büyük gözlem değerleridir. Aykırı değerlerle karıştırılmaması gerekmektedir.

Tanım: Bir veri kümesinde veri kümesinin ortadaki %50’lik kısmını kapsayan değere alt dörtlük ve üst dörtlük denir.

; ’i aşmayan en büyük tam sayı şeklinde tanımlanmıştır.

Konum parametresinin aykırı değerlerden etkilenmeyen bir diğer tahmin edicisi dir.

(3)

Verilerin konumunu tahmin etmek için yaygın olarak medyan ve trimean kullanılırken veri kümesinin yayılımını tahmin etmek için basit bir robust tahmin edicisi olan Dörtlük Yayılımı ( ) kullanılır. Dörtlük Yayılımı

olarak ifade edilir.

Aykırı değerlerin belirlenmesi: Dörtlük yayılımı ( ) kullanılarak elde edilen kesim (cut off) noktaları ( ve ) dışında kalan gözlemler aykırı değer olarak belirlenir.

| | | | Burada ve şeklinde hesaplanır.

Eğer gözlem değeri değerinden küçük veya değerinden büyük ise bu gözlem değeri aykırı değer olarak belirlenir.

Örnek: dağılımı için

ve olarak hesaplanır. Buradan,

aralığı dışında kalan değerler aykırı değer olarak belirlenir.

dağılımı için

(4)

Not: Bir veri setinde, gözlem sayısının %5’i ile %10’u kadarının aykırı değer olma olasılığı vardır.

Tanım: Medyan, dörtlükler ve uç değerler 5 değerli özet olarak adlandırılır.

Örnek: Aşağıdaki veri seti için 5 değerli özeti hesaplayalım.

İlk önce veriler küçükten büyüğe doğru sıralanır.

Bu veri setinde, değerinden küçük ve değerinden büyük gözlem bulunmadığından aykırı değer yoktur.

Daha büyük veri kümelerinde özetleyici değer çiftlerini eklemeye devam edebiliriz. Örneğin 8’lik, 16’lık v.b. Sekizliğin derinliği

(5)

olarak hesaplanır.

Önceki örnekte,

olacaktır. Sekizliklerin de yer aldığı özetlere 7 değerli özet denir.

Formülü genelleştirirsek, genel formül,

şeklinde ifade edilir.

Referanslar

Benzer Belgeler

38 Ayrıca Kur’ân İlimleri terminolojisinde, Kur’ân’ın değişik lehçelerin farklılıklarını dikkate alarak inzâl edilmiş olmasından dolayı ortaya çıkan

Çünkü zayıf takım- ların sayısının çok olduğu durumda, bu takımlardan biraz daha güçlü olan biri diğer zayıf takımların hepsinden pu- an alabilir ve

Birim Köklü Zaman Serileri İçin Asimptotik Özellikler: Birim köklü zaman serilerinde parametrelerin EKK tahmin edicilerinin asimptotik dağılımlarının

Tablo G ve H sırası ile tahmin edilen parametrelere ilişkin korelasyon matrisi ile modelden elde edilen artıklar serisinin beyaz gürültü serisi olup olmadığını sınamak

 nın en çok olabilirlik tahmin edicisi olabilirlik fonksiyonunu veya log-olabilirlik fonksiyonunu maksimum yapan değerdir.. Ancak, bazı durumlarda log-olabilirlik

biçiminde hesaplanır. Küçük örneklemlerde oran fazla bir anlam ifade etmeyeceğinden oranla ilgili bir tahmin söz konusu olduğunda örneklem hacminin büyük olduğu

Hipotez, kitle dağılımı ile ilgili öne sürülen bir önermedir. Örneğin, kitle dağılımı normaldir ya da kitle dağılımının ortalaması sıfırdır gibi. Kitle

Örnekleme seçilen kümelerin ve bu kümelerde yer alan birimlerin aşağıda gösterildiği gibi olduğunu varsayalım...  Küme başına ortalamanın