İçeriğe atla

Medyan

Vikipedi, özgür ansiklopedi

Medyan(ya daortanca) biranakütleya daörneklemveri serisini küçükten büyüğe doğru sıraladığımızda, seriyi ortadan ikiye ayıran değere denir.İstatistiğinbir alt dalı olanbetimsel istatistikdemedyan birmerkezsel konum ölçüsükabul edilir.[1]

Merkezsel konum olarak medyan[değiştir|kaynağı değiştir]

Birolasılık dağılımısimetrik olmayıp,çarpıklıkgösteriyorsa, medyan,aritmetik ortalamadandaha uygun birmerkezsel konum ölçüsüdür.Simetrik olmama, sıralanmış veri değerleri için ya en küçük değerlerin ya da en büyük değerlerin diğerlerinden çok daha fazla uzaklaşması ile ortaya çıkar. Bu beklenmedik küçük veya büyük değerlereaykırı değer(outlier) adı verilir. Eğer veri dağılımıasitmetrik olan aykırı değerlerkapsıyorsa, medyan aritmetik ortalamaya nazaran daha güçlü (robust) bir merkezsel konum ölçüsü halini alır.

Medyan değeri hesaplanması[değiştir|kaynağı değiştir]

Veri sayıları küçükten büyüğe doğru sıralandıktan sonra,ngözlem sayısı olmak üzere, medyan değerinin bu seri içindeki sıra numarası şu şekilde bulunur:

Eğer gözlem sayısı tek ise medyanın sıra numarası birtam sayıolacaktır ve doğrudan medyan bulunur. Eğer gözlem sayısı çift ise medyanın sıra numarası ½ li bir sayı çıkar. Bu durumda bu sayının etrafındaki iki değerin aritmetik ortalaması medyandır.

Örnek

1,3,4,5,7,8,13 dizisinin medyanı 4. sıradaki eleman olan 5'tir.

2,4,6,8 dizisinin medyan pozisyonu 2.5'tir. Bu durumda 2. ve 3. elemanların aritmetik ortalaması yani (4+6)/2=5 medyan değeridir.

Gözlem sayısı küçükse, gözlem değerlerinin sıralaması elle kolay olarak yapılabilmekte ve bu hesaplama kolaylığımerkezsel konum ölçüsüolarak medyanın tercih edilmesine bir neden olmaktadır. Ancak gözlem sayısınartıkça, sıralama işlemleri gittikçe zorlaşmaktadır; ayrıca basit el hesap makinaları ile sıralama yapmak imkanı olmamaktadır. Bilgisayar kullanılmadan ve elle yapılan işlemler kullanarak büyük gözlem sayılı verilerinin sıralanması zorluğu nedeni ile medyan büyük veri kullanılması gerektiren araştırmalarda kullanılmamıştır. Ama bilgisayarların gelişmesi ile medyan kullanılmasının bu dezavantajı kaybolmuştur. Bilgisayarla yapılan veri sıralanması için, özellikle çok büyük gözlem sayıda veri için özel hızlısıralama algoritmalarıkullanılmaktadır. Busıralama algoritmalarındagenellikle (nlogn) işlem yapılmaktadır ama özelböl ve fethet algoritmasıkullanılması ile sadecenişlem gerekmektedir.

Çokluk dağılımları için medyan değerinin hesaplanması[değiştir|kaynağı değiştir]

Veri değerleri gruplanmış veçokluk dağılımlarıolarak verilmişler ise, medyan, gözlem sayısında N/2 inci değerin denk düştüğü sınıftadır veinterpolasyonile ortaya çıkartılan formülü şu şekilde verilir:

  • L: Medyan sınıfın alt değeri
  • c: Medyan sınıfın aralığı
  • f: Medyan sınıfın frekansı
  • N: Toplam birim sayısı
  • d: Medyan sınıftan bir önceki sınıfın birikimli frekansı.

Olasılık dağılımları için medyanlar[değiştir|kaynağı değiştir]

Reeldoğrusu üzerinde olan veFfonksiyonu ile ifade edilenyığmalı dağılım fonksiyonugösteren herhangi birolasılık dağılımıiçin,kesikliveyasürekliolması özelliğine bakılmadan, medyan değerimşu eşitsizlik ifadelerine her zaman uyar:

veya

Belirli parametreleri olan belirli dağılımların medyanları hakkında şunlar söylenebilir:

  • Ortalama değeri μ ve varyansı σ2olan birnormal dağılımiçin medyan değeri μ olur. Gerçekten normal dağılım simetrik çan şeklinde olduğundan ortalama=medyan=mod olur.
  • [ab] aralığında bulunan birsürekli tekdüze dağılımiçin medyan değeri (a+b) / 2 olup bu ortalama değerine de eşittir.
  • Konum parametresix0ve ölçek parametresiydex0olanCauchy dağılımıiçin medyan değeri konum parametresine eşittir.
  • Şekil parametresikve ölçek parametresiolan birWeibull dağılımıiçin medyan değeriolur.

Özellikleri[değiştir|kaynağı değiştir]

  • Optimal olma özelliği

Medyan, mutlak dağılmaların ortalamalarının en küçük değerini bulan bir merkezsel noktadır. Olasılık kuramının özel terimlerine göre

ifadesini en küçük yapancdeğeri için,Xrassal değişkeninolasılık dağılımının medyanıdır. Dikkat edilmesi gerekir ki, c her zaman tek değildir ve onun için genellikle kesinlikle tanımlanamaz.

  • Sürekli bir olasılık dağılımı için, medyan sayı değeri ile ortalama sayı değeri arasında birstandart sapmayaeşit bir fark vardır.
  • Medyan 2incidörttebirlik,5inciondabirlikve 50inciyüzdebirlik'e eşittir.
  • Genellikle medyan bir yanlı kestirimcidir.

Ayrıca bakınız[değiştir|kaynağı değiştir]

Kaynakça[değiştir|kaynağı değiştir]

  1. ^İstatistik.3.baskı. Yüzer, Ali Fuat. Eskişehir: Anadolu Üniversitesi. 2006. ss. 48-53.ISBN975-06-0183-1.OCLC567334808.