Медианата е средната стойност в сортиран набор от данни. Това е една от трите основни мерки на централната тенденция — наред със средната стойност и модата — и е особено полезно, когато вашите данни съдържат отклонения или изкривени стойности.

Какво е медианата?

Медианата разделя набор от данни точно наполовина: 50% от стойностите са под нея и 50% са над нея. За разлика от средната стойност, медианата не се влияе от екстремни стойности.

Пример: Средната заплата от $50 000 ви казва повече за типичния работник от средната заплата от $90 000, която е изтеглена от шепа мениджъри, печелещи милиони.

Как да намерим медианата: Нечетен брой стойности

Стъпка 1: Сортирайте всички стойности във възходящ ред (от най-малката към най-голямата).

Стъпка 2: Намерете средната стойност — тази с равен брой стойности от всяка страна.

Пример: Набор от данни: 7, 3, 5, 1, 9

  1. Сортиране: 1, 3, 5, 7, 9
  2. Средната стойност е 5 (2 стойности отдолу, 2 стойности отгоре)

Медианата е 5.

Как да намерим медианата: четен брой стойности

Когато има четен брой стойности, няма нито една средна стойност — имате две. Медианата е средната стойност на тези две средни стойности.

Стъпка 1: Сортирайте всички стойности във възходящ ред.

Стъпка 2: Идентифицирайте двете средни стойности.

Стъпка 3: Съберете ги заедно и разделете на 2.

Пример: Набор от данни: 4, 8, 6, 2, 10, 3

  1. Сортиране: 2, 3, 4, 6, 8, 10
  2. Двете средни стойности са 4 и 6
  3. Медиана = (4 + 6) / 2 = 5

Медианата е 5.

Намиране на средната позиция

За всеки набор от данни от n стойности средната позиция е:

  • Нечетно n: Позиция = (n + 1) / 2
  • Четно n: Средни позиции n/2 и (n/2) + 1
n стойности Средна позиция
5 Позиция 3
7 Позиция 4
10 Средна стойност на позиции 5 и 6
12 Средна стойност на позиции 6 и 7

Работен пример: По-голям набор от данни

Набор от данни: 14, 23, 8, 31, 17, 5, 29, 11, 20, 18, 25, 9

Стъпка 1: Брой: 12 стойности (четни)

Стъпка 2: Сортиране: 5, 8, 9, 11, 14, 17, 18, 20, 23, 25, 29, 31

Стъпка 3: Средните позиции са 6-та и 7-ма стойност = 17 и 18

Стъпка 4: Медиана = (17 + 18) / 2 = 17,5

Медиана срещу средна стойност: Кое трябва да използвате?

Ситуация По-добра мярка
Данните имат отклонения Медиана
Данните са изкривени (напр. доход) Медиана
Симетрично разпределение Или (средното е по-точно)
Категориални или порядъчни данни Медиана
Трябва да се използва при по-нататъшни изчисления Средно

Правило: Ако вашата средна стойност и медиана са много различни, вашите данни са изкривени. Отчетете медианата като по-представителна стойност.

Медиана на групирани данни

Когато данните са представени в честотни таблици или групирани интервали, можете да оцените медианата с помощта на интерполация.

Пример:

резултат Честота Кумулативна честота
0–20 3 3
21–40 7 10
41–60 12 22
61–80 8 30
81–100 5 35

Общо: 35 стойности. Медианата е 18-та стойност (позиция = (35+1)/2 = 18).

18-та стойност попада в групата 41–60 (кумулативната честота достига 22 в тази група, след като е била 10 преди нея).

Median ≈ L + [(n/2 − F) / f] × h

където:

  • L = долна граница на средния клас = 41
  • n = обща честота = 35
  • F = кумулативна честота преди средния клас = 10
  • f = честота на средния клас = 12
  • h = широчина на класа = 20
Median ≈ 41 + [(17.5 − 10) / 12] × 20
        ≈ 41 + [7.5 / 12] × 20
        ≈ 41 + 12.5
        ≈ 53.5

Претеглена медиана

Когато точките от данни имат различни тегла или важност, използвайте претеглената медиана — стойността, при която кумулативното тегло достига 50%.

Примери от реалния свят

Цени на жилищата: Средната цена на жилище в град по-добре представя „типична“ къща, отколкото средната стойност, която може да бъде изкривена от няколко луксозни имота.

Резултати от теста: Ако повечето студенти имат резултат 60–70, но няколко имат резултат 100, средният резултат е по-информативен от средния.

Время за реакция: При уеб производителността средното време за реакция показва какво преживява типичният потребител, докато средната стойност може да бъде отхвърлена от случайни бавни заявки.

Често срещани грешки

Не се сортира първо — Трябва да сортирате данните, преди да намерите средната стойност.

Отклонение по едно на позиция — За 9 стойности медианата е на позиция 5, а не на позиция 4,5.

Използване на средната стойност за четни набори от данни — За четен брой стойности винаги осреднявайте двете средни стойности.


Прочетете следващия