Медианата е средната стойност в сортиран набор от данни. Това е една от трите основни мерки на централната тенденция — наред със средната стойност и модата — и е особено полезно, когато вашите данни съдържат отклонения или изкривени стойности.
Какво е медианата?
Медианата разделя набор от данни точно наполовина: 50% от стойностите са под нея и 50% са над нея. За разлика от средната стойност, медианата не се влияе от екстремни стойности.
Пример: Средната заплата от $50 000 ви казва повече за типичния работник от средната заплата от $90 000, която е изтеглена от шепа мениджъри, печелещи милиони.
Как да намерим медианата: Нечетен брой стойности
Стъпка 1: Сортирайте всички стойности във възходящ ред (от най-малката към най-голямата).
Стъпка 2: Намерете средната стойност — тази с равен брой стойности от всяка страна.
Пример: Набор от данни: 7, 3, 5, 1, 9
- Сортиране: 1, 3, 5, 7, 9
- Средната стойност е 5 (2 стойности отдолу, 2 стойности отгоре)
Медианата е 5.
Как да намерим медианата: четен брой стойности
Когато има четен брой стойности, няма нито една средна стойност — имате две. Медианата е средната стойност на тези две средни стойности.
Стъпка 1: Сортирайте всички стойности във възходящ ред.
Стъпка 2: Идентифицирайте двете средни стойности.
Стъпка 3: Съберете ги заедно и разделете на 2.
Пример: Набор от данни: 4, 8, 6, 2, 10, 3
- Сортиране: 2, 3, 4, 6, 8, 10
- Двете средни стойности са 4 и 6
- Медиана = (4 + 6) / 2 = 5
Медианата е 5.
Намиране на средната позиция
За всеки набор от данни от n стойности средната позиция е:
- Нечетно n: Позиция = (n + 1) / 2
- Четно n: Средни позиции n/2 и (n/2) + 1
| n стойности | Средна позиция |
|---|---|
| 5 | Позиция 3 |
| 7 | Позиция 4 |
| 10 | Средна стойност на позиции 5 и 6 |
| 12 | Средна стойност на позиции 6 и 7 |
Работен пример: По-голям набор от данни
Набор от данни: 14, 23, 8, 31, 17, 5, 29, 11, 20, 18, 25, 9
Стъпка 1: Брой: 12 стойности (четни)
Стъпка 2: Сортиране: 5, 8, 9, 11, 14, 17, 18, 20, 23, 25, 29, 31
Стъпка 3: Средните позиции са 6-та и 7-ма стойност = 17 и 18
Стъпка 4: Медиана = (17 + 18) / 2 = 17,5
Медиана срещу средна стойност: Кое трябва да използвате?
| Ситуация | По-добра мярка |
|---|---|
| Данните имат отклонения | Медиана |
| Данните са изкривени (напр. доход) | Медиана |
| Симетрично разпределение | Или (средното е по-точно) |
| Категориални или порядъчни данни | Медиана |
| Трябва да се използва при по-нататъшни изчисления | Средно |
Правило: Ако вашата средна стойност и медиана са много различни, вашите данни са изкривени. Отчетете медианата като по-представителна стойност.
Медиана на групирани данни
Когато данните са представени в честотни таблици или групирани интервали, можете да оцените медианата с помощта на интерполация.
Пример:
| резултат | Честота | Кумулативна честота |
|---|---|---|
| 0–20 | 3 | 3 |
| 21–40 | 7 | 10 |
| 41–60 | 12 | 22 |
| 61–80 | 8 | 30 |
| 81–100 | 5 | 35 |
Общо: 35 стойности. Медианата е 18-та стойност (позиция = (35+1)/2 = 18).
18-та стойност попада в групата 41–60 (кумулативната честота достига 22 в тази група, след като е била 10 преди нея).
Median ≈ L + [(n/2 − F) / f] × h
където:
- L = долна граница на средния клас = 41
- n = обща честота = 35
- F = кумулативна честота преди средния клас = 10
- f = честота на средния клас = 12
- h = широчина на класа = 20
Median ≈ 41 + [(17.5 − 10) / 12] × 20
≈ 41 + [7.5 / 12] × 20
≈ 41 + 12.5
≈ 53.5
Претеглена медиана
Когато точките от данни имат различни тегла или важност, използвайте претеглената медиана — стойността, при която кумулативното тегло достига 50%.
Примери от реалния свят
Цени на жилищата: Средната цена на жилище в град по-добре представя „типична“ къща, отколкото средната стойност, която може да бъде изкривена от няколко луксозни имота.
Резултати от теста: Ако повечето студенти имат резултат 60–70, но няколко имат резултат 100, средният резултат е по-информативен от средния.
Время за реакция: При уеб производителността средното време за реакция показва какво преживява типичният потребител, докато средната стойност може да бъде отхвърлена от случайни бавни заявки.
Често срещани грешки
Не се сортира първо — Трябва да сортирате данните, преди да намерите средната стойност.
Отклонение по едно на позиция — За 9 стойности медианата е на позиция 5, а не на позиция 4,5.
Използване на средната стойност за четни набори от данни — За четен брой стойности винаги осреднявайте двете средни стойности.