Mediana to środkowa wartość w posortowanym zbiorze danych. Jest to jedna z trzech głównych miar tendencji centralnej — obok średniej i trybu — i jest szczególnie przydatna, gdy dane zawierają wartości odstające lub wypaczone.

Co to jest mediana?

Mediana dzieli zbiór danych dokładnie na pół: 50% wartości znajduje się poniżej niej, a 50% powyżej niej. W przeciwieństwie do średniej, wartości ekstremalne nie mają wpływu na medianę.

Przykład: Średnia pensja wynosząca 50 000 dolarów mówi więcej o typowym pracowniku niż średnia pensja wynosząca 90 000 dolarów uzyskana przez garstkę menedżerów zarabiających miliony.

Jak znaleźć medianę: nieparzysta liczba wartości

Krok 1: Posortuj wszystkie wartości w kolejności rosnącej (od najmniejszej do największej).

Krok 2: Znajdź wartość środkową — tę, która ma równą liczbę wartości po obu stronach.

Przykład: Zbiór danych: 7, 3, 5, 1, 9

  1. Sortuj: 1, 3, 5, 7, 9
  2. Wartość środkowa to 5 (2 wartości poniżej, 2 wartości powyżej)

Mediana wynosi 5.

Jak znaleźć medianę: parzysta liczba wartości

Gdy istnieje parzysta liczba wartości, nie ma jednej wartości środkowej — masz dwie. Mediana jest średnią tych dwóch środkowych wartości.

Krok 1: Posortuj wszystkie wartości w kolejności rosnącej.

Krok 2: Znajdź dwie średnie wartości.

Krok 3: Dodaj je do siebie i podziel przez 2.

Przykład: Zbiór danych: 4, 8, 6, 2, 10, 3

  1. Sortuj: 2, 3, 4, 6, 8, 10
  2. Dwie środkowe wartości to 4 i 6
  3. Mediana = (4 + 6) / 2 = 5

Mediana wynosi 5.

Znajdowanie środkowej pozycji

Dla dowolnego zbioru danych zawierającego n wartości środkowa pozycja to:

  • Nieparzyste n: Pozycja = (n + 1) / 2
  • Nawet n: Średnie pozycje n/2 i (n/2) + 1
n wartości Pozycja środkowa
5 Pozycja 3
7 Pozycja 4
10 Średnia z pozycji 5 i 6
12 Średnia z pozycji 6 i 7

Przykład praktyczny: większy zbiór danych

Zbiór danych: 14, 23, 8, 31, 17, 5, 29, 11, 20, 18, 25, 9

Krok 1: Liczba: 12 wartości (parzyste)

Krok 2: Sortuj: 5, 8, 9, 11, 14, 17, 18, 20, 23, 25, 29, 31

Krok 3: Środkowe pozycje to 6. i 7. wartość = 17 i 18

Krok 4: Mediana = (17 + 18) / 2 = 17,5

Mediana a średnia: której należy użyć?

Sytuacja Lepiej zmierzyć
Dane mają wartości odstające Mediana
Dane są wypaczone (np. dochody) Mediana
Rozkład symetryczny Albo (średnia jest bardziej precyzyjna)
Dane kategoryczne lub porządkowe Mediana
Należy wykorzystać w dalszych obliczeniach Mieć na myśli

Ogólna zasada: jeśli średnia i mediana bardzo się różnią, dane są wypaczone. Podaj medianę jako bardziej reprezentatywną wartość.

Mediana zgrupowanych danych

Gdy dane są prezentowane w tabelach częstości lub w zgrupowanych przedziałach, można oszacować medianę za pomocą interpolacji.

Przykład:

Wynik Częstotliwość Częstotliwość skumulowana
0–20 3 3
21–40 7 10
41–60 12 22
61–80 8 30
81–100 5 35

Razem: 35 wartości. Mediana to 18. wartość (pozycja = (35+1)/2 = 18).

Wartość 18. mieści się w grupie 41–60 (skumulowana częstotliwość sięga w tej grupie 22, a wcześniej wynosiła 10).

Median ≈ L + [(n/2 − F) / f] × h

Gdzie:

  • L = dolna granica klasy mediany = 41
  • n = częstotliwość całkowita = 35
  • F = częstotliwość skumulowana przed klasą mediany = 10
  • f = częstotliwość klasy mediany = 12
  • h = szerokość klasy = 20
Median ≈ 41 + [(17.5 − 10) / 12] × 20
        ≈ 41 + [7.5 / 12] × 20
        ≈ 41 + 12.5
        ≈ 53.5

Mediana ważona

Jeżeli punkty danych mają różną wagę lub znaczenie, należy zastosować medianę ważoną — wartość, przy której skumulowana waga osiąga 50%.

Przykłady z życia wzięte

Ceny domów: średnia cena domu w mieście lepiej odzwierciedla „typowy” dom niż średnią, którą może zafałszować kilka luksusowych nieruchomości.

Wyniki testu: Jeśli większość uczniów uzyskuje wynik 60–70, ale kilku osiąga 100, mediana wyniku jest bardziej informatywna niż średnia.

Czasy odpowiedzi: w przypadku wydajności sieci średni czas odpowiedzi pokazuje, czego doświadcza typowy użytkownik, podczas gdy średni czas może zostać zaniżony w przypadku okazjonalnych powolnych żądań.

Typowe błędy

Nie sortuj najpierw — musisz posortować dane przed znalezieniem środkowej wartości.

Przesunięcie o jeden na pozycji — W przypadku 9 wartości mediana znajduje się na pozycji 5, a nie na pozycji 4,5.

Używanie średniej dla parzystych zbiorów danych — W przypadku parzystej liczby wartości zawsze należy uśrednić dwie środkowe wartości.


Przeczytaj dalej