Mediana to środkowa wartość w posortowanym zbiorze danych. Jest to jedna z trzech głównych miar tendencji centralnej — obok średniej i trybu — i jest szczególnie przydatna, gdy dane zawierają wartości odstające lub wypaczone.
Co to jest mediana?
Mediana dzieli zbiór danych dokładnie na pół: 50% wartości znajduje się poniżej niej, a 50% powyżej niej. W przeciwieństwie do średniej, wartości ekstremalne nie mają wpływu na medianę.
Przykład: Średnia pensja wynosząca 50 000 dolarów mówi więcej o typowym pracowniku niż średnia pensja wynosząca 90 000 dolarów uzyskana przez garstkę menedżerów zarabiających miliony.
Jak znaleźć medianę: nieparzysta liczba wartości
Krok 1: Posortuj wszystkie wartości w kolejności rosnącej (od najmniejszej do największej).
Krok 2: Znajdź wartość środkową — tę, która ma równą liczbę wartości po obu stronach.
Przykład: Zbiór danych: 7, 3, 5, 1, 9
- Sortuj: 1, 3, 5, 7, 9
- Wartość środkowa to 5 (2 wartości poniżej, 2 wartości powyżej)
Mediana wynosi 5.
Jak znaleźć medianę: parzysta liczba wartości
Gdy istnieje parzysta liczba wartości, nie ma jednej wartości środkowej — masz dwie. Mediana jest średnią tych dwóch środkowych wartości.
Krok 1: Posortuj wszystkie wartości w kolejności rosnącej.
Krok 2: Znajdź dwie średnie wartości.
Krok 3: Dodaj je do siebie i podziel przez 2.
Przykład: Zbiór danych: 4, 8, 6, 2, 10, 3
- Sortuj: 2, 3, 4, 6, 8, 10
- Dwie środkowe wartości to 4 i 6
- Mediana = (4 + 6) / 2 = 5
Mediana wynosi 5.
Znajdowanie środkowej pozycji
Dla dowolnego zbioru danych zawierającego n wartości środkowa pozycja to:
- Nieparzyste n: Pozycja = (n + 1) / 2
- Nawet n: Średnie pozycje n/2 i (n/2) + 1
| n wartości | Pozycja środkowa |
|---|---|
| 5 | Pozycja 3 |
| 7 | Pozycja 4 |
| 10 | Średnia z pozycji 5 i 6 |
| 12 | Średnia z pozycji 6 i 7 |
Przykład praktyczny: większy zbiór danych
Zbiór danych: 14, 23, 8, 31, 17, 5, 29, 11, 20, 18, 25, 9
Krok 1: Liczba: 12 wartości (parzyste)
Krok 2: Sortuj: 5, 8, 9, 11, 14, 17, 18, 20, 23, 25, 29, 31
Krok 3: Środkowe pozycje to 6. i 7. wartość = 17 i 18
Krok 4: Mediana = (17 + 18) / 2 = 17,5
Mediana a średnia: której należy użyć?
| Sytuacja | Lepiej zmierzyć |
|---|---|
| Dane mają wartości odstające | Mediana |
| Dane są wypaczone (np. dochody) | Mediana |
| Rozkład symetryczny | Albo (średnia jest bardziej precyzyjna) |
| Dane kategoryczne lub porządkowe | Mediana |
| Należy wykorzystać w dalszych obliczeniach | Mieć na myśli |
Ogólna zasada: jeśli średnia i mediana bardzo się różnią, dane są wypaczone. Podaj medianę jako bardziej reprezentatywną wartość.
Mediana zgrupowanych danych
Gdy dane są prezentowane w tabelach częstości lub w zgrupowanych przedziałach, można oszacować medianę za pomocą interpolacji.
Przykład:
| Wynik | Częstotliwość | Częstotliwość skumulowana |
|---|---|---|
| 0–20 | 3 | 3 |
| 21–40 | 7 | 10 |
| 41–60 | 12 | 22 |
| 61–80 | 8 | 30 |
| 81–100 | 5 | 35 |
Razem: 35 wartości. Mediana to 18. wartość (pozycja = (35+1)/2 = 18).
Wartość 18. mieści się w grupie 41–60 (skumulowana częstotliwość sięga w tej grupie 22, a wcześniej wynosiła 10).
Median ≈ L + [(n/2 − F) / f] × h
Gdzie:
- L = dolna granica klasy mediany = 41
- n = częstotliwość całkowita = 35
- F = częstotliwość skumulowana przed klasą mediany = 10
- f = częstotliwość klasy mediany = 12
- h = szerokość klasy = 20
Median ≈ 41 + [(17.5 − 10) / 12] × 20
≈ 41 + [7.5 / 12] × 20
≈ 41 + 12.5
≈ 53.5
Mediana ważona
Jeżeli punkty danych mają różną wagę lub znaczenie, należy zastosować medianę ważoną — wartość, przy której skumulowana waga osiąga 50%.
Przykłady z życia wzięte
Ceny domów: średnia cena domu w mieście lepiej odzwierciedla „typowy” dom niż średnią, którą może zafałszować kilka luksusowych nieruchomości.
Wyniki testu: Jeśli większość uczniów uzyskuje wynik 60–70, ale kilku osiąga 100, mediana wyniku jest bardziej informatywna niż średnia.
Czasy odpowiedzi: w przypadku wydajności sieci średni czas odpowiedzi pokazuje, czego doświadcza typowy użytkownik, podczas gdy średni czas może zostać zaniżony w przypadku okazjonalnych powolnych żądań.
Typowe błędy
Nie sortuj najpierw — musisz posortować dane przed znalezieniem środkowej wartości.
Przesunięcie o jeden na pozycji — W przypadku 9 wartości mediana znajduje się na pozycji 5, a nie na pozycji 4,5.
Używanie średniej dla parzystych zbiorów danych — W przypadku parzystej liczby wartości zawsze należy uśrednić dwie środkowe wartości.