Mediana este valoarea mijlocie dintr-un set de date sortat. Este una dintre cele trei măsuri principale ale tendinței centrale - alături de medie și mod - și este deosebit de utilă atunci când datele dvs. conțin valori aberante sau denaturate.
Care este mediana?
Mediana împarte un set de date exact în jumătate: 50% dintre valori cad sub acesta, iar 50% peste el. Spre deosebire de medie, mediana nu este afectată de valori extreme.
Exemplu: Salariul mediu de 50.000 USD vă spune mai multe despre un muncitor obișnuit decât un salariu mediu de 90.000 USD care a fost ridicat de câțiva directori care câștigă milioane.
Cum să găsiți mediana: număr impar de valori
Pasul 1: Sortați toate valorile în ordine crescătoare (de la cel mai mic la cel mai mare).
Pasul 2: Găsiți valoarea de mijloc — cea cu un număr egal de valori pe fiecare parte.
Exemplu: Set de date: 7, 3, 5, 1, 9
- Sortați: 1, 3, 5, 7, 9
- Valoarea de mijloc este 5 (2 valori mai jos, 2 valori mai sus)
Mediana este 5.
Cum să găsiți mediana: număr par de valori
Când există un număr par de valori, nu există o singură valoare mijlocie - aveți două. Mediana este media celor două valori medii.
Pasul 1: Sortați toate valorile în ordine crescătoare.
Pasul 2: Identificați cele două valori din mijloc.
Pasul 3: Adăugați-le și împărțiți la 2.
Exemplu: Set de date: 4, 8, 6, 2, 10, 3
- Sortați: 2, 3, 4, 6, 8, 10
- Cele două valori din mijloc sunt 4 și 6
- Mediană = (4 + 6) / 2 = 5
Mediana este 5.
Găsirea poziției de mijloc
Pentru orice set de date de n valori, poziția de mijloc este:
- Impar n: Poziție = (n + 1) / 2
- Par n: Pozițiile medii n/2 și (n/2) + 1
| n valori | Poziția de mijloc |
|---|---|
| 5 | Poziția 3 |
| 7 | Poziția 4 |
| 10 | Media pozițiilor 5 și 6 |
| 12 | Media pozițiilor 6 și 7 |
Exemplu funcționat: set de date mai mare
Set de date: 14, 23, 8, 31, 17, 5, 29, 11, 20, 18, 25, 9
Pasul 1: Număr: 12 valori (pari)
Pasul 2: Sortare: 5, 8, 9, 11, 14, 17, 18, 20, 23, 25, 29, 31
Pasul 3: Pozițiile din mijloc sunt valorile a 6-a și a 7-a = 17 și 18
Pasul 4: Median = (17 + 18) / 2 = 17,5
Mediană vs medie: pe care ar trebui să-l folosiți?
| Situaţie | Măsoară mai bună |
|---|---|
| Datele au valori aberante | Median |
| Datele sunt denaturate (de exemplu, venit) | Median |
| Distribuție simetrică | Ori (media este mai precisă) |
| Date categoriale sau ordinale | Median |
| Trebuie folosit în calcule ulterioare | Medie |
Regula generală: dacă media și mediana sunt foarte diferite, datele dvs. sunt denaturate. Raportați mediana ca valoare mai reprezentativă.
Mediana datelor grupate
Când datele sunt prezentate în tabele de frecvență sau în intervale grupate, puteți estima mediana utilizând interpolare.
Exemplu:
| Scor | Frecvenţă | Frecvența cumulativă |
|---|---|---|
| 0–20 | 3 | 3 |
| 21–40 | 7 | 10 |
| 41–60 | 12 | 22 |
| 61–80 | 8 | 30 |
| 81–100 | 5 | 35 |
Total: 35 de valori. Mediana este a 18-a valoare (poziție = (35+1)/2 = 18).
A 18-a valoare se încadrează în grupul 41-60 (frecvența cumulată ajunge la 22 în acest grup, fiind de 10 înaintea ei).
Median ≈ L + [(n/2 − F) / f] × h
Unde:
- L = limita inferioară a clasei mediane = 41
- n = frecvența totală = 35
- F = frecvența cumulativă înainte de clasa medie = 10
- f = frecvența clasei mediane = 12
- h = lățimea clasei = 20
Median ≈ 41 + [(17.5 − 10) / 12] × 20
≈ 41 + [7.5 / 12] × 20
≈ 41 + 12.5
≈ 53.5
Mediană ponderată
Când punctele de date au ponderi sau importanță diferite, utilizați mediana ponderată - valoarea la care ponderea cumulată atinge 50%.
Exemple din lumea reală
Prețurile caselor: Prețul mediu al casei într-un oraș reprezintă mai bine o casă „tipică” decât media, care poate fi denaturată de câteva proprietăți de lux.
Scoruri la test: Dacă majoritatea studenților obțin 60–70, dar câțiva obțin 100, scorul median este mai informativ decât media.
Timpurile de răspuns: în performanța web, timpul mediu de răspuns arată ceea ce se confruntă cu un utilizator obișnuit, în timp ce media poate fi abătută de solicitări lente ocazionale.
Greșeli frecvente
Nu se sortează mai întâi — Trebuie să sortați datele înainte de a găsi valoarea de mijloc.
Off-by-one pe poziție — Pentru 9 valori, mediana este în poziția 5, nu în poziția 4.5.
Folosirea mediei pentru seturile de date pare — Pentru un număr par de valori, întotdeauna media celor două valori din mijloc.