Medianen er den midterste værdi i et sorteret datasæt. Det er et af de tre hovedmål for central tendens - sammen med middelværdien og tilstanden - og det er især nyttigt, når dine data indeholder afvigere eller skæve værdier.
Hvad er medianen?
Medianen deler et datasæt nøjagtigt i to: 50 % af værdierne falder under det, og 50 % falder over det. I modsætning til gennemsnittet er medianen ikke påvirket af ekstreme værdier.
Eksempel: Medianlønnen på $50.000 fortæller dig mere om en typisk arbejder end en gennemsnitlig løn på $90.000, der er blevet trukket op af en håndfuld ledere, der tjener millioner.
Sådan finder du medianen: ulige antal værdier
Trin 1: Sorter alle værdier i stigende rækkefølge (mindst til størst).
Trin 2: Find den midterste værdi - den med lige mange værdier på hver side.
Eksempel: Datasæt: 7, 3, 5, 1, 9
- Sortér: 1, 3, 5, 7, 9
- Den midterste værdi er 5 (2 værdier under, 2 værdier over)
Medianen er 5.
Sådan finder du medianen: lige antal værdier
Når der er et lige antal værdier, er der ingen enkelt mellemværdi - du har to. Medianen er middelværdien af disse to midterste værdier.
Trin 1: Sorter alle værdier i stigende rækkefølge.
Trin 2: Identificer de to midterste værdier.
Trin 3: Tilføj dem sammen og divider med 2.
Eksempel: Datasæt: 4, 8, 6, 2, 10, 3
- Sortér: 2, 3, 4, 6, 8, 10
- De to midterste værdier er 4 og 6
- Median = (4 + 6) / 2 = 5
Medianen er 5.
At finde midterpositionen
For ethvert datasæt med n værdier er midterpositionen:
- Ulige n: Position = (n + 1) / 2
- Lige n: Gennemsnitlige positioner n/2 og (n/2) + 1
| n værdier | Mellem position |
|---|---|
| 5 | Position 3 |
| 7 | Position 4 |
| 10 | Gennemsnit af position 5 og 6 |
| 12 | Gennemsnit af position 6 og 7 |
Bearbejdet eksempel: Større datasæt
Datasæt: 14, 23, 8, 31, 17, 5, 29, 11, 20, 18, 25, 9
Trin 1: Antal: 12 værdier (lige)
Trin 2: Sorter: 5, 8, 9, 11, 14, 17, 18, 20, 23, 25, 29, 31
Trin 3: Mellempositioner er 6. og 7. værdier = 17 og 18
Trin 4: Median = (17 + 18) / 2 = 17,5
Median vs middelværdi: Hvilken skal du bruge?
| Situation | Bedre mål |
|---|---|
| Data har outliers | Median |
| Data er skæve (f.eks. indkomst) | Median |
| Symmetrisk fordeling | Enten (gennemsnit er mere præcist) |
| Kategoriske eller ordinære data | Median |
| Skal bruges i yderligere beregninger | Betyde |
Tommelfingerregel: Hvis din middelværdi og median er meget forskellige, er dine data skæve. Rapportér medianen som den mere repræsentative værdi.
Medianen af grupperede data
Når data præsenteres i frekvenstabeller eller grupperede intervaller, kan du estimere medianen ved hjælp af interpolation.
Eksempel:
| Score | Frekvens | Kumulativ frekvens |
|---|---|---|
| 0-20 | 3 | 3 |
| 21-40 | 7 | 10 |
| 41-60 | 12 | 22 |
| 61-80 | 8 | 30 |
| 81-100 | 5 | 35 |
I alt: 35 værdier. Medianen er den 18. værdi (position = (35+1)/2 = 18).
Den 18. værdi falder i 41-60-gruppen (kumulativ frekvens når 22 i denne gruppe, efter at have været 10 før den).
Median ≈ L + [(n/2 − F) / f] × h
Hvor:
- L = nedre grænse for medianklassen = 41
- n = total frekvens = 35
- F = kumulativ frekvens før medianklasse = 10
- f = frekvens af medianklasse = 12
- h = klassebredde = 20
Median ≈ 41 + [(17.5 − 10) / 12] × 20
≈ 41 + [7.5 / 12] × 20
≈ 41 + 12.5
≈ 53.5
Vægtet median
Når datapunkter har forskellig vægt eller vigtighed, skal du bruge den vægtede median — den værdi, ved hvilken den kumulative vægt når 50 %.
Eksempler fra den virkelige verden
Huspriser: Medianhusprisen i en by repræsenterer bedre et "typisk" hus end gennemsnittet, som kan være skævt af nogle få luksusejendomme.
Testresultater: Hvis de fleste elever scorer 60-70, men nogle få scorer 100, er medianresultatet mere informativt end gennemsnittet.
Responstider: I web-ydeevne viser mediansvartiden, hvad en typisk bruger oplever, hvorimod middelværdien kan blive forkastet af lejlighedsvise langsomme anmodninger.
Almindelige fejl
Sorteres ikke først — Du skal sortere dataene, før du finder den midterste værdi.
Off-by-one på positionen — For 9 værdier er medianen på position 5, ikke position 4,5.
Brug af middelværdien for lige datasæt — For et lige antal værdier skal du altid tage et gennemsnit af de to midterste værdier.