Medianen er den midterste værdi i et sorteret datasæt. Det er et af de tre hovedmål for central tendens - sammen med middelværdien og tilstanden - og det er især nyttigt, når dine data indeholder afvigere eller skæve værdier.

Hvad er medianen?

Medianen deler et datasæt nøjagtigt i to: 50 % af værdierne falder under det, og 50 % falder over det. I modsætning til gennemsnittet er medianen ikke påvirket af ekstreme værdier.

Eksempel: Medianlønnen på $50.000 fortæller dig mere om en typisk arbejder end en gennemsnitlig løn på $90.000, der er blevet trukket op af en håndfuld ledere, der tjener millioner.

Sådan finder du medianen: ulige antal værdier

Trin 1: Sorter alle værdier i stigende rækkefølge (mindst til størst).

Trin 2: Find den midterste værdi - den med lige mange værdier på hver side.

Eksempel: Datasæt: 7, 3, 5, 1, 9

  1. Sortér: 1, 3, 5, 7, 9
  2. Den midterste værdi er 5 (2 værdier under, 2 værdier over)

Medianen er 5.

Sådan finder du medianen: lige antal værdier

Når der er et lige antal værdier, er der ingen enkelt mellemværdi - du har to. Medianen er middelværdien af ​​disse to midterste værdier.

Trin 1: Sorter alle værdier i stigende rækkefølge.

Trin 2: Identificer de to midterste værdier.

Trin 3: Tilføj dem sammen og divider med 2.

Eksempel: Datasæt: 4, 8, 6, 2, 10, 3

  1. Sortér: 2, 3, 4, 6, 8, 10
  2. De to midterste værdier er 4 og 6
  3. Median = (4 + 6) / 2 = 5

Medianen er 5.

At finde midterpositionen

For ethvert datasæt med n værdier er midterpositionen:

  • Ulige n: Position = (n + 1) / 2
  • Lige n: Gennemsnitlige positioner n/2 og (n/2) + 1
n værdier Mellem position
5 Position 3
7 Position 4
10 Gennemsnit af position 5 og 6
12 Gennemsnit af position 6 og 7

Bearbejdet eksempel: Større datasæt

Datasæt: 14, 23, 8, 31, 17, 5, 29, 11, 20, 18, 25, 9

Trin 1: Antal: 12 værdier (lige)

Trin 2: Sorter: 5, 8, 9, 11, 14, 17, 18, 20, 23, 25, 29, 31

Trin 3: Mellempositioner er 6. og 7. værdier = 17 og 18

Trin 4: Median = (17 + 18) / 2 = 17,5

Median vs middelværdi: Hvilken skal du bruge?

Situation Bedre mål
Data har outliers Median
Data er skæve (f.eks. indkomst) Median
Symmetrisk fordeling Enten (gennemsnit er mere præcist)
Kategoriske eller ordinære data Median
Skal bruges i yderligere beregninger Betyde

Tommelfingerregel: Hvis din middelværdi og median er meget forskellige, er dine data skæve. Rapportér medianen som den mere repræsentative værdi.

Medianen af ​​grupperede data

Når data præsenteres i frekvenstabeller eller grupperede intervaller, kan du estimere medianen ved hjælp af interpolation.

Eksempel:

Score Frekvens Kumulativ frekvens
0-20 3 3
21-40 7 10
41-60 12 22
61-80 8 30
81-100 5 35

I alt: 35 værdier. Medianen er den 18. værdi (position = (35+1)/2 = 18).

Den 18. værdi falder i 41-60-gruppen (kumulativ frekvens når 22 i denne gruppe, efter at have været 10 før den).

Median ≈ L + [(n/2 − F) / f] × h

Hvor:

  • L = nedre grænse for medianklassen = 41
  • n = total frekvens = 35
  • F = kumulativ frekvens før medianklasse = 10
  • f = frekvens af medianklasse = 12
  • h = klassebredde = 20
Median ≈ 41 + [(17.5 − 10) / 12] × 20
        ≈ 41 + [7.5 / 12] × 20
        ≈ 41 + 12.5
        ≈ 53.5

Vægtet median

Når datapunkter har forskellig vægt eller vigtighed, skal du bruge den vægtede median — den værdi, ved hvilken den kumulative vægt når 50 %.

Eksempler fra den virkelige verden

Huspriser: Medianhusprisen i en by repræsenterer bedre et "typisk" hus end gennemsnittet, som kan være skævt af nogle få luksusejendomme.

Testresultater: Hvis de fleste elever scorer 60-70, men nogle få scorer 100, er medianresultatet mere informativt end gennemsnittet.

Responstider: I web-ydeevne viser mediansvartiden, hvad en typisk bruger oplever, hvorimod middelværdien kan blive forkastet af lejlighedsvise langsomme anmodninger.

Almindelige fejl

Sorteres ikke først — Du skal sortere dataene, før du finder den midterste værdi.

Off-by-one på positionen — For 9 værdier er medianen på position 5, ikke position 4,5.

Brug af middelværdien for lige datasæt — For et lige antal værdier skal du altid tage et gennemsnit af de to midterste værdier.


Læs næste