De mediaan is de middelste waarde in een gesorteerde dataset. Het is een van de drie belangrijkste maatstaven voor de centrale tendens (naast het gemiddelde en de modus) en is vooral handig als uw gegevens uitschieters of scheve waarden bevatten.

Wat is de mediaan?

De mediaan splitst een dataset precies in tweeën: 50% van de waarden valt eronder en 50% valt erboven. In tegenstelling tot het gemiddelde wordt de mediaan niet beïnvloed door extreme waarden.

Voorbeeld: Het gemiddelde salaris van €50.000 vertelt je meer over een gemiddelde werknemer dan een gemiddeld salaris van €90.000 dat is opgetrokken door een handjevol leidinggevenden die miljoenen verdienen.

Hoe u de mediaan kunt vinden: oneven aantal waarden

Stap 1: Sorteer alle waarden in oplopende volgorde (van klein naar groot).

Stap 2: Zoek de middelste waarde: degene met een gelijk aantal waarden aan elke kant.

Voorbeeld: Gegevensset: 7, 3, 5, 1, 9

  1. Sorteren: 1, 3, 5, 7, 9
  2. De middelste waarde is 5 (2 waarden onder, 2 waarden boven)

De mediaan is 5.

Hoe de mediaan te vinden: even aantal waarden

Als er een even aantal waarden is, is er geen enkele middelste waarde; je hebt er twee. De mediaan is het gemiddelde van deze twee middelste waarden.

Stap 1: Sorteer alle waarden in oplopende volgorde.

Stap 2: Identificeer de twee middelste waarden.

Stap 3: Tel ze bij elkaar op en deel door 2.

Voorbeeld: Gegevensset: 4, 8, 6, 2, 10, 3

  1. Sorteren: 2, 3, 4, 6, 8, 10
  2. De twee middelste waarden zijn 4 en 6
  3. Mediaan = (4 + 6) / 2 = 5

De mediaan is 5.

De middenpositie vinden

Voor elke dataset met n waarden is de middelste positie:

  • Oneven n: Positie = (n + 1) / 2
  • Zelfs n: Gemiddelde posities n/2 en (n/2) + 1
n waarden Midden positie
5 Positie 3
7 Positie 4
10 Gemiddelde van posities 5 en 6
12 Gemiddelde van posities 6 en 7

Uitgewerkt voorbeeld: grotere dataset

Gegevenset: 14, 23, 8, 31, 17, 5, 29, 11, 20, 18, 25, 9

Stap 1: Aantal: 12 waarden (even)

Stap 2: Sorteren: 5, 8, 9, 11, 14, 17, 18, 20, 23, 25, 29, 31

Stap 3: Middenposities zijn 6e en 7e waarden = 17 en 18

Stap 4: Mediaan = (17 + 18) / 2 = 17,5

Mediaan versus gemiddelde: welke moet u gebruiken?

Situatie Beter meten
Gegevens hebben uitschieters Mediaan
Gegevens zijn vertekend (bijvoorbeeld inkomen) Mediaan
Symmetrische distributie Ofwel (gemiddeld is nauwkeuriger)
Categorische of ordinale gegevens Mediaan
Moet worden gebruikt bij verdere berekeningen Gemeen

Vuistregel: Als uw gemiddelde en mediaan heel verschillend zijn, zijn uw gegevens scheef. Rapporteer de mediaan als de meer representatieve waarde.

Mediaan van gegroepeerde gegevens

Wanneer gegevens worden gepresenteerd in frequentietabellen of gegroepeerde intervallen, kunt u de mediaan schatten met behulp van interpolatie.

Voorbeeld:

Scoren Frequentie Cumulatieve frequentie
0–20 3 3
21–40 7 10
41–60 12 22
61–80 8 30
81–100 5 35

Totaal: 35 waarden. De mediaan is de 18e waarde (positie = (35+1)/2 = 18).

De 18e waarde valt in de groep 41-60 (de cumulatieve frequentie bereikt 22 in deze groep, terwijl het daarvoor 10 was).

Median ≈ L + [(n/2 − F) / f] × h

Waar:

  • L = ondergrens van mediaanklasse = 41
  • n = totale frequentie = 35
  • F = cumulatieve frequentie vóór mediaanklasse = 10
  • f = frequentie van mediaanklasse = 12
  • h = klassenbreedte = 20
Median ≈ 41 + [(17.5 − 10) / 12] × 20
        ≈ 41 + [7.5 / 12] × 20
        ≈ 41 + 12.5
        ≈ 53.5

Gewogen mediaan

Wanneer gegevenspunten verschillende gewichten of belangrijkheid hebben, gebruikt u de gewogen mediaan: de waarde waarbij het cumulatieve gewicht 50% bereikt.

Voorbeelden uit de echte wereld

Huizenprijzen: De gemiddelde huizenprijs in een stad vertegenwoordigt beter een 'typisch' huis dan het gemiddelde, dat vertekend kan worden door een paar luxe eigendommen.

Testscores: Als de meeste leerlingen een score van 60–70 hebben, maar enkelen een score van 100, is de mediaanscore informatiever dan het gemiddelde.

Responstijd: Bij webprestaties laat de gemiddelde responstijd zien wat een gemiddelde gebruiker ervaart, terwijl het gemiddelde kan worden verstoord door incidentele langzame verzoeken.

Veelvoorkomende fouten

Niet eerst sorteren — U moet de gegevens sorteren voordat u de middelste waarde vindt.

Eén-één op de positie — Voor 9 waarden ligt de mediaan op positie 5, niet op positie 4,5.

Het gemiddelde gebruiken voor even gegevenssets: voor een even aantal waarden moet u altijd het gemiddelde nemen van de twee middelste waarden.


Lees volgende