A medián egy rendezett adatkészlet középső értéke. Ez a központi tendencia három fő mérőszámának egyike – az átlag és a módus mellett –, és különösen akkor hasznos, ha az adatok kiugró értékeket vagy ferde értékeket tartalmaznak.

Mi a medián?

A medián pontosan a felére oszt egy adathalmazt: az értékek 50%-a alá, 50%-a fölé. Az átlagtól eltérően a mediánt nem befolyásolják a szélsőséges értékek.

Példa: Az 50 000 dolláros medián fizetés többet mond el egy tipikus dolgozóról, mint egy 90 000 dolláros átlagfizetés, amelyet néhány milliókat kereső vezető húzott fel.

Hogyan találjuk meg a mediánt: Páratlan számú értékek

1. lépés: Rendezze az összes értéket növekvő sorrendbe (a legkisebbtől a legnagyobbig).

2. lépés: Keresse meg a középső értéket – azt, amelyik mindkét oldalon azonos számú értékkel rendelkezik.

Példa: Adatkészlet: 7, 3, 5, 1, 9

  1. Rendezés: 1, 3, 5, 7, 9
  2. A középső érték 5 (2 érték alatta, 2 érték felett)

A medián 5.

Hogyan találjuk meg a mediánt: az értékek páros száma

Ha páros számú érték van, akkor nincs egyetlen középső érték – kettő van. A medián e két középérték átlaga.

1. lépés: Rendezze az összes értéket növekvő sorrendbe.

2. lépés: Határozza meg a két középső értéket.

3. lépés: Adja össze őket, és ossza el 2-vel.

Példa: Adatkészlet: 4, 8, 6, 2, 10, 3

  1. Rendezés: 2, 3, 4, 6, 8, 10
  2. A két középső érték a 4 és a 6
  3. Medián = (4 + 6) / 2 = 5

A medián 5.

A középső pozíció megtalálása

Bármely n értékből álló adatkészletnél a középső pozíció:

  • Páratlan n: Pozíció = (n + 1) / 2
  • Páros n: Átlagos pozíciók n/2 és (n/2) + 1
n értékeket Középső pozíció
5 3. pozíció
7 4. pozíció
10 Az 5. és 6. pozíció átlaga
12 A 6. és 7. pozíció átlaga

Működött példa: Nagyobb adatkészlet

Adatkészlet: 14, 23, 8, 31, 17, 5, 29, 11, 20, 18, 25, 9

1. lépés: Szám: 12 érték (páros)

2. lépés: Rendezés: 5, 8, 9, 11, 14, 17, 18, 20, 23, 25, 29, 31

3. lépés: A középső pozíciók a 6. és 7. értékek = 17 és 18

4. lépés: Medián = (17 + 18) / 2 = 17,5

Medián vs átlag: melyiket használja?

Helyzet Jobb mérték
Az adatoknak vannak kiugró értékei Középső
Az adatok torzak (pl. jövedelem) Középső
Szimmetrikus eloszlás Bármelyik (az átlag pontosabb)
Kategorikus vagy sorszámú adatok Középső
A további számításokhoz kell használni Átlagos

Ökölszabály: Ha az átlag és a medián nagyon különbözik, az adatok torzak. Jelentse a mediánt reprezentatívabb értékként.

Csoportosított adatok mediánja

Ha az adatok gyakorisági táblázatokban vagy csoportosított intervallumokban jelennek meg, interpoláció segítségével megbecsülheti a mediánt.

Példa:

Pontszám Frekvencia kumulatív gyakoriság
0–20 3 3
21–40 7 10
41–60 12 22
61–80 8 30
81–100 5 35

Összesen: 35 érték. A medián a 18. érték (pozíció = (35+1)/2 = 18).

A 18. érték a 41-60 közötti csoportba esik (a kumulatív gyakoriság ebben a csoportban eléri a 22-t, előtte 10 volt).

Median ≈ L + [(n/2 − F) / f] × h

Ahol:

  • L = a medián osztály alsó határa = 41
  • n = teljes frekvencia = 35
  • F = kumulatív gyakoriság a medián osztály előtt = 10
  • f = a medián osztály gyakorisága = 12
  • h = osztályszélesség = 20
Median ≈ 41 + [(17.5 − 10) / 12] × 20
        ≈ 41 + [7.5 / 12] × 20
        ≈ 41 + 12.5
        ≈ 53.5

Súlyozott medián

Ha az adatpontok eltérő súllyal vagy fontossággal rendelkeznek, használja a súlyozott mediánt – azt az értéket, amelynél a kumulatív súly eléri az 50%-ot.

Valós példák

Lakárak: A városi lakásárak mediánja jobban reprezentál egy "tipikus" házat, mint az átlag, amelyet néhány luxusingatlan torzíthat.

Tesztpontszámok: Ha a legtöbb diák 60–70 pontot ér el, de néhányan 100 pontot érnek el, a medián pontszám informatívabb, mint az átlag.

Válaszidők: A webes teljesítményben a medián válaszidő azt mutatja meg, hogy egy tipikus felhasználó mit tapasztal, míg az átlagot az időnkénti lassú kérések eldobhatják.

Gyakori hibák

Először ne rendezze — A középső érték megtalálása előtt rendeznie kell az adatokat.

Egyre a pozícióban — 9 érték esetén a medián az 5. pozícióban van, nem a 4.5.

A páros adatkészletek átlagának használata — Páros számú érték esetén mindig átlagolja a két középső értéket.


Olvassa el a következőt