A medián egy rendezett adatkészlet középső értéke. Ez a központi tendencia három fő mérőszámának egyike – az átlag és a módus mellett –, és különösen akkor hasznos, ha az adatok kiugró értékeket vagy ferde értékeket tartalmaznak.
Mi a medián?
A medián pontosan a felére oszt egy adathalmazt: az értékek 50%-a alá, 50%-a fölé. Az átlagtól eltérően a mediánt nem befolyásolják a szélsőséges értékek.
Példa: Az 50 000 dolláros medián fizetés többet mond el egy tipikus dolgozóról, mint egy 90 000 dolláros átlagfizetés, amelyet néhány milliókat kereső vezető húzott fel.
Hogyan találjuk meg a mediánt: Páratlan számú értékek
1. lépés: Rendezze az összes értéket növekvő sorrendbe (a legkisebbtől a legnagyobbig).
2. lépés: Keresse meg a középső értéket – azt, amelyik mindkét oldalon azonos számú értékkel rendelkezik.
Példa: Adatkészlet: 7, 3, 5, 1, 9
- Rendezés: 1, 3, 5, 7, 9
- A középső érték 5 (2 érték alatta, 2 érték felett)
A medián 5.
Hogyan találjuk meg a mediánt: az értékek páros száma
Ha páros számú érték van, akkor nincs egyetlen középső érték – kettő van. A medián e két középérték átlaga.
1. lépés: Rendezze az összes értéket növekvő sorrendbe.
2. lépés: Határozza meg a két középső értéket.
3. lépés: Adja össze őket, és ossza el 2-vel.
Példa: Adatkészlet: 4, 8, 6, 2, 10, 3
- Rendezés: 2, 3, 4, 6, 8, 10
- A két középső érték a 4 és a 6
- Medián = (4 + 6) / 2 = 5
A medián 5.
A középső pozíció megtalálása
Bármely n értékből álló adatkészletnél a középső pozíció:
- Páratlan n: Pozíció = (n + 1) / 2
- Páros n: Átlagos pozíciók n/2 és (n/2) + 1
| n értékeket | Középső pozíció |
|---|---|
| 5 | 3. pozíció |
| 7 | 4. pozíció |
| 10 | Az 5. és 6. pozíció átlaga |
| 12 | A 6. és 7. pozíció átlaga |
Működött példa: Nagyobb adatkészlet
Adatkészlet: 14, 23, 8, 31, 17, 5, 29, 11, 20, 18, 25, 9
1. lépés: Szám: 12 érték (páros)
2. lépés: Rendezés: 5, 8, 9, 11, 14, 17, 18, 20, 23, 25, 29, 31
3. lépés: A középső pozíciók a 6. és 7. értékek = 17 és 18
4. lépés: Medián = (17 + 18) / 2 = 17,5
Medián vs átlag: melyiket használja?
| Helyzet | Jobb mérték |
|---|---|
| Az adatoknak vannak kiugró értékei | Középső |
| Az adatok torzak (pl. jövedelem) | Középső |
| Szimmetrikus eloszlás | Bármelyik (az átlag pontosabb) |
| Kategorikus vagy sorszámú adatok | Középső |
| A további számításokhoz kell használni | Átlagos |
Ökölszabály: Ha az átlag és a medián nagyon különbözik, az adatok torzak. Jelentse a mediánt reprezentatívabb értékként.
Csoportosított adatok mediánja
Ha az adatok gyakorisági táblázatokban vagy csoportosított intervallumokban jelennek meg, interpoláció segítségével megbecsülheti a mediánt.
Példa:
| Pontszám | Frekvencia | kumulatív gyakoriság |
|---|---|---|
| 0–20 | 3 | 3 |
| 21–40 | 7 | 10 |
| 41–60 | 12 | 22 |
| 61–80 | 8 | 30 |
| 81–100 | 5 | 35 |
Összesen: 35 érték. A medián a 18. érték (pozíció = (35+1)/2 = 18).
A 18. érték a 41-60 közötti csoportba esik (a kumulatív gyakoriság ebben a csoportban eléri a 22-t, előtte 10 volt).
Median ≈ L + [(n/2 − F) / f] × h
Ahol:
- L = a medián osztály alsó határa = 41
- n = teljes frekvencia = 35
- F = kumulatív gyakoriság a medián osztály előtt = 10
- f = a medián osztály gyakorisága = 12
- h = osztályszélesség = 20
Median ≈ 41 + [(17.5 − 10) / 12] × 20
≈ 41 + [7.5 / 12] × 20
≈ 41 + 12.5
≈ 53.5
Súlyozott medián
Ha az adatpontok eltérő súllyal vagy fontossággal rendelkeznek, használja a súlyozott mediánt – azt az értéket, amelynél a kumulatív súly eléri az 50%-ot.
Valós példák
Lakárak: A városi lakásárak mediánja jobban reprezentál egy "tipikus" házat, mint az átlag, amelyet néhány luxusingatlan torzíthat.
Tesztpontszámok: Ha a legtöbb diák 60–70 pontot ér el, de néhányan 100 pontot érnek el, a medián pontszám informatívabb, mint az átlag.
Válaszidők: A webes teljesítményben a medián válaszidő azt mutatja meg, hogy egy tipikus felhasználó mit tapasztal, míg az átlagot az időnkénti lassú kérések eldobhatják.
Gyakori hibák
Először ne rendezze — A középső érték megtalálása előtt rendeznie kell az adatokat.
Egyre a pozícióban — 9 érték esetén a medián az 5. pozícióban van, nem a 4.5.
A páros adatkészletek átlagának használata — Páros számú érték esetén mindig átlagolja a két középső értéket.
Olvassa el a következőt
- Az átlag kiszámítása
- [Hogyan számítható ki a variancia] (/en/blog/how-to-calculate-variance)
- Statisztikák kezdőknek