La médiane est la valeur médiane dans un ensemble de données triées. Il s'agit de l'une des trois principales mesures de tendance centrale (avec la moyenne et le mode) et elle est particulièrement utile lorsque vos données contiennent des valeurs aberrantes ou asymétriques.
Quelle est la médiane ?
La médiane divise un ensemble de données exactement en deux : 50 % des valeurs se situent en dessous et 50 % au-dessus. Contrairement à la moyenne, la médiane n’est pas affectée par les valeurs extrêmes.
Exemple : Le salaire médian de 50 000 $ vous en dit plus sur un travailleur type qu'un salaire moyen de 90 000 $ obtenu par une poignée de cadres gagnant des millions.
Comment trouver la médiane : nombre impair de valeurs
Étape 1 : Triez toutes les valeurs par ordre croissant (de la plus petite à la plus grande).
Étape 2 : Trouvez la valeur du milieu : celle avec un nombre égal de valeurs de chaque côté.
Exemple : Ensemble de données : 7, 3, 5, 1, 9
- Trier : 1, 3, 5, 7, 9
- La valeur médiane est 5 (2 valeurs en dessous, 2 valeurs au-dessus)
La médiane est de 5.
Comment trouver la médiane : nombre pair de valeurs
Lorsqu’il y a un nombre pair de valeurs, il n’y a pas de valeur intermédiaire unique : vous en avez deux. La médiane est la moyenne de ces deux valeurs moyennes.
Étape 1 : Triez toutes les valeurs par ordre croissant.
Étape 2 : Identifiez les deux valeurs médianes.
Étape 3 : Additionnez-les et divisez par 2.
Exemple : Ensemble de données : 4, 8, 6, 2, 10, 3
- Trier : 2, 3, 4, 6, 8, 10
- Les deux valeurs médianes sont 4 et 6
- Médiane = (4 + 6) / 2 = 5
La médiane est de 5.
Trouver la position médiane
Pour tout ensemble de données de n valeurs, la position médiane est :
- N impair : Position = (n + 1) / 2
- Pair n : Positions moyennes n/2 et (n/2) + 1
| n valeurs | Position médiane |
|---|---|
| 5 | Poste 3 |
| 7 | Poste 4 |
| 10 | Moyenne des positions 5 et 6 |
| 12 | Moyenne des positions 6 et 7 |
Exemple concret : ensemble de données plus grand
Ensemble de données : 14, 23, 8, 31, 17, 5, 29, 11, 20, 18, 25, 9
Étape 1 : Nombre : 12 valeurs (paires)
Étape 2 : Trier : 5, 8, 9, 11, 14, 17, 18, 20, 23, 25, 29, 31
Étape 3 : Les positions médianes sont les 6e et 7e valeurs = 17 et 18
Étape 4 : Médiane = (17 + 18) / 2 = 17,5
Médiane vs moyenne : laquelle devriez-vous utiliser ?
| Situation | Mieux mesurer |
|---|---|
| Les données comportent des valeurs aberrantes | Médian |
| Les données sont faussées (par exemple, les revenus) | Médian |
| Distribution symétrique | Soit (la moyenne est plus précise) |
| Données catégorielles ou ordinales | Médian |
| Besoin d'utiliser dans d'autres calculs | Signifier |
Règle générale : Si votre moyenne et votre médiane sont très différentes, vos données sont faussées. Indiquez la médiane comme valeur la plus représentative.
Médiane des données groupées
Lorsque les données sont présentées sous forme de tableaux de fréquences ou d'intervalles groupés, vous pouvez estimer la médiane à l'aide de l'interpolation.
Exemple:
| Score | Fréquence | Fréquence cumulée |
|---|---|---|
| 0 à 20 | 3 | 3 |
| 21-40 | 7 | 10 |
| 41-60 | 12 | 22 |
| 61-80 | 8 | 30 |
| 81-100 | 5 | 35 |
Total : 35 valeurs. La médiane est la 18ème valeur (position = (35+1)/2 = 18).
La 18e valeur se situe dans le groupe 41-60 (la fréquence cumulée atteint 22 dans ce groupe, après avoir été 10 avant).
Median ≈ L + [(n/2 − F) / f] × h
Où:
- L = limite inférieure de la classe médiane = 41
- n = fréquence totale = 35
- F = fréquence cumulée avant classe médiane = 10
- f = fréquence de classe médiane = 12
- h = largeur de classe = 20
Median ≈ 41 + [(17.5 − 10) / 12] × 20
≈ 41 + [7.5 / 12] × 20
≈ 41 + 12.5
≈ 53.5
Médiane pondérée
Lorsque les points de données ont des poids ou une importance différents, utilisez la médiane pondérée – la valeur à laquelle le poids cumulé atteint 50 %.
Exemples concrets
Prix des maisons : Le prix médian des maisons dans une ville représente mieux une maison « typique » que la moyenne, qui peut être faussée par quelques propriétés de luxe.
Résultats des tests : Si la plupart des élèves obtiennent un score de 60 à 70 mais que quelques-uns obtiennent un score de 100, le score médian est plus informatif que la moyenne.
Temps de réponse : Dans les performances Web, le temps de réponse médian indique ce qu'un utilisateur typique expérimente, alors que la moyenne peut être perturbée par des requêtes lentes occasionnelles.
Erreurs courantes
Ne pas trier en premier — Vous devez trier les données avant de trouver la valeur médiane.
Off-by-one sur la position — Pour 9 valeurs, la médiane est à la position 5, et non à la position 4,5.
Utilisation de la moyenne pour des ensembles de données pairs — Pour un nombre pair de valeurs, faites toujours la moyenne des deux valeurs médianes.