השכיח הוא הערך שמופיע בתדירות הגבוהה ביותר בקבוצת נתונים. בניגוד לממוצע ולחציון, קבוצת נתונים יכולה להכיל יותר משכיח אחד או אף שכיח כלל.
כיצד למצוא את השכיח: תהליך בן 3 שלבים
- סדר את הנתונים: סדר את הערכים מהקטן לגדול כדי להקל על הספירה.
- ספור את התדרים: קבע כמה פעמים מופיע כל ערך.
- זהה את השכיח ביותר: הערך (או הערכים) עם התדר הגבוה ביותר הוא השכיח.
דוגמאות פתורות
דוגמה 1: שכיח אחד (חד-שכיח)
קבוצת נתונים: {2, 4, 4, 6, 7, 4, 9}
לאחר מיון: 2, 4, 4, 4, 6, 7, 9
תדר כל ערך:
- 2 → פעם אחת
- 4 → 3 פעמים
- 6 → פעם אחת
- 7 → פעם אחת
- 9 → פעם אחת
שכיח = 4 (מופיע בתדירות הגבוהה ביותר)
דוגמה 2: שני שכיחים (דו-שכיח)
קבוצת נתונים: {1, 2, 2, 3, 5, 5, 7}
תדר כל ערך:
- 1 → פעם אחת
- 2 → פעמיים
- 3 → פעם אחת
- 5 → פעמיים
- 7 → פעם אחת
שכיחים = 2 ו-5 (שניהם מופיעים פעמיים)
דוגמה 3: ללא שכיח
קבוצת נתונים: {1, 2, 3, 4, 5}
כל ערך מופיע רק פעם אחת, לכן אין שכיח.
מתי להשתמש בשכיח
| מצב | מדד מתאים |
|---|---|
| שכר ממוצע בחברה | חציון |
| מספר נעל הנמכר ביותר | שכיח |
| מרכז ציוני מבחן | ממוצע או חציון |
| סוג הפגם הנפוץ ביותר במפעל | שכיח |
שכיח בנתונים מקובצים
בעבודה עם נתונים המקובצים בכיתות, ניתן לאמוד את השכיח באמצעות הנוסחה הבאה:
שכיח = L + [(f₁ − f₀) / (2f₁ − f₀ − f₂)] × h
כאשר:
- L = גבול תחתון של המחלקה השכיחה
- f₁ = תדר המחלקה השכיחה
- f₀ = תדר המחלקה שלפני המחלקה השכיחה
- f₂ = תדר המחלקה שאחרי המחלקה השכיחה
- h = רוחב המחלקה
נוסחה זו נמצאת בשימוש נרחב בסטטיסטיקה בעת ניתוח נתונים המאורגנים בטבלאות תדרים.