מהי רגרסיה לינארית?
רגרסיה לינארית היא שיטה סטטיסטית לדוגמנות הקשר בין משתנה בלתי תלוי (x) למשתנה תלוי (y). המטרה היא למצוא את הקו הישר הטוב ביותר העובר דרך נקודות הנתונים.
משוואת קו הרגרסיה: y = mx + b
- m = שיפוע (שינוי y לכל יחידת x)
- b = נקודת חיתוך עם ציר y (ערך y כאשר x = 0)
נוסחאות
m = (nΣxy − ΣxΣy) / (nΣx² − (Σx)²)
b = (Σy − mΣx) / n
דוגמה פתורה
| x | y | xy | x² |
|---|---|---|---|
| 1 | 2 | 2 | 1 |
| 2 | 4 | 8 | 4 |
| 3 | 5 | 15 | 9 |
| 4 | 4 | 16 | 16 |
| 5 | 5 | 25 | 25 |
| Σ=15 | Σ=20 | Σ=66 | Σ=55 |
m = (5×66 − 15×20) / (5×55 − 225) = 30/50 = 0.6
b = (20 − 0.6×15) / 5 = 11/5 = 2.2
תוצאה: y = 0.6x + 2.2
פרשנות
שיפוע (m = 0.6): y עולה ב-0.6 לכל יחידת עלייה ב-x.
נקודת חיתוך (b = 2.2): y = 2.2 כאשר x = 0.
R²: מודד את איכות ההתאמה (0 עד 1).
יישומים
- חיזוי מכירות
- הערכת מחירי נדל"ן
- ניתוח ציונים
- תחזיות אוכלוסין