Wat is lineaire regressie?

Lineaire regressie is een statistische methode voor het modelleren van de relatie tussen een onafhankelijke variabele (x) en een afhankelijke variabele (y).

Vergelijking: y = mx + b

  • m = helling (verandering in y per eenheid x)
  • b = y-snijpunt (y wanneer x = 0)

Formules

m = (nΣxy − ΣxΣy) / (nΣx² − (Σx)²)

b = (Σy − mΣx) / n

Opgelost voorbeeld

x y xy
1 2 2 1
2 4 8 4
3 5 15 9
4 4 16 16
5 5 25 25
Σ=15 Σ=20 Σ=66 Σ=55

m = (5×66 − 15×20) / (5×55 − 225) = 30/50 = 0.6

b = (20 − 0.6×15) / 5 = 11/5 = 2.2

Resultaat: y = 0.6x + 2.2

Interpretatie

Helling (m = 0.6): y neemt toe met 0.6 voor elke eenheid toename in x.

Y-snijpunt (b = 2.2): y = 2.2 wanneer x = 0.

R²: meet de kwaliteit van de aanpassing (0 tot 1).

Toepassingen

  • Verkoopprognoses op basis van reclame
  • Schatting van huizenprijzen
  • Analyse van studieresultaten
  • Bevolkingsgroeiprognoses