Cos'è la regressione lineare?

La regressione lineare è un metodo statistico per modellare la relazione tra una variabile indipendente (x) e una variabile dipendente (y).

Equazione: y = mx + b

  • m = pendenza (variazione di y per unità di x)
  • b = intercetta sull'asse y (y quando x = 0)

Formule di calcolo

m = (nΣxy − ΣxΣy) / (nΣx² − (Σx)²)

b = (Σy − mΣx) / n

Esempio risolto

x y xy
1 2 2 1
2 4 8 4
3 5 15 9
4 4 16 16
5 5 25 25
Σ=15 Σ=20 Σ=66 Σ=55

m = (5×66 − 15×20) / (5×55 − 225) = 30/50 = 0.6

b = (20 − 0.6×15) / 5 = 11/5 = 2.2

Risultato: y = 0.6x + 2.2

Interpretazione

Pendenza (m = 0.6): y aumenta di 0.6 per ogni unità di x.

Intercetta (b = 2.2): y = 2.2 quando x = 0.

R²: misura la qualità dell'adattamento (0 a 1).

Applicazioni

  • Previsione vendite
  • Stima prezzi immobili
  • Analisi rendimento scolastico
  • Proiezioni demografiche