Co je lineární regrese?

Lineární regrese je statistická metoda pro modelování vztahu mezi nezávislou proměnnou (x) a závislou proměnnou (y). Cílem je najít nejlepší přímku procházející datovými body.

Rovnice regresní přímky: y = mx + b

  • m je sklon (změna y na jednotku x)
  • b je průsečík s osou y (y při x = 0)

Výpočetní vzorce

m = (nΣxy − ΣxΣy) / (nΣx² − (Σx)²)

b = (Σy − mΣx) / n

Řešený příklad

x y xy
1 2 2 1
2 4 8 4
3 5 15 9
4 4 16 16
5 5 25 25
Σ=15 Σ=20 Σ=66 Σ=55

m = (5×66 − 15×20) / (5×55 − 225) = 30/50 = 0.6

b = (20 − 0.6×15) / 5 = 11/5 = 2.2

Výsledek: y = 0.6x + 2.2

Interpretace

Sklon (m = 0.6): y roste o 0.6 za každou jednotku x.

Průsečík (b = 2.2): y = 2.2 při x = 0.

R²: měří kvalitu shody modelu s daty (0 až 1).

Použití

  • Předpovídání prodejů dle reklamy
  • Odhad cen nemovitostí
  • Analýza studijních výsledků
  • Demografické prognózy