Normaalijakauma (tai Gaussin jakauma) on tilastojen tärkein todennäköisyysjakauma. Se kuvaa, kuinka monta luonnonilmiötä jakautuu - testitulokset, korkeudet, mittausvirheet, varaston tuotto - ja on useimpien tilastollisten päätelmien ja hypoteesien testauksen perusta.

Kaava

Normaalijakauman todennäköisyystiheysfunktio on:

f(x) = (1 / (σ√(2π))) × e^(-(x-μ)²/(2σ²))

Jossa:

  • μ (mu) = keskiarvo (jakauman keskipiste)
  • σ (sigma) = keskihajonta (jakauman hajonta)
  • x = arvo, jota olet arvioimassa
  • e ≈ 2,71828
  • π ≈ 3,14159

Muoto on kellokaareva, ja noin 68 % arvoista osuu 1 keskihajonnan sisälle, 95 % 2 standardipoikkeamaan ja 99,7 % 3 standardipoikkeamaan (sääntö 68-95-99,7).

Toiminut esimerkki

Standardoidun testin keskiarvo on 100 ja keskihajonta 15. Mikä on todennäköisyys, että satunnainen pistemäärä on pienempi kuin 115?

Muunna ensin z-pisteiksi:

z = (115 - 100) / 15 = 1.0

Z-pistemäärä 1,0 tarkoittaa, että 115 on yksi standardipoikkeama keskiarvon yläpuolella. Normaalia normaalitaulukkoa tai laskinta käyttäen P(z ≤ 1,0) ≈ 0,8413 tai 84,13 %.

Joten noin 84 % testin ottajista saa alle 115:n.

Tärkeimmät ominaisuudet

Normaalijakauma määritellään kokonaan sen keskiarvon ja keskihajonnan perusteella. Keskiarvon siirtäminen siirtää käyrää vasemmalle tai oikealle; keskihajonnan lisääminen tasoittaa ja leventää sitä. Käyrän alla oleva kokonaispinta-ala on aina yhtä suuri kuin 1.

Mikä tahansa normaalijakauma voidaan muuntaa normaaliksi normaalijakaumaksi (keskiarvo 0, keskihajonta 1) käyttämällä yllä olevaa z-pisteiden kaavaa. Tämän standardoinnin avulla voit käyttää yhtä yleistä normaalipöytää.

Milloin käyttää

Käytä normaalijakaumaa, kun:

  • Tietoklusterit keskeisen arvon ympärille
  • Arvot noudattavat kellon muotoista histogrammia
  • Keskirajalause on voimassa (näytteen keskiarvo mistä tahansa jakaumasta likimääräinen normaali)
  • Olet tekemässä hypoteesitestausta tai luottamusväliä

Suurin osa reaalimaailman jatkuvasta datasta noudattaa karkeasti normaalijakaumaa, mikä tekee siitä sovellettavien tilastojen työhevonen.

Vinkkejä

Tarkista normaalisuus histogrammin tai Q-Q-kuvaajan avulla, ennen kuin oletat tietojen olevan normaaleja. Jos tiedot ovat voimakkaasti vääristyneitä tai niissä on poikkeavuuksia, normaalijakauma ei ehkä ole sopiva. Käytä ei-normaalia dataa varten ei-parametrisia testejä tai tietojen muuntamista.

Käytä [Normal Distribution Calculator] (/en/math/calculus/normal-distribution-calc) löytääksesi todennäköisyydet, prosenttipisteet ja z-pisteet välittömästi.