De normale verdeling (of Gaussiaanse verdeling) is de belangrijkste kansverdeling in de statistiek. Het beschrijft hoeveel natuurlijke fenomenen er zijn – testscores, hoogten, meetfouten, aandelenrendementen – en vormt de basis van de meeste statistische gevolgtrekkingen en het testen van hypothesen.
De formule
De kansdichtheidsfunctie voor een normale verdeling is:
f(x) = (1 / (σ√(2π))) × e^(-(x-μ)²/(2σ²))
Waar:
- μ (mu) = gemiddelde (centrum van de verdeling)
- σ (sigma) = standaarddeviatie (spreiding van de verdeling)
- x = de waarde die u evalueert
- e ≈ 2,71828
- π ≈ 3,14159
De vorm is klokvormig en ongeveer 68% van de waarden valt binnen 1 standaarddeviatie van het gemiddelde, 95% binnen 2 standaarddeviaties en 99,7% binnen 3 standaarddeviaties (de 68-95-99,7-regel).
Uitgewerkt voorbeeld
Een gestandaardiseerde test heeft een gemiddelde van 100 en een standaarddeviatie van 15. Wat is de kans dat een willekeurige score kleiner is dan 115?
Converteer eerst naar een z-score:
z = (115 - 100) / 15 = 1.0
Een z-score van 1,0 betekent dat 115 één standaardafwijking boven het gemiddelde ligt. Met behulp van een standaard normale tabel of rekenmachine, P(z ≤ 1,0) ≈ 0,8413 of 84,13%.
Ongeveer 84% van de testpersonen scoort dus onder de 115.
Belangrijkste eigenschappen
De normale verdeling wordt volledig bepaald door het gemiddelde en de standaarddeviatie. Door het gemiddelde te verschuiven, wordt de curve naar links of rechts verplaatst; het vergroten van de standaarddeviatie maakt deze vlakker en breder. De totale oppervlakte onder de curve is altijd gelijk aan 1.
Elke normale verdeling kan worden omgezet naar de standaardnormale verdeling (gemiddelde 0, standaardafwijking 1) met behulp van de bovenstaande z-score-formule. Door deze standaardisatie kunt u één universele normaaltabel gebruiken.
Wanneer te gebruiken
Gebruik de normale verdeling als:
- Dataclusters rond een centrale waarde
- Waarden volgen een klokvormig histogram
- De centrale limietstelling is van toepassing (steekproefgemiddelden uit elke verdeling benaderen normaal)
- Je doet hypothesetests of betrouwbaarheidsintervallen
De meeste continue gegevens uit de echte wereld volgen grofweg een normale verdeling, waardoor dit het werkpaard is van toegepaste statistiek.
Tips
Controleer op normaliteit met behulp van een histogram of Q-Q-plot voordat u ervan uitgaat dat de gegevens normaal zijn. Als de gegevens sterk scheef zijn of uitschieters vertonen, is de normale verdeling mogelijk niet geschikt. Gebruik voor niet-normale gegevens niet-parametrische tests of gegevenstransformatie.
Gebruik onze Normale verdelingscalculator om direct kansen, percentielen en z-scores te vinden.