Rozkład normalny (lub rozkład Gaussa) jest najważniejszym rozkładem prawdopodobieństwa w statystyce. Opisuje rozkład wielu zjawisk naturalnych – wyników testów, wysokości, błędów pomiarów, zysków z akcji – i stanowi podstawę większości wnioskowań statystycznych i testowania hipotez.

Formuła

Funkcja gęstości prawdopodobieństwa dla rozkładu normalnego to:

f(x) = (1 / (σ√(2π))) × e^(-(x-μ)²/(2σ²))

Gdzie:

  • μ (mu) = średnia (środek rozkładu)
  • σ (sigma) = odchylenie standardowe (rozrzut rozkładu)
  • x = wartość, którą oceniasz
  • e ≈ 2,71828
  • π ≈ 3,14159

Kształt ma kształt dzwonu, a około 68% wartości mieści się w granicach 1 odchylenia standardowego od średniej, 95% w granicach 2 odchyleń standardowych, a 99,7% w granicach 3 odchyleń standardowych (reguła 68-95-99,7).

Sprawdzony przykład

Test standaryzowany ma średnią 100 i odchylenie standardowe 15. Jakie jest prawdopodobieństwo, że losowy wynik będzie mniejszy niż 115?

Najpierw przekonwertuj na wynik Z:

z = (115 - 100) / 15 = 1.0

Wynik Z wynoszący 1,0 oznacza, że ​​115 to jedno odchylenie standardowe powyżej średniej. Używając standardowej tabeli normalnych lub kalkulatora, P (z ≤ 1,0) ≈ 0,8413 lub 84,13%.

Zatem około 84% zdających uzyskuje wynik poniżej 115.

Właściwości klucza

Rozkład normalny definiuje się całkowicie poprzez jego średnią i odchylenie standardowe. Przesunięcie średniej przesuwa krzywą w lewo lub w prawo; zwiększenie odchylenia standardowego spłaszcza je i poszerza. Całkowite pole pod krzywą zawsze wynosi 1.

Dowolny rozkład normalny można przekształcić w standardowy rozkład normalny (średnia 0, odchylenie standardowe 1), korzystając z powyższego wzoru z-score. Ta standaryzacja pozwala na użycie jednej uniwersalnej tabeli normalnych.

Kiedy używać

Użyj rozkładu normalnego, gdy:

  • Klastry danych wokół wartości centralnej
  • Wartości są zgodne z histogramem w kształcie dzwonu
  • Obowiązuje Centralne Twierdzenie Graniczne (przykładowe średnie z dowolnego rozkładu są w przybliżeniu normalne)
  • Robisz testowanie hipotez lub przedziałów ufności

Większość rzeczywistych danych ciągłych ma z grubsza rozkład normalny, co sprawia, że ​​są one podstawą statystyk stosowanych.

Porady

Zanim założysz, że dane są normalne, sprawdź normalność za pomocą histogramu lub wykresu Q-Q. Jeśli dane są mocno wypaczone lub występują wartości odstające, rozkład normalny może nie być odpowiedni. W przypadku danych nietypowych użyj testów nieparametrycznych lub transformacji danych.

Skorzystaj z naszego Kalkulatora rozkładu normalnego, aby błyskawicznie znaleźć prawdopodobieństwa, percentyle i wartości Z.