Rozkład normalny (lub rozkład Gaussa) jest najważniejszym rozkładem prawdopodobieństwa w statystyce. Opisuje rozkład wielu zjawisk naturalnych – wyników testów, wysokości, błędów pomiarów, zysków z akcji – i stanowi podstawę większości wnioskowań statystycznych i testowania hipotez.
Formuła
Funkcja gęstości prawdopodobieństwa dla rozkładu normalnego to:
f(x) = (1 / (σ√(2π))) × e^(-(x-μ)²/(2σ²))
Gdzie:
- μ (mu) = średnia (środek rozkładu)
- σ (sigma) = odchylenie standardowe (rozrzut rozkładu)
- x = wartość, którą oceniasz
- e ≈ 2,71828
- π ≈ 3,14159
Kształt ma kształt dzwonu, a około 68% wartości mieści się w granicach 1 odchylenia standardowego od średniej, 95% w granicach 2 odchyleń standardowych, a 99,7% w granicach 3 odchyleń standardowych (reguła 68-95-99,7).
Sprawdzony przykład
Test standaryzowany ma średnią 100 i odchylenie standardowe 15. Jakie jest prawdopodobieństwo, że losowy wynik będzie mniejszy niż 115?
Najpierw przekonwertuj na wynik Z:
z = (115 - 100) / 15 = 1.0
Wynik Z wynoszący 1,0 oznacza, że 115 to jedno odchylenie standardowe powyżej średniej. Używając standardowej tabeli normalnych lub kalkulatora, P (z ≤ 1,0) ≈ 0,8413 lub 84,13%.
Zatem około 84% zdających uzyskuje wynik poniżej 115.
Właściwości klucza
Rozkład normalny definiuje się całkowicie poprzez jego średnią i odchylenie standardowe. Przesunięcie średniej przesuwa krzywą w lewo lub w prawo; zwiększenie odchylenia standardowego spłaszcza je i poszerza. Całkowite pole pod krzywą zawsze wynosi 1.
Dowolny rozkład normalny można przekształcić w standardowy rozkład normalny (średnia 0, odchylenie standardowe 1), korzystając z powyższego wzoru z-score. Ta standaryzacja pozwala na użycie jednej uniwersalnej tabeli normalnych.
Kiedy używać
Użyj rozkładu normalnego, gdy:
- Klastry danych wokół wartości centralnej
- Wartości są zgodne z histogramem w kształcie dzwonu
- Obowiązuje Centralne Twierdzenie Graniczne (przykładowe średnie z dowolnego rozkładu są w przybliżeniu normalne)
- Robisz testowanie hipotez lub przedziałów ufności
Większość rzeczywistych danych ciągłych ma z grubsza rozkład normalny, co sprawia, że są one podstawą statystyk stosowanych.
Porady
Zanim założysz, że dane są normalne, sprawdź normalność za pomocą histogramu lub wykresu Q-Q. Jeśli dane są mocno wypaczone lub występują wartości odstające, rozkład normalny może nie być odpowiedni. W przypadku danych nietypowych użyj testów nieparametrycznych lub transformacji danych.
Skorzystaj z naszego Kalkulatora rozkładu normalnego, aby błyskawicznie znaleźć prawdopodobieństwa, percentyle i wartości Z.