Стандартното отклонение е най-широко използваната мярка за разпространение в статистиката. Той ви казва колко далеч се намира една типична стойност от средната – независимо дали вашите данни са плътно групирани или широко разпръснати. След като веднъж сте работили с изчислението на ръка, концепцията става интуитивна.
Какво ви казва стандартното отклонение
Ако даден клас студенти има среден резултат от изпита 70 със стандартно отклонение 5, повечето резултати попадат между 65 и 75. Ако стандартното отклонение беше 20, резултатите биха варирали много по-широко - от 50 до 90 и повече.
Малко стандартно отклонение означава последователност. Голям означава променливост.
Популация спрямо стандартно отклонение на извадката
Има две версии и изборът на правилната е от значение:
Стандартно отклонение на населението (σ): Използвайте, когато имате данни за всеки член на групата, която ви интересува. Дели се на n.
Стандартно отклонение на извадката: Използвайте, когато вашите данни са извадка, извлечена от по-голяма популация. Дели се на n − 1 (корекцията на Бесел, която отчита несигурността, въведена от вземането на проби).
На практика почти винаги използвате извадково стандартно отклонение — освен ако не анализирате пълно преброяване или контролиран набор от данни без липсващи членове.
Изчисление стъпка по стъпка
Набор от данни: 4, 7, 13, 2, 1 (извадка от 5 стойности)
Стъпка 1: Изчислете средната стойност
Mean (x̄) = (4 + 7 + 13 + 2 + 1) / 5 = 27 / 5 = 5.4
Стъпка 2: Намерете всяко отклонение от средната стойност
Извадете средната стойност от всяка стойност:
| Стойност (x) | Отклонение (x − x̄) |
|---|---|
| 4 | 4 − 5,4 = −1,4 |
| 7 | 7 − 5,4 = +1,6 |
| 13 | 13 − 5,4 = +7,6 |
| 2 | 2 − 5,4 = −3,4 |
| 1 | 1 − 5,4 = −4,4 |
Стъпка 3: Квадратирайте всяко отклонение
Квадратурата елиминира отрицателните знаци и подчертава по-големите отклонения:
| Отклонение | Квадратно отклонение |
|---|---|
| −1,4 | 1.96 |
| +1.6 | 2.56 |
| +7.6 | 57.76 |
| −3,4 | 11.56 |
| −4,4 | 19.36 |
Стъпка 4: Сумирайте отклоненията на квадрат
Sum = 1.96 + 2.56 + 57.76 + 11.56 + 19.36 = 93.2
Стъпка 5: Разделете на n − 1 (за примерно стандартно отклонение)
Variance (s²) = 93.2 / (5 − 1) = 93.2 / 4 = 23.3
Стъпка 6: Извадете корен квадратен
Standard deviation (s) = √23.3 = 4.83
Тълкуване: Стойностите в този набор от данни обикновено се намират на около 4,83 единици от средната стойност от 5,4.
Написаната формула
Примерно стандартно отклонение:
s = √[ Σ(x − x̄)² / (n − 1) ]
Стандартно отклонение на популацията:
σ = √[ Σ(x − μ)² / n ]
Където μ (mu) е средната популация.
Емпиричното правило (правило 68-95-99.7)
За данни, които следват нормално разпределение, стандартното отклонение има надеждна връзка с дела на данните във всеки диапазон:
| Обхват | Пропорция на данните |
|---|---|
| Средно ± 1 SD | ~68% |
| Средно ± 2 SD | ~95% |
| Средно ± 3 SD | ~99,7% |
Приложен пример: IQ резултатите имат средна стойност 100 и SD 15.
- 68% от хората имат точки между 85 и 115
- 95% резултат между 70 и 130
- 99,7% резултат между 55 и 145
Това правило се прилага само за нормално разпределени данни. За изкривени или тежки разпределения използвайте вместо това неравенството на Чебишев.
Дисперсия срещу стандартно отклонение
Дисперсията е квадратното отклонение (стъпка 5 по-горе) — стандартното отклонение е квадратният му корен. И двете измерват разпространението, но стандартното отклонение се изразява в същите единици като оригиналните данни, което го прави по-лесно интерпретируем.
Ако вашите данни са в килограми, вашето стандартно отклонение е в килограми. Вашата дисперсия е в килограми на квадрат, което е по-трудно да се интерпретира смислено.
Общи приложения
Финанси: Измерване на променливостта на инвестициите. Акция с дневна възвръщаемост, която има висок SD, е по-волатилна — по-висока потенциална печалба и по-висока потенциална загуба.
Контрол на качеството: Производството използва SD, за да гарантира, че продуктите остават в допустимите граници. Процес с твърде голям SD произвежда твърде много дефектни елементи.
Образование: Стандартизиране на резултатите от тестовете. Z-резултатът ви казва колко стандартни отклонения резултатът е над или под средната стойност: z = (x − средно) / SD.
Наука: Изразяване на несигурността на измерването и сравняване на експериментални резултати.
Пряк път за изчисление
За големи набори от данни използвайте изчислителната формула, която избягва индивидуалното изчисляване на отклоненията:
s² = [Σx² − (Σx)²/n] / (n − 1)
Това е математически еквивалентно, но изисква само две преминавания през данните, а не три.
Използвайте нашия Калкулатор за стандартно отклонение, за да изчислите SD, дисперсия и пълна разбивка за всеки набор от данни, който въвеждате.