Как да изчислим стандартното отклонение — стъпка по стъпка

Стандартното отклонение е най-широко използваната мярка за разпространение в статистиката. Той ви казва колко далеч се намира една типична стойност от средната – независимо дали вашите данни са плътно групирани или широко разпръснати. След като веднъж сте работили с изчислението на ръка, концепцията става интуитивна.

Какво ви казва стандартното отклонение

Ако даден клас студенти има среден резултат от изпита 70 със стандартно отклонение 5, повечето резултати попадат между 65 и 75. Ако стандартното отклонение беше 20, резултатите биха варирали много по-широко - от 50 до 90 и повече.

Малко стандартно отклонение означава последователност. Голям означава променливост.

Популация спрямо стандартно отклонение на извадката

Има две версии и изборът на правилната е от значение:

Стандартно отклонение на населението (σ): Използвайте, когато имате данни за всеки член на групата, която ви интересува. Дели се на n.

Стандартно отклонение на извадката: Използвайте, когато вашите данни са извадка, извлечена от по-голяма популация. Дели се на n − 1 (корекцията на Бесел, която отчита несигурността, въведена от вземането на проби).

На практика почти винаги използвате извадково стандартно отклонение — освен ако не анализирате пълно преброяване или контролиран набор от данни без липсващи членове.

Изчисление стъпка по стъпка

Набор от данни: 4, 7, 13, 2, 1 (извадка от 5 стойности)

Стъпка 1: Изчислете средната стойност

Mean (x̄) = (4 + 7 + 13 + 2 + 1) / 5 = 27 / 5 = 5.4

Стъпка 2: Намерете всяко отклонение от средната стойност

Извадете средната стойност от всяка стойност:

Стойност (x)	Отклонение (x − x̄)
4	4 − 5,4 = −1,4
7	7 − 5,4 = +1,6
13	13 − 5,4 = +7,6
2	2 − 5,4 = −3,4
1	1 − 5,4 = −4,4

Стъпка 3: Квадратирайте всяко отклонение

Квадратурата елиминира отрицателните знаци и подчертава по-големите отклонения:

Отклонение	Квадратно отклонение
−1,4	1.96
+1.6	2.56
+7.6	57.76
−3,4	11.56
−4,4	19.36

Стъпка 4: Сумирайте отклоненията на квадрат

Sum = 1.96 + 2.56 + 57.76 + 11.56 + 19.36 = 93.2

Стъпка 5: Разделете на n − 1 (за примерно стандартно отклонение)

Variance (s²) = 93.2 / (5 − 1) = 93.2 / 4 = 23.3

Стъпка 6: Извадете корен квадратен

Standard deviation (s) = √23.3 = 4.83

Тълкуване: Стойностите в този набор от данни обикновено се намират на около 4,83 единици от средната стойност от 5,4.

Написаната формула

Примерно стандартно отклонение:

s = √[ Σ(x − x̄)² / (n − 1) ]

Стандартно отклонение на популацията:

σ = √[ Σ(x − μ)² / n ]

Където μ (mu) е средната популация.

Емпиричното правило (правило 68-95-99.7)

За данни, които следват нормално разпределение, стандартното отклонение има надеждна връзка с дела на данните във всеки диапазон:

Обхват	Пропорция на данните
Средно ± 1 SD	~68%
Средно ± 2 SD	~95%
Средно ± 3 SD	~99,7%

Приложен пример: IQ резултатите имат средна стойност 100 и SD 15.

68% от хората имат точки между 85 и 115
95% резултат между 70 и 130
99,7% резултат между 55 и 145

Това правило се прилага само за нормално разпределени данни. За изкривени или тежки разпределения използвайте вместо това неравенството на Чебишев.

Дисперсия срещу стандартно отклонение

Дисперсията е квадратното отклонение (стъпка 5 по-горе) — стандартното отклонение е квадратният му корен. И двете измерват разпространението, но стандартното отклонение се изразява в същите единици като оригиналните данни, което го прави по-лесно интерпретируем.

Ако вашите данни са в килограми, вашето стандартно отклонение е в килограми. Вашата дисперсия е в килограми на квадрат, което е по-трудно да се интерпретира смислено.

Общи приложения

Финанси: Измерване на променливостта на инвестициите. Акция с дневна възвръщаемост, която има висок SD, е по-волатилна — по-висока потенциална печалба и по-висока потенциална загуба.

Контрол на качеството: Производството използва SD, за да гарантира, че продуктите остават в допустимите граници. Процес с твърде голям SD произвежда твърде много дефектни елементи.

Образование: Стандартизиране на резултатите от тестовете. Z-резултатът ви казва колко стандартни отклонения резултатът е над или под средната стойност: z = (x − средно) / SD.

Наука: Изразяване на несигурността на измерването и сравняване на експериментални резултати.

Пряк път за изчисление

За големи набори от данни използвайте изчислителната формула, която избягва индивидуалното изчисляване на отклоненията:

s² = [Σx² − (Σx)²/n] / (n − 1)

Това е математически еквивалентно, но изисква само две преминавания през данните, а не три.

Използвайте нашия Калкулатор за стандартно отклонение, за да изчислите SD, дисперсия и пълна разбивка за всеки набор от данни, който въвеждате.