स्टँडर्ड विचलन हे स्टॅटिस्टिक्समध्ये स्प्रेडचे सर्वाधिक वापरलेले माप आहे. हे तुम्हाला सांगते की ठराविक मूल्य सरासरीपासून किती अंतरावर आहे — तुमचा डेटा घट्ट क्लस्टर केलेला आहे किंवा मोठ्या प्रमाणात विखुरलेला आहे. एकदा तुम्ही हाताने गणना करून काम केले की, संकल्पना अंतर्ज्ञानी बनते.
मानक विचलन तुम्हाला काय सांगते
5 च्या मानक विचलनासह विद्यार्थ्यांच्या एका वर्गाचे सरासरी परिक्षेतील गुण 70 असल्यास, बहुतेक स्कोअर 65 आणि 75 च्या दरम्यान येतात. जर मानक विचलन 20 असेल, तर गुण अधिक व्यापकपणे श्रेणीत असतील — 50 ते 90 आणि त्यापुढील.
एक लहान मानक विचलन म्हणजे सुसंगतता. मोठा म्हणजे परिवर्तनशीलता.
लोकसंख्या वि नमुना मानक विचलन
दोन आवृत्त्या आहेत आणि योग्य निवडणे महत्त्वाचे आहे:
लोकसंख्या मानक विचलन (σ): तुमच्याकडे महत्त्वाच्या गटातील प्रत्येक सदस्याचा डेटा असेल तेव्हा वापरा. n ने भागते.
नमुना मानक विचलन (चे): जेव्हा तुमचा डेटा मोठ्या लोकसंख्येमधून काढलेला नमुना असेल तेव्हा वापरा. n − 1 ने भागते (बेसेलची सुधारणा, जे सॅम्पलिंगद्वारे सादर केलेल्या अनिश्चिततेसाठी कारणीभूत आहे).
व्यवहारात, तुम्ही जवळजवळ नेहमीच नमुना मानक विचलन वापरता — जोपर्यंत तुम्ही पूर्ण जनगणना किंवा कोणतेही सदस्य नसलेल्या नियंत्रित डेटासेटचे विश्लेषण करत नाही.
चरण-दर-चरण गणना
डेटासेट: ४, ७, १३, २, १ (५ मूल्यांचा नमुना)
पायरी 1: सरासरीची गणना करा
Mean (x̄) = (4 + 7 + 13 + 2 + 1) / 5 = 27 / 5 = 5.4
पायरी 2: सरासरी पासून प्रत्येक विचलन शोधा
प्रत्येक मूल्यातून सरासरी वजा करा:
| मूल्य (x) | विचलन (x − x̄) |
|---|---|
| 4 | 4 − 5.4 = −1.4 |
| 7 | ७ − ५.४ = +१.६ |
| 13 | १३ − ५.४ = +७.६ |
| 2 | 2 − 5.4 = −3.4 |
| 1 | 1 − 5.4 = −4.4 |
पायरी 3: प्रत्येक विचलनाचे वर्ग करा
स्क्वेअरिंग नकारात्मक चिन्हे काढून टाकते आणि मोठ्या विचलनांवर जोर देते:
| विचलन | चौरस विचलन |
|---|---|
| −१.४ | 1.96 |
| +1.6 | 2.56 |
| +7.6 | 57.76 |
| −3.4 | 11.56 |
| −4.4 | 19.36 |
पायरी 4: वर्ग विचलनाची बेरीज करा
Sum = 1.96 + 2.56 + 57.76 + 11.56 + 19.36 = 93.2
पायरी 5: n − 1 ने भागा (नमुना मानक विचलनासाठी)
Variance (s²) = 93.2 / (5 − 1) = 93.2 / 4 = 23.3
पायरी 6: वर्गमूळ घ्या
Standard deviation (s) = √23.3 = 4.83
व्याख्या: या डेटासेटमधील मूल्ये साधारणपणे ५.४ च्या सरासरीपेक्षा ४.८३ युनिट्स दूर असतात.
फॉर्म्युला लिहिलेला आहे
नमुना मानक विचलन:
s = √[ Σ(x − x̄)² / (n − 1) ]
लोकसंख्या मानक विचलन:
σ = √[ Σ(x − μ)² / n ]
जेथे μ (mu) म्हणजे लोकसंख्येचा अर्थ.
अनुभवजन्य नियम (68-95-99.7 नियम)
सामान्य वितरणाचे अनुसरण करणाऱ्या डेटासाठी, मानक विचलनाचा प्रत्येक श्रेणीतील डेटाच्या प्रमाणात विश्वासार्ह संबंध असतो:
| श्रेणी | डेटाचे प्रमाण |
|---|---|
| सरासरी ± 1 SD | ~68% |
| सरासरी ± 2 SD | ~95% |
| सरासरी ± 3 SD | ~99.7% |
अनुप्रयुक्त उदाहरण: IQ स्कोअरचे सरासरी 100 आणि SD 15 आहे.
- 68% लोक 85 ते 115 दरम्यान गुण मिळवतात
- 70 आणि 130 दरम्यान 95% गुण
- 55 आणि 145 दरम्यान 99.7% गुण
हा नियम फक्त सामान्यपणे वितरित डेटावर लागू होतो. स्क्युड किंवा हेवी-टेल्ड डिस्ट्रिब्यूशनसाठी, त्याऐवजी चेबीशेव्हची असमानता वापरा.
भिन्नता वि मानक विचलन
विविधता हे वर्गीय विचलन आहे (वरील पायरी ५) — मानक विचलन हे त्याचे वर्गमूळ आहे. दोन्ही स्प्रेड मोजतात, परंतु मानक विचलन मूळ डेटा सारख्याच युनिट्समध्ये व्यक्त केले जाते, ज्यामुळे ते अधिक स्पष्ट होते.
तुमचा डेटा किलोग्रॅममध्ये असल्यास, तुमचे मानक विचलन किलोग्रॅममध्ये असेल. तुमचा फरक किलोग्रॅम-चौरसात आहे, ज्याचा अर्थपूर्ण अर्थ लावणे कठीण आहे.
सामान्य अनुप्रयोग
वित्त: गुंतवणुकीची अस्थिरता मोजणे. उच्च SD असलेला दैनिक परतावा असलेला स्टॉक अधिक अस्थिर असतो — उच्च संभाव्य लाभ आणि उच्च संभाव्य तोटा.
गुणवत्ता नियंत्रण: उत्पादने सहनशीलतेमध्ये राहतील याची खात्री करण्यासाठी उत्पादन SD चा वापर करते. SD खूप मोठी असलेली प्रक्रिया खूप दोषपूर्ण वस्तू तयार करते.
शिक्षण: चाचणी गुणांचे मानकीकरण. z-स्कोअर तुम्हाला सांगते की स्कोअर सरासरीच्या वर किंवा खाली किती मानक विचलन बसतो: z = (x − सरासरी) / SD.
विज्ञान: मोजमाप अनिश्चितता व्यक्त करणे आणि प्रायोगिक परिणामांची तुलना करणे.
मोजणीसाठी शॉर्टकट
मोठ्या डेटासेटसाठी, संगणकीय सूत्र वापरा जे वैयक्तिकरित्या विचलनांची गणना टाळते:
s² = [Σx² − (Σx)²/n] / (n − 1)
हे गणितीयदृष्ट्या समतुल्य आहे परंतु डेटामधून तीन ऐवजी फक्त दोन पास आवश्यक आहेत.
तुम्ही एंटर केलेल्या कोणत्याही डेटासेटसाठी SD, भिन्नता आणि संपूर्ण ब्रेकडाउनची गणना करण्यासाठी आमचे Standard Deviation Calculator वापरा.