भिन्नता मोजते की संख्यांचा संच त्यांच्या सरासरीवरून किती पसरलेला आहे. ही सांख्यिकीतील सर्वात महत्त्वाची संकल्पना आहे — गुंतवणुकीच्या जोखमीचे मोजमाप करण्यासाठी फायनान्समध्ये, प्रायोगिक सुसंगततेचे मूल्यांकन करण्यासाठी विज्ञानामध्ये आणि दैनंदिन डेटा विश्लेषणामध्ये वापरली जाते.
भिन्नता म्हणजे काय?
प्रसरण म्हणजे सरासरीच्या वर्गातील फरकांची सरासरी. कमी फरक म्हणजे डेटा पॉइंट्स सरासरीच्या आसपास घट्टपणे क्लस्टर करतात. उच्च भिन्नता म्हणजे ते मोठ्या प्रमाणावर पसरलेले आहेत.
दोन प्रकार आहेत:
- लोकसंख्या भिन्नता (σ²) — जेव्हा तुमच्याकडे संपूर्ण लोकसंख्येचा डेटा असतो तेव्हा वापरला जातो
- नमुना भिन्नता (s²) — जेव्हा तुमचा डेटा मोठ्या लोकसंख्येचा नमुना असतो तेव्हा वापरला जातो
व्यवहारात, तुम्ही जवळजवळ नेहमीच नमुना भिन्नता वापराल.
भिन्नता फॉर्म्युला
लोकसंख्या भिन्नता
σ² = Σ(xᵢ - μ)² / N
कुठे:
- xᵢ = प्रत्येक डेटा पॉइंट
- μ = लोकसंख्या याचा अर्थ
- N = डेटा पॉइंट्सची संख्या
नमुना भिन्नता
s² = Σ(xᵢ - x̄)² / (n - 1)
कुठे:
- x̄ = नमुना मध्य
- n - 1 = स्वातंत्र्याची अंश (बेसलची सुधारणा)
नमुना भिन्नतामधील CODE0 या वस्तुस्थितीसाठी दुरुस्त करतो की नमुना लोकसंख्येचा खरा प्रसार कमी लेखतो.
चरण-दर-चरण उदाहरण
डेटासेट: ४, ८, ६, ५, ३, २, ८, ९, २, ५
पायरी १: सरासरीची गणना करा
Mean = (4 + 8 + 6 + 5 + 3 + 2 + 8 + 9 + 2 + 5) / 10
= 52 / 10
= 5.2
चरण २: प्रत्येक मूल्यातून सरासरी वजा करा आणि निकालाचा वर्ग करा
| मूल्य | मूल्य - सरासरी | (मूल्य − सरासरी)² |
|---|---|---|
| 4 | 4 − 5.2 = −1.2 | 1.44 |
| 8 | ८ − ५.२ = २.८ | 7.84 |
| 6 | ६ − ५.२ = ०.८ | 0.64 |
| 5 | ५ − ५.२ = −०.२ | 0.04 |
| 3 | ३ − ५.२ = −२.२ | 4.84 |
| 2 | 2 − 5.2 = −3.2 | 10.24 |
| 8 | ८ − ५.२ = २.८ | 7.84 |
| 9 | ९ − ५.२ = ३.८ | 14.44 |
| 2 | 2 − 5.2 = −3.2 | 10.24 |
| 5 | ५ − ५.२ = −०.२ | 0.04 |
चरण ३: वर्गातील फरकांची बेरीज करा
Σ(xᵢ − x̄)² = 1.44 + 7.84 + 0.64 + 0.04 + 4.84 + 10.24 + 7.84 + 14.44 + 10.24 + 0.04
= 57.6
चरण ४: n − 1 ने भागा (नमुना भिन्नता)
s² = 57.6 / (10 − 1) = 57.6 / 9 = 6.4
नमुना भिन्नता 6.4 आहे.
भिन्नता वि मानक विचलन
मानक विचलन हे फक्त भिन्नतेचे वर्गमूळ आहे:
s = √s² = √6.4 ≈ 2.53
मानक विचलन मूळ डेटाच्या समान युनिट्समध्ये व्यक्त केले जाते, ज्यामुळे त्याचा अर्थ लावणे सोपे होते. तुमचा डेटा किलोग्रॅममध्ये असल्यास, मानक विचलन किलोग्रॅममध्ये असेल. भिन्नता किलोग्रॅम² मध्ये आहे. म्हणूनच मानक विचलन अधिक सामान्यपणे नोंदवले जाते — परंतु भिन्नता अनेक सांख्यिकीय गणनांमध्ये वापरली जाते.
लोकसंख्या वि नमुना: प्रत्येक कधी वापरायचा
| परिस्थिती | वापरा |
|---|---|
| तुमच्याकडे गटातील प्रत्येक सदस्याचा डेटा आहे | लोकसंख्या भिन्नता (÷ N) |
| तुमचा डेटा मोठ्या गटातील नमुना आहे | नमुना भिन्नता (÷ n − 1) |
| इतर सांख्यिकीय चाचण्यांच्या तुलनेत | सहसा नमुना भिन्नता |
| तुमचा डेटासेट संपूर्ण चित्र आहे | लोकसंख्येतील फरक |
शंका असल्यास, नमुना भिन्नता वापरा. बहुतेक वास्तविक-जगातील डेटासेट हे नमुने असतात.
आम्ही फरक का वर्ग करतो
तुम्हाला कदाचित आश्चर्य वाटेल: फक्त सरासरी कच्च्या फरकांची सरासरी का नाही?
समस्या अशी आहे की सकारात्मक आणि नकारात्मक विचलन रद्द होतात. वरील डेटासेटसाठी, काही मूल्ये सरासरीच्या वर आहेत आणि काही खाली आहेत. तुम्ही चौरस न करता ते सर्व जोडल्यास, तुम्हाला नेहमी शून्य मिळेल.
स्क्वेअरिंग नकारात्मक चिन्हे काढून टाकते, म्हणून सर्व विचलन एकूण प्रसारासाठी सकारात्मक योगदान देतात.
व्यावहारिक अनुप्रयोग
वित्त: पोर्टफोलिओ भिन्नता गुंतवणूक जोखीम मोजते. 0.04 च्या भिन्नतेसह पोर्टफोलिओ 0.16 च्या भिन्नतेपेक्षा कमी धोकादायक आहे — जरी दोन्हीकडे समान अपेक्षित परतावा असला तरीही.
गुणवत्ता नियंत्रण: कमी भिन्नता असलेली उत्पादन प्रक्रिया अधिक सुसंगत आउटपुट तयार करते. उच्च भिन्नता म्हणजे अप्रत्याशित परिणाम.
विज्ञान: प्रयोगांमध्ये, पुनरावृत्ती केलेल्या मोजमापांमधील उच्च तफावत मोजमाप त्रुटी किंवा अनियंत्रित चल सूचित करते.
क्रीडा विश्लेषण: खेळाडूंच्या कामगिरीतील फरक तुम्हाला सांगतो की खेळाडू सातत्यपूर्ण (कमी फरक) किंवा स्ट्रीकी (उच्च भिन्नता) आहे.
सामान्य चुका
नमुन्यांसाठी n − 1 ऐवजी N वापरणे — हे खरे लोकसंख्येतील फरक कमी लेखते. नमुना डेटासाठी नेहमी n − 1 वापरा.
वर्ग करणे विसरणे — वर्गातील फरकांऐवजी कच्च्या फरकांची सरासरी काढणे ही एक सामान्य त्रुटी आहे.
श्रेणीसह गोंधळात टाकणारे भिन्नता — श्रेणी म्हणजे कमाल वजा किमान. भिन्नता सर्व डेटा पॉइंट्ससाठी जबाबदार आहे, केवळ टोकाचा नाही.
द्रुत संदर्भ
| सूत्र | कधी वापरायचे |
|---|---|
| CODE0 | पूर्ण लोकसंख्या |
| CODE0 | लोकसंख्येवरून नमुना |
| CODE0 | मानक विचलन प्राप्त करण्यासाठी |