भिन्नता मोजते की संख्यांचा संच त्यांच्या सरासरीवरून किती पसरलेला आहे. ही सांख्यिकीतील सर्वात महत्त्वाची संकल्पना आहे — गुंतवणुकीच्या जोखमीचे मोजमाप करण्यासाठी फायनान्समध्ये, प्रायोगिक सुसंगततेचे मूल्यांकन करण्यासाठी विज्ञानामध्ये आणि दैनंदिन डेटा विश्लेषणामध्ये वापरली जाते.

भिन्नता म्हणजे काय?

प्रसरण म्हणजे सरासरीच्या वर्गातील फरकांची सरासरी. कमी फरक म्हणजे डेटा पॉइंट्स सरासरीच्या आसपास घट्टपणे क्लस्टर करतात. उच्च भिन्नता म्हणजे ते मोठ्या प्रमाणावर पसरलेले आहेत.

दोन प्रकार आहेत:

  • लोकसंख्या भिन्नता (σ²) — जेव्हा तुमच्याकडे संपूर्ण लोकसंख्येचा डेटा असतो तेव्हा वापरला जातो
  • नमुना भिन्नता (s²) — जेव्हा तुमचा डेटा मोठ्या लोकसंख्येचा नमुना असतो तेव्हा वापरला जातो

व्यवहारात, तुम्ही जवळजवळ नेहमीच नमुना भिन्नता वापराल.

भिन्नता फॉर्म्युला

लोकसंख्या भिन्नता

σ² = Σ(xᵢ - μ)² / N

कुठे:

  • xᵢ = प्रत्येक डेटा पॉइंट
  • μ = लोकसंख्या याचा अर्थ
  • N = डेटा पॉइंट्सची संख्या

नमुना भिन्नता

s² = Σ(xᵢ - x̄)² / (n - 1)

कुठे:

  • x̄ = नमुना मध्य
  • n - 1 = स्वातंत्र्याची अंश (बेसलची सुधारणा)

नमुना भिन्नतामधील CODE0 या वस्तुस्थितीसाठी दुरुस्त करतो की नमुना लोकसंख्येचा खरा प्रसार कमी लेखतो.

चरण-दर-चरण उदाहरण

डेटासेट: ४, ८, ६, ५, ३, २, ८, ९, २, ५

पायरी १: सरासरीची गणना करा

Mean = (4 + 8 + 6 + 5 + 3 + 2 + 8 + 9 + 2 + 5) / 10
     = 52 / 10
     = 5.2

चरण २: प्रत्येक मूल्यातून सरासरी वजा करा आणि निकालाचा वर्ग करा

मूल्य मूल्य - सरासरी (मूल्य − सरासरी)²
4 4 − 5.2 = −1.2 1.44
8 ८ − ५.२ = २.८ 7.84
6 ६ − ५.२ = ०.८ 0.64
5 ५ − ५.२ = −०.२ 0.04
3 ३ − ५.२ = −२.२ 4.84
2 2 − 5.2 = −3.2 10.24
8 ८ − ५.२ = २.८ 7.84
9 ९ − ५.२ = ३.८ 14.44
2 2 − 5.2 = −3.2 10.24
5 ५ − ५.२ = −०.२ 0.04

चरण ३: वर्गातील फरकांची बेरीज करा

Σ(xᵢ − x̄)² = 1.44 + 7.84 + 0.64 + 0.04 + 4.84 + 10.24 + 7.84 + 14.44 + 10.24 + 0.04
             = 57.6

चरण ४: n − 1 ने भागा (नमुना भिन्नता)

s² = 57.6 / (10 − 1) = 57.6 / 9 = 6.4

नमुना भिन्नता 6.4 आहे.

भिन्नता वि मानक विचलन

मानक विचलन हे फक्त भिन्नतेचे वर्गमूळ आहे:

s = √s² = √6.4 ≈ 2.53

मानक विचलन मूळ डेटाच्या समान युनिट्समध्ये व्यक्त केले जाते, ज्यामुळे त्याचा अर्थ लावणे सोपे होते. तुमचा डेटा किलोग्रॅममध्ये असल्यास, मानक विचलन किलोग्रॅममध्ये असेल. भिन्नता किलोग्रॅम² मध्ये आहे. म्हणूनच मानक विचलन अधिक सामान्यपणे नोंदवले जाते — परंतु भिन्नता अनेक सांख्यिकीय गणनांमध्ये वापरली जाते.

लोकसंख्या वि नमुना: प्रत्येक कधी वापरायचा

परिस्थिती वापरा
तुमच्याकडे गटातील प्रत्येक सदस्याचा डेटा आहे लोकसंख्या भिन्नता (÷ N)
तुमचा डेटा मोठ्या गटातील नमुना आहे नमुना भिन्नता (÷ n − 1)
इतर सांख्यिकीय चाचण्यांच्या तुलनेत सहसा नमुना भिन्नता
तुमचा डेटासेट संपूर्ण चित्र आहे लोकसंख्येतील फरक

शंका असल्यास, नमुना भिन्नता वापरा. बहुतेक वास्तविक-जगातील डेटासेट हे नमुने असतात.

आम्ही फरक का वर्ग करतो

तुम्हाला कदाचित आश्चर्य वाटेल: फक्त सरासरी कच्च्या फरकांची सरासरी का नाही?

समस्या अशी आहे की सकारात्मक आणि नकारात्मक विचलन रद्द होतात. वरील डेटासेटसाठी, काही मूल्ये सरासरीच्या वर आहेत आणि काही खाली आहेत. तुम्ही चौरस न करता ते सर्व जोडल्यास, तुम्हाला नेहमी शून्य मिळेल.

स्क्वेअरिंग नकारात्मक चिन्हे काढून टाकते, म्हणून सर्व विचलन एकूण प्रसारासाठी सकारात्मक योगदान देतात.

व्यावहारिक अनुप्रयोग

वित्त: पोर्टफोलिओ भिन्नता गुंतवणूक जोखीम मोजते. 0.04 च्या भिन्नतेसह पोर्टफोलिओ 0.16 च्या भिन्नतेपेक्षा कमी धोकादायक आहे — जरी दोन्हीकडे समान अपेक्षित परतावा असला तरीही.

गुणवत्ता नियंत्रण: कमी भिन्नता असलेली उत्पादन प्रक्रिया अधिक सुसंगत आउटपुट तयार करते. उच्च भिन्नता म्हणजे अप्रत्याशित परिणाम.

विज्ञान: प्रयोगांमध्ये, पुनरावृत्ती केलेल्या मोजमापांमधील उच्च तफावत मोजमाप त्रुटी किंवा अनियंत्रित चल सूचित करते.

क्रीडा विश्लेषण: खेळाडूंच्या कामगिरीतील फरक तुम्हाला सांगतो की खेळाडू सातत्यपूर्ण (कमी फरक) किंवा स्ट्रीकी (उच्च भिन्नता) आहे.

सामान्य चुका

नमुन्यांसाठी n − 1 ऐवजी N वापरणे — हे खरे लोकसंख्येतील फरक कमी लेखते. नमुना डेटासाठी नेहमी n − 1 वापरा.

वर्ग करणे विसरणे — वर्गातील फरकांऐवजी कच्च्या फरकांची सरासरी काढणे ही एक सामान्य त्रुटी आहे.

श्रेणीसह गोंधळात टाकणारे भिन्नता — श्रेणी म्हणजे कमाल वजा किमान. भिन्नता सर्व डेटा पॉइंट्ससाठी जबाबदार आहे, केवळ टोकाचा नाही.

द्रुत संदर्भ

सूत्र कधी वापरायचे
CODE0 पूर्ण लोकसंख्या
CODE0 लोकसंख्येवरून नमुना
CODE0 मानक विचलन प्राप्त करण्यासाठी

पुढे वाचा