వైవిధ్యం సంఖ్యల సమితి వాటి సగటు నుండి ఎలా విస్తరించిందో కొలుస్తుంది. ఇది గణాంకాలలో అత్యంత ముఖ్యమైన భావనలలో ఒకటి — పెట్టుబడి నష్టాన్ని కొలవడానికి ఫైనాన్స్లో, ప్రయోగాత్మక స్థిరత్వాన్ని అంచనా వేయడానికి సైన్స్లో మరియు రోజువారీ డేటా విశ్లేషణలో ఉపయోగించబడుతుంది.
వైవిధ్యం అంటే ఏమిటి?
వ్యత్యాసం అనేది సగటు నుండి స్క్వేర్డ్ తేడాల సగటు. తక్కువ వ్యత్యాసం అంటే డేటా పాయింట్ల క్లస్టర్ సగటు చుట్టూ గట్టిగా ఉంటుంది. అధిక వ్యత్యాసం అంటే అవి విస్తృతంగా వ్యాపించాయి.
రెండు రకాలు ఉన్నాయి:
- జనాభా వ్యత్యాసం (σ²) — మీరు మొత్తం జనాభా కోసం డేటాను కలిగి ఉన్నప్పుడు ఉపయోగించబడుతుంది
- నమూనా వైవిధ్యం (s²) — మీ డేటా ఎక్కువ జనాభా నుండి నమూనా అయినప్పుడు ఉపయోగించబడుతుంది
ఆచరణలో, మీరు దాదాపు ఎల్లప్పుడూ నమూనా వ్యత్యాసాన్ని ఉపయోగిస్తారు.
వేరియెన్స్ ఫార్ములా
జనాభా వైవిధ్యం
σ² = Σ(xᵢ - μ)² / N
ఎక్కడ:
- xᵢ = ప్రతి డేటా పాయింట్
- μ = జనాభా సగటు
- N = డేటా పాయింట్ల సంఖ్య
నమూనా వైవిధ్యం
s² = Σ(xᵢ - x̄)² / (n - 1)
ఎక్కడ:
- x̄ = నమూనా సగటు
- n - 1 = స్వేచ్ఛ యొక్క డిగ్రీలు (బెస్సెల్ యొక్క దిద్దుబాటు)
నమూనా వ్యత్యాసంలోని CODE0 అనేది ఒక నమూనా జనాభా యొక్క నిజమైన వ్యాప్తిని తక్కువగా అంచనా వేస్తుందనే వాస్తవాన్ని సరిచేస్తుంది.
దశల వారీ ఉదాహరణ
డేటాసెట్: 4, 8, 6, 5, 3, 2, 8, 9, 2, 5
** దశ 1: సగటును లెక్కించండి **
Mean = (4 + 8 + 6 + 5 + 3 + 2 + 8 + 9 + 2 + 5) / 10
= 52 / 10
= 5.2
దశ 2: ప్రతి విలువ నుండి సగటును తీసివేసి, ఫలితాన్ని వర్గీకరించండి
| విలువ | విలువ - సగటు | (విలువ - సగటు)² |
|---|---|---|
| 4 | 4 - 5.2 = -1.2 | 1.44 |
| 8 | 8 - 5.2 = 2.8 | 7.84 |
| 6 | 6 - 5.2 = 0.8 | 0.64 |
| 5 | 5 - 5.2 = -0.2 | 0.04 |
| 3 | 3 - 5.2 = -2.2 | 4.84 |
| 2 | 2 - 5.2 = -3.2 | 10.24 |
| 8 | 8 - 5.2 = 2.8 | 7.84 |
| 9 | 9 - 5.2 = 3.8 | 14.44 |
| 2 | 2 - 5.2 = -3.2 | 10.24 |
| 5 | 5 - 5.2 = -0.2 | 0.04 |
దశ 3: స్క్వేర్డ్ తేడాలను సంకలనం చేయండి
Σ(xᵢ − x̄)² = 1.44 + 7.84 + 0.64 + 0.04 + 4.84 + 10.24 + 7.84 + 14.44 + 10.24 + 0.04
= 57.6
దశ 4: n - 1 ద్వారా భాగించండి (నమూనా వ్యత్యాసం)
s² = 57.6 / (10 − 1) = 57.6 / 9 = 6.4
నమూనా వ్యత్యాసం 6.4.
వ్యత్యాసం vs ప్రామాణిక విచలనం
ప్రామాణిక విచలనం అనేది వ్యత్యాసం యొక్క వర్గమూలం:
s = √s² = √6.4 ≈ 2.53
ప్రామాణిక విచలనం అసలైన డేటా వలె అదే యూనిట్లలో వ్యక్తీకరించబడుతుంది, ఇది అర్థం చేసుకోవడం సులభం చేస్తుంది. మీ డేటా కిలోగ్రాములలో ఉంటే, ప్రామాణిక విచలనం కిలోగ్రాములలో ఉంటుంది. వ్యత్యాసం కిలోగ్రాముల²లో ఉంది. అందుకే ప్రామాణిక విచలనం ఎక్కువగా నివేదించబడుతుంది - కానీ అనేక గణాంక గణనలలో వ్యత్యాసం ఉపయోగించబడుతుంది.
జనాభా vs నమూనా: ప్రతి ఒక్కటి ఎప్పుడు ఉపయోగించాలి
| పరిస్థితి | ఉపయోగించండి |
|---|---|
| సమూహంలోని ప్రతి సభ్యునికి సంబంధించిన డేటా మీ వద్ద ఉంది | జనాభా వ్యత్యాసం (÷ N) |
| మీ డేటా పెద్ద సమూహం నుండి వచ్చిన నమూనా | నమూనా వ్యత్యాసం (÷ n - 1) |
| ఇతర గణాంక పరీక్షలతో పోల్చడం | సాధారణంగా నమూనా వ్యత్యాసం |
| మీ డేటాసెట్ పూర్తి చిత్రం | జనాభా వ్యత్యాసం |
సందేహంలో ఉన్నప్పుడు, నమూనా వ్యత్యాసాన్ని ఉపయోగించండి. చాలా వాస్తవ-ప్రపంచ డేటాసెట్లు నమూనాలు.
మేము తేడాలను ఎందుకు వర్గీకరిస్తాము
మీరు ఆశ్చర్యపోవచ్చు: సగటు నుండి ముడి వ్యత్యాసాలను ఎందుకు సగటు చేయకూడదు?
సమస్య ఏమిటంటే సానుకూల మరియు ప్రతికూల విచలనాలు రద్దు చేయబడతాయి. ఎగువ డేటాసెట్ కోసం, కొన్ని విలువలు సగటు కంటే ఎక్కువగా ఉంటాయి మరియు కొన్ని దిగువన ఉన్నాయి. మీరు స్క్వేర్ లేకుండా వాటన్నింటినీ జోడిస్తే, మీరు ఎల్లప్పుడూ సున్నా పొందుతారు.
స్క్వేర్ చేయడం ప్రతికూల సంకేతాలను తొలగిస్తుంది, కాబట్టి అన్ని విచలనాలు మొత్తం వ్యాప్తికి సానుకూలంగా దోహదం చేస్తాయి.
ప్రాక్టికల్ అప్లికేషన్స్
ఫైనాన్స్: పోర్ట్ఫోలియో వ్యత్యాసం పెట్టుబడి ప్రమాదాన్ని కొలుస్తుంది. 0.04 వేరియెన్స్ ఉన్న పోర్ట్ఫోలియో 0.16 వేరియెన్స్ ఉన్న దాని కంటే తక్కువ రిస్క్తో కూడుకున్నది - రెండూ ఒకే విధమైన రాబడిని కలిగి ఉన్నప్పటికీ.
నాణ్యత నియంత్రణ: తక్కువ వ్యత్యాసంతో తయారీ ప్రక్రియ మరింత స్థిరమైన అవుట్పుట్ను ఉత్పత్తి చేస్తుంది. అధిక వ్యత్యాసం అంటే అనూహ్య ఫలితాలు.
సైన్స్: ప్రయోగాలలో, పునరావృత కొలతల మధ్య అధిక వ్యత్యాసం కొలత లోపం లేదా అనియంత్రిత వేరియబుల్లను సూచిస్తుంది.
** స్పోర్ట్స్ అనలిటిక్స్:** ఆటగాడు స్థిరంగా ఉన్నాడా (తక్కువ వ్యత్యాసం) లేదా స్ట్రీకీ (అధిక వ్యత్యాసం) అని ప్లేయర్ పనితీరు వైవిధ్యం మీకు తెలియజేస్తుంది.
సాధారణ తప్పులు
నమూనాల కోసం n − 1కి బదులుగా Nని ఉపయోగించడం — ఇది నిజమైన జనాభా వ్యత్యాసాన్ని తక్కువగా అంచనా వేస్తుంది. నమూనా డేటా కోసం ఎల్లప్పుడూ n − 1ని ఉపయోగించండి.
స్క్వేర్ను మర్చిపోవడం — ఒక సాధారణ లోపం స్క్వేర్డ్ తేడాల కంటే ముడి వ్యత్యాసాల సగటు.
శ్రేణితో అయోమయ భేదం — పరిధి గరిష్టంగా మైనస్ కనిష్టంగా ఉంటుంది. విపరీతమైన వాటికే కాకుండా అన్ని డేటా పాయింట్లకు వైవిధ్యం ఖాతాలు.
త్వరిత సూచన
| ఫార్ములా | ఎప్పుడు ఉపయోగించాలి |
|---|---|
| కోడ్0 | పూర్తి జనాభా |
| కోడ్0 | జనాభా నుండి నమూనా |
| కోడ్0 | ప్రామాణిక విచలనం పొందడానికి |