ભિન્નતા માપે છે કે સંખ્યાઓનો સમૂહ તેમના સરેરાશથી કેટલો ફેલાય છે. તે આંકડાઓમાં સૌથી મહત્વની વિભાવનાઓમાંની એક છે - રોકાણના જોખમને માપવા માટે નાણામાં, વિજ્ઞાનમાં પ્રાયોગિક સુસંગતતાનું મૂલ્યાંકન કરવા માટે અને રોજિંદા ડેટા વિશ્લેષણમાં વપરાય છે.
વિભિન્નતા શું છે?
ભિન્નતા એ સરેરાશથી વર્ગના તફાવતોની સરેરાશ છે. નીચા તફાવતનો અર્થ એ છે કે ડેટા પોઈન્ટ સરેરાશની આસપાસ ચુસ્તપણે ક્લસ્ટર થાય છે. ઉચ્ચ તફાવતનો અર્થ છે કે તેઓ વ્યાપકપણે ફેલાયેલા છે.
ત્યાં બે પ્રકાર છે:
- વસ્તી તફાવત (σ²) — જ્યારે તમારી પાસે સમગ્ર વસ્તી માટેનો ડેટા હોય ત્યારે વપરાય છે
- સેમ્પલ વેરિઅન્સ (s²) — જ્યારે તમારો ડેટા મોટી વસ્તીનો નમૂનો હોય ત્યારે ઉપયોગમાં લેવાય છે
વ્યવહારમાં, તમે લગભગ હંમેશા નમૂના ભિન્નતાનો ઉપયોગ કરશો.
વેરિઅન્સ ફોર્મ્યુલા
વસ્તી તફાવત
σ² = Σ(xᵢ - μ)² / N
ક્યાં:
- xᵢ = દરેક ડેટા પોઈન્ટ
- μ = વસ્તીનો અર્થ
- N = ડેટા પોઈન્ટની સંખ્યા
નમૂના તફાવત
s² = Σ(xᵢ - x̄)² / (n - 1)
ક્યાં:
- x̄ = નમૂનાનો અર્થ
- n - 1 = સ્વતંત્રતાની ડિગ્રી (બેસેલનું કરેક્શન)
નમૂનાના તફાવતમાં CODE0 એ હકીકતને સુધારે છે કે નમૂના વસ્તીના સાચા ફેલાવાને ઓછો અંદાજ આપે છે.
પગલું-દર-પગલાંનું ઉદાહરણ
ડેટાસેટ: 4, 8, 6, 5, 3, 2, 8, 9, 2, 5
પગલું 1: સરેરાશની ગણતરી કરો
Mean = (4 + 8 + 6 + 5 + 3 + 2 + 8 + 9 + 2 + 5) / 10
= 52 / 10
= 5.2
પગલું 2: દરેક મૂલ્યમાંથી સરેરાશ બાદબાકી કરો અને પરિણામનો વર્ગ કરો
| મૂલ્ય | મૂલ્ય - સરેરાશ | (મૂલ્ય - સરેરાશ)² |
|---|---|---|
| 4 | 4 − 5.2 = −1.2 | 1.44 |
| 8 | 8 − 5.2 = 2.8 | 7.84 |
| 6 | 6 − 5.2 = 0.8 | 0.64 |
| 5 | 5 − 5.2 = −0.2 | 0.04 |
| 3 | 3 − 5.2 = −2.2 | 4.84 |
| 2 | 2 − 5.2 = −3.2 | 10.24 |
| 8 | 8 − 5.2 = 2.8 | 7.84 |
| 9 | 9 − 5.2 = 3.8 | 14.44 |
| 2 | 2 − 5.2 = −3.2 | 10.24 |
| 5 | 5 − 5.2 = −0.2 | 0.04 |
પગલું 3: વર્ગના તફાવતોનો સરવાળો કરો
Σ(xᵢ − x̄)² = 1.44 + 7.84 + 0.64 + 0.04 + 4.84 + 10.24 + 7.84 + 14.44 + 10.24 + 0.04
= 57.6
પગલું 4: n − 1 વડે ભાગાકાર કરો (નમૂનો તફાવત)
s² = 57.6 / (10 − 1) = 57.6 / 9 = 6.4
નમૂનાનો તફાવત 6.4 છે.
વિચલન વિ માનક વિચલન
પ્રમાણભૂત વિચલન એ વિચલનનું વર્ગમૂળ છે:
s = √s² = √6.4 ≈ 2.53
પ્રમાણભૂત વિચલન મૂળ ડેટા જેવા જ એકમોમાં વ્યક્ત કરવામાં આવે છે, જે તેને અર્થઘટન કરવાનું સરળ બનાવે છે. જો તમારો ડેટા કિલોગ્રામમાં છે, તો પ્રમાણભૂત વિચલન કિલોગ્રામમાં છે. વિભિન્નતા કિલોગ્રામ²માં છે. તેથી જ પ્રમાણભૂત વિચલન વધુ સામાન્ય રીતે નોંધવામાં આવે છે — પરંતુ ઘણી આંકડાકીય ગણતરીઓમાં વિભિન્નતાનો ઉપયોગ થાય છે.
વસ્તી વિ સેમ્પલ: દરેકનો ઉપયોગ ક્યારે કરવો
| સિચ્યુએશન | ઉપયોગ કરો |
|---|---|
| તમારી પાસે જૂથના દરેક સભ્યનો ડેટા છે | વસ્તી તફાવત (÷ N) |
| તમારો ડેટા મોટા જૂથમાંથી એક નમૂના છે | નમૂનાનો તફાવત (÷ n − 1) |
| અન્ય આંકડાકીય પરીક્ષણો સાથે સરખામણી | સામાન્ય રીતે નમૂના તફાવત |
| તમારો ડેટાસેટ સંપૂર્ણ ચિત્ર છે | વસ્તી તફાવત |
જ્યારે શંકા હોય, ત્યારે નમૂનાના તફાવતનો ઉપયોગ કરો. મોટાભાગના વાસ્તવિક-વિશ્વ ડેટાસેટ્સ નમૂનાઓ છે.
શા માટે આપણે તફાવતોને વર્ગીકૃત કરીએ છીએ
તમે આશ્ચર્ય પામી શકો છો: શા માટે માત્ર સરેરાશથી કાચા તફાવતની સરેરાશ ન કરો?
સમસ્યા એ છે કે સકારાત્મક અને નકારાત્મક વિચલનો રદ થાય છે. ઉપરોક્ત ડેટાસેટ માટે, કેટલાક મૂલ્યો સરેરાશથી ઉપર છે અને કેટલાક નીચે છે. જો તમે તે બધાને ચોરસ કર્યા વિના ઉમેરશો, તો તમને હંમેશા શૂન્ય મળશે.
સ્ક્વેરિંગ નકારાત્મક ચિહ્નોને દૂર કરે છે, તેથી તમામ વિચલનો કુલ ફેલાવામાં હકારાત્મક રીતે ફાળો આપે છે.
વ્યવહારુ એપ્લિકેશનો
ફાઇનાન્સ: પોર્ટફોલિયો વેરિઅન્સ રોકાણના જોખમને માપે છે. 0.04 ના વેરિએન્સ સાથેનો પોર્ટફોલિયો 0.16 ના વેરિએન્સવાળા એક કરતા ઓછો જોખમી છે — ભલે બંને પાસે સમાન અપેક્ષિત વળતર હોય.
ગુણવત્તા નિયંત્રણ: ઓછા વિચલન સાથે ઉત્પાદન પ્રક્રિયા વધુ સુસંગત આઉટપુટ ઉત્પન્ન કરે છે. ઉચ્ચ વિચલન એટલે અણધાર્યા પરિણામો.
વિજ્ઞાન: પ્રયોગોમાં, પુનરાવર્તિત માપન વચ્ચેનો ઉચ્ચ તફાવત માપન ભૂલ અથવા અનિયંત્રિત ચલો સૂચવે છે.
સ્પોર્ટ્સ એનાલિટિક્સ: પ્લેયરના પર્ફોર્મન્સ વેરિઅન્સ તમને જણાવે છે કે ખેલાડી સુસંગત છે (નીચા વેરિઅન્સ) કે સ્ટ્રેકી (ઉચ્ચ વેરિઅન્સ) છે.
સામાન્ય ભૂલો
નમૂનાઓ માટે n − 1 ને બદલે N નો ઉપયોગ કરવો — આ સાચા વસ્તી તફાવતને ઓછો અંદાજ આપે છે. નમૂના ડેટા માટે હંમેશા n − 1 નો ઉપયોગ કરો.
ચોરસ કરવાનું ભૂલી જવું — એક સામાન્ય ભૂલ એ વર્ગના તફાવતોને બદલે કાચા તફાવતોની સરેરાશ છે.
શ્રેણી સાથે ગૂંચવણમાં મૂકે છે — રેંજ એ ફક્ત મહત્તમ બાદ ન્યૂનતમ છે. વિભિન્નતા તમામ ડેટા પોઈન્ટ માટે જવાબદાર છે, માત્ર ચરમસીમાઓ માટે નહીં.
ઝડપી સંદર્ભ
| ફોર્મ્યુલા | ક્યારે વાપરવું |
|---|---|
| CODE0 | સંપૂર્ણ વસ્તી |
| CODE0 | વસ્તીમાંથી નમૂના |
| CODE0 | પ્રમાણભૂત વિચલન મેળવવા માટે |