ભિન્નતા માપે છે કે સંખ્યાઓનો સમૂહ તેમના સરેરાશથી કેટલો ફેલાય છે. તે આંકડાઓમાં સૌથી મહત્વની વિભાવનાઓમાંની એક છે - રોકાણના જોખમને માપવા માટે નાણામાં, વિજ્ઞાનમાં પ્રાયોગિક સુસંગતતાનું મૂલ્યાંકન કરવા માટે અને રોજિંદા ડેટા વિશ્લેષણમાં વપરાય છે.

વિભિન્નતા શું છે?

ભિન્નતા એ સરેરાશથી વર્ગના તફાવતોની સરેરાશ છે. નીચા તફાવતનો અર્થ એ છે કે ડેટા પોઈન્ટ સરેરાશની આસપાસ ચુસ્તપણે ક્લસ્ટર થાય છે. ઉચ્ચ તફાવતનો અર્થ છે કે તેઓ વ્યાપકપણે ફેલાયેલા છે.

ત્યાં બે પ્રકાર છે:

  • વસ્તી તફાવત (σ²) — જ્યારે તમારી પાસે સમગ્ર વસ્તી માટેનો ડેટા હોય ત્યારે વપરાય છે
  • સેમ્પલ વેરિઅન્સ (s²) — જ્યારે તમારો ડેટા મોટી વસ્તીનો નમૂનો હોય ત્યારે ઉપયોગમાં લેવાય છે

વ્યવહારમાં, તમે લગભગ હંમેશા નમૂના ભિન્નતાનો ઉપયોગ કરશો.

વેરિઅન્સ ફોર્મ્યુલા

વસ્તી તફાવત

σ² = Σ(xᵢ - μ)² / N

ક્યાં:

  • xᵢ = દરેક ડેટા પોઈન્ટ
  • μ = વસ્તીનો અર્થ
  • N = ડેટા પોઈન્ટની સંખ્યા

નમૂના તફાવત

s² = Σ(xᵢ - x̄)² / (n - 1)

ક્યાં:

  • x̄ = નમૂનાનો અર્થ
  • n - 1 = સ્વતંત્રતાની ડિગ્રી (બેસેલનું કરેક્શન)

નમૂનાના તફાવતમાં CODE0 એ હકીકતને સુધારે છે કે નમૂના વસ્તીના સાચા ફેલાવાને ઓછો અંદાજ આપે છે.

પગલું-દર-પગલાંનું ઉદાહરણ

ડેટાસેટ: 4, 8, 6, 5, 3, 2, 8, 9, 2, 5

પગલું 1: સરેરાશની ગણતરી કરો

Mean = (4 + 8 + 6 + 5 + 3 + 2 + 8 + 9 + 2 + 5) / 10
     = 52 / 10
     = 5.2

પગલું 2: દરેક મૂલ્યમાંથી સરેરાશ બાદબાકી કરો અને પરિણામનો વર્ગ કરો

મૂલ્ય મૂલ્ય - સરેરાશ (મૂલ્ય - સરેરાશ)²
4 4 − 5.2 = −1.2 1.44
8 8 − 5.2 = 2.8 7.84
6 6 − 5.2 = 0.8 0.64
5 5 − 5.2 = −0.2 0.04
3 3 − 5.2 = −2.2 4.84
2 2 − 5.2 = −3.2 10.24
8 8 − 5.2 = 2.8 7.84
9 9 − 5.2 = 3.8 14.44
2 2 − 5.2 = −3.2 10.24
5 5 − 5.2 = −0.2 0.04

પગલું 3: વર્ગના તફાવતોનો સરવાળો કરો

Σ(xᵢ − x̄)² = 1.44 + 7.84 + 0.64 + 0.04 + 4.84 + 10.24 + 7.84 + 14.44 + 10.24 + 0.04
             = 57.6

પગલું 4: n − 1 વડે ભાગાકાર કરો (નમૂનો તફાવત)

s² = 57.6 / (10 − 1) = 57.6 / 9 = 6.4

નમૂનાનો તફાવત 6.4 છે.

વિચલન વિ માનક વિચલન

પ્રમાણભૂત વિચલન એ વિચલનનું વર્ગમૂળ છે:

s = √s² = √6.4 ≈ 2.53

પ્રમાણભૂત વિચલન મૂળ ડેટા જેવા જ એકમોમાં વ્યક્ત કરવામાં આવે છે, જે તેને અર્થઘટન કરવાનું સરળ બનાવે છે. જો તમારો ડેટા કિલોગ્રામમાં છે, તો પ્રમાણભૂત વિચલન કિલોગ્રામમાં છે. વિભિન્નતા કિલોગ્રામ²માં છે. તેથી જ પ્રમાણભૂત વિચલન વધુ સામાન્ય રીતે નોંધવામાં આવે છે — પરંતુ ઘણી આંકડાકીય ગણતરીઓમાં વિભિન્નતાનો ઉપયોગ થાય છે.

વસ્તી વિ સેમ્પલ: દરેકનો ઉપયોગ ક્યારે કરવો

સિચ્યુએશન ઉપયોગ કરો
તમારી પાસે જૂથના દરેક સભ્યનો ડેટા છે વસ્તી તફાવત (÷ N)
તમારો ડેટા મોટા જૂથમાંથી એક નમૂના છે નમૂનાનો તફાવત (÷ n − 1)
અન્ય આંકડાકીય પરીક્ષણો સાથે સરખામણી સામાન્ય રીતે નમૂના તફાવત
તમારો ડેટાસેટ સંપૂર્ણ ચિત્ર છે વસ્તી તફાવત

જ્યારે શંકા હોય, ત્યારે નમૂનાના તફાવતનો ઉપયોગ કરો. મોટાભાગના વાસ્તવિક-વિશ્વ ડેટાસેટ્સ નમૂનાઓ છે.

શા માટે આપણે તફાવતોને વર્ગીકૃત કરીએ છીએ

તમે આશ્ચર્ય પામી શકો છો: શા માટે માત્ર સરેરાશથી કાચા તફાવતની સરેરાશ ન કરો?

સમસ્યા એ છે કે સકારાત્મક અને નકારાત્મક વિચલનો રદ થાય છે. ઉપરોક્ત ડેટાસેટ માટે, કેટલાક મૂલ્યો સરેરાશથી ઉપર છે અને કેટલાક નીચે છે. જો તમે તે બધાને ચોરસ કર્યા વિના ઉમેરશો, તો તમને હંમેશા શૂન્ય મળશે.

સ્ક્વેરિંગ નકારાત્મક ચિહ્નોને દૂર કરે છે, તેથી તમામ વિચલનો કુલ ફેલાવામાં હકારાત્મક રીતે ફાળો આપે છે.

વ્યવહારુ એપ્લિકેશનો

ફાઇનાન્સ: પોર્ટફોલિયો વેરિઅન્સ રોકાણના જોખમને માપે છે. 0.04 ના વેરિએન્સ સાથેનો પોર્ટફોલિયો 0.16 ના વેરિએન્સવાળા એક કરતા ઓછો જોખમી છે — ભલે બંને પાસે સમાન અપેક્ષિત વળતર હોય.

ગુણવત્તા નિયંત્રણ: ઓછા વિચલન સાથે ઉત્પાદન પ્રક્રિયા વધુ સુસંગત આઉટપુટ ઉત્પન્ન કરે છે. ઉચ્ચ વિચલન એટલે અણધાર્યા પરિણામો.

વિજ્ઞાન: પ્રયોગોમાં, પુનરાવર્તિત માપન વચ્ચેનો ઉચ્ચ તફાવત માપન ભૂલ અથવા અનિયંત્રિત ચલો સૂચવે છે.

સ્પોર્ટ્સ એનાલિટિક્સ: પ્લેયરના પર્ફોર્મન્સ વેરિઅન્સ તમને જણાવે છે કે ખેલાડી સુસંગત છે (નીચા વેરિઅન્સ) કે સ્ટ્રેકી (ઉચ્ચ વેરિઅન્સ) છે.

સામાન્ય ભૂલો

નમૂનાઓ માટે n − 1 ને બદલે N નો ઉપયોગ કરવો — આ સાચા વસ્તી તફાવતને ઓછો અંદાજ આપે છે. નમૂના ડેટા માટે હંમેશા n − 1 નો ઉપયોગ કરો.

ચોરસ કરવાનું ભૂલી જવું — એક સામાન્ય ભૂલ એ વર્ગના તફાવતોને બદલે કાચા તફાવતોની સરેરાશ છે.

શ્રેણી સાથે ગૂંચવણમાં મૂકે છે — રેંજ એ ફક્ત મહત્તમ બાદ ન્યૂનતમ છે. વિભિન્નતા તમામ ડેટા પોઈન્ટ માટે જવાબદાર છે, માત્ર ચરમસીમાઓ માટે નહીં.

ઝડપી સંદર્ભ

ફોર્મ્યુલા ક્યારે વાપરવું
CODE0 સંપૂર્ણ વસ્તી
CODE0 વસ્તીમાંથી નમૂના
CODE0 પ્રમાણભૂત વિચલન મેળવવા માટે

આગળ વાંચો