ವ್ಯತ್ಯಾಸವನ್ನು ಹೇಗೆ ಲೆಕ್ಕ ಹಾಕುವುದು: ಹಂತ-ಹಂತದ ಮಾರ್ಗದರ್ಶಿ

ವ್ಯತ್ಯಾಸವು ಅವುಗಳ ಸರಾಸರಿಯಿಂದ ಸಂಖ್ಯೆಗಳ ಗುಂಪನ್ನು ಹೇಗೆ ಹರಡುತ್ತದೆ ಎಂಬುದನ್ನು ಅಳೆಯುತ್ತದೆ. ಇದು ಅಂಕಿಅಂಶಗಳಲ್ಲಿನ ಪ್ರಮುಖ ಪರಿಕಲ್ಪನೆಗಳಲ್ಲಿ ಒಂದಾಗಿದೆ - ಹೂಡಿಕೆ ಅಪಾಯವನ್ನು ಅಳೆಯಲು ಹಣಕಾಸುದಲ್ಲಿ ಬಳಸಲಾಗುತ್ತದೆ, ಪ್ರಾಯೋಗಿಕ ಸ್ಥಿರತೆಯನ್ನು ನಿರ್ಣಯಿಸಲು ವಿಜ್ಞಾನದಲ್ಲಿ ಮತ್ತು ದೈನಂದಿನ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿ ಬಳಸಲಾಗುತ್ತದೆ.

ವ್ಯತ್ಯಯ ಎಂದರೇನು?

ವ್ಯತ್ಯಾಸವು ಸರಾಸರಿಯಿಂದ ವರ್ಗ ವ್ಯತ್ಯಾಸಗಳ ಸರಾಸರಿಯಾಗಿದೆ. ಕಡಿಮೆ ವ್ಯತ್ಯಾಸ ಎಂದರೆ ಸರಾಸರಿಯ ಸುತ್ತ ಬಿಗಿಯಾಗಿ ಡೇಟಾ ಪಾಯಿಂಟ್ ಕ್ಲಸ್ಟರ್. ಹೆಚ್ಚಿನ ವ್ಯತ್ಯಾಸವೆಂದರೆ ಅವುಗಳು ವ್ಯಾಪಕವಾಗಿ ಹರಡಿವೆ ಎಂದರ್ಥ.

ಎರಡು ವಿಧಗಳಿವೆ:

ಜನಸಂಖ್ಯಾ ವ್ಯತ್ಯಾಸ (σ²) - ನೀವು ಸಂಪೂರ್ಣ ಜನಸಂಖ್ಯೆಗೆ ಡೇಟಾವನ್ನು ಹೊಂದಿರುವಾಗ ಬಳಸಲಾಗುತ್ತದೆ
ಮಾದರಿ ವ್ಯತ್ಯಾಸ (s²) — ನಿಮ್ಮ ಡೇಟಾವು ದೊಡ್ಡ ಜನಸಂಖ್ಯೆಯಿಂದ ಮಾದರಿಯಾಗಿದ್ದಾಗ ಬಳಸಲಾಗುತ್ತದೆ

ಪ್ರಾಯೋಗಿಕವಾಗಿ, ನೀವು ಯಾವಾಗಲೂ ಮಾದರಿ ವ್ಯತ್ಯಾಸವನ್ನು ಬಳಸುತ್ತೀರಿ.

ವ್ಯತ್ಯಯ ಸೂತ್ರ

ಜನಸಂಖ್ಯೆಯ ವ್ಯತ್ಯಾಸ

σ² = Σ(xᵢ - μ)² / N

ಎಲ್ಲಿ:

xᵢ = ಪ್ರತಿ ಡೇಟಾ ಪಾಯಿಂಟ್
μ = ಜನಸಂಖ್ಯೆಯ ಸರಾಸರಿ
N = ಡೇಟಾ ಬಿಂದುಗಳ ಸಂಖ್ಯೆ

ಮಾದರಿ ವ್ಯತ್ಯಾಸ

s² = Σ(xᵢ - x̄)² / (n - 1)

ಎಲ್ಲಿ:

x̄ = ಮಾದರಿ ಸರಾಸರಿ
n - 1 = ಸ್ವಾತಂತ್ರ್ಯದ ಡಿಗ್ರಿಗಳು (ಬೆಸೆಲ್ ತಿದ್ದುಪಡಿ)

ಮಾದರಿ ವ್ಯತ್ಯಾಸದಲ್ಲಿನ CODE0 ಒಂದು ಮಾದರಿಯು ಜನಸಂಖ್ಯೆಯ ನಿಜವಾದ ಹರಡುವಿಕೆಯನ್ನು ಕಡಿಮೆ ಅಂದಾಜು ಮಾಡುತ್ತದೆ ಎಂಬ ಅಂಶವನ್ನು ಸರಿಪಡಿಸುತ್ತದೆ.

ಹಂತ-ಹಂತದ ಉದಾಹರಣೆ

ಡೇಟಾಸೆಟ್: 4, 8, 6, 5, 3, 2, 8, 9, 2, 5

** ಹಂತ 1: ಸರಾಸರಿ ಲೆಕ್ಕಾಚಾರ **

Mean = (4 + 8 + 6 + 5 + 3 + 2 + 8 + 9 + 2 + 5) / 10
     = 52 / 10
     = 5.2

ಹಂತ 2: ಪ್ರತಿ ಮೌಲ್ಯದಿಂದ ಸರಾಸರಿಯನ್ನು ಕಳೆಯಿರಿ ಮತ್ತು ಫಲಿತಾಂಶವನ್ನು ವರ್ಗೀಕರಿಸಿ

ಮೌಲ್ಯ	ಮೌಲ್ಯ - ಸರಾಸರಿ	(ಮೌಲ್ಯ - ಸರಾಸರಿ)²
4	4 - 5.2 = -1.2	1.44
8	8 - 5.2 = 2.8	7.84
6	6 - 5.2 = 0.8	0.64
5	5 - 5.2 = -0.2	0.04
3	3 - 5.2 = -2.2	4.84
2	2 - 5.2 = -3.2	10.24
8	8 - 5.2 = 2.8	7.84
9	9 - 5.2 = 3.8	14.44
2	2 - 5.2 = -3.2	10.24
5	5 - 5.2 = -0.2	0.04

** ಹಂತ 3: ವರ್ಗ ವ್ಯತ್ಯಾಸಗಳನ್ನು ಒಟ್ಟುಗೂಡಿಸಿ**

Σ(xᵢ − x̄)² = 1.44 + 7.84 + 0.64 + 0.04 + 4.84 + 10.24 + 7.84 + 14.44 + 10.24 + 0.04
             = 57.6

** ಹಂತ 4: n - 1 ರಿಂದ ಭಾಗಿಸಿ (ಮಾದರಿ ವ್ಯತ್ಯಾಸ)**

s² = 57.6 / (10 − 1) = 57.6 / 9 = 6.4

ಮಾದರಿ ವ್ಯತ್ಯಾಸವು 6.4 ಆಗಿದೆ.

ವ್ಯತ್ಯಾಸ vs ಪ್ರಮಾಣಿತ ವಿಚಲನ

ಪ್ರಮಾಣಿತ ವಿಚಲನವು ವ್ಯತ್ಯಾಸದ ವರ್ಗಮೂಲವಾಗಿದೆ:

s = √s² = √6.4 ≈ 2.53

ಪ್ರಮಾಣಿತ ವಿಚಲನವನ್ನು ಮೂಲ ಡೇಟಾದಂತೆಯೇ ಅದೇ ಘಟಕಗಳಲ್ಲಿ ವ್ಯಕ್ತಪಡಿಸಲಾಗುತ್ತದೆ, ಇದು ಅರ್ಥೈಸಲು ಸುಲಭವಾಗುತ್ತದೆ. ನಿಮ್ಮ ಡೇಟಾವು ಕಿಲೋಗ್ರಾಂಗಳಲ್ಲಿದ್ದರೆ, ಪ್ರಮಾಣಿತ ವಿಚಲನವು ಕಿಲೋಗ್ರಾಂಗಳಲ್ಲಿದೆ. ವ್ಯತ್ಯಾಸವು ಕಿಲೋಗ್ರಾಂಗಳಲ್ಲಿ² ಆಗಿದೆ. ಇದಕ್ಕಾಗಿಯೇ ಪ್ರಮಾಣಿತ ವಿಚಲನವನ್ನು ಹೆಚ್ಚು ಸಾಮಾನ್ಯವಾಗಿ ವರದಿ ಮಾಡಲಾಗುತ್ತದೆ - ಆದರೆ ಅನೇಕ ಅಂಕಿಅಂಶಗಳ ಲೆಕ್ಕಾಚಾರಗಳಲ್ಲಿ ವ್ಯತ್ಯಾಸವನ್ನು ಬಳಸಲಾಗುತ್ತದೆ.

ಜನಸಂಖ್ಯೆ ವಿರುದ್ಧ ಮಾದರಿ: ಪ್ರತಿಯೊಂದನ್ನು ಯಾವಾಗ ಬಳಸಬೇಕು

ಪರಿಸ್ಥಿತಿ	ಬಳಸಿ
ಗುಂಪಿನ ಪ್ರತಿಯೊಬ್ಬ ಸದಸ್ಯರಿಗೆ ನೀವು ಡೇಟಾವನ್ನು ಹೊಂದಿರುವಿರಿ	ಜನಸಂಖ್ಯೆಯ ವ್ಯತ್ಯಾಸ (÷ N)
ನಿಮ್ಮ ಡೇಟಾವು ದೊಡ್ಡ ಗುಂಪಿನಿಂದ ಮಾದರಿಯಾಗಿದೆ	ಮಾದರಿ ವ್ಯತ್ಯಾಸ (÷ n - 1)
ಇತರ ಅಂಕಿಅಂಶಗಳ ಪರೀಕ್ಷೆಗಳಿಗೆ ಹೋಲಿಸಿದರೆ	ಸಾಮಾನ್ಯವಾಗಿ ಮಾದರಿ ವ್ಯತ್ಯಾಸ
ನಿಮ್ಮ ಡೇಟಾ ಸೆಟ್ ಸಂಪೂರ್ಣ ಚಿತ್ರವಾಗಿದೆ	ಜನಸಂಖ್ಯೆಯ ವ್ಯತ್ಯಾಸ

ಸಂದೇಹವಿದ್ದಲ್ಲಿ, ಮಾದರಿ ವ್ಯತ್ಯಾಸವನ್ನು ಬಳಸಿ. ಹೆಚ್ಚಿನ ನೈಜ-ಪ್ರಪಂಚದ ಡೇಟಾಸೆಟ್‌ಗಳು ಮಾದರಿಗಳಾಗಿವೆ.

ನಾವು ವ್ಯತ್ಯಾಸಗಳನ್ನು ಏಕೆ ವರ್ಗ ಮಾಡುತ್ತೇವೆ

ನೀವು ಆಶ್ಚರ್ಯಪಡಬಹುದು: ಸರಾಸರಿಯಿಂದ ಕಚ್ಚಾ ವ್ಯತ್ಯಾಸಗಳನ್ನು ಏಕೆ ಸರಾಸರಿ ಮಾಡಬಾರದು?

ಸಮಸ್ಯೆಯೆಂದರೆ ಧನಾತ್ಮಕ ಮತ್ತು ಋಣಾತ್ಮಕ ವಿಚಲನಗಳು ರದ್ದುಗೊಳ್ಳುತ್ತವೆ. ಮೇಲಿನ ಡೇಟಾಸೆಟ್‌ಗಾಗಿ, ಕೆಲವು ಮೌಲ್ಯಗಳು ಸರಾಸರಿಗಿಂತ ಮೇಲಿವೆ ಮತ್ತು ಕೆಲವು ಕೆಳಗಿವೆ. ನೀವು ಸ್ಕ್ವೇರ್ ಮಾಡದೆಯೇ ಎಲ್ಲವನ್ನೂ ಸೇರಿಸಿದರೆ, ನೀವು ಯಾವಾಗಲೂ ಶೂನ್ಯವನ್ನು ಪಡೆಯುತ್ತೀರಿ.

ವರ್ಗೀಕರಣವು ನಕಾರಾತ್ಮಕ ಚಿಹ್ನೆಗಳನ್ನು ತೆಗೆದುಹಾಕುತ್ತದೆ, ಆದ್ದರಿಂದ ಎಲ್ಲಾ ವಿಚಲನಗಳು ಒಟ್ಟು ಹರಡುವಿಕೆಗೆ ಧನಾತ್ಮಕವಾಗಿ ಕೊಡುಗೆ ನೀಡುತ್ತವೆ.

ಪ್ರಾಯೋಗಿಕ ಅಪ್ಲಿಕೇಶನ್‌ಗಳು

ಹಣಕಾಸು: ಪೋರ್ಟ್‌ಫೋಲಿಯೊ ವ್ಯತ್ಯಾಸವು ಹೂಡಿಕೆಯ ಅಪಾಯವನ್ನು ಅಳೆಯುತ್ತದೆ. 0.04 ವ್ಯತ್ಯಾಸವನ್ನು ಹೊಂದಿರುವ ಪೋರ್ಟ್‌ಫೋಲಿಯೊವು 0.16 ವ್ಯತ್ಯಾಸವಿರುವ ಒಂದಕ್ಕಿಂತ ಕಡಿಮೆ ಅಪಾಯಕಾರಿಯಾಗಿದೆ - ಎರಡೂ ಒಂದೇ ರೀತಿಯ ನಿರೀಕ್ಷಿತ ಆದಾಯವನ್ನು ಹೊಂದಿದ್ದರೂ ಸಹ.

** ಗುಣಮಟ್ಟ ನಿಯಂತ್ರಣ:** ಕಡಿಮೆ ವ್ಯತ್ಯಾಸದೊಂದಿಗೆ ಉತ್ಪಾದನಾ ಪ್ರಕ್ರಿಯೆಯು ಹೆಚ್ಚು ಸ್ಥಿರವಾದ ಉತ್ಪಾದನೆಯನ್ನು ಉತ್ಪಾದಿಸುತ್ತದೆ. ಹೆಚ್ಚಿನ ವ್ಯತ್ಯಾಸ ಎಂದರೆ ಅನಿರೀಕ್ಷಿತ ಫಲಿತಾಂಶಗಳು.

ವಿಜ್ಞಾನ: ಪ್ರಯೋಗಗಳಲ್ಲಿ, ಪುನರಾವರ್ತಿತ ಅಳತೆಗಳ ನಡುವಿನ ಹೆಚ್ಚಿನ ವ್ಯತ್ಯಾಸವು ಮಾಪನ ದೋಷ ಅಥವಾ ಅನಿಯಂತ್ರಿತ ಅಸ್ಥಿರಗಳನ್ನು ಸೂಚಿಸುತ್ತದೆ.

ಕ್ರೀಡಾ ವಿಶ್ಲೇಷಣೆ: ಆಟಗಾರನು ಸ್ಥಿರವಾಗಿದೆಯೇ (ಕಡಿಮೆ ವ್ಯತ್ಯಾಸ) ಅಥವಾ ಸ್ಟ್ರೀಕಿ (ಹೆಚ್ಚಿನ ವ್ಯತ್ಯಾಸ) ಎಂಬುದನ್ನು ಆಟಗಾರರ ಕಾರ್ಯಕ್ಷಮತೆಯ ವ್ಯತ್ಯಾಸವು ನಿಮಗೆ ತಿಳಿಸುತ್ತದೆ.

ಸಾಮಾನ್ಯ ತಪ್ಪುಗಳು

** ಮಾದರಿಗಳಿಗಾಗಿ n - 1 ಬದಲಿಗೆ N ಅನ್ನು ಬಳಸುವುದು** - ಇದು ನಿಜವಾದ ಜನಸಂಖ್ಯೆಯ ವ್ಯತ್ಯಾಸವನ್ನು ಕಡಿಮೆ ಅಂದಾಜು ಮಾಡುತ್ತದೆ. ಮಾದರಿ ಡೇಟಾಕ್ಕಾಗಿ ಯಾವಾಗಲೂ n - 1 ಅನ್ನು ಬಳಸಿ.

ವರ್ಗವನ್ನು ಮರೆತುಬಿಡುವುದು - ವರ್ಗದ ವ್ಯತ್ಯಾಸಗಳಿಗಿಂತ ಕಚ್ಚಾ ವ್ಯತ್ಯಾಸಗಳನ್ನು ಸರಾಸರಿ ಮಾಡುವುದು ಸಾಮಾನ್ಯ ದೋಷವಾಗಿದೆ.

ಶ್ರೇಣಿಯೊಂದಿಗೆ ಗೊಂದಲಮಯ ವ್ಯತ್ಯಾಸ — ಶ್ರೇಣಿಯು ಸರಳವಾಗಿ ಗರಿಷ್ಠ ಮೈನಸ್ ಕನಿಷ್ಠವಾಗಿರುತ್ತದೆ. ಎಲ್ಲಾ ಡೇಟಾ ಪಾಯಿಂಟ್‌ಗಳಿಗೆ ವ್ಯತ್ಯಾಸ ಖಾತೆಗಳು, ಕೇವಲ ವಿಪರೀತಗಳಿಗೆ ಮಾತ್ರವಲ್ಲ.

ತ್ವರಿತ ಉಲ್ಲೇಖ

ಫಾರ್ಮುಲಾ	ಯಾವಾಗ ಬಳಸಬೇಕು
ಕೋಡ್0	ಪೂರ್ಣ ಜನಸಂಖ್ಯೆ
ಕೋಡ್0	ಜನಸಂಖ್ಯೆಯಿಂದ ಮಾದರಿ
ಕೋಡ್0	ಪ್ರಮಾಣಿತ ವಿಚಲನವನ್ನು ಪಡೆಯಲು