ವ್ಯತ್ಯಾಸವು ಅವುಗಳ ಸರಾಸರಿಯಿಂದ ಸಂಖ್ಯೆಗಳ ಗುಂಪನ್ನು ಹೇಗೆ ಹರಡುತ್ತದೆ ಎಂಬುದನ್ನು ಅಳೆಯುತ್ತದೆ. ಇದು ಅಂಕಿಅಂಶಗಳಲ್ಲಿನ ಪ್ರಮುಖ ಪರಿಕಲ್ಪನೆಗಳಲ್ಲಿ ಒಂದಾಗಿದೆ - ಹೂಡಿಕೆ ಅಪಾಯವನ್ನು ಅಳೆಯಲು ಹಣಕಾಸುದಲ್ಲಿ ಬಳಸಲಾಗುತ್ತದೆ, ಪ್ರಾಯೋಗಿಕ ಸ್ಥಿರತೆಯನ್ನು ನಿರ್ಣಯಿಸಲು ವಿಜ್ಞಾನದಲ್ಲಿ ಮತ್ತು ದೈನಂದಿನ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿ ಬಳಸಲಾಗುತ್ತದೆ.
ವ್ಯತ್ಯಯ ಎಂದರೇನು?
ವ್ಯತ್ಯಾಸವು ಸರಾಸರಿಯಿಂದ ವರ್ಗ ವ್ಯತ್ಯಾಸಗಳ ಸರಾಸರಿಯಾಗಿದೆ. ಕಡಿಮೆ ವ್ಯತ್ಯಾಸ ಎಂದರೆ ಸರಾಸರಿಯ ಸುತ್ತ ಬಿಗಿಯಾಗಿ ಡೇಟಾ ಪಾಯಿಂಟ್ ಕ್ಲಸ್ಟರ್. ಹೆಚ್ಚಿನ ವ್ಯತ್ಯಾಸವೆಂದರೆ ಅವುಗಳು ವ್ಯಾಪಕವಾಗಿ ಹರಡಿವೆ ಎಂದರ್ಥ.
ಎರಡು ವಿಧಗಳಿವೆ:
- ಜನಸಂಖ್ಯಾ ವ್ಯತ್ಯಾಸ (σ²) - ನೀವು ಸಂಪೂರ್ಣ ಜನಸಂಖ್ಯೆಗೆ ಡೇಟಾವನ್ನು ಹೊಂದಿರುವಾಗ ಬಳಸಲಾಗುತ್ತದೆ
- ಮಾದರಿ ವ್ಯತ್ಯಾಸ (s²) — ನಿಮ್ಮ ಡೇಟಾವು ದೊಡ್ಡ ಜನಸಂಖ್ಯೆಯಿಂದ ಮಾದರಿಯಾಗಿದ್ದಾಗ ಬಳಸಲಾಗುತ್ತದೆ
ಪ್ರಾಯೋಗಿಕವಾಗಿ, ನೀವು ಯಾವಾಗಲೂ ಮಾದರಿ ವ್ಯತ್ಯಾಸವನ್ನು ಬಳಸುತ್ತೀರಿ.
ವ್ಯತ್ಯಯ ಸೂತ್ರ
ಜನಸಂಖ್ಯೆಯ ವ್ಯತ್ಯಾಸ
σ² = Σ(xᵢ - μ)² / N
ಎಲ್ಲಿ:
- xᵢ = ಪ್ರತಿ ಡೇಟಾ ಪಾಯಿಂಟ್
- μ = ಜನಸಂಖ್ಯೆಯ ಸರಾಸರಿ
- N = ಡೇಟಾ ಬಿಂದುಗಳ ಸಂಖ್ಯೆ
ಮಾದರಿ ವ್ಯತ್ಯಾಸ
s² = Σ(xᵢ - x̄)² / (n - 1)
ಎಲ್ಲಿ:
- x̄ = ಮಾದರಿ ಸರಾಸರಿ
- n - 1 = ಸ್ವಾತಂತ್ರ್ಯದ ಡಿಗ್ರಿಗಳು (ಬೆಸೆಲ್ ತಿದ್ದುಪಡಿ)
ಮಾದರಿ ವ್ಯತ್ಯಾಸದಲ್ಲಿನ CODE0 ಒಂದು ಮಾದರಿಯು ಜನಸಂಖ್ಯೆಯ ನಿಜವಾದ ಹರಡುವಿಕೆಯನ್ನು ಕಡಿಮೆ ಅಂದಾಜು ಮಾಡುತ್ತದೆ ಎಂಬ ಅಂಶವನ್ನು ಸರಿಪಡಿಸುತ್ತದೆ.
ಹಂತ-ಹಂತದ ಉದಾಹರಣೆ
ಡೇಟಾಸೆಟ್: 4, 8, 6, 5, 3, 2, 8, 9, 2, 5
** ಹಂತ 1: ಸರಾಸರಿ ಲೆಕ್ಕಾಚಾರ **
Mean = (4 + 8 + 6 + 5 + 3 + 2 + 8 + 9 + 2 + 5) / 10
= 52 / 10
= 5.2
ಹಂತ 2: ಪ್ರತಿ ಮೌಲ್ಯದಿಂದ ಸರಾಸರಿಯನ್ನು ಕಳೆಯಿರಿ ಮತ್ತು ಫಲಿತಾಂಶವನ್ನು ವರ್ಗೀಕರಿಸಿ
| ಮೌಲ್ಯ | ಮೌಲ್ಯ - ಸರಾಸರಿ | (ಮೌಲ್ಯ - ಸರಾಸರಿ)² |
|---|---|---|
| 4 | 4 - 5.2 = -1.2 | 1.44 |
| 8 | 8 - 5.2 = 2.8 | 7.84 |
| 6 | 6 - 5.2 = 0.8 | 0.64 |
| 5 | 5 - 5.2 = -0.2 | 0.04 |
| 3 | 3 - 5.2 = -2.2 | 4.84 |
| 2 | 2 - 5.2 = -3.2 | 10.24 |
| 8 | 8 - 5.2 = 2.8 | 7.84 |
| 9 | 9 - 5.2 = 3.8 | 14.44 |
| 2 | 2 - 5.2 = -3.2 | 10.24 |
| 5 | 5 - 5.2 = -0.2 | 0.04 |
** ಹಂತ 3: ವರ್ಗ ವ್ಯತ್ಯಾಸಗಳನ್ನು ಒಟ್ಟುಗೂಡಿಸಿ**
Σ(xᵢ − x̄)² = 1.44 + 7.84 + 0.64 + 0.04 + 4.84 + 10.24 + 7.84 + 14.44 + 10.24 + 0.04
= 57.6
** ಹಂತ 4: n - 1 ರಿಂದ ಭಾಗಿಸಿ (ಮಾದರಿ ವ್ಯತ್ಯಾಸ)**
s² = 57.6 / (10 − 1) = 57.6 / 9 = 6.4
ಮಾದರಿ ವ್ಯತ್ಯಾಸವು 6.4 ಆಗಿದೆ.
ವ್ಯತ್ಯಾಸ vs ಪ್ರಮಾಣಿತ ವಿಚಲನ
ಪ್ರಮಾಣಿತ ವಿಚಲನವು ವ್ಯತ್ಯಾಸದ ವರ್ಗಮೂಲವಾಗಿದೆ:
s = √s² = √6.4 ≈ 2.53
ಪ್ರಮಾಣಿತ ವಿಚಲನವನ್ನು ಮೂಲ ಡೇಟಾದಂತೆಯೇ ಅದೇ ಘಟಕಗಳಲ್ಲಿ ವ್ಯಕ್ತಪಡಿಸಲಾಗುತ್ತದೆ, ಇದು ಅರ್ಥೈಸಲು ಸುಲಭವಾಗುತ್ತದೆ. ನಿಮ್ಮ ಡೇಟಾವು ಕಿಲೋಗ್ರಾಂಗಳಲ್ಲಿದ್ದರೆ, ಪ್ರಮಾಣಿತ ವಿಚಲನವು ಕಿಲೋಗ್ರಾಂಗಳಲ್ಲಿದೆ. ವ್ಯತ್ಯಾಸವು ಕಿಲೋಗ್ರಾಂಗಳಲ್ಲಿ² ಆಗಿದೆ. ಇದಕ್ಕಾಗಿಯೇ ಪ್ರಮಾಣಿತ ವಿಚಲನವನ್ನು ಹೆಚ್ಚು ಸಾಮಾನ್ಯವಾಗಿ ವರದಿ ಮಾಡಲಾಗುತ್ತದೆ - ಆದರೆ ಅನೇಕ ಅಂಕಿಅಂಶಗಳ ಲೆಕ್ಕಾಚಾರಗಳಲ್ಲಿ ವ್ಯತ್ಯಾಸವನ್ನು ಬಳಸಲಾಗುತ್ತದೆ.
ಜನಸಂಖ್ಯೆ ವಿರುದ್ಧ ಮಾದರಿ: ಪ್ರತಿಯೊಂದನ್ನು ಯಾವಾಗ ಬಳಸಬೇಕು
| ಪರಿಸ್ಥಿತಿ | ಬಳಸಿ |
|---|---|
| ಗುಂಪಿನ ಪ್ರತಿಯೊಬ್ಬ ಸದಸ್ಯರಿಗೆ ನೀವು ಡೇಟಾವನ್ನು ಹೊಂದಿರುವಿರಿ | ಜನಸಂಖ್ಯೆಯ ವ್ಯತ್ಯಾಸ (÷ N) |
| ನಿಮ್ಮ ಡೇಟಾವು ದೊಡ್ಡ ಗುಂಪಿನಿಂದ ಮಾದರಿಯಾಗಿದೆ | ಮಾದರಿ ವ್ಯತ್ಯಾಸ (÷ n - 1) |
| ಇತರ ಅಂಕಿಅಂಶಗಳ ಪರೀಕ್ಷೆಗಳಿಗೆ ಹೋಲಿಸಿದರೆ | ಸಾಮಾನ್ಯವಾಗಿ ಮಾದರಿ ವ್ಯತ್ಯಾಸ |
| ನಿಮ್ಮ ಡೇಟಾ ಸೆಟ್ ಸಂಪೂರ್ಣ ಚಿತ್ರವಾಗಿದೆ | ಜನಸಂಖ್ಯೆಯ ವ್ಯತ್ಯಾಸ |
ಸಂದೇಹವಿದ್ದಲ್ಲಿ, ಮಾದರಿ ವ್ಯತ್ಯಾಸವನ್ನು ಬಳಸಿ. ಹೆಚ್ಚಿನ ನೈಜ-ಪ್ರಪಂಚದ ಡೇಟಾಸೆಟ್ಗಳು ಮಾದರಿಗಳಾಗಿವೆ.
ನಾವು ವ್ಯತ್ಯಾಸಗಳನ್ನು ಏಕೆ ವರ್ಗ ಮಾಡುತ್ತೇವೆ
ನೀವು ಆಶ್ಚರ್ಯಪಡಬಹುದು: ಸರಾಸರಿಯಿಂದ ಕಚ್ಚಾ ವ್ಯತ್ಯಾಸಗಳನ್ನು ಏಕೆ ಸರಾಸರಿ ಮಾಡಬಾರದು?
ಸಮಸ್ಯೆಯೆಂದರೆ ಧನಾತ್ಮಕ ಮತ್ತು ಋಣಾತ್ಮಕ ವಿಚಲನಗಳು ರದ್ದುಗೊಳ್ಳುತ್ತವೆ. ಮೇಲಿನ ಡೇಟಾಸೆಟ್ಗಾಗಿ, ಕೆಲವು ಮೌಲ್ಯಗಳು ಸರಾಸರಿಗಿಂತ ಮೇಲಿವೆ ಮತ್ತು ಕೆಲವು ಕೆಳಗಿವೆ. ನೀವು ಸ್ಕ್ವೇರ್ ಮಾಡದೆಯೇ ಎಲ್ಲವನ್ನೂ ಸೇರಿಸಿದರೆ, ನೀವು ಯಾವಾಗಲೂ ಶೂನ್ಯವನ್ನು ಪಡೆಯುತ್ತೀರಿ.
ವರ್ಗೀಕರಣವು ನಕಾರಾತ್ಮಕ ಚಿಹ್ನೆಗಳನ್ನು ತೆಗೆದುಹಾಕುತ್ತದೆ, ಆದ್ದರಿಂದ ಎಲ್ಲಾ ವಿಚಲನಗಳು ಒಟ್ಟು ಹರಡುವಿಕೆಗೆ ಧನಾತ್ಮಕವಾಗಿ ಕೊಡುಗೆ ನೀಡುತ್ತವೆ.
ಪ್ರಾಯೋಗಿಕ ಅಪ್ಲಿಕೇಶನ್ಗಳು
ಹಣಕಾಸು: ಪೋರ್ಟ್ಫೋಲಿಯೊ ವ್ಯತ್ಯಾಸವು ಹೂಡಿಕೆಯ ಅಪಾಯವನ್ನು ಅಳೆಯುತ್ತದೆ. 0.04 ವ್ಯತ್ಯಾಸವನ್ನು ಹೊಂದಿರುವ ಪೋರ್ಟ್ಫೋಲಿಯೊವು 0.16 ವ್ಯತ್ಯಾಸವಿರುವ ಒಂದಕ್ಕಿಂತ ಕಡಿಮೆ ಅಪಾಯಕಾರಿಯಾಗಿದೆ - ಎರಡೂ ಒಂದೇ ರೀತಿಯ ನಿರೀಕ್ಷಿತ ಆದಾಯವನ್ನು ಹೊಂದಿದ್ದರೂ ಸಹ.
** ಗುಣಮಟ್ಟ ನಿಯಂತ್ರಣ:** ಕಡಿಮೆ ವ್ಯತ್ಯಾಸದೊಂದಿಗೆ ಉತ್ಪಾದನಾ ಪ್ರಕ್ರಿಯೆಯು ಹೆಚ್ಚು ಸ್ಥಿರವಾದ ಉತ್ಪಾದನೆಯನ್ನು ಉತ್ಪಾದಿಸುತ್ತದೆ. ಹೆಚ್ಚಿನ ವ್ಯತ್ಯಾಸ ಎಂದರೆ ಅನಿರೀಕ್ಷಿತ ಫಲಿತಾಂಶಗಳು.
ವಿಜ್ಞಾನ: ಪ್ರಯೋಗಗಳಲ್ಲಿ, ಪುನರಾವರ್ತಿತ ಅಳತೆಗಳ ನಡುವಿನ ಹೆಚ್ಚಿನ ವ್ಯತ್ಯಾಸವು ಮಾಪನ ದೋಷ ಅಥವಾ ಅನಿಯಂತ್ರಿತ ಅಸ್ಥಿರಗಳನ್ನು ಸೂಚಿಸುತ್ತದೆ.
ಕ್ರೀಡಾ ವಿಶ್ಲೇಷಣೆ: ಆಟಗಾರನು ಸ್ಥಿರವಾಗಿದೆಯೇ (ಕಡಿಮೆ ವ್ಯತ್ಯಾಸ) ಅಥವಾ ಸ್ಟ್ರೀಕಿ (ಹೆಚ್ಚಿನ ವ್ಯತ್ಯಾಸ) ಎಂಬುದನ್ನು ಆಟಗಾರರ ಕಾರ್ಯಕ್ಷಮತೆಯ ವ್ಯತ್ಯಾಸವು ನಿಮಗೆ ತಿಳಿಸುತ್ತದೆ.
ಸಾಮಾನ್ಯ ತಪ್ಪುಗಳು
** ಮಾದರಿಗಳಿಗಾಗಿ n - 1 ಬದಲಿಗೆ N ಅನ್ನು ಬಳಸುವುದು** - ಇದು ನಿಜವಾದ ಜನಸಂಖ್ಯೆಯ ವ್ಯತ್ಯಾಸವನ್ನು ಕಡಿಮೆ ಅಂದಾಜು ಮಾಡುತ್ತದೆ. ಮಾದರಿ ಡೇಟಾಕ್ಕಾಗಿ ಯಾವಾಗಲೂ n - 1 ಅನ್ನು ಬಳಸಿ.
ವರ್ಗವನ್ನು ಮರೆತುಬಿಡುವುದು - ವರ್ಗದ ವ್ಯತ್ಯಾಸಗಳಿಗಿಂತ ಕಚ್ಚಾ ವ್ಯತ್ಯಾಸಗಳನ್ನು ಸರಾಸರಿ ಮಾಡುವುದು ಸಾಮಾನ್ಯ ದೋಷವಾಗಿದೆ.
ಶ್ರೇಣಿಯೊಂದಿಗೆ ಗೊಂದಲಮಯ ವ್ಯತ್ಯಾಸ — ಶ್ರೇಣಿಯು ಸರಳವಾಗಿ ಗರಿಷ್ಠ ಮೈನಸ್ ಕನಿಷ್ಠವಾಗಿರುತ್ತದೆ. ಎಲ್ಲಾ ಡೇಟಾ ಪಾಯಿಂಟ್ಗಳಿಗೆ ವ್ಯತ್ಯಾಸ ಖಾತೆಗಳು, ಕೇವಲ ವಿಪರೀತಗಳಿಗೆ ಮಾತ್ರವಲ್ಲ.
ತ್ವರಿತ ಉಲ್ಲೇಖ
| ಫಾರ್ಮುಲಾ | ಯಾವಾಗ ಬಳಸಬೇಕು |
|---|---|
| ಕೋಡ್0 | ಪೂರ್ಣ ಜನಸಂಖ್ಯೆ |
| ಕೋಡ್0 | ಜನಸಂಖ್ಯೆಯಿಂದ ಮಾದರಿ |
| ಕೋಡ್0 | ಪ್ರಮಾಣಿತ ವಿಚಲನವನ್ನು ಪಡೆಯಲು |