ವ್ಯತ್ಯಾಸವು ಅವುಗಳ ಸರಾಸರಿಯಿಂದ ಸಂಖ್ಯೆಗಳ ಗುಂಪನ್ನು ಹೇಗೆ ಹರಡುತ್ತದೆ ಎಂಬುದನ್ನು ಅಳೆಯುತ್ತದೆ. ಇದು ಅಂಕಿಅಂಶಗಳಲ್ಲಿನ ಪ್ರಮುಖ ಪರಿಕಲ್ಪನೆಗಳಲ್ಲಿ ಒಂದಾಗಿದೆ - ಹೂಡಿಕೆ ಅಪಾಯವನ್ನು ಅಳೆಯಲು ಹಣಕಾಸುದಲ್ಲಿ ಬಳಸಲಾಗುತ್ತದೆ, ಪ್ರಾಯೋಗಿಕ ಸ್ಥಿರತೆಯನ್ನು ನಿರ್ಣಯಿಸಲು ವಿಜ್ಞಾನದಲ್ಲಿ ಮತ್ತು ದೈನಂದಿನ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿ ಬಳಸಲಾಗುತ್ತದೆ.

ವ್ಯತ್ಯಯ ಎಂದರೇನು?

ವ್ಯತ್ಯಾಸವು ಸರಾಸರಿಯಿಂದ ವರ್ಗ ವ್ಯತ್ಯಾಸಗಳ ಸರಾಸರಿಯಾಗಿದೆ. ಕಡಿಮೆ ವ್ಯತ್ಯಾಸ ಎಂದರೆ ಸರಾಸರಿಯ ಸುತ್ತ ಬಿಗಿಯಾಗಿ ಡೇಟಾ ಪಾಯಿಂಟ್ ಕ್ಲಸ್ಟರ್. ಹೆಚ್ಚಿನ ವ್ಯತ್ಯಾಸವೆಂದರೆ ಅವುಗಳು ವ್ಯಾಪಕವಾಗಿ ಹರಡಿವೆ ಎಂದರ್ಥ.

ಎರಡು ವಿಧಗಳಿವೆ:

  • ಜನಸಂಖ್ಯಾ ವ್ಯತ್ಯಾಸ (σ²) - ನೀವು ಸಂಪೂರ್ಣ ಜನಸಂಖ್ಯೆಗೆ ಡೇಟಾವನ್ನು ಹೊಂದಿರುವಾಗ ಬಳಸಲಾಗುತ್ತದೆ
  • ಮಾದರಿ ವ್ಯತ್ಯಾಸ (s²) — ನಿಮ್ಮ ಡೇಟಾವು ದೊಡ್ಡ ಜನಸಂಖ್ಯೆಯಿಂದ ಮಾದರಿಯಾಗಿದ್ದಾಗ ಬಳಸಲಾಗುತ್ತದೆ

ಪ್ರಾಯೋಗಿಕವಾಗಿ, ನೀವು ಯಾವಾಗಲೂ ಮಾದರಿ ವ್ಯತ್ಯಾಸವನ್ನು ಬಳಸುತ್ತೀರಿ.

ವ್ಯತ್ಯಯ ಸೂತ್ರ

ಜನಸಂಖ್ಯೆಯ ವ್ಯತ್ಯಾಸ

σ² = Σ(xᵢ - μ)² / N

ಎಲ್ಲಿ:

  • xᵢ = ಪ್ರತಿ ಡೇಟಾ ಪಾಯಿಂಟ್
  • μ = ಜನಸಂಖ್ಯೆಯ ಸರಾಸರಿ
  • N = ಡೇಟಾ ಬಿಂದುಗಳ ಸಂಖ್ಯೆ

ಮಾದರಿ ವ್ಯತ್ಯಾಸ

s² = Σ(xᵢ - x̄)² / (n - 1)

ಎಲ್ಲಿ:

  • x̄ = ಮಾದರಿ ಸರಾಸರಿ
  • n - 1 = ಸ್ವಾತಂತ್ರ್ಯದ ಡಿಗ್ರಿಗಳು (ಬೆಸೆಲ್ ತಿದ್ದುಪಡಿ)

ಮಾದರಿ ವ್ಯತ್ಯಾಸದಲ್ಲಿನ CODE0 ಒಂದು ಮಾದರಿಯು ಜನಸಂಖ್ಯೆಯ ನಿಜವಾದ ಹರಡುವಿಕೆಯನ್ನು ಕಡಿಮೆ ಅಂದಾಜು ಮಾಡುತ್ತದೆ ಎಂಬ ಅಂಶವನ್ನು ಸರಿಪಡಿಸುತ್ತದೆ.

ಹಂತ-ಹಂತದ ಉದಾಹರಣೆ

ಡೇಟಾಸೆಟ್: 4, 8, 6, 5, 3, 2, 8, 9, 2, 5

** ಹಂತ 1: ಸರಾಸರಿ ಲೆಕ್ಕಾಚಾರ **

Mean = (4 + 8 + 6 + 5 + 3 + 2 + 8 + 9 + 2 + 5) / 10
     = 52 / 10
     = 5.2

ಹಂತ 2: ಪ್ರತಿ ಮೌಲ್ಯದಿಂದ ಸರಾಸರಿಯನ್ನು ಕಳೆಯಿರಿ ಮತ್ತು ಫಲಿತಾಂಶವನ್ನು ವರ್ಗೀಕರಿಸಿ

ಮೌಲ್ಯ ಮೌಲ್ಯ - ಸರಾಸರಿ (ಮೌಲ್ಯ - ಸರಾಸರಿ)²
4 4 - 5.2 = -1.2 1.44
8 8 - 5.2 = 2.8 7.84
6 6 - 5.2 = 0.8 0.64
5 5 - 5.2 = -0.2 0.04
3 3 - 5.2 = -2.2 4.84
2 2 - 5.2 = -3.2 10.24
8 8 - 5.2 = 2.8 7.84
9 9 - 5.2 = 3.8 14.44
2 2 - 5.2 = -3.2 10.24
5 5 - 5.2 = -0.2 0.04

** ಹಂತ 3: ವರ್ಗ ವ್ಯತ್ಯಾಸಗಳನ್ನು ಒಟ್ಟುಗೂಡಿಸಿ**

Σ(xᵢ − x̄)² = 1.44 + 7.84 + 0.64 + 0.04 + 4.84 + 10.24 + 7.84 + 14.44 + 10.24 + 0.04
             = 57.6

** ಹಂತ 4: n - 1 ರಿಂದ ಭಾಗಿಸಿ (ಮಾದರಿ ವ್ಯತ್ಯಾಸ)**

s² = 57.6 / (10 − 1) = 57.6 / 9 = 6.4

ಮಾದರಿ ವ್ಯತ್ಯಾಸವು 6.4 ಆಗಿದೆ.

ವ್ಯತ್ಯಾಸ vs ಪ್ರಮಾಣಿತ ವಿಚಲನ

ಪ್ರಮಾಣಿತ ವಿಚಲನವು ವ್ಯತ್ಯಾಸದ ವರ್ಗಮೂಲವಾಗಿದೆ:

s = √s² = √6.4 ≈ 2.53

ಪ್ರಮಾಣಿತ ವಿಚಲನವನ್ನು ಮೂಲ ಡೇಟಾದಂತೆಯೇ ಅದೇ ಘಟಕಗಳಲ್ಲಿ ವ್ಯಕ್ತಪಡಿಸಲಾಗುತ್ತದೆ, ಇದು ಅರ್ಥೈಸಲು ಸುಲಭವಾಗುತ್ತದೆ. ನಿಮ್ಮ ಡೇಟಾವು ಕಿಲೋಗ್ರಾಂಗಳಲ್ಲಿದ್ದರೆ, ಪ್ರಮಾಣಿತ ವಿಚಲನವು ಕಿಲೋಗ್ರಾಂಗಳಲ್ಲಿದೆ. ವ್ಯತ್ಯಾಸವು ಕಿಲೋಗ್ರಾಂಗಳಲ್ಲಿ² ಆಗಿದೆ. ಇದಕ್ಕಾಗಿಯೇ ಪ್ರಮಾಣಿತ ವಿಚಲನವನ್ನು ಹೆಚ್ಚು ಸಾಮಾನ್ಯವಾಗಿ ವರದಿ ಮಾಡಲಾಗುತ್ತದೆ - ಆದರೆ ಅನೇಕ ಅಂಕಿಅಂಶಗಳ ಲೆಕ್ಕಾಚಾರಗಳಲ್ಲಿ ವ್ಯತ್ಯಾಸವನ್ನು ಬಳಸಲಾಗುತ್ತದೆ.

ಜನಸಂಖ್ಯೆ ವಿರುದ್ಧ ಮಾದರಿ: ಪ್ರತಿಯೊಂದನ್ನು ಯಾವಾಗ ಬಳಸಬೇಕು

ಪರಿಸ್ಥಿತಿ ಬಳಸಿ
ಗುಂಪಿನ ಪ್ರತಿಯೊಬ್ಬ ಸದಸ್ಯರಿಗೆ ನೀವು ಡೇಟಾವನ್ನು ಹೊಂದಿರುವಿರಿ ಜನಸಂಖ್ಯೆಯ ವ್ಯತ್ಯಾಸ (÷ N)
ನಿಮ್ಮ ಡೇಟಾವು ದೊಡ್ಡ ಗುಂಪಿನಿಂದ ಮಾದರಿಯಾಗಿದೆ ಮಾದರಿ ವ್ಯತ್ಯಾಸ (÷ n - 1)
ಇತರ ಅಂಕಿಅಂಶಗಳ ಪರೀಕ್ಷೆಗಳಿಗೆ ಹೋಲಿಸಿದರೆ ಸಾಮಾನ್ಯವಾಗಿ ಮಾದರಿ ವ್ಯತ್ಯಾಸ
ನಿಮ್ಮ ಡೇಟಾ ಸೆಟ್ ಸಂಪೂರ್ಣ ಚಿತ್ರವಾಗಿದೆ ಜನಸಂಖ್ಯೆಯ ವ್ಯತ್ಯಾಸ

ಸಂದೇಹವಿದ್ದಲ್ಲಿ, ಮಾದರಿ ವ್ಯತ್ಯಾಸವನ್ನು ಬಳಸಿ. ಹೆಚ್ಚಿನ ನೈಜ-ಪ್ರಪಂಚದ ಡೇಟಾಸೆಟ್‌ಗಳು ಮಾದರಿಗಳಾಗಿವೆ.

ನಾವು ವ್ಯತ್ಯಾಸಗಳನ್ನು ಏಕೆ ವರ್ಗ ಮಾಡುತ್ತೇವೆ

ನೀವು ಆಶ್ಚರ್ಯಪಡಬಹುದು: ಸರಾಸರಿಯಿಂದ ಕಚ್ಚಾ ವ್ಯತ್ಯಾಸಗಳನ್ನು ಏಕೆ ಸರಾಸರಿ ಮಾಡಬಾರದು?

ಸಮಸ್ಯೆಯೆಂದರೆ ಧನಾತ್ಮಕ ಮತ್ತು ಋಣಾತ್ಮಕ ವಿಚಲನಗಳು ರದ್ದುಗೊಳ್ಳುತ್ತವೆ. ಮೇಲಿನ ಡೇಟಾಸೆಟ್‌ಗಾಗಿ, ಕೆಲವು ಮೌಲ್ಯಗಳು ಸರಾಸರಿಗಿಂತ ಮೇಲಿವೆ ಮತ್ತು ಕೆಲವು ಕೆಳಗಿವೆ. ನೀವು ಸ್ಕ್ವೇರ್ ಮಾಡದೆಯೇ ಎಲ್ಲವನ್ನೂ ಸೇರಿಸಿದರೆ, ನೀವು ಯಾವಾಗಲೂ ಶೂನ್ಯವನ್ನು ಪಡೆಯುತ್ತೀರಿ.

ವರ್ಗೀಕರಣವು ನಕಾರಾತ್ಮಕ ಚಿಹ್ನೆಗಳನ್ನು ತೆಗೆದುಹಾಕುತ್ತದೆ, ಆದ್ದರಿಂದ ಎಲ್ಲಾ ವಿಚಲನಗಳು ಒಟ್ಟು ಹರಡುವಿಕೆಗೆ ಧನಾತ್ಮಕವಾಗಿ ಕೊಡುಗೆ ನೀಡುತ್ತವೆ.

ಪ್ರಾಯೋಗಿಕ ಅಪ್ಲಿಕೇಶನ್‌ಗಳು

ಹಣಕಾಸು: ಪೋರ್ಟ್‌ಫೋಲಿಯೊ ವ್ಯತ್ಯಾಸವು ಹೂಡಿಕೆಯ ಅಪಾಯವನ್ನು ಅಳೆಯುತ್ತದೆ. 0.04 ವ್ಯತ್ಯಾಸವನ್ನು ಹೊಂದಿರುವ ಪೋರ್ಟ್‌ಫೋಲಿಯೊವು 0.16 ವ್ಯತ್ಯಾಸವಿರುವ ಒಂದಕ್ಕಿಂತ ಕಡಿಮೆ ಅಪಾಯಕಾರಿಯಾಗಿದೆ - ಎರಡೂ ಒಂದೇ ರೀತಿಯ ನಿರೀಕ್ಷಿತ ಆದಾಯವನ್ನು ಹೊಂದಿದ್ದರೂ ಸಹ.

** ಗುಣಮಟ್ಟ ನಿಯಂತ್ರಣ:** ಕಡಿಮೆ ವ್ಯತ್ಯಾಸದೊಂದಿಗೆ ಉತ್ಪಾದನಾ ಪ್ರಕ್ರಿಯೆಯು ಹೆಚ್ಚು ಸ್ಥಿರವಾದ ಉತ್ಪಾದನೆಯನ್ನು ಉತ್ಪಾದಿಸುತ್ತದೆ. ಹೆಚ್ಚಿನ ವ್ಯತ್ಯಾಸ ಎಂದರೆ ಅನಿರೀಕ್ಷಿತ ಫಲಿತಾಂಶಗಳು.

ವಿಜ್ಞಾನ: ಪ್ರಯೋಗಗಳಲ್ಲಿ, ಪುನರಾವರ್ತಿತ ಅಳತೆಗಳ ನಡುವಿನ ಹೆಚ್ಚಿನ ವ್ಯತ್ಯಾಸವು ಮಾಪನ ದೋಷ ಅಥವಾ ಅನಿಯಂತ್ರಿತ ಅಸ್ಥಿರಗಳನ್ನು ಸೂಚಿಸುತ್ತದೆ.

ಕ್ರೀಡಾ ವಿಶ್ಲೇಷಣೆ: ಆಟಗಾರನು ಸ್ಥಿರವಾಗಿದೆಯೇ (ಕಡಿಮೆ ವ್ಯತ್ಯಾಸ) ಅಥವಾ ಸ್ಟ್ರೀಕಿ (ಹೆಚ್ಚಿನ ವ್ಯತ್ಯಾಸ) ಎಂಬುದನ್ನು ಆಟಗಾರರ ಕಾರ್ಯಕ್ಷಮತೆಯ ವ್ಯತ್ಯಾಸವು ನಿಮಗೆ ತಿಳಿಸುತ್ತದೆ.

ಸಾಮಾನ್ಯ ತಪ್ಪುಗಳು

** ಮಾದರಿಗಳಿಗಾಗಿ n - 1 ಬದಲಿಗೆ N ಅನ್ನು ಬಳಸುವುದು** - ಇದು ನಿಜವಾದ ಜನಸಂಖ್ಯೆಯ ವ್ಯತ್ಯಾಸವನ್ನು ಕಡಿಮೆ ಅಂದಾಜು ಮಾಡುತ್ತದೆ. ಮಾದರಿ ಡೇಟಾಕ್ಕಾಗಿ ಯಾವಾಗಲೂ n - 1 ಅನ್ನು ಬಳಸಿ.

ವರ್ಗವನ್ನು ಮರೆತುಬಿಡುವುದು - ವರ್ಗದ ವ್ಯತ್ಯಾಸಗಳಿಗಿಂತ ಕಚ್ಚಾ ವ್ಯತ್ಯಾಸಗಳನ್ನು ಸರಾಸರಿ ಮಾಡುವುದು ಸಾಮಾನ್ಯ ದೋಷವಾಗಿದೆ.

ಶ್ರೇಣಿಯೊಂದಿಗೆ ಗೊಂದಲಮಯ ವ್ಯತ್ಯಾಸ — ಶ್ರೇಣಿಯು ಸರಳವಾಗಿ ಗರಿಷ್ಠ ಮೈನಸ್ ಕನಿಷ್ಠವಾಗಿರುತ್ತದೆ. ಎಲ್ಲಾ ಡೇಟಾ ಪಾಯಿಂಟ್‌ಗಳಿಗೆ ವ್ಯತ್ಯಾಸ ಖಾತೆಗಳು, ಕೇವಲ ವಿಪರೀತಗಳಿಗೆ ಮಾತ್ರವಲ್ಲ.

ತ್ವರಿತ ಉಲ್ಲೇಖ

ಫಾರ್ಮುಲಾ ಯಾವಾಗ ಬಳಸಬೇಕು
ಕೋಡ್0 ಪೂರ್ಣ ಜನಸಂಖ್ಯೆ
ಕೋಡ್0 ಜನಸಂಖ್ಯೆಯಿಂದ ಮಾದರಿ
ಕೋಡ್0 ಪ್ರಮಾಣಿತ ವಿಚಲನವನ್ನು ಪಡೆಯಲು

ಮುಂದೆ ಓದಿ