يقيس التباين مدى انتشار مجموعة من الأرقام من وسطها. إنه أحد أهم المفاهيم في مجال الإحصاء - يُستخدم في التمويل لقياس مخاطر الاستثمار، وفي العلوم لتقييم الاتساق التجريبي، وفي تحليل البيانات اليومية.

ما هو التباين؟

التباين هو متوسط ​​مربعات الفروق عن المتوسط. ويعني التباين المنخفض أن نقاط البيانات تتجمع بإحكام حول المتوسط. ويعني التباين العالي أنها منتشرة على نطاق واسع.

هناك نوعان:

  • التباين السكاني (σ²) — يُستخدم عندما تكون لديك بيانات لجميع السكان
  • تباين العينة (s²) — يُستخدم عندما تكون بياناتك عينة من مجموعة أكبر من السكان

من الناحية العملية، ستستخدم دائمًا تباين العينة.

صيغة التباين

التباين السكاني

σ² = Σ(xᵢ - μ)² / N

أين:

  • xᵢ = كل نقطة بيانات
  • μ = متوسط ​​عدد السكان
  • N = عدد نقاط البيانات

تباين العينة

s² = Σ(xᵢ - x̄)² / (n - 1)

أين:

  • x̄ = متوسط ​​العينة
  • ن - 1 = درجات الحرية (تصحيح بيسل)

يصحح CODE0 في تباين العينة حقيقة أن العينة تميل إلى التقليل من تقدير الانتشار الحقيقي للسكان.

مثال خطوة بخطوة

مجموعة البيانات: 4، 8، 6، 5، 3، 2، 8، 9، 2، 5

الخطوة 1: حساب المتوسط

Mean = (4 + 8 + 6 + 5 + 3 + 2 + 8 + 9 + 2 + 5) / 10
     = 52 / 10
     = 5.2

الخطوة 2: اطرح المتوسط ​​من كل قيمة وقم بتربيع النتيجة

قيمة القيمة - المتوسط (القيمة - المتوسط)²
4 4 − 5.2 = −1.2 1.44
8 8 - 5.2 = 2.8 7.84
6 6 - 5.2 = 0.8 0.64
5 5 − 5.2 = −0.2 0.04
3 3 − 5.2 = −2.2 4.84
2 2 − 5.2 = −3.2 10.24
8 8 - 5.2 = 2.8 7.84
9 9 − 5.2 = 3.8 14.44
2 2 − 5.2 = −3.2 10.24
5 5 − 5.2 = −0.2 0.04

الخطوة 3: جمع الفروق التربيعية

Σ(xᵢ − x̄)² = 1.44 + 7.84 + 0.64 + 0.04 + 4.84 + 10.24 + 7.84 + 14.44 + 10.24 + 0.04
             = 57.6

الخطوة 4: القسمة على n − 1 (تباين العينة)

s² = 57.6 / (10 − 1) = 57.6 / 9 = 6.4

تباين العينة هو 6.4.

التباين مقابل الانحراف المعياري

الانحراف المعياري هو ببساطة الجذر التربيعي للتباين:

s = √s² = √6.4 ≈ 2.53

يتم التعبير عن الانحراف المعياري بنفس وحدات البيانات الأصلية، مما يسهل تفسيره. إذا كانت بياناتك بالكيلو جرام، يكون الانحراف المعياري بالكيلو جرام. التباين بالكيلو جرام². ولهذا السبب يتم الإبلاغ عن الانحراف المعياري بشكل أكثر شيوعًا، ولكن يتم استخدام التباين في العديد من الحسابات الإحصائية.

السكان مقابل العينة: متى يجب استخدام كل منهما

الموقف يستخدم
لديك بيانات لكل عضو في المجموعة التباين السكاني (÷ N)
بياناتك هي عينة من مجموعة أكبر تباين العينة (÷ n - 1)
المقارنة مع الاختبارات الإحصائية الأخرى عادة تباين العينة
مجموعة البيانات الخاصة بك هي الصورة الكاملة التباين السكاني

في حالة الشك، استخدم تباين العينة. معظم مجموعات البيانات الواقعية عبارة عن عينات.

لماذا نقوم بتربيع الاختلافات

قد تتساءل: لماذا لا نكتفي بمتوسط ​​الفروق الأولية عن المتوسط؟

المشكلة هي أن الانحرافات الإيجابية والسلبية تلغي. بالنسبة لمجموعة البيانات أعلاه، تكون بعض القيم أعلى من المتوسط ​​وبعضها أقل. إذا قمت بجمعها كلها بدون تربيع، فستحصل دائمًا على صفر.

يؤدي التربيع إلى إزالة الإشارات السلبية، وبالتالي فإن جميع الانحرافات تساهم بشكل إيجابي في إجمالي الانتشار.

تطبيقات عملية

التمويل: يقيس تباين المحفظة مخاطر الاستثمار. تعتبر المحفظة ذات التباين 0.04 أقل خطورة من المحفظة ذات التباين 0.16 - حتى لو كان لكل منهما نفس العائد المتوقع.

مراقبة الجودة: تنتج عملية التصنيع ذات التباين المنخفض مخرجات أكثر اتساقًا. التباين العالي يعني نتائج غير متوقعة.

العلوم: في التجارب، يشير التباين الكبير بين القياسات المتكررة إلى وجود خطأ في القياس أو وجود متغيرات غير منضبطة.

التحليلات الرياضية: يخبرك تباين أداء اللاعب بما إذا كان اللاعب ثابتًا (تباين منخفض) أو متقلب (تباين عالٍ).

##أخطاء شائعة

استخدام N بدلاً من n − 1 للعينات — هذا يقلل من التباين السكاني الحقيقي. استخدم دائمًا n − 1 لعينة البيانات.

نسيان التربيع — من الأخطاء الشائعة حساب متوسط ​​الفروق الأولية بدلاً من الفروقات المربعة.

التباين المربك مع النطاق — النطاق هو ببساطة الحد الأقصى ناقص الحد الأدنى. يمثل التباين جميع نقاط البيانات، وليس فقط الحدود المتطرفة.

مرجع سريع

صيغة متى تستخدم
الكود0 كامل السكان
الكود0 عينة من السكان
الكود0 للحصول على الانحراف المعياري

اقرأ التالي