পার্থক্য পরিমাপ করে যে সংখ্যার একটি সেট তাদের গড় থেকে কীভাবে ছড়িয়ে পড়ে। এটি পরিসংখ্যানের সবচেয়ে গুরুত্বপূর্ণ ধারণাগুলির মধ্যে একটি — বিনিয়োগের ঝুঁকি পরিমাপ করতে অর্থে ব্যবহৃত হয়, বিজ্ঞানে পরীক্ষামূলক ধারাবাহিকতা মূল্যায়ন করতে এবং দৈনন্দিন ডেটা বিশ্লেষণে।

ভ্যারিয়েন্স কি?

প্রকরণ হল গড় থেকে বর্গীয় পার্থক্যের গড়। একটি কম বৈচিত্র মানে ডেটা পয়েন্টগুলি গড়ের চারপাশে শক্তভাবে ক্লাস্টার। একটি উচ্চ পার্থক্য মানে তারা ব্যাপকভাবে ছড়িয়ে আছে।

দুই ধরনের আছে:

  • জনসংখ্যার ভিন্নতা (σ²) — ব্যবহৃত হয় যখন আপনার কাছে সমগ্র জনসংখ্যার ডেটা থাকে
  • স্যাম্পল ভ্যারিয়েন্স (s²) — ব্যবহৃত হয় যখন আপনার ডেটা একটি বৃহত্তর জনসংখ্যার নমুনা হয়

অনুশীলনে, আপনি প্রায় সবসময় নমুনা বৈচিত্র ব্যবহার করবেন।

ভ্যারিয়েন্স সূত্র

জনসংখ্যার ভিন্নতা

σ² = Σ(xᵢ - μ)² / N

কোথায়:

  • xᵢ = প্রতিটি ডেটা পয়েন্ট
  • μ = জনসংখ্যা মানে
  • N = ডেটা পয়েন্টের সংখ্যা

নমুনা বৈচিত্র

s² = Σ(xᵢ - x̄)² / (n - 1)

কোথায়:

  • x̄ = নমুনা গড়
  • n - 1 = স্বাধীনতার ডিগ্রি (বেসেলের সংশোধন)

নমুনা ভিন্নতার মধ্যে CODE0 এই সত্যের জন্য সংশোধন করে যে একটি নমুনা জনসংখ্যার প্রকৃত বিস্তারকে অবমূল্যায়ন করে।

ধাপে ধাপে উদাহরণ

ডেটাসেট: ৪, ৮, ৬, ৫, ৩, ২, ৮, ৯, ২, ৫

ধাপ 1: গড় গণনা করুন

Mean = (4 + 8 + 6 + 5 + 3 + 2 + 8 + 9 + 2 + 5) / 10
     = 52 / 10
     = 5.2

ধাপ 2: প্রতিটি মান থেকে গড় বিয়োগ করুন এবং ফলাফলটি বর্গ করুন

মান মান - গড় (মান − গড়)²
4 4 − 5.2 = −1.2 1.44
8 8 − 5.2 = 2.8 7.84
6 6 − 5.2 = 0.8 0.64
5 5 − 5.2 = −0.2 0.04
3 3 − 5.2 = −2.2 4.84
2 2 − 5.2 = −3.2 10.24
8 8 − 5.2 = 2.8 7.84
9 9 − 5.2 = 3.8 14.44
2 2 − 5.2 = −3.2 10.24
5 5 − 5.2 = −0.2 0.04

ধাপ 3: বর্গক্ষেত্র পার্থক্য যোগ করুন

Σ(xᵢ − x̄)² = 1.44 + 7.84 + 0.64 + 0.04 + 4.84 + 10.24 + 7.84 + 14.44 + 10.24 + 0.04
             = 57.6

ধাপ 4: n − 1 দ্বারা ভাগ করুন (নমুনা প্রকরণ)

s² = 57.6 / (10 − 1) = 57.6 / 9 = 6.4

নমুনার পার্থক্য হল 6.4

পার্থক্য বনাম স্ট্যান্ডার্ড বিচ্যুতি

আদর্শ বিচ্যুতি হল প্রকরণের বর্গমূল:

s = √s² = √6.4 ≈ 2.53

স্ট্যান্ডার্ড বিচ্যুতি মূল ডেটার মতো একই ইউনিটে প্রকাশ করা হয়, এটি ব্যাখ্যা করা সহজ করে তোলে। যদি আপনার ডেটা কিলোগ্রামে হয়, তবে মানক বিচ্যুতি কিলোগ্রামে হয়। পার্থক্য কিলোগ্রাম² এ। এই কারণেই প্রমিত বিচ্যুতি আরও সাধারণভাবে রিপোর্ট করা হয় — কিন্তু বৈচিত্র অনেক পরিসংখ্যানগত গণনায় ব্যবহৃত হয়।

জনসংখ্যা বনাম নমুনা: কখন প্রতিটি ব্যবহার করবেন

পরিস্থিতি ব্যবহার করুন
গ্রুপের প্রত্যেক সদস্যের জন্য আপনার কাছে ডেটা আছে জনসংখ্যার ভিন্নতা (÷ N)
আপনার ডেটা একটি বড় গ্রুপ থেকে একটি নমুনা নমুনা বৈচিত্র্য (÷ n − 1)
অন্যান্য পরিসংখ্যানগত পরীক্ষার সাথে তুলনা করা সাধারণত নমুনা বৈচিত্র
আপনার ডেটাসেট সম্পূর্ণ ছবি জনসংখ্যার বৈচিত্র্য

যখন সন্দেহ হয়, নমুনা ভিন্নতা ব্যবহার করুন। বেশিরভাগ বাস্তব-বিশ্ব ডেটাসেট নমুনা।

কেন আমরা পার্থক্য বর্গ

আপনি ভাবতে পারেন: কেন শুধু গড় থেকে কাঁচা পার্থক্য গড় করবেন না?

সমস্যা হল যে ইতিবাচক এবং নেতিবাচক বিচ্যুতিগুলি বাতিল হয়ে যায়। উপরের ডেটাসেটের জন্য, কিছু মান গড় থেকে উপরে এবং কিছু নীচে। আপনি যদি বর্গক্ষেত্র ছাড়াই সেগুলিকে যোগ করেন, আপনি সর্বদা শূন্য পাবেন।

স্কোয়ারিং নেতিবাচক লক্ষণগুলিকে সরিয়ে দেয়, তাই সমস্ত বিচ্যুতি মোট বিস্তারে ইতিবাচকভাবে অবদান রাখে।

ব্যবহারিক অ্যাপ্লিকেশন

অর্থ: পোর্টফোলিও বৈচিত্র্য বিনিয়োগ ঝুঁকি পরিমাপ করে। 0.04 ভেরিয়েন্স সহ একটি পোর্টফোলিও 0.16 এর ভ্যারিয়েন্স সহ একটির চেয়ে কম ঝুঁকিপূর্ণ — এমনকি উভয়ের একই প্রত্যাশিত রিটার্ন থাকলেও।

মান নিয়ন্ত্রণ: কম বৈচিত্র সহ একটি উত্পাদন প্রক্রিয়া আরও সামঞ্জস্যপূর্ণ আউটপুট তৈরি করে। উচ্চ বৈচিত্র মানে অপ্রত্যাশিত ফলাফল।

বিজ্ঞান: পরীক্ষায়, পুনরাবৃত্ত পরিমাপের মধ্যে উচ্চ পার্থক্য পরিমাপের ত্রুটি বা অনিয়ন্ত্রিত ভেরিয়েবলের পরামর্শ দেয়।

স্পোর্টস অ্যানালিটিক্স: প্লেয়ারের পারফরম্যান্সের বৈচিত্র্য আপনাকে বলে যে একজন খেলোয়াড় সামঞ্জস্যপূর্ণ (নিম্ন বৈচিত্র্য) নাকি স্ট্রীকি (উচ্চ বৈচিত্র্য)।

সাধারণ ভুল

নমুনার জন্য n − 1 এর পরিবর্তে N ব্যবহার করা — এটি প্রকৃত জনসংখ্যার বৈচিত্রকে অবমূল্যায়ন করে। নমুনা ডেটার জন্য সর্বদা n − 1 ব্যবহার করুন।

বর্গক্ষেত্রে ভুলে যাওয়া — একটি সাধারণ ত্রুটি হল বর্গীয় পার্থক্যের পরিবর্তে কাঁচা পার্থক্যের গড়।

পরিসীমার সাথে বিভ্রান্তিকর প্রকরণ — ব্যাপ্তি হল সর্বাধিক বিয়োগ সর্বনিম্ন। ভ্যারিয়েন্স সমস্ত ডেটা পয়েন্টের জন্য দায়ী, শুধুমাত্র চরম নয়।

দ্রুত রেফারেন্স

সূত্র কখন ব্যবহার করতে হবে
CODE0 পূর্ণ জনসংখ্যা
CODE0 জনসংখ্যা থেকে নমুনা
CODE0 মান বিচ্যুতি পেতে

পরবর্তী পড়ুন