নতুনদের জন্য পরিসংখ্যান: গড়, SD, হাইপোথিসিস পরীক্ষা এবং আরও অনেক কিছু

পরিসংখ্যান হল অনিশ্চয়তার ভাষা — এমন একটি টুল যা আমাদের অসম্পূর্ণ তথ্য থেকে উপসংহার আঁকতে দেয়। আপনি একটি নিউজ পোল পড়ছেন, একটি ক্লিনিকাল ট্রায়ালের ফলাফল ব্যাখ্যা করছেন বা আপনার নিজের ডেটা বিশ্লেষণ করছেন, এই মূল ধারণাগুলি বোঝা আপনাকে আরও বেশি সমালোচনামূলক পাঠক করে তুলবে।

বর্ণনামূলক পরিসংখ্যান: ডেটা সংক্ষিপ্তকরণ

আপনি ডেটা বিশ্লেষণ করার আগে, আপনাকে এটি বর্ণনা করতে হবে। মূল পরিমাপগুলি হল কেন্দ্রীয় প্রবণতা (মাঝখানে কোথায়?) এবং স্প্রেড (ডেটা কতটা পরিবর্তনশীল?)।

গড়, মধ্যমা এবং মোড

পাটিগণিত গড় হল গণনা দ্বারা ভাগ করা যোগফল। এটি সবচেয়ে পরিচিত গড় কিন্তু বহিরাগতদের জন্য অত্যন্ত সংবেদনশীল।

ডেটা সাজানোর সময় মিডিয়ান হল মধ্যম মান। এটি আরও শক্তিশালী - একটি একক চরম মান এটিকে খুব বেশি সরাতে পারে না।

মোড হল সবচেয়ে ঘন ঘন মান। সুনির্দিষ্ট তথ্যের জন্য দরকারী; ক্রমাগত পরিমাপের জন্য কম দরকারী।

ডেটাসেট	মানে	মাঝামাঝি	মোড
2, 4, 4, 6, 8	4.8	4	4
2, 4, 4, 6, 100	23.2	4	4

লক্ষ্য করুন কিভাবে একটি চরম মান (100) নাটকীয়ভাবে গড় পরিবর্তন করে কিন্তু মধ্যকে অস্পৃশ্য রাখে। এই কারণেই বাড়ির দামের পরিসংখ্যান মধ্যম ব্যবহার করে — মুষ্টিমেয় মাল্টি-মিলিয়ন-পাউন্ড ম্যানশন গড় দামকে বিভ্রান্তিকর করে তুলবে।

স্ট্যান্ডার্ড ডেভিয়েশন এবং ভ্যারিয়েন্স

ভ্যারিয়েন্স গড় থেকে গড় বর্গ বিচ্যুতি পরিমাপ করে:

σ² = Σ(xi - x̄)² / n

প্রমিত বিচ্যুতি হল প্রকরণের বর্গমূল — এটি মূল ডেটার মতো একই ইউনিটে, যা এটিকে ব্যাখ্যাযোগ্য করে তোলে:

σ = √[Σ(xi - x̄)² / n]

সাধারণত বিতরণ করা ডেটার জন্য 68-95-99.7 নিয়ম:

মানগুলির 68% গড় 1 আদর্শ বিচ্যুতির মধ্যে পড়ে
95% 2 স্ট্যান্ডার্ড বিচ্যুতির মধ্যে
3টি আদর্শ বিচ্যুতির মধ্যে 99.7%

দ্রষ্টব্য: জনসংখ্যার মান বিচ্যুতির জন্য হর-এ n ব্যবহার করুন; একটি নমুনা অনুমানের জন্য n−1 ব্যবহার করুন (এটিকে বেসেলের সংশোধন বলা হয় এবং নমুনার সাথে ঘটে যাওয়া সামান্য অবমূল্যায়নের জন্য সংশোধন করে)।

সাধারণ বিতরণ

স্বাভাবিক (গাউসিয়ান) বণ্টন হল ঘণ্টা-আকৃতির বক্ররেখা যা প্রকৃতি এবং পরিসংখ্যানের সর্বত্র দেখা যায়। এটি সম্পূর্ণরূপে দুটি প্যারামিটার দ্বারা বর্ণনা করা হয়েছে: গড় (μ) এবং আদর্শ বিচ্যুতি (σ)।

z-স্কোর যেকোন মানকে "গড় থেকে কত প্রমিত বিচ্যুতি" এ রূপান্তরিত করে:

z = (x - μ) / σ

1.96-এর একটি z-স্কোর 97.5 তম পার্সেন্টাইলের সাথে মিলে যায় - যে মানটির উপরে বন্টনের মাত্র 2.5% থাকে। আত্মবিশ্বাসের ব্যবধানের কারণে এটি পরিসংখ্যানে ক্রমাগত প্রদর্শিত হয়।

কেন্দ্রীয় সীমা উপপাদ্য কেন স্বাভাবিক বন্টন এত গুরুত্বপূর্ণ: মূল জনসংখ্যার আকৃতি নির্বিশেষে, নমুনার বন্টন মানে নমুনার আকার বৃদ্ধির সাথে সাথে স্বাভাবিকতার দিকে এগিয়ে যায়। এই কারণেই অনেক পরিসংখ্যানগত পরীক্ষা স্বাভাবিকতা ধরে নেয় এমনকি যখন কাঁচা ডেটা সাধারণত বিতরণ করা হয় না।

আত্মবিশ্বাসের ব্যবধান

একটি 95% আত্মবিশ্বাসের ব্যবধানের অর্থ এই নয় যে "এই পরিসরে প্রকৃত মানটির 95% সম্ভাবনা রয়েছে।" এর অর্থ হল: "যদি আমরা এই নমুনা প্রক্রিয়াটি বহুবার পুনরাবৃত্তি করি, আমরা গণনা করেছি 95% ব্যবধানে প্রকৃত মান থাকবে।"

n আকারের নমুনা থেকে p অনুপাতের জন্য:

CI = p ± z × √(p(1-p)/n)

95% আত্মবিশ্বাসের জন্য, z = 1.96। 99% এর জন্য, z = 2.576।

ত্রুটির মার্জিন শুধুমাত্র ± অংশ: z × √(p(1-p)/n)। যখন একটি পোল "±3 শতাংশ পয়েন্ট" রিপোর্ট করে, এটি ত্রুটির মার্জিন।

হাইপোথিসিস টেস্টিং

প্রতিটি অনুমান পরীক্ষা একই কাঠামো অনুসরণ করে:

H₀ (নাল হাইপোথিসিস): ডিফল্ট — সাধারণত "কোন প্রভাব নেই," "কোন পার্থক্য নেই," "কোন সম্পর্ক নেই"
H₁ (বিকল্প অনুমান): আপনি কি প্রমাণ দেখানোর চেষ্টা করছেন
পরীক্ষার পরিসংখ্যান: ডেটা থেকে গণনা করা একটি সংখ্যা যা পরিমাপ করে যে ডেটা H₀ থেকে কত দূরে
p-মান: H₀ সত্য হলে অন্তত এই চরম ফলাফল পর্যবেক্ষণের সম্ভাবনা

পি-মান ব্যাখ্যা করা হয়েছে

0.03 এর একটি p-মান মানে: "যদি সত্যিই কোন প্রভাব না থাকে, তাহলে আমরা সুযোগের মাত্র 3% সময় এই চরম ডেটা দেখতে পেতাম।" এটি সাধারণত H₀ প্রত্যাখ্যান করার জন্য যথেষ্ট গুরুত্বপূর্ণ বলে বিবেচিত হয়।

কি পি < 0.05 এর মানে এই নয়:

এর মানে এই নয় যে প্রভাবটি বাস্তব হওয়ার 95% সম্ভাবনা রয়েছে
এর অর্থ এই নয় যে প্রভাবটি কার্যত গুরুত্বপূর্ণ
এর মানে এই নয় যে H₀ মিথ্যা

টাইপ I এবং টাইপ II ত্রুটি:

	H₀ সত্য	H₀ মিথ্যা
প্রত্যাখ্যান H₀	টাইপ I ত্রুটি (মিথ্যা ইতিবাচক)	সঠিক
H₀ প্রত্যাখ্যান করতে ব্যর্থ	সঠিক	টাইপ II ত্রুটি (মিথ্যা নেতিবাচক)

α (তাৎপর্য স্তর) = টাইপ I ত্রুটির হার, সাধারণত 0.05 β = টাইপ II ত্রুটি হার; শক্তি = 1 − β, সাধারণত 0.80 টার্গেট করা হয়

টি-টেস্ট

টি-পরীক্ষা গোষ্ঠীর মধ্যে অর্থ তুলনা করে। দুই-নমুনা টি-পরিসংখ্যান হল:

t = (x̄₁ - x̄₂) / √(s₁²/n₁ + s₂²/n₂)

একটি বড় |t| মানে গ্রুপের মধ্যে পরিবর্তনশীলতার তুলনায় গোষ্ঠীগুলি অনেক দূরে। স্বাধীনতার উপযুক্ত ডিগ্রির সাথে একটি সমালোচনামূলক মান (বা p-মান গণনা) তুলনা করুন।

কখন এটি ব্যবহার করবেন: স্বতন্ত্র গোষ্ঠী থেকে দুটি উপায়ের তুলনা করা, যখন ডেটা প্রায় স্বাভাবিক বা n > 30।

পারস্পরিক সম্পর্ক

পিয়ারসনের আর দুটি ভেরিয়েবলের মধ্যে রৈখিক সম্পর্কের শক্তি পরিমাপ করে:

r = +1: নিখুঁত ইতিবাচক রৈখিক সম্পর্ক
r = 0: কোন রৈখিক সম্পর্ক নেই
r = −1: নিখুঁত নেতিবাচক রৈখিক সম্পর্ক

r = Σ(xi - x̄)(yi - ȳ) / √[Σ(xi - x̄)² × Σ(yi - ȳ)²]

R² (r বর্গাকার) আপনাকে X দ্বারা ব্যাখ্যা করা Y-তে প্রকরণের অনুপাত বলে। যদি r = 0.7 হয়, তাহলে R² = 0.49 — X ব্যাখ্যা করে Y-তে পরিবর্তনশীলতার 49%।

স্পিয়ারম্যানের ρ (rho) একই কাজ করে কিন্তু কাঁচা মানের পরিবর্তে র‌্যাঙ্ক ব্যবহার করে, এটি বহিরাগতদের কাছে শক্তিশালী এবং অর্ডিনাল ডেটার জন্য উপযুক্ত করে তোলে।

মনে রাখবেন: পারস্পরিক সম্পর্ক ≠ কারণ। আইসক্রিম বিক্রি এবং ডুবে যাওয়ার হার দৃঢ়ভাবে সম্পর্কযুক্ত (উভয়ই গ্রীষ্মে সর্বোচ্চ), কিন্তু আইসক্রিম ডুবে যাওয়ার কারণ হয় না।

ইফেক্ট সাইজ

পরিসংখ্যানগত তাৎপর্য আপনাকে বলে একটি প্রভাব বাস্তব কিনা; প্রভাব আকার আপনাকে বলে যে এটি কত বড়। দুটি অর্থ তুলনা করার জন্য কোহেনের ডি:

d = (μ₁ - μ₂) / σ_pooled

কোহেনের ডি	ব্যাখ্যা
0.2	ছোট
0.5	মাঝারি
0.8	বড়

d = 0.1 সহ একটি অত্যন্ত তাৎপর্যপূর্ণ p-মান মানে আপনি একটি বাস্তব কিন্তু তুচ্ছভাবে ছোট প্রভাব শনাক্ত করেছেন — সম্ভবত আপনার নমুনাটি বিশাল ছিল। সর্বদা p-মানগুলির পাশাপাশি প্রভাবের আকারগুলি রিপোর্ট করুন৷

চি-স্কয়ার টেস্ট

চি-স্কোয়ার (χ²) পরীক্ষা জিজ্ঞাসা করে: "পর্যবেক্ষিত গণনাগুলি কি সুযোগ দ্বারা আমরা যা আশা করি তার থেকে আলাদা?"

χ² = Σ (Observed - Expected)² / Expected

যখন আপনার ডেটা শ্রেণীবদ্ধ হয় তখন এটি ব্যবহার করুন - উদাহরণস্বরূপ, একটি ডাই ন্যায্য কিনা তা পরীক্ষা করা, বা চিকিত্সার ফলাফল চিকিত্সা গোষ্ঠীর থেকে স্বাধীন কিনা।

সঠিক পরীক্ষা নির্বাচন করা

পরিস্থিতি	পরীক্ষা
একটি পরিচিত মান একটি গড় তুলনা	এক-নমুনা টি-পরীক্ষা
দুটি স্বাধীন উপায় তুলনা করুন	দুই-নমুনা টি-পরীক্ষা
দুটি জোড়ার উপায় তুলনা করুন	পেয়ার করা টি-পরীক্ষা
3+ মানে তুলনা করুন	আনোভা
3+ মানে তুলনা করুন (অ-স্বাভাবিক)	ক্রুস্কাল-ওয়ালিস
দুটি অবিচ্ছিন্ন ভেরিয়েবলের মধ্যে সংযোগ	পিয়ারসন/স্পিয়ারম্যান পারস্পরিক সম্পর্ক
শ্রেণীগত অনুপাত তুলনা	চি-স্কয়ার
দুটি দল, অ-স্বাভাবিক বিতরণ	মান-হুইটনি ইউ

সাধারণ ভুল

পিকিং: বারবার আপনার পরীক্ষা চালানো এবং যখন p < 0.05 টাইপ I এরর নাটকীয়ভাবে স্ফীত করে। ডেটা সংগ্রহ করার আগে আপনার নমুনার আকার পরিকল্পনা করুন।

একাধিক তুলনা: α = 0.05 এ 20টি স্বাধীন পরীক্ষা চালালে গড়ে একটি মিথ্যা পজিটিভ তৈরি হবে। Bonferroni সংশোধন ব্যবহার করুন বা মিথ্যা আবিষ্কার হার নিয়ন্ত্রণ.

অনুমান উপেক্ষা করা: বেশিরভাগ পরীক্ষায় এলোমেলো নমুনা, পর্যবেক্ষণের স্বাধীনতা এবং (টি-পরীক্ষার জন্য) আনুমানিক স্বাভাবিকতা অনুমান করা হয়। এগুলি লঙ্ঘন করা ফলাফলগুলিকে হ্রাস করে।

আমাদের Z-স্কোর ক্যালকুলেটর, নমুনা সাইজ ক্যালকুলেটর, t-Test Calculator, এবং Corelation Calculator ব্যবহার করুন তথ্য