পরিসংখ্যান হল অনিশ্চয়তার ভাষা — এমন একটি টুল যা আমাদের অসম্পূর্ণ তথ্য থেকে উপসংহার আঁকতে দেয়। আপনি একটি নিউজ পোল পড়ছেন, একটি ক্লিনিকাল ট্রায়ালের ফলাফল ব্যাখ্যা করছেন বা আপনার নিজের ডেটা বিশ্লেষণ করছেন, এই মূল ধারণাগুলি বোঝা আপনাকে আরও বেশি সমালোচনামূলক পাঠক করে তুলবে।
বর্ণনামূলক পরিসংখ্যান: ডেটা সংক্ষিপ্তকরণ
আপনি ডেটা বিশ্লেষণ করার আগে, আপনাকে এটি বর্ণনা করতে হবে। মূল পরিমাপগুলি হল কেন্দ্রীয় প্রবণতা (মাঝখানে কোথায়?) এবং স্প্রেড (ডেটা কতটা পরিবর্তনশীল?)।
গড়, মধ্যমা এবং মোড
পাটিগণিত গড় হল গণনা দ্বারা ভাগ করা যোগফল। এটি সবচেয়ে পরিচিত গড় কিন্তু বহিরাগতদের জন্য অত্যন্ত সংবেদনশীল।
ডেটা সাজানোর সময় মিডিয়ান হল মধ্যম মান। এটি আরও শক্তিশালী - একটি একক চরম মান এটিকে খুব বেশি সরাতে পারে না।
মোড হল সবচেয়ে ঘন ঘন মান। সুনির্দিষ্ট তথ্যের জন্য দরকারী; ক্রমাগত পরিমাপের জন্য কম দরকারী।
| ডেটাসেট | মানে | মাঝামাঝি | মোড |
|---|---|---|---|
| 2, 4, 4, 6, 8 | 4.8 | 4 | 4 |
| 2, 4, 4, 6, 100 | 23.2 | 4 | 4 |
লক্ষ্য করুন কিভাবে একটি চরম মান (100) নাটকীয়ভাবে গড় পরিবর্তন করে কিন্তু মধ্যকে অস্পৃশ্য রাখে। এই কারণেই বাড়ির দামের পরিসংখ্যান মধ্যম ব্যবহার করে — মুষ্টিমেয় মাল্টি-মিলিয়ন-পাউন্ড ম্যানশন গড় দামকে বিভ্রান্তিকর করে তুলবে।
স্ট্যান্ডার্ড ডেভিয়েশন এবং ভ্যারিয়েন্স
ভ্যারিয়েন্স গড় থেকে গড় বর্গ বিচ্যুতি পরিমাপ করে:
σ² = Σ(xi - x̄)² / n
প্রমিত বিচ্যুতি হল প্রকরণের বর্গমূল — এটি মূল ডেটার মতো একই ইউনিটে, যা এটিকে ব্যাখ্যাযোগ্য করে তোলে:
σ = √[Σ(xi - x̄)² / n]
সাধারণত বিতরণ করা ডেটার জন্য 68-95-99.7 নিয়ম:
- মানগুলির 68% গড় 1 আদর্শ বিচ্যুতির মধ্যে পড়ে
- 95% 2 স্ট্যান্ডার্ড বিচ্যুতির মধ্যে
- 3টি আদর্শ বিচ্যুতির মধ্যে 99.7%
দ্রষ্টব্য: জনসংখ্যার মান বিচ্যুতির জন্য হর-এ n ব্যবহার করুন; একটি নমুনা অনুমানের জন্য n−1 ব্যবহার করুন (এটিকে বেসেলের সংশোধন বলা হয় এবং নমুনার সাথে ঘটে যাওয়া সামান্য অবমূল্যায়নের জন্য সংশোধন করে)।
সাধারণ বিতরণ
স্বাভাবিক (গাউসিয়ান) বণ্টন হল ঘণ্টা-আকৃতির বক্ররেখা যা প্রকৃতি এবং পরিসংখ্যানের সর্বত্র দেখা যায়। এটি সম্পূর্ণরূপে দুটি প্যারামিটার দ্বারা বর্ণনা করা হয়েছে: গড় (μ) এবং আদর্শ বিচ্যুতি (σ)।
z-স্কোর যেকোন মানকে "গড় থেকে কত প্রমিত বিচ্যুতি" এ রূপান্তরিত করে:
z = (x - μ) / σ
1.96-এর একটি z-স্কোর 97.5 তম পার্সেন্টাইলের সাথে মিলে যায় - যে মানটির উপরে বন্টনের মাত্র 2.5% থাকে। আত্মবিশ্বাসের ব্যবধানের কারণে এটি পরিসংখ্যানে ক্রমাগত প্রদর্শিত হয়।
কেন্দ্রীয় সীমা উপপাদ্য কেন স্বাভাবিক বন্টন এত গুরুত্বপূর্ণ: মূল জনসংখ্যার আকৃতি নির্বিশেষে, নমুনার বন্টন মানে নমুনার আকার বৃদ্ধির সাথে সাথে স্বাভাবিকতার দিকে এগিয়ে যায়। এই কারণেই অনেক পরিসংখ্যানগত পরীক্ষা স্বাভাবিকতা ধরে নেয় এমনকি যখন কাঁচা ডেটা সাধারণত বিতরণ করা হয় না।
আত্মবিশ্বাসের ব্যবধান
একটি 95% আত্মবিশ্বাসের ব্যবধানের অর্থ এই নয় যে "এই পরিসরে প্রকৃত মানটির 95% সম্ভাবনা রয়েছে।" এর অর্থ হল: "যদি আমরা এই নমুনা প্রক্রিয়াটি বহুবার পুনরাবৃত্তি করি, আমরা গণনা করেছি 95% ব্যবধানে প্রকৃত মান থাকবে।"
n আকারের নমুনা থেকে p অনুপাতের জন্য:
CI = p ± z × √(p(1-p)/n)
95% আত্মবিশ্বাসের জন্য, z = 1.96। 99% এর জন্য, z = 2.576।
ত্রুটির মার্জিন শুধুমাত্র ± অংশ: z × √(p(1-p)/n)। যখন একটি পোল "±3 শতাংশ পয়েন্ট" রিপোর্ট করে, এটি ত্রুটির মার্জিন।
হাইপোথিসিস টেস্টিং
প্রতিটি অনুমান পরীক্ষা একই কাঠামো অনুসরণ করে:
- H₀ (নাল হাইপোথিসিস): ডিফল্ট — সাধারণত "কোন প্রভাব নেই," "কোন পার্থক্য নেই," "কোন সম্পর্ক নেই"
- H₁ (বিকল্প অনুমান): আপনি কি প্রমাণ দেখানোর চেষ্টা করছেন
- পরীক্ষার পরিসংখ্যান: ডেটা থেকে গণনা করা একটি সংখ্যা যা পরিমাপ করে যে ডেটা H₀ থেকে কত দূরে
- p-মান: H₀ সত্য হলে অন্তত এই চরম ফলাফল পর্যবেক্ষণের সম্ভাবনা
পি-মান ব্যাখ্যা করা হয়েছে
0.03 এর একটি p-মান মানে: "যদি সত্যিই কোন প্রভাব না থাকে, তাহলে আমরা সুযোগের মাত্র 3% সময় এই চরম ডেটা দেখতে পেতাম।" এটি সাধারণত H₀ প্রত্যাখ্যান করার জন্য যথেষ্ট গুরুত্বপূর্ণ বলে বিবেচিত হয়।
কি পি < 0.05 এর মানে এই নয়:
- এর মানে এই নয় যে প্রভাবটি বাস্তব হওয়ার 95% সম্ভাবনা রয়েছে
- এর অর্থ এই নয় যে প্রভাবটি কার্যত গুরুত্বপূর্ণ
- এর মানে এই নয় যে H₀ মিথ্যা
টাইপ I এবং টাইপ II ত্রুটি:
| H₀ সত্য | H₀ মিথ্যা | |
|---|---|---|
| ** প্রত্যাখ্যান H₀** | টাইপ I ত্রুটি (মিথ্যা ইতিবাচক) | সঠিক |
| ** H₀** প্রত্যাখ্যান করতে ব্যর্থ | সঠিক | টাইপ II ত্রুটি (মিথ্যা নেতিবাচক) |
α (তাৎপর্য স্তর) = টাইপ I ত্রুটির হার, সাধারণত 0.05 β = টাইপ II ত্রুটি হার; শক্তি = 1 − β, সাধারণত 0.80 টার্গেট করা হয়
টি-টেস্ট
টি-পরীক্ষা গোষ্ঠীর মধ্যে অর্থ তুলনা করে। দুই-নমুনা টি-পরিসংখ্যান হল:
t = (x̄₁ - x̄₂) / √(s₁²/n₁ + s₂²/n₂)
একটি বড় |t| মানে গ্রুপের মধ্যে পরিবর্তনশীলতার তুলনায় গোষ্ঠীগুলি অনেক দূরে। স্বাধীনতার উপযুক্ত ডিগ্রির সাথে একটি সমালোচনামূলক মান (বা p-মান গণনা) তুলনা করুন।
কখন এটি ব্যবহার করবেন: স্বতন্ত্র গোষ্ঠী থেকে দুটি উপায়ের তুলনা করা, যখন ডেটা প্রায় স্বাভাবিক বা n > 30।
পারস্পরিক সম্পর্ক
পিয়ারসনের আর দুটি ভেরিয়েবলের মধ্যে রৈখিক সম্পর্কের শক্তি পরিমাপ করে:
- r = +1: নিখুঁত ইতিবাচক রৈখিক সম্পর্ক
- r = 0: কোন রৈখিক সম্পর্ক নেই
- r = −1: নিখুঁত নেতিবাচক রৈখিক সম্পর্ক
r = Σ(xi - x̄)(yi - ȳ) / √[Σ(xi - x̄)² × Σ(yi - ȳ)²]
R² (r বর্গাকার) আপনাকে X দ্বারা ব্যাখ্যা করা Y-তে প্রকরণের অনুপাত বলে। যদি r = 0.7 হয়, তাহলে R² = 0.49 — X ব্যাখ্যা করে Y-তে পরিবর্তনশীলতার 49%।
স্পিয়ারম্যানের ρ (rho) একই কাজ করে কিন্তু কাঁচা মানের পরিবর্তে র্যাঙ্ক ব্যবহার করে, এটি বহিরাগতদের কাছে শক্তিশালী এবং অর্ডিনাল ডেটার জন্য উপযুক্ত করে তোলে।
মনে রাখবেন: পারস্পরিক সম্পর্ক ≠ কারণ। আইসক্রিম বিক্রি এবং ডুবে যাওয়ার হার দৃঢ়ভাবে সম্পর্কযুক্ত (উভয়ই গ্রীষ্মে সর্বোচ্চ), কিন্তু আইসক্রিম ডুবে যাওয়ার কারণ হয় না।
ইফেক্ট সাইজ
পরিসংখ্যানগত তাৎপর্য আপনাকে বলে একটি প্রভাব বাস্তব কিনা; প্রভাব আকার আপনাকে বলে যে এটি কত বড়। দুটি অর্থ তুলনা করার জন্য কোহেনের ডি:
d = (μ₁ - μ₂) / σ_pooled
| কোহেনের ডি | ব্যাখ্যা |
|---|---|
| 0.2 | ছোট |
| 0.5 | মাঝারি |
| 0.8 | বড় |
d = 0.1 সহ একটি অত্যন্ত তাৎপর্যপূর্ণ p-মান মানে আপনি একটি বাস্তব কিন্তু তুচ্ছভাবে ছোট প্রভাব শনাক্ত করেছেন — সম্ভবত আপনার নমুনাটি বিশাল ছিল। সর্বদা p-মানগুলির পাশাপাশি প্রভাবের আকারগুলি রিপোর্ট করুন৷
চি-স্কয়ার টেস্ট
চি-স্কোয়ার (χ²) পরীক্ষা জিজ্ঞাসা করে: "পর্যবেক্ষিত গণনাগুলি কি সুযোগ দ্বারা আমরা যা আশা করি তার থেকে আলাদা?"
χ² = Σ (Observed - Expected)² / Expected
যখন আপনার ডেটা শ্রেণীবদ্ধ হয় তখন এটি ব্যবহার করুন - উদাহরণস্বরূপ, একটি ডাই ন্যায্য কিনা তা পরীক্ষা করা, বা চিকিত্সার ফলাফল চিকিত্সা গোষ্ঠীর থেকে স্বাধীন কিনা।
সঠিক পরীক্ষা নির্বাচন করা
| পরিস্থিতি | পরীক্ষা |
|---|---|
| একটি পরিচিত মান একটি গড় তুলনা | এক-নমুনা টি-পরীক্ষা |
| দুটি স্বাধীন উপায় তুলনা করুন | দুই-নমুনা টি-পরীক্ষা |
| দুটি জোড়ার উপায় তুলনা করুন | পেয়ার করা টি-পরীক্ষা |
| 3+ মানে তুলনা করুন | আনোভা |
| 3+ মানে তুলনা করুন (অ-স্বাভাবিক) | ক্রুস্কাল-ওয়ালিস |
| দুটি অবিচ্ছিন্ন ভেরিয়েবলের মধ্যে সংযোগ | পিয়ারসন/স্পিয়ারম্যান পারস্পরিক সম্পর্ক |
| শ্রেণীগত অনুপাত তুলনা | চি-স্কয়ার |
| দুটি দল, অ-স্বাভাবিক বিতরণ | মান-হুইটনি ইউ |
সাধারণ ভুল
পিকিং: বারবার আপনার পরীক্ষা চালানো এবং যখন p < 0.05 টাইপ I এরর নাটকীয়ভাবে স্ফীত করে। ডেটা সংগ্রহ করার আগে আপনার নমুনার আকার পরিকল্পনা করুন।
একাধিক তুলনা: α = 0.05 এ 20টি স্বাধীন পরীক্ষা চালালে গড়ে একটি মিথ্যা পজিটিভ তৈরি হবে। Bonferroni সংশোধন ব্যবহার করুন বা মিথ্যা আবিষ্কার হার নিয়ন্ত্রণ.
অনুমান উপেক্ষা করা: বেশিরভাগ পরীক্ষায় এলোমেলো নমুনা, পর্যবেক্ষণের স্বাধীনতা এবং (টি-পরীক্ষার জন্য) আনুমানিক স্বাভাবিকতা অনুমান করা হয়। এগুলি লঙ্ঘন করা ফলাফলগুলিকে হ্রাস করে।
আমাদের Z-স্কোর ক্যালকুলেটর, নমুনা সাইজ ক্যালকুলেটর, t-Test Calculator, এবং Corelation Calculator ব্যবহার করুন তথ্য