Shahriar Alam Rakib

Hi everyone, welcome to the channel.
This is Shahriar Alam Rakib with a strong background in social science research and statistical analysis. I hold a Master's degree in Applied Statistics and Data Science, Post-Graduate Diploma in Information and Communication Technology (ICT), Bachelor and Master Degree in Sociology, University of Dhaka. I have five year working experience in research and statistical roles at various organizations, including icddrb, North South University, BUET and CWCS. I am proficient in a variety of statistical software, including SPSS, Stata, R and Python.

On this channel, I'll be sharing my knowledge and experience in data science, statistics, social research and technology. You'll learn about the data analysis tools and techniques used in various fields and also you will get updated with the latest tech trends, gadgets, and tutorials.

Whether you're a student, a researcher, or just someone interested in data and tech field, you've come to the right place!

View channel on YouTube

Switch Invidious Instance

Videos

Shorts

Playlists

Posts

Shahriar Alam Rakib

ভাগাভাগির এই পাই চার্টেই লুকিয়ে আছে কুরবানির আসল সার্থকতা।

2 days ago | [YT] | 0

View 0 replies

Shahriar Alam Rakib

Quantitative Research -এর Data Analysis-এ Confused? সমাধান এই কম্বো কোর্স!
রিসার্চে সবচেয়ে বড় ভুলটা হয় যখন আমরা স্ট্যাটিসটিকসের কনসেপ্ট না বুঝে সরাসরি সফটওয়্যারে এনালাইসিস কমান্ড দেওয়া শুরু করি। অনেকেই ভাবেন SPSS/STATA Software শেখা মানেই ডেটা অ্যানালাইসিস শেখা! কিন্তু সত্যিটা হলো, ব্যাকগ্রাউন্ডে 'Applied Statistics'-এর থিওরি আর লজিকগুলো না বুঝলে ওই টেবিলগুলো শুধুই অর্থহীন সংখ্যা!
রিসার্চের এই গুরুত্বপূর্ণ গ্যাপটি দূর করতেই আমরা "Applied Statistics with SPSS" নামে একটা Combo কোর্স পরিচালনা করছি। এই কোর্সে স্ট্যাটিসটিকস এবং প্র্যাক্টিক্যাল ডেটা অ্যানালাইসিসের একটি সমন্বিত গাইডলাইন দেওয়া হয়।
স্টুডেন্টদের সুবিধার্থে আমরা প্রতি ব্যাচেই আর্থিক সমস্যাগুলো বিবেচনা করি। তাই আর্থিক সমস্যা আছে কিন্তু আগ্রহী এমন ২০ জনের জন্য ২৫% Scholarship দিচ্ছি। (এছাড়াও কারো ব্যক্তিগত সমস্যা থাকলে আমাকে ইনবক্স করতে পারেন)
🎁 বিশেষ আকর্ষণ: কোর্স শেষে বেস্ট পারফর্মারদের আমাদের টীমে কাজ করার সুযোগ দেয়া হয়।
🔗 কোর্সের পূর্ণাঙ্গ মডিউল এবং রেজিস্ট্রেশনের বিস্তারিত প্রথম কমেন্টে দেওয়া হলো।
শুধু সফটওয়্যার শেখা নয়, শিখতে হবে Applied Statistics-এর সঠিক প্রয়োগ।

6 days ago (edited) | [YT] | 5

View 0 replies

Shahriar Alam Rakib

পরীক্ষায় নকল ধরা এবং স্ট্যাটিস্টিকস: আমরা কি আসলেই নিশ্চিত হয়ে কাউকে শাস্তি দেই?
Statistics-এর সবচেয়ে জটিল ও প্যাঁচানো কয়েকটা টপিক, Level of Significance (alpha value), p-value, Confusion Matrix, Hypothesis Testing - সবগুলো কনসেপ্ট সহজে বুঝে যাবেন এই গল্পে!

Disclaimer: এগুলো Statistics-এর ভাষা না। জাস্ট সহজে কনসেপ্টটা ধরার জন্য এই উদাহরণগুলো দেয়া।

ধরুন, আপনি একজন শিক্ষক। আপনি পরীক্ষার হলে গার্ড দিচ্ছেন।
এক্ষেত্রে আপনি ২ ধরনের ভুল করতে পারেন:

Type I Error: ছাত্র নকল করেনি, কিন্তু ভুলে শাস্তি দিয়ে দেন। (বড় ভুল — alpha)
Type II Error: ছাত্র নকল করেছে, কিন্তু ভুলে শাস্তি দেন না। (তুলনামূলক ছোট ভুল — beta)

নির্দোষকে শাস্তি দেওয়া আমাদের সবচেয়ে বড় ভুল। কিন্তু এই ভুল পুরোপুরি শূন্যে নামানো সম্ভব না — তাই আমরা একটা সহনীয় সীমা ঠিক করি। আমরা ধরে নিই, ১০০ জন নির্দোষের মধ্যে সর্বোচ্চ ৫ জনকে ভুলে সন্দেহজনক হিসেবে চিহ্নিত করব, এর বেশি না। এটাকেই পরিসংখ্যানের ভাষায় α = 0.05 বলি, যা ৫% বোঝায়।

এখন আপনি দেখলেন একজন ছাত্র বারবার পাশের জনের দিকে তাকাচ্ছে। আপনাকে সিদ্ধান্ত নিতে হবে — নকল করছে কিনা। (আপনি এখন বিচারকের আসনে।)

আদালতে যেমন বিচারক শুরুতেই আসামিকে নির্দোষ ধরে নেন, আপনিও তাই করলেন। ২টা অনুমান (Hypothesis) করলেন:

H₀ (Null) = ছাত্র নকল করছে না। (আসামি নির্দোষ।)
H₁ (Alternative) = ছাত্র আসলেই নকল করছে। (আসামি দোষী।)

এখন উকিলের কাজ — প্রমাণ হাজির করা। পরিসংখ্যানে সেই প্রমাণটা হলো p-value। আমরা একটাই প্রশ্ন করি — পরীক্ষার হলে নকল না করলেও, এরকম সন্দেহজনক আচরণ করার সম্ভাবনা কতটুকু? এই সম্ভাবনাকেই p-value বলে।

ক্যালকুলেশন করে p-value পেলাম ০.০৩। উকিল বিচারকের সামনে প্রমাণ রাখলেন — নির্দোষ ছাত্ররাও পরীক্ষার হলে এরকম সন্দেহজনক আচরণ করে, তবে মাত্র ৩% ক্ষেত্রে।

এখন বিচারক হিসেবে আপনি তুলনা করলেন। আপনার আগে ঠিক করা সীমা ছিল ৫%। কিন্তু এই ছাত্রের আচরণ মাত্র ৩% নির্দোষ ছাত্র করে — যা সেই সীমার চেয়েও কম। এত বিরল আচরণকে আর কাকতালীয় বলা যাচ্ছে না। তাই রায় — H₀ বাতিল। ছাত্র সম্ভবত নকল করছে।

এটাই Hypothesis Testing-এর সারকথা। আমরা কখনো ১০০% নিশ্চিত হই না। আমরা শুধু বলি — প্রমাণ এতটাই শক্তিশালী যে নির্দোষের অনুমান আর টিকিয়ে রাখা যাচ্ছে না।

তাই আমরা বলি না যে "নকল করেছে — প্রমাণিত।" এটাকে ঘুরিয়ে বলি — "নকল করছে না এই অনুমান আর টিকিয়ে রাখা যাচ্ছে না।"

এই কারণেই আমরা বলি "Null Hypothesis Rejected", কখনো বলি না "Alternative Hypothesis Accepted"। অর্থাৎ পুরো বিষয়টাই প্রমাণের সাথে সম্পৃক্ত, Accept বা Reject এর সাথে না। এটা নিয়ে আমার আরেকটি বিস্তারিত পোস্ট আছে, কমেন্টে লিঙ্ক দেওয়া হলো।

সহজ ভাষায় গবেষণা ডেটা এনালাইসিস সম্পর্কিত লেখা আমার প্রোফাইলে পেয়ে যাবেন। যারা জটিল কথাগুলো সহজে বুঝতে চান, আমার প্রোফাইলটি দেখতে পারেন।

#Statistics #HypothesisTesting #PValue #ConfusionMatrix #LevelOfSignificance #SPSS #ResearchMethodology #InferentialStatistics #QuantitativeResearch #StatisticalAnalysis #AlphaValue #রিসার্চ #পরিসংখ্যান #ডেটা_অ্যানালাইসিস
#FalsePositive #FalseNegative #Type1Error #Type2Error

2 weeks ago | [YT] | 4

View 0 replies

Shahriar Alam Rakib

Mastering Data Analytics for Research সেমিনারটি আজ রাত ৯টায় অনুষ্ঠিত হবে। যারা রেজিস্ট্রেশন করতে পারেননি, plz register: forms.gle/4caxushnBFXGL8i76

3 weeks ago | [YT] | 1

View 1 reply

Shahriar Alam Rakib

⚠️ রিসার্চ ডেটা এনালাইসিসের আগে এই ৭টি কাজ জানতেই হবে 📉

ডেটা এনালাইসিস শুরু করার পূর্বে আমাদের Raw ডেটা গুছিয়ে নিতে হয়, কারণ আপনার ক্লিন না করা Raw ডেটা আপনার পুরো রিসার্চকে নষ্ট করে দিতে পারে! এই ধাপেই আমরা সেই ভুলগুলো সংশোধন করি। এগুলোই মূলত ডেটা ক্লিনিং (Data Cleaning & Pre-processing) এর কাজ।

নিচে এ সম্পর্কিত প্রয়োজনীয় বিষয়গুলো আলোচনা করা হলো:

📍 ১. মিসিং ভ্যালু হ্যান্ডলিং (Handling Missing Values)
অনেক সময় শিক্ষার্থীরা কিছু প্রশ্নের উত্তর না দিয়েই ফর্ম জমা দেয়।
🔹 বাস্তব উদাহরণ: ধরা যাক, ২০ জন শিক্ষার্থী তাদের ওজন (Weight) লেখেনি। এখন গড় ওজন বের করার সময় ওই ঘরগুলো খালি থাকলে সঠিক ফলাফল আসবে না।
✅ সমাধান: ডেটার পরিমাণ কম হলে ওই ২০ জনের পুরো সারি (Row) বাদ দেওয়া যেতে পারে। অথবা সবার ওজনের গড় মান (Average) খালি ঘরে বসিয়ে দেওয়া (Imputation) বা এডভান্স রিগ্রেশন মডেল ব্যবহার করে মান প্রেডিক্ট করা যেতে পারে।

📍 ২. ডুপ্লিকেট ডেটা রিমুভ করা (Removing Duplicates)
কখনও কখনও একজন শিক্ষার্থী ভুলে দুইবার ফর্ম সাবমিট করে ফেলে।
🔹 বাস্তব উদাহরণ: একই স্টুডেন্টের তথ্য দুইবার থাকলে রেজাল্ট বায়াসড বা ভুল আসবে।
✅ সমাধান: Student_ID বা ইমেইল চেক করে ডুপ্লিকেট এন্ট্রিগুলো ডিলিট করে দিতে হবে।

📍 ৩. আউটলায়ার ডিটেকশন (Outlier Detection)
আউটলায়ার মানে হলো এমন কিছু মান যা অস্বাভাবিক (খুব বেশি বড় অথবা খুব ছোট)।
🔹 বাস্তব উদাহরণ: সবার বয়স ১৮-২৮ এর মধ্যে হলেও কেউ হয়তো মজা করে বা ভুলে লিখেছে '৭০' বা '৭'!
✅ সমাধান: এই অস্বাভাবিক মানগুলো খুঁজে বের করতে হবে। হয় এগুলো সংশোধন করতে হবে, না হয় বাদ দিতে হবে। কারণ একজন ৭০ বছর বয়সী স্টুডেন্ট পুরো গবেষণার গড় বয়স নষ্ট করে দেবে।

📍 ৪. ডেটা টাইপ ঠিক করা (Data Type Correction)
সফটওয়্যার অনেক সময় সংখ্যাকেও টেক্সট হিসেবে ধরে নেয়।
🔹 বাস্তব উদাহরণ: ওজনের কলামে কেউ লিখেছে '65 kg'। কম্পিউটার এখানে 'kg' থাকার কারণে এটাকে সংখ্যা হিসেবে যোগ-বিয়োগ করতে পারবে না।
✅ সমাধান: ক্লিনিংয়ের সময় 'kg' লেখাটি মুছে দিয়ে কলামটিকে শুধু 'Numeric' বা সংখ্যায় রূপান্তর করতে হবে।

📍 ৫. ডেটা কোডিং এবং ডিকোড (Data Coding)
পরিসংখ্যানের সফটওয়্যার (যেমন SPSS) সংখ্যার সাথে ভালো কাজ করে। তাই ক্যাটাগরিক্যাল ডেটাকে কোড করতে হয়।
🔹 বাস্তব উদাহরণ:
লিঙ্গ (Gender): Male = 1, Female = 2
খাবারের অভ্যাস (Food Habit): Vegetarian = 1, Non-Vegetarian = 2
সামাজিক শ্রেণি (Social Class): নিম্নবিত্ত = 1, মধ্যবিত্ত = 2, উচ্চবিত্ত = 3

📍 ৬. নতুন ভেরিয়েবল তৈরি করা (Variable Transformation)
কখনও বিদ্যমান ডেটা থেকে নতুন কিছু তৈরি করতে হয়।
🔹 বাস্তব উদাহরণ: 'উচ্চতা' ও 'ওজন' ব্যবহার করে আমরা সহজেই BMI (Body Mass Index) নামক নতুন কলাম তৈরি করতে পারি। যা আমাদের বলবে স্টুডেন্টটি সুস্বাস্থ্যের অধিকারী কি না।

📍 ৭. ইনকনসিস্টেন্সি দূর করা (Handling Inconsistencies)
একই তথ্য বিভিন্নভাবে লেখা থাকলে তা সংশোধন করা।
🔹 উদাহরণ: জেলা বা 'District' কলামে কেউ লিখেছে 'Cumilla', কেউ 'Comilla', আবার কেউ 'COMILA'।
✅ সমাধান: সবগুলোকে বানান ঠিক করে একটি নির্দিষ্ট স্ট্যান্ডার্ড ফরম্যাটে (Standardization) নিয়ে আসা।

💡 মনে রাখবেন: আপনার ডেটা যত ক্লিন হবে, এনালাইসিস তত সুন্দর হবে এবং গবেষণার ফলাফল তত নিখুঁত হবে।

এগুলো ছাড়াও আরও গুরুত্বপূর্ণ বিষয় আছে, যা ধীরে ধীরে আলোচনা করার চেষ্টা করবো। সাথেই থাকুন! 🤝

#DataAnalysis #DataCleaning #ডেটা #পরিসংখ্যান #এনালাইসিস #গবেষণা #ResearchHelp #Statistics #ThesisWriting #SPSS #QuantitativeResearch #DataScience

4 weeks ago | [YT] | 4

View 0 replies

Shahriar Alam Rakib

ডেটার ধরণ অনুযায়ী সঠিক গ্রাফ নির্বাচন: কোনটি কখন ব্যবহার করবেন?
রিসার্চ বা ডেটা অ্যানালাইসিসে গ্রাফিক্যাল রিপ্রেজেন্টেশন হলো এক পলকে আসল জিনিসটা রিডারকে বুঝিয়ে দেয়া। এজন্য সঠিক গ্রাফ নির্বাচন করা অত্যন্ত গুরুত্বপূর্ণ। ভুল গ্রাফ ব্যবহার করলে আপনার মূল তথ্যটি হারিয়ে যেতে পারে।

ডেটার ধরণ অনুযায়ী কখন কোন গ্রাফ বেশি ব্যবহৃত হয় চলুন দেখি।

📉 ১. Bar Chart (বার চার্ট)
ব্যবহার: যখন অনেকগুলো বড় ক্যাটাগরির মধ্যে তুলনা করতে হয়। ক্যাটাগরি নামগুলো সহজে পড়া যায়।
উদাহরণ: একটি ক্লাসের ১৩টি আলাদা সাবজেক্টের রেজাল্ট (এটি সাজানোর জন্য Ascending বা Descending Order ব্যবহার করা ভালো)।
📊 ২. Column Chart (কলাম চার্ট)
ব্যবহার: অল্প কিছু ক্যাটাগরির মধ্যে তুলনা করার জন্য সহজ।
উদাহরণ: একটি ক্লাসের ৫টি আলাদা ব্যাচের রেজাল্টের তুলনা।
🍕 ৩. Pie Chart (পাই চার্ট)
ব্যবহার: ক্যাটাগরিকাল ডেটার অনুপাত বা শতাংশ (Proportion/Percentage) দেখাতে।
উদাহরণ: একটি ক্লাসের ৫৭% ছেলে এবং ৪৩% মেয়ে। (মনে রাখবেন, ৫-৭টির বেশি ক্যাটাগরি থাকলে পাই চার্ট এড়িয়ে চলাই ভালো)।
📶 ৪. Histogram (হিস্টোগ্রাম)
ব্যবহার: নিউমেরিক্যাল ডেটার বিন্যাস বা ডিস্ট্রিবিউশন (Distribution) বুঝতে।
উদাহরণ: শিক্ষার্থীদের প্রাপ্ত নম্বরের গড় বা মধ্যমা (Mean/Median) কেমন তা দেখতে।
📦 ৫. Box Plot (বক্স প্লট)
ব্যবহার: ডেটার বিস্তৃতি (Spread) এবং কোনো অস্বাভাবিক মান বা আউটলায়ার (Outlier) আছে কি না তা দেখতে।
উদাহরণ: ক্লাসের শিক্ষার্থীদের মধ্যে কারা অনেক বেশি বা অনেক কম নম্বর পেয়েছে তা চিহ্নিত করতে।
📈 ৬. Line Chart (লাইন চার্ট)
ব্যবহার: সময়ের সাথে পরিবর্তনের ধারা (Trend over time) বোঝাতে।
উদাহরণ: গত ১০ বছরে একটি ক্লাসের শিক্ষার্থীদের জিপিএ-র পরিবর্তনের তুলনা।
🏔️ ৭. Area Chart (এরিয়া চার্ট)
ব্যবহার: সময়ের সাথে ডেটার পরিমাণ বা বিশালত্ব (Magnitude/Volume) বোঝাতে।
উদাহরণ: কয়েকটি সাবজেক্টের শিক্ষার্থীদের গত ১০ বছরের জিপিএ-র সমষ্টিগত তুলনা।
🔵 ৮. Scatter Plot (স্ক্যাটার প্লট)
ব্যবহার: দুটি নিউমেরিক্যাল ভ্যারিয়েবলের মধ্যে সম্পর্ক (Relationship) বুঝতে।
উদাহরণ: পড়াশোনার সময় (ঘণ্টা) এবং প্রাপ্ত জিপিএ-র মধ্যে কোনো সম্পর্ক আছে কি না তা যাচাই করা।
আপনার প্রেজেন্টেশনের ধরণ রিসার্চ রিপোর্টটা অনেকটা কোয়ালিটি এনে দেয় এবং এঁর গুরুত্ব বহুগুণ বেড়ে যায় যখন আপনি সঠিক তথ্যের জন্য সঠিক ভিজুয়ালাইজেশন বেছে নেন।

ডেটা এনালাইসিস এবং রিসার্চ সম্পর্কে ছোটখাট বিষয়গুলো সহজভাবে জানতে চ্যানেলটি ফলো করতে পারেন। ধন্যবাদ।

#DataVisualization #ResearchMethods #Statistics #DataAnalysis #LearningTogether

1 month ago | [YT] | 4

View 0 replies

Shahriar Alam Rakib

Null Hypothesis Rejected মানেই তো Alternative Hypothesis Accepted তাই না?
কিন্তু কেন এই সত্যিটা সরাসরি বলতে পারি না? কেন এই প্যাঁচ? চলুন সহজ করি!
মূলত দুইটা দর্শনের কারণে আমরা এমনটা করি।

প্রথমটা হচ্ছে আদালতের দর্শন (Innocent until proven guilty বা অপরাধ প্রমাণ না হওয়া পর্যন্ত আসামি নির্দোষ)।

আরেকটা হচ্ছে বিজ্ঞানের অনিশ্চয়তার নীতি (বিজ্ঞান, গবেষণা বা পরিসংখ্যান কখনোই ১০০% গ্যারান্টি দেয় না, কেননা প্রকৃতিতে অনেক uncertainty বিদ্যমান)। বিজ্ঞান শুধু চেষ্টা করে সেই uncertainty কমাইতে। বিজ্ঞান কখনো ১০০% নিশ্চিত হয়ে কিছু বলে না এবং ভবিষ্যতেও বলতে পারবে না। এটাই বিজ্ঞানের নীতি।

এবার আসেন দেখি এই টার্মগুলোর বাংলা কি আসলে। দুইটা দেখতে একইরকম কথা হলেও খুব সুক্ষ পার্থক্য আছে।

যেমনঃ
Alternative Hypothesis Accepted = ১০০% নিশ্চিত
(অনেক বেশি শক্তিশালী কথা) যা বিজ্ঞান এর নীতি বহির্ভূত।

Null Hypothesis Rejected = পর্যাপ্ত প্রমাণ না থাকা সাপেক্ষে নিশ্চিত (তুলনামূলক নিরাপদ কথা) কেননা ভবিষ্যতে আরও প্রমাণ আসলে এই দাবী/সত্যটি বাতিল করা যাবে।

অর্থাৎ ভবিষ্যতে নতুন কোনো তথ্য এসে বর্তমানের অল্টারনেটিভ হাইপোথিসিসকেও ভুল প্রমাণ করতে পারে। তাই বিজ্ঞানীরা নিরাপদ থাকতে "Accepted" শব্দটি এড়িয়ে চলেন। এবং বলেন Null
Hypothesis Rejected বা আপাতত পর্যাপ্ত প্রমাণ না থাকা সাপেক্ষে নিশ্চিত হচ্ছি বা সত্য বলে মেনে নিচ্চি।

Quantitative রিসার্চের জন্য Statistics এবং Data Analysis এর খুঁটিনাটি বিষয়গুলো সহজভাবে বুঝার আমি একটি সেমিনার আয়োজন করতে চাই। আপনারা আগ্রহী হলে কমেন্ট করতে পারেন। ধন্যবাদ

#Statistics #Research #data #dataanalysis #NullHypothesis #LearningEveryday #DataScience

1 month ago | [YT] | 2

View 1 reply

Shahriar Alam Rakib

Quantitative রিসার্চে Statistical Tests Selection একটি গুরুত্বপূর্ণ বিষয়। ডেটার ধরন এবং উদ্দেশ্যের উপর নির্ভর করে সঠিক টেস্ট রান না করতে পারলে আপনার গবেষণা থেকে আপনি কোন meaningful insight বের করতে পারবেন না।

যে টেস্টগুলো খুবই প্রয়োজনীয় এবং প্রায় সব ফিল্ডের রিসার্চেই ব্যবহার করতে হয় সেগুলো নিয়ে আলোচনা করছি। অল্প কথায়, সহজভাবে উদাহরণসহ উপস্থাপন করেছি যেন একজন বিগিনারও বুঝতে পারে।
আপনি টেবিলটি সেভ করে রাখতে পারেন, ভবিষ্যতে কাজে লাগতে পারে।

১. একটি গ্রুপের তুলনা
আপনার ডেটা থেকে প্রাপ্ত রেজাল্ট যখন কোনো National/Standard মান বা পপুলেশনের গড়ের সাথে তুলনা করতে চান।
উদাহরণ: ঢাবির শিক্ষার্থীদের গড় ওজন কি দেশের জাতীয় গড় ওজনের (যেমন: ৬৫ কেজি) সমান?
টেস্ট: One Sample T-Test (প্যারামেট্রিক) অথবা Wilcoxon Signed Rank Test (নন-প্যারামেট্রিক)।
২. দুটি আলাদা গ্রুপের তুলনা (Two Independent Samples)
যখন আপনি দুটি সম্পূর্ণ আলাদা গ্রুপের মধ্যে তুলনা করতে চান।
উদাহরণ: ছাত্রদের গড় ওজন কি ছাত্রীদের গড় ওজনের চেয়ে ভিন্ন?
টেস্ট: Independent Samples T-Test (প্যারামেট্রিক) অথবা Mann-Whitney U Test (নন-প্যারামেট্রিক)।
৩. তিন বা ততোধিক গ্রুপের তুলনা (More Than Two Independent Samples)
যখন আপনার গবেষণায় ৩টি বা তার বেশি আলাদা গ্রুপ থাকে।
উদাহরণ: উচ্চবিত্ত, মধ্যবিত্ত এবং নিম্নবিত্ত পরিবারের শিক্ষার্থীদের ওজনে কি কোনো পার্থক্য আছে?
টেস্ট: One-Way ANOVA (প্যারামেট্রিক) অথবা Kruskal-Wallis Test (নন-প্যারামেট্রিক)।
৪. একই গ্রুপের আগে ও পরের তুলনা (Two Dependent Samples)
যখন একই মানুষের ওপর দুটি ভিন্ন সময়ে পরীক্ষা চালানো হয়।
উদাহরণ: করোনাকালীন ছুটির আগের গড় ওজন এবং পরের গড় ওজনে কি কোনো পরিবর্তন এসেছে?
টেস্ট: Paired Samples T-Test (প্যারামেট্রিক) অথবা Wilcoxon Signed Rank Test (নন-প্যারামেট্রিক)।
৫. দুটি সংখ্যামূলক চলকের সম্পর্ক (Relationship: Numeric)
যখন আপনি জানতে চান একটি সংখ্যা বাড়লে অন্যটি বাড়ে কি না।
উদাহরণ: ওজন বাড়লে কি উচ্চতাও বাড়ে? অর্থাৎ ওজন ও উচ্চতার মধ্যে কি সম্পর্ক আছে?
টেস্ট: Pearson Correlation (প্যারামেট্রিক) অথবা Spearman Rank Correlation (নন-প্যারামেট্রিক)।
৬. দুটি গুণবাচক চলকের সম্পর্ক (Relationship: Categorical)
যখন দুটি ক্যাটাগরির মধ্যে সম্পর্ক খুঁজতে চান।
উদাহরণ: শিক্ষার্থীদের লিঙ্গ (Gender) এবং তাদের আবাসন অবস্থার (Residential Status) মধ্যে কি কোনো সম্পর্ক আছে?
টেস্ট: Chi-Square Test of Independence।
৭. ফলাফল প্রেডিক্ট করা (Predicting an Outcome)
যখন আপনি এক বা একাধিক কারণ দিয়ে একটি ফলাফল আগে থেকে অনুমান করতে চান।
Linear: এসএসসি/এইচএসসির রেজাল্ট দিয়ে কি অনার্সের সিজিপিএ প্রেডিক্ট করা সম্ভব?
Logistic: সিজিপিএ এবং অভিজ্ঞতা দেখে কি বলা সম্ভব কেউ চাকরি পাবে কি পাবে না (হ্যাঁ/না)?

সবগুলো টেস্ট একটা রিয়েল ডেটাসেট থেকে প্রাকটিকালি দেখতে চাইলে এবং রিপোর্টে কিভাবে রেজাল্ট প্রেজেন্ট করতে হয় জানতে চাইলে একটা সেমিনারের আয়োজন করতে পারি। আপনারা আগ্রহী হলে কমেন্ট করতে পারেন। ধন্যবাদ।

#Research #Statistics #DataAnalysis #ThesisHelp #SPSS #LearningStatistics

1 month ago | [YT] | 1

View 0 replies

Shahriar Alam Rakib

Standard Deviation বলতে কি বুঝি, সহজভাবে উদাহরণ দিয়ে বুঝানোর চেষ্টা করবো।
ছবিতে ১০ জনের height নিলাম এবং দেখতে পাচ্ছি এদের গড় উচ্চতা 5.46। এখন দেখেন এই mean থেকে কিন্তু প্রতিটা value মানে প্রতিটা মানুষের হাইট একটু deviate করতেছে, মানে একটু দূরে অবস্থান করতেছে। আসলে সেই দূরত্বটা কতটুকু, চলুন দেখি।
এখানে প্রথমজনের হাইট 5 ফুট এবং mean থেকে দূরত্ব 0.46, একইভাবে দ্বিতীয়জন 0.06, তৃতীয়জন 0.16 এবং উপড়ের দিকেও ঠিক এরকম দূরত্ব আমরা দেখতে পাচ্ছি। statistics নিয়ে কাজ করলে স্বাভাবিকভাবেই আপনার মনে প্রশ্ন আসবে, এইযে দূরত্বগুলো দেখতে পাচ্ছি, এগুলোর গড় কত? এই গড় দূরত্বটাই আসলে standard deviation. মানে প্রতিটা value, mean থেকে গড়ে কতটুকু দূরে অবস্থান করতেছে, এটাইকেই বলে standard deviation বা আদর্শ বিচ্যুতি।
এটা কেন প্রয়োজন পড়ে? আমরা mean থেকে একটা সিনারিও পাই যে সবার গড় উচ্চতা ৫ফুট ৪ইঞ্চি। এখন যদি standard deviation value টা কম হয়, তাহলে বুঝতে পারবো এই ১০ জনের সবার উচ্চতা প্রায় কাছাকাছি। আর যদি standard deviation value টা বেশি আসে, তাহলে বুঝতে হবে এদের মাঝে উচ্চতার পার্থক্য অনেক বেশি, মানে সবাই কাছাকাছি উচ্চতার না, একজনের থেকে আরেকজনের উচ্চতার বিশাল পার্থক্য আছে। এটাকে বলে Measures of Dispersion, মানে ডেটাগুলো কেমন ছড়িয়ে ছিটিয়ে আছে সেগুলো দেখা।
Data Visualize করে মোটাদাগে সহজভাবে বুঝানোর চেষ্টা করেছি। আরও স্পষ্টকরে যদি বুঝতে চান, এটা নিয়ে আমার একটা ভিডিও আছে যেখানে পুরো বিষয়টা ফর্মুলা থেকে ম্যানুয়ালি calculate করা এবং excel দিয়ে ক্যালকুলেট করেও দেখানো হয়েছে। ভিডিওটা দেখলে আশা করি বুঝতে পারবেন।

1 year ago | [YT] | 8

View 0 replies

Shahriar Alam Rakib

আমরা যদি Likert Scale Data নিয়ে কাজ করি এবং অনেকগুলো প্রশ্ন দিয়ে নির্দিষ্ট কোন লেভেল মাপতে চাই তাহলে এই Formula টা এপ্লাই করে এনালাইসিস করতে পারি।
ধরুন, আমরা Consumer দের Safe Fish Knowledge জানতে চাই। সেক্ষেত্রে Fish Consumption Knowledge সম্পর্কিত ১০টা Likert Scale প্রশ্ন তৈরি করলাম। এবং সেগুলো 5 point likert scale.
For Example: “Consumption of safe food is more important than tasty food. Do you know that?” এই প্রশ্নের উত্তরগুলো হবে-
1 = Not at all
2 = Very little
3 = Somewhat
4 = A lot
5 = To a great extent
এরকম করে ভিন্ন ভিন্ন ১০টা প্রশ্ন তৈরি করলাম।
এখন এই ১০টা প্রশ্নকে Calculation এর মাধ্যমে একটা সিঙ্গেল ভ্যারিয়েবলে নিয়ে এসে উনাদের Safe Fish Knowledge লেভেল জানতে পারি। তারপর সেটাকে নতুন আরেকটা ভ্যারিয়েবলে রি-ক্যাটাগরাইজ করবো এভাবে “High Knowledge”, “Moderate Knowledge”, “Low Knowledge” ক্যাটেগরি তৈরি করে আমরা একটা সামারিতে আসতে পারি।
সেটা করার জন্য জাস্ট নিচের ফর্মুলাটা এপ্লাই করতে হবে। আর এই কাজটা একদম ডেটা থেকে খুঁটিনাটি ব্যাখ্যা করে প্রাক্টিক্যালি দেখানো হয়েছে আমার ইউটিউব চ্যানেলে। যারা Likert Scale নিয়ে কাজ করেন তাদের ক্ষেত্রে এটা খুবই হেল্পফুল হবে। যেকোন Likert Scale Data আপনি এভাবে এনালাইসিস করতে পারবেন।
তারপর এই Likert Scale ডেটা নিয়ে কিভাবে আরও Inferential Statistics তৈরি করা যায় সেগুলোও ধীরে ধীরে ধীরে দেখানো হবে। আশা করি উপকৃত হবেন। ধন্যবাদ

1 year ago | [YT] | 0

View 0 replies