Hi everyone, welcome to the channel.
This is Shahriar Alam Rakib with a strong background in social science research and statistical analysis. I hold a Master's degree in Applied Statistics and Data Science, Post-Graduate Diploma in Information and Communication Technology (ICT), Bachelor and Master Degree in Sociology, University of Dhaka. I have five year working experience in research and statistical roles at various organizations, including icddrb, North South University, BUET and CWCS. I am proficient in a variety of statistical software, including SPSS, Stata, R and Python.
On this channel, I'll be sharing my knowledge and experience in data science, statistics, social research and technology. You'll learn about the data analysis tools and techniques used in various fields and also you will get updated with the latest tech trends, gadgets, and tutorials.
Whether you're a student, a researcher, or just someone interested in data and tech field, you've come to the right place!
Shahriar Alam Rakib
ভাগাভাগির এই পাই চার্টেই লুকিয়ে আছে কুরবানির আসল সার্থকতা।
2 days ago | [YT] | 0
View 0 replies
Shahriar Alam Rakib
Quantitative Research -এর Data Analysis-এ Confused? সমাধান এই কম্বো কোর্স!
রিসার্চে সবচেয়ে বড় ভুলটা হয় যখন আমরা স্ট্যাটিসটিকসের কনসেপ্ট না বুঝে সরাসরি সফটওয়্যারে এনালাইসিস কমান্ড দেওয়া শুরু করি। অনেকেই ভাবেন SPSS/STATA Software শেখা মানেই ডেটা অ্যানালাইসিস শেখা! কিন্তু সত্যিটা হলো, ব্যাকগ্রাউন্ডে 'Applied Statistics'-এর থিওরি আর লজিকগুলো না বুঝলে ওই টেবিলগুলো শুধুই অর্থহীন সংখ্যা!
রিসার্চের এই গুরুত্বপূর্ণ গ্যাপটি দূর করতেই আমরা "Applied Statistics with SPSS" নামে একটা Combo কোর্স পরিচালনা করছি। এই কোর্সে স্ট্যাটিসটিকস এবং প্র্যাক্টিক্যাল ডেটা অ্যানালাইসিসের একটি সমন্বিত গাইডলাইন দেওয়া হয়।
স্টুডেন্টদের সুবিধার্থে আমরা প্রতি ব্যাচেই আর্থিক সমস্যাগুলো বিবেচনা করি। তাই আর্থিক সমস্যা আছে কিন্তু আগ্রহী এমন ২০ জনের জন্য ২৫% Scholarship দিচ্ছি। (এছাড়াও কারো ব্যক্তিগত সমস্যা থাকলে আমাকে ইনবক্স করতে পারেন)
🎁 বিশেষ আকর্ষণ: কোর্স শেষে বেস্ট পারফর্মারদের আমাদের টীমে কাজ করার সুযোগ দেয়া হয়।
🔗 কোর্সের পূর্ণাঙ্গ মডিউল এবং রেজিস্ট্রেশনের বিস্তারিত প্রথম কমেন্টে দেওয়া হলো।
শুধু সফটওয়্যার শেখা নয়, শিখতে হবে Applied Statistics-এর সঠিক প্রয়োগ।
6 days ago (edited) | [YT] | 5
View 0 replies
Shahriar Alam Rakib
পরীক্ষায় নকল ধরা এবং স্ট্যাটিস্টিকস: আমরা কি আসলেই নিশ্চিত হয়ে কাউকে শাস্তি দেই?
Statistics-এর সবচেয়ে জটিল ও প্যাঁচানো কয়েকটা টপিক, Level of Significance (alpha value), p-value, Confusion Matrix, Hypothesis Testing - সবগুলো কনসেপ্ট সহজে বুঝে যাবেন এই গল্পে!
Disclaimer: এগুলো Statistics-এর ভাষা না। জাস্ট সহজে কনসেপ্টটা ধরার জন্য এই উদাহরণগুলো দেয়া।
ধরুন, আপনি একজন শিক্ষক। আপনি পরীক্ষার হলে গার্ড দিচ্ছেন।
এক্ষেত্রে আপনি ২ ধরনের ভুল করতে পারেন:
Type I Error: ছাত্র নকল করেনি, কিন্তু ভুলে শাস্তি দিয়ে দেন। (বড় ভুল — alpha)
Type II Error: ছাত্র নকল করেছে, কিন্তু ভুলে শাস্তি দেন না। (তুলনামূলক ছোট ভুল — beta)
নির্দোষকে শাস্তি দেওয়া আমাদের সবচেয়ে বড় ভুল। কিন্তু এই ভুল পুরোপুরি শূন্যে নামানো সম্ভব না — তাই আমরা একটা সহনীয় সীমা ঠিক করি। আমরা ধরে নিই, ১০০ জন নির্দোষের মধ্যে সর্বোচ্চ ৫ জনকে ভুলে সন্দেহজনক হিসেবে চিহ্নিত করব, এর বেশি না। এটাকেই পরিসংখ্যানের ভাষায় α = 0.05 বলি, যা ৫% বোঝায়।
এখন আপনি দেখলেন একজন ছাত্র বারবার পাশের জনের দিকে তাকাচ্ছে। আপনাকে সিদ্ধান্ত নিতে হবে — নকল করছে কিনা। (আপনি এখন বিচারকের আসনে।)
আদালতে যেমন বিচারক শুরুতেই আসামিকে নির্দোষ ধরে নেন, আপনিও তাই করলেন। ২টা অনুমান (Hypothesis) করলেন:
H₀ (Null) = ছাত্র নকল করছে না। (আসামি নির্দোষ।)
H₁ (Alternative) = ছাত্র আসলেই নকল করছে। (আসামি দোষী।)
এখন উকিলের কাজ — প্রমাণ হাজির করা। পরিসংখ্যানে সেই প্রমাণটা হলো p-value। আমরা একটাই প্রশ্ন করি — পরীক্ষার হলে নকল না করলেও, এরকম সন্দেহজনক আচরণ করার সম্ভাবনা কতটুকু? এই সম্ভাবনাকেই p-value বলে।
ক্যালকুলেশন করে p-value পেলাম ০.০৩। উকিল বিচারকের সামনে প্রমাণ রাখলেন — নির্দোষ ছাত্ররাও পরীক্ষার হলে এরকম সন্দেহজনক আচরণ করে, তবে মাত্র ৩% ক্ষেত্রে।
এখন বিচারক হিসেবে আপনি তুলনা করলেন। আপনার আগে ঠিক করা সীমা ছিল ৫%। কিন্তু এই ছাত্রের আচরণ মাত্র ৩% নির্দোষ ছাত্র করে — যা সেই সীমার চেয়েও কম। এত বিরল আচরণকে আর কাকতালীয় বলা যাচ্ছে না। তাই রায় — H₀ বাতিল। ছাত্র সম্ভবত নকল করছে।
এটাই Hypothesis Testing-এর সারকথা। আমরা কখনো ১০০% নিশ্চিত হই না। আমরা শুধু বলি — প্রমাণ এতটাই শক্তিশালী যে নির্দোষের অনুমান আর টিকিয়ে রাখা যাচ্ছে না।
তাই আমরা বলি না যে "নকল করেছে — প্রমাণিত।" এটাকে ঘুরিয়ে বলি — "নকল করছে না এই অনুমান আর টিকিয়ে রাখা যাচ্ছে না।"
এই কারণেই আমরা বলি "Null Hypothesis Rejected", কখনো বলি না "Alternative Hypothesis Accepted"। অর্থাৎ পুরো বিষয়টাই প্রমাণের সাথে সম্পৃক্ত, Accept বা Reject এর সাথে না। এটা নিয়ে আমার আরেকটি বিস্তারিত পোস্ট আছে, কমেন্টে লিঙ্ক দেওয়া হলো।
সহজ ভাষায় গবেষণা ডেটা এনালাইসিস সম্পর্কিত লেখা আমার প্রোফাইলে পেয়ে যাবেন। যারা জটিল কথাগুলো সহজে বুঝতে চান, আমার প্রোফাইলটি দেখতে পারেন।
#Statistics #HypothesisTesting #PValue #ConfusionMatrix #LevelOfSignificance #SPSS #ResearchMethodology #InferentialStatistics #QuantitativeResearch #StatisticalAnalysis #AlphaValue #রিসার্চ #পরিসংখ্যান #ডেটা_অ্যানালাইসিস
#FalsePositive #FalseNegative #Type1Error #Type2Error
2 weeks ago | [YT] | 4
View 0 replies
Shahriar Alam Rakib
Mastering Data Analytics for Research সেমিনারটি আজ রাত ৯টায় অনুষ্ঠিত হবে। যারা রেজিস্ট্রেশন করতে পারেননি, plz register: forms.gle/4caxushnBFXGL8i76
3 weeks ago | [YT] | 1
View 1 reply
Shahriar Alam Rakib
⚠️ রিসার্চ ডেটা এনালাইসিসের আগে এই ৭টি কাজ জানতেই হবে 📉
ডেটা এনালাইসিস শুরু করার পূর্বে আমাদের Raw ডেটা গুছিয়ে নিতে হয়, কারণ আপনার ক্লিন না করা Raw ডেটা আপনার পুরো রিসার্চকে নষ্ট করে দিতে পারে! এই ধাপেই আমরা সেই ভুলগুলো সংশোধন করি। এগুলোই মূলত ডেটা ক্লিনিং (Data Cleaning & Pre-processing) এর কাজ।
নিচে এ সম্পর্কিত প্রয়োজনীয় বিষয়গুলো আলোচনা করা হলো:
📍 ১. মিসিং ভ্যালু হ্যান্ডলিং (Handling Missing Values)
অনেক সময় শিক্ষার্থীরা কিছু প্রশ্নের উত্তর না দিয়েই ফর্ম জমা দেয়।
🔹 বাস্তব উদাহরণ: ধরা যাক, ২০ জন শিক্ষার্থী তাদের ওজন (Weight) লেখেনি। এখন গড় ওজন বের করার সময় ওই ঘরগুলো খালি থাকলে সঠিক ফলাফল আসবে না।
✅ সমাধান: ডেটার পরিমাণ কম হলে ওই ২০ জনের পুরো সারি (Row) বাদ দেওয়া যেতে পারে। অথবা সবার ওজনের গড় মান (Average) খালি ঘরে বসিয়ে দেওয়া (Imputation) বা এডভান্স রিগ্রেশন মডেল ব্যবহার করে মান প্রেডিক্ট করা যেতে পারে।
📍 ২. ডুপ্লিকেট ডেটা রিমুভ করা (Removing Duplicates)
কখনও কখনও একজন শিক্ষার্থী ভুলে দুইবার ফর্ম সাবমিট করে ফেলে।
🔹 বাস্তব উদাহরণ: একই স্টুডেন্টের তথ্য দুইবার থাকলে রেজাল্ট বায়াসড বা ভুল আসবে।
✅ সমাধান: Student_ID বা ইমেইল চেক করে ডুপ্লিকেট এন্ট্রিগুলো ডিলিট করে দিতে হবে।
📍 ৩. আউটলায়ার ডিটেকশন (Outlier Detection)
আউটলায়ার মানে হলো এমন কিছু মান যা অস্বাভাবিক (খুব বেশি বড় অথবা খুব ছোট)।
🔹 বাস্তব উদাহরণ: সবার বয়স ১৮-২৮ এর মধ্যে হলেও কেউ হয়তো মজা করে বা ভুলে লিখেছে '৭০' বা '৭'!
✅ সমাধান: এই অস্বাভাবিক মানগুলো খুঁজে বের করতে হবে। হয় এগুলো সংশোধন করতে হবে, না হয় বাদ দিতে হবে। কারণ একজন ৭০ বছর বয়সী স্টুডেন্ট পুরো গবেষণার গড় বয়স নষ্ট করে দেবে।
📍 ৪. ডেটা টাইপ ঠিক করা (Data Type Correction)
সফটওয়্যার অনেক সময় সংখ্যাকেও টেক্সট হিসেবে ধরে নেয়।
🔹 বাস্তব উদাহরণ: ওজনের কলামে কেউ লিখেছে '65 kg'। কম্পিউটার এখানে 'kg' থাকার কারণে এটাকে সংখ্যা হিসেবে যোগ-বিয়োগ করতে পারবে না।
✅ সমাধান: ক্লিনিংয়ের সময় 'kg' লেখাটি মুছে দিয়ে কলামটিকে শুধু 'Numeric' বা সংখ্যায় রূপান্তর করতে হবে।
📍 ৫. ডেটা কোডিং এবং ডিকোড (Data Coding)
পরিসংখ্যানের সফটওয়্যার (যেমন SPSS) সংখ্যার সাথে ভালো কাজ করে। তাই ক্যাটাগরিক্যাল ডেটাকে কোড করতে হয়।
🔹 বাস্তব উদাহরণ:
লিঙ্গ (Gender): Male = 1, Female = 2
খাবারের অভ্যাস (Food Habit): Vegetarian = 1, Non-Vegetarian = 2
সামাজিক শ্রেণি (Social Class): নিম্নবিত্ত = 1, মধ্যবিত্ত = 2, উচ্চবিত্ত = 3
📍 ৬. নতুন ভেরিয়েবল তৈরি করা (Variable Transformation)
কখনও বিদ্যমান ডেটা থেকে নতুন কিছু তৈরি করতে হয়।
🔹 বাস্তব উদাহরণ: 'উচ্চতা' ও 'ওজন' ব্যবহার করে আমরা সহজেই BMI (Body Mass Index) নামক নতুন কলাম তৈরি করতে পারি। যা আমাদের বলবে স্টুডেন্টটি সুস্বাস্থ্যের অধিকারী কি না।
📍 ৭. ইনকনসিস্টেন্সি দূর করা (Handling Inconsistencies)
একই তথ্য বিভিন্নভাবে লেখা থাকলে তা সংশোধন করা।
🔹 উদাহরণ: জেলা বা 'District' কলামে কেউ লিখেছে 'Cumilla', কেউ 'Comilla', আবার কেউ 'COMILA'।
✅ সমাধান: সবগুলোকে বানান ঠিক করে একটি নির্দিষ্ট স্ট্যান্ডার্ড ফরম্যাটে (Standardization) নিয়ে আসা।
💡 মনে রাখবেন: আপনার ডেটা যত ক্লিন হবে, এনালাইসিস তত সুন্দর হবে এবং গবেষণার ফলাফল তত নিখুঁত হবে।
এগুলো ছাড়াও আরও গুরুত্বপূর্ণ বিষয় আছে, যা ধীরে ধীরে আলোচনা করার চেষ্টা করবো। সাথেই থাকুন! 🤝
#DataAnalysis #DataCleaning #ডেটা #পরিসংখ্যান #এনালাইসিস #গবেষণা #ResearchHelp #Statistics #ThesisWriting #SPSS #QuantitativeResearch #DataScience
4 weeks ago | [YT] | 4
View 0 replies
Shahriar Alam Rakib
ডেটার ধরণ অনুযায়ী সঠিক গ্রাফ নির্বাচন: কোনটি কখন ব্যবহার করবেন?
রিসার্চ বা ডেটা অ্যানালাইসিসে গ্রাফিক্যাল রিপ্রেজেন্টেশন হলো এক পলকে আসল জিনিসটা রিডারকে বুঝিয়ে দেয়া। এজন্য সঠিক গ্রাফ নির্বাচন করা অত্যন্ত গুরুত্বপূর্ণ। ভুল গ্রাফ ব্যবহার করলে আপনার মূল তথ্যটি হারিয়ে যেতে পারে।
ডেটার ধরণ অনুযায়ী কখন কোন গ্রাফ বেশি ব্যবহৃত হয় চলুন দেখি।
📉 ১. Bar Chart (বার চার্ট)
ব্যবহার: যখন অনেকগুলো বড় ক্যাটাগরির মধ্যে তুলনা করতে হয়। ক্যাটাগরি নামগুলো সহজে পড়া যায়।
উদাহরণ: একটি ক্লাসের ১৩টি আলাদা সাবজেক্টের রেজাল্ট (এটি সাজানোর জন্য Ascending বা Descending Order ব্যবহার করা ভালো)।
📊 ২. Column Chart (কলাম চার্ট)
ব্যবহার: অল্প কিছু ক্যাটাগরির মধ্যে তুলনা করার জন্য সহজ।
উদাহরণ: একটি ক্লাসের ৫টি আলাদা ব্যাচের রেজাল্টের তুলনা।
🍕 ৩. Pie Chart (পাই চার্ট)
ব্যবহার: ক্যাটাগরিকাল ডেটার অনুপাত বা শতাংশ (Proportion/Percentage) দেখাতে।
উদাহরণ: একটি ক্লাসের ৫৭% ছেলে এবং ৪৩% মেয়ে। (মনে রাখবেন, ৫-৭টির বেশি ক্যাটাগরি থাকলে পাই চার্ট এড়িয়ে চলাই ভালো)।
📶 ৪. Histogram (হিস্টোগ্রাম)
ব্যবহার: নিউমেরিক্যাল ডেটার বিন্যাস বা ডিস্ট্রিবিউশন (Distribution) বুঝতে।
উদাহরণ: শিক্ষার্থীদের প্রাপ্ত নম্বরের গড় বা মধ্যমা (Mean/Median) কেমন তা দেখতে।
📦 ৫. Box Plot (বক্স প্লট)
ব্যবহার: ডেটার বিস্তৃতি (Spread) এবং কোনো অস্বাভাবিক মান বা আউটলায়ার (Outlier) আছে কি না তা দেখতে।
উদাহরণ: ক্লাসের শিক্ষার্থীদের মধ্যে কারা অনেক বেশি বা অনেক কম নম্বর পেয়েছে তা চিহ্নিত করতে।
📈 ৬. Line Chart (লাইন চার্ট)
ব্যবহার: সময়ের সাথে পরিবর্তনের ধারা (Trend over time) বোঝাতে।
উদাহরণ: গত ১০ বছরে একটি ক্লাসের শিক্ষার্থীদের জিপিএ-র পরিবর্তনের তুলনা।
🏔️ ৭. Area Chart (এরিয়া চার্ট)
ব্যবহার: সময়ের সাথে ডেটার পরিমাণ বা বিশালত্ব (Magnitude/Volume) বোঝাতে।
উদাহরণ: কয়েকটি সাবজেক্টের শিক্ষার্থীদের গত ১০ বছরের জিপিএ-র সমষ্টিগত তুলনা।
🔵 ৮. Scatter Plot (স্ক্যাটার প্লট)
ব্যবহার: দুটি নিউমেরিক্যাল ভ্যারিয়েবলের মধ্যে সম্পর্ক (Relationship) বুঝতে।
উদাহরণ: পড়াশোনার সময় (ঘণ্টা) এবং প্রাপ্ত জিপিএ-র মধ্যে কোনো সম্পর্ক আছে কি না তা যাচাই করা।
আপনার প্রেজেন্টেশনের ধরণ রিসার্চ রিপোর্টটা অনেকটা কোয়ালিটি এনে দেয় এবং এঁর গুরুত্ব বহুগুণ বেড়ে যায় যখন আপনি সঠিক তথ্যের জন্য সঠিক ভিজুয়ালাইজেশন বেছে নেন।
ডেটা এনালাইসিস এবং রিসার্চ সম্পর্কে ছোটখাট বিষয়গুলো সহজভাবে জানতে চ্যানেলটি ফলো করতে পারেন। ধন্যবাদ।
#DataVisualization #ResearchMethods #Statistics #DataAnalysis #LearningTogether
1 month ago | [YT] | 4
View 0 replies
Shahriar Alam Rakib
Null Hypothesis Rejected মানেই তো Alternative Hypothesis Accepted তাই না?
কিন্তু কেন এই সত্যিটা সরাসরি বলতে পারি না? কেন এই প্যাঁচ? চলুন সহজ করি!
মূলত দুইটা দর্শনের কারণে আমরা এমনটা করি।
প্রথমটা হচ্ছে আদালতের দর্শন (Innocent until proven guilty বা অপরাধ প্রমাণ না হওয়া পর্যন্ত আসামি নির্দোষ)।
আরেকটা হচ্ছে বিজ্ঞানের অনিশ্চয়তার নীতি (বিজ্ঞান, গবেষণা বা পরিসংখ্যান কখনোই ১০০% গ্যারান্টি দেয় না, কেননা প্রকৃতিতে অনেক uncertainty বিদ্যমান)। বিজ্ঞান শুধু চেষ্টা করে সেই uncertainty কমাইতে। বিজ্ঞান কখনো ১০০% নিশ্চিত হয়ে কিছু বলে না এবং ভবিষ্যতেও বলতে পারবে না। এটাই বিজ্ঞানের নীতি।
এবার আসেন দেখি এই টার্মগুলোর বাংলা কি আসলে। দুইটা দেখতে একইরকম কথা হলেও খুব সুক্ষ পার্থক্য আছে।
যেমনঃ
Alternative Hypothesis Accepted = ১০০% নিশ্চিত
(অনেক বেশি শক্তিশালী কথা) যা বিজ্ঞান এর নীতি বহির্ভূত।
Null Hypothesis Rejected = পর্যাপ্ত প্রমাণ না থাকা সাপেক্ষে নিশ্চিত (তুলনামূলক নিরাপদ কথা) কেননা ভবিষ্যতে আরও প্রমাণ আসলে এই দাবী/সত্যটি বাতিল করা যাবে।
অর্থাৎ ভবিষ্যতে নতুন কোনো তথ্য এসে বর্তমানের অল্টারনেটিভ হাইপোথিসিসকেও ভুল প্রমাণ করতে পারে। তাই বিজ্ঞানীরা নিরাপদ থাকতে "Accepted" শব্দটি এড়িয়ে চলেন। এবং বলেন Null
Hypothesis Rejected বা আপাতত পর্যাপ্ত প্রমাণ না থাকা সাপেক্ষে নিশ্চিত হচ্ছি বা সত্য বলে মেনে নিচ্চি।
Quantitative রিসার্চের জন্য Statistics এবং Data Analysis এর খুঁটিনাটি বিষয়গুলো সহজভাবে বুঝার আমি একটি সেমিনার আয়োজন করতে চাই। আপনারা আগ্রহী হলে কমেন্ট করতে পারেন। ধন্যবাদ
#Statistics #Research #data #dataanalysis #NullHypothesis #LearningEveryday #DataScience
1 month ago | [YT] | 2
View 1 reply
Shahriar Alam Rakib
Quantitative রিসার্চে Statistical Tests Selection একটি গুরুত্বপূর্ণ বিষয়। ডেটার ধরন এবং উদ্দেশ্যের উপর নির্ভর করে সঠিক টেস্ট রান না করতে পারলে আপনার গবেষণা থেকে আপনি কোন meaningful insight বের করতে পারবেন না।
যে টেস্টগুলো খুবই প্রয়োজনীয় এবং প্রায় সব ফিল্ডের রিসার্চেই ব্যবহার করতে হয় সেগুলো নিয়ে আলোচনা করছি। অল্প কথায়, সহজভাবে উদাহরণসহ উপস্থাপন করেছি যেন একজন বিগিনারও বুঝতে পারে।
আপনি টেবিলটি সেভ করে রাখতে পারেন, ভবিষ্যতে কাজে লাগতে পারে।
১. একটি গ্রুপের তুলনা
আপনার ডেটা থেকে প্রাপ্ত রেজাল্ট যখন কোনো National/Standard মান বা পপুলেশনের গড়ের সাথে তুলনা করতে চান।
উদাহরণ: ঢাবির শিক্ষার্থীদের গড় ওজন কি দেশের জাতীয় গড় ওজনের (যেমন: ৬৫ কেজি) সমান?
টেস্ট: One Sample T-Test (প্যারামেট্রিক) অথবা Wilcoxon Signed Rank Test (নন-প্যারামেট্রিক)।
২. দুটি আলাদা গ্রুপের তুলনা (Two Independent Samples)
যখন আপনি দুটি সম্পূর্ণ আলাদা গ্রুপের মধ্যে তুলনা করতে চান।
উদাহরণ: ছাত্রদের গড় ওজন কি ছাত্রীদের গড় ওজনের চেয়ে ভিন্ন?
টেস্ট: Independent Samples T-Test (প্যারামেট্রিক) অথবা Mann-Whitney U Test (নন-প্যারামেট্রিক)।
৩. তিন বা ততোধিক গ্রুপের তুলনা (More Than Two Independent Samples)
যখন আপনার গবেষণায় ৩টি বা তার বেশি আলাদা গ্রুপ থাকে।
উদাহরণ: উচ্চবিত্ত, মধ্যবিত্ত এবং নিম্নবিত্ত পরিবারের শিক্ষার্থীদের ওজনে কি কোনো পার্থক্য আছে?
টেস্ট: One-Way ANOVA (প্যারামেট্রিক) অথবা Kruskal-Wallis Test (নন-প্যারামেট্রিক)।
৪. একই গ্রুপের আগে ও পরের তুলনা (Two Dependent Samples)
যখন একই মানুষের ওপর দুটি ভিন্ন সময়ে পরীক্ষা চালানো হয়।
উদাহরণ: করোনাকালীন ছুটির আগের গড় ওজন এবং পরের গড় ওজনে কি কোনো পরিবর্তন এসেছে?
টেস্ট: Paired Samples T-Test (প্যারামেট্রিক) অথবা Wilcoxon Signed Rank Test (নন-প্যারামেট্রিক)।
৫. দুটি সংখ্যামূলক চলকের সম্পর্ক (Relationship: Numeric)
যখন আপনি জানতে চান একটি সংখ্যা বাড়লে অন্যটি বাড়ে কি না।
উদাহরণ: ওজন বাড়লে কি উচ্চতাও বাড়ে? অর্থাৎ ওজন ও উচ্চতার মধ্যে কি সম্পর্ক আছে?
টেস্ট: Pearson Correlation (প্যারামেট্রিক) অথবা Spearman Rank Correlation (নন-প্যারামেট্রিক)।
৬. দুটি গুণবাচক চলকের সম্পর্ক (Relationship: Categorical)
যখন দুটি ক্যাটাগরির মধ্যে সম্পর্ক খুঁজতে চান।
উদাহরণ: শিক্ষার্থীদের লিঙ্গ (Gender) এবং তাদের আবাসন অবস্থার (Residential Status) মধ্যে কি কোনো সম্পর্ক আছে?
টেস্ট: Chi-Square Test of Independence।
৭. ফলাফল প্রেডিক্ট করা (Predicting an Outcome)
যখন আপনি এক বা একাধিক কারণ দিয়ে একটি ফলাফল আগে থেকে অনুমান করতে চান।
Linear: এসএসসি/এইচএসসির রেজাল্ট দিয়ে কি অনার্সের সিজিপিএ প্রেডিক্ট করা সম্ভব?
Logistic: সিজিপিএ এবং অভিজ্ঞতা দেখে কি বলা সম্ভব কেউ চাকরি পাবে কি পাবে না (হ্যাঁ/না)?
সবগুলো টেস্ট একটা রিয়েল ডেটাসেট থেকে প্রাকটিকালি দেখতে চাইলে এবং রিপোর্টে কিভাবে রেজাল্ট প্রেজেন্ট করতে হয় জানতে চাইলে একটা সেমিনারের আয়োজন করতে পারি। আপনারা আগ্রহী হলে কমেন্ট করতে পারেন। ধন্যবাদ।
#Research #Statistics #DataAnalysis #ThesisHelp #SPSS #LearningStatistics
1 month ago | [YT] | 1
View 0 replies
Shahriar Alam Rakib
Standard Deviation বলতে কি বুঝি, সহজভাবে উদাহরণ দিয়ে বুঝানোর চেষ্টা করবো।
ছবিতে ১০ জনের height নিলাম এবং দেখতে পাচ্ছি এদের গড় উচ্চতা 5.46। এখন দেখেন এই mean থেকে কিন্তু প্রতিটা value মানে প্রতিটা মানুষের হাইট একটু deviate করতেছে, মানে একটু দূরে অবস্থান করতেছে। আসলে সেই দূরত্বটা কতটুকু, চলুন দেখি।
এখানে প্রথমজনের হাইট 5 ফুট এবং mean থেকে দূরত্ব 0.46, একইভাবে দ্বিতীয়জন 0.06, তৃতীয়জন 0.16 এবং উপড়ের দিকেও ঠিক এরকম দূরত্ব আমরা দেখতে পাচ্ছি। statistics নিয়ে কাজ করলে স্বাভাবিকভাবেই আপনার মনে প্রশ্ন আসবে, এইযে দূরত্বগুলো দেখতে পাচ্ছি, এগুলোর গড় কত? এই গড় দূরত্বটাই আসলে standard deviation. মানে প্রতিটা value, mean থেকে গড়ে কতটুকু দূরে অবস্থান করতেছে, এটাইকেই বলে standard deviation বা আদর্শ বিচ্যুতি।
এটা কেন প্রয়োজন পড়ে? আমরা mean থেকে একটা সিনারিও পাই যে সবার গড় উচ্চতা ৫ফুট ৪ইঞ্চি। এখন যদি standard deviation value টা কম হয়, তাহলে বুঝতে পারবো এই ১০ জনের সবার উচ্চতা প্রায় কাছাকাছি। আর যদি standard deviation value টা বেশি আসে, তাহলে বুঝতে হবে এদের মাঝে উচ্চতার পার্থক্য অনেক বেশি, মানে সবাই কাছাকাছি উচ্চতার না, একজনের থেকে আরেকজনের উচ্চতার বিশাল পার্থক্য আছে। এটাকে বলে Measures of Dispersion, মানে ডেটাগুলো কেমন ছড়িয়ে ছিটিয়ে আছে সেগুলো দেখা।
Data Visualize করে মোটাদাগে সহজভাবে বুঝানোর চেষ্টা করেছি। আরও স্পষ্টকরে যদি বুঝতে চান, এটা নিয়ে আমার একটা ভিডিও আছে যেখানে পুরো বিষয়টা ফর্মুলা থেকে ম্যানুয়ালি calculate করা এবং excel দিয়ে ক্যালকুলেট করেও দেখানো হয়েছে। ভিডিওটা দেখলে আশা করি বুঝতে পারবেন।
1 year ago | [YT] | 8
View 0 replies
Shahriar Alam Rakib
আমরা যদি Likert Scale Data নিয়ে কাজ করি এবং অনেকগুলো প্রশ্ন দিয়ে নির্দিষ্ট কোন লেভেল মাপতে চাই তাহলে এই Formula টা এপ্লাই করে এনালাইসিস করতে পারি।
ধরুন, আমরা Consumer দের Safe Fish Knowledge জানতে চাই। সেক্ষেত্রে Fish Consumption Knowledge সম্পর্কিত ১০টা Likert Scale প্রশ্ন তৈরি করলাম। এবং সেগুলো 5 point likert scale.
For Example: “Consumption of safe food is more important than tasty food. Do you know that?” এই প্রশ্নের উত্তরগুলো হবে-
1 = Not at all
2 = Very little
3 = Somewhat
4 = A lot
5 = To a great extent
এরকম করে ভিন্ন ভিন্ন ১০টা প্রশ্ন তৈরি করলাম।
এখন এই ১০টা প্রশ্নকে Calculation এর মাধ্যমে একটা সিঙ্গেল ভ্যারিয়েবলে নিয়ে এসে উনাদের Safe Fish Knowledge লেভেল জানতে পারি। তারপর সেটাকে নতুন আরেকটা ভ্যারিয়েবলে রি-ক্যাটাগরাইজ করবো এভাবে “High Knowledge”, “Moderate Knowledge”, “Low Knowledge” ক্যাটেগরি তৈরি করে আমরা একটা সামারিতে আসতে পারি।
সেটা করার জন্য জাস্ট নিচের ফর্মুলাটা এপ্লাই করতে হবে। আর এই কাজটা একদম ডেটা থেকে খুঁটিনাটি ব্যাখ্যা করে প্রাক্টিক্যালি দেখানো হয়েছে আমার ইউটিউব চ্যানেলে। যারা Likert Scale নিয়ে কাজ করেন তাদের ক্ষেত্রে এটা খুবই হেল্পফুল হবে। যেকোন Likert Scale Data আপনি এভাবে এনালাইসিস করতে পারবেন।
তারপর এই Likert Scale ডেটা নিয়ে কিভাবে আরও Inferential Statistics তৈরি করা যায় সেগুলোও ধীরে ধীরে ধীরে দেখানো হবে। আশা করি উপকৃত হবেন। ধন্যবাদ
1 year ago | [YT] | 0
View 0 replies
Load more