দিয়া: স্যার, আমি স্কুলে একটা নতুন প্রজেক্ট পেয়েছি। আমাদের ক্লাসের বন্ধুদের পছন্দের খাবার নিয়ে একটা রিপোর্ট তৈরি করতে হবে। কিন্তু এতগুলো ডেটা কীভাবে সাজাবো, আর কীভাবেই বা বুঝবো কোনটা সবচেয়ে বেশি জনপ্রিয়, সেটা বুঝতে পারছি না। মনে হচ্ছে এটা খুব জটিল কিছু!

অঙ্ক স্যার: আরে, দিয়া! এটা তো মোটেও জটিল কিছু নয়, বরং খুব মজার একটা কাজ! তুমি আসলে ‘রাশিবিজ্ঞান’ (Statistics) এর প্রাথমিক স্তরে প্রবেশ করছো। এটা গণিতের এমন একটি শাখা যা আমাদের চারপাশের তথ্য বা ডেটা সংগ্রহ করতে, সেগুলোকে সুন্দরভাবে সাজাতে, বিশ্লেষণ করতে এবং সেই ডেটা থেকে গুরুত্বপূর্ণ সিদ্ধান্ত নিতে সাহায্য করে। তোমার এই প্রজেক্টের জন্য রাশিবিজ্ঞানই হলো আসল চাবিকাঠি!

রাশিবিজ্ঞান কী এবং কেন এটি প্রয়োজন?

দিয়া: রাশিবিজ্ঞান? নামটা শুনেছি, কিন্তু এর ব্যবহার যে এত গুরুত্বপূর্ণ, তা জানতাম না। তাহলে এর মানে কী, স্যার?

অঙ্ক স্যার: সহজ কথায় বলতে গেলে, রাশিবিজ্ঞান হলো ডেটা নিয়ে কাজ করার বিজ্ঞান। ধরো, আমাদের দেশের জনসংখ্যা কত, গত দশ বছরে আবহাওয়ার পরিবর্তন কেমন হয়েছে, বা কোন ক্রিকেট খেলোয়াড়ের ব্যাটিং গড় কত – এই সব কিছুই হলো তথ্য বা ডেটা। রাশিবিজ্ঞান আমাদের এই অগোছালো ডেটাগুলোকে অর্থপূর্ণ তথ্যে পরিণত করতে শেখায়, যাতে আমরা সেগুলোকে বুঝতে পারি এবং সে অনুযায়ী পদক্ষেপ নিতে পারি। যেমন, সরকার জানতে চায় কোন অঞ্চলে শিক্ষার হার কেমন, কোম্পানি জানতে চায় তাদের কোন পণ্যটি বেশি বিক্রি হচ্ছে, বা তুমি যেমন জানতে চাও তোমার বন্ধুদের পছন্দের খাবার কী।

দিয়া: ওহ, তাহলে তো এটা আমাদের দৈনন্দিন জীবনেও খুব কাজে লাগে!

অঙ্ক স্যার: একদম ঠিক বলেছ! এখন, তোমার প্রজেক্টের কথায় আসি। প্রথমেই তোমাকে ডেটা সংগ্রহ করতে হবে, অর্থাৎ বন্ধুদের পছন্দের খাবারের তালিকা নিতে হবে। এরপর সেই ডেটাগুলোকে সাজাতে হবে। এই সাজানোর প্রক্রিয়াকে আমরা বলি ‘পরিসংখ্যা বিভাজন’ (Frequency Distribution)।

ডেটা ও পরিসংখ্যা বিভাজন

দিয়া: পরিসংখ্যা বিভাজন? এটা কী জিনিস?

অঙ্ক স্যার: ধরো, তুমি তোমার ক্লাসের ২০ জন বন্ধুর পছন্দের খাবার জিজ্ঞেস করেছ এবং তাদের উত্তরগুলো হলো: বিরিয়ানি, মোমো, পিৎজা, মোমো, বিরিয়ানি, বিরিয়ানি, পিৎজা, মোমো, চাউমিন, বিরিয়ানি, মোমো, পিৎজা, বিরিয়ানি, চাউমিন, মোমো, বিরিয়ানি, পিৎজা, মোমো, চাউমিন, বিরিয়ানি।

এটা হলো তোমার 'কাঁচা ডেটা' (Raw Data)। এখন তুমি যদি জানতে চাও কোন খাবার কতজন বন্ধু পছন্দ করে, তাহলে তুমি প্রত্যেকটি খাবারের জন্য কতজন করে বলেছে, তা গুনবে।

  • বিরিয়ানি: 7 জন
  • মোমো: 6 জন
  • পিৎজা: 4 জন
  • চাউমিন: 3 জন

এই যে তুমি প্রত্যেকটি খাবারের পাশে তার সংখ্যাটা লিখলে, এই সংখ্যাটাকেই বলা হয় 'পরিসংখ্যা' (Frequency)। আর এই পুরো সারণিটাই হলো একটি 'পরিসংখ্যা বিভাজন সারণি'। যখন ডেটাগুলো ছোট হয়, তখন এভাবে সরাসরি পরিসংখ্যা বের করা যায়। কিন্তু ডেটা যদি অনেক বেশি হয়, যেমন, ১০০ জন ছাত্রের প্রাপ্ত নম্বর, তখন আমরা ডেটাগুলোকে 'শ্রেণি ব্যবধান' (Class Interval) এ ভাগ করি।

দিয়া: শ্রেণি ব্যবধান? মানে ০-১০, ১০-২০ এমন?

অঙ্ক স্যার: একদম ঠিক! ওগুলোকে বলে 'শ্রেণিবদ্ধ ডেটা' (Grouped Data)। নবম শ্রেণিতে আমরা এই শ্রেণিবদ্ধ ডেটার 'কেন্দ্রীয় প্রবণতার পরিমাপ' (Measures of Central Tendency) নিয়ে বিস্তারিত আলোচনা করি। কেন্দ্রীয় প্রবণতার প্রধান তিনটি পরিমাপ হলো: গড় (Mean), মধ্যমা (Median) এবং সংখ্যাগুরু মান (Mode)।

কেন্দ্রীয় প্রবণতার পরিমাপ: গড় (Mean)

দিয়া: গড় তো আমরা ছোটবেলা থেকেই করছি। সব সংখ্যা যোগ করে মোট সংখ্যা দিয়ে ভাগ করলেই হয়, তাই না?

অঙ্ক স্যার: হ্যাঁ, তুমি যেটা বলছো, সেটা হলো 'অশ্রেণিবদ্ধ ডেটা' (Ungrouped Data) এর গড়। ধরো, তোমার শেষ ৫টি গণিত পরীক্ষার নম্বর হলো: 75, 80, 65, 90, 85। এদের গড় হবে:

গড় = (75 + 80 + 65 + 90 + 85) / 5 = 395 / 5 = 79

কিন্তু যখন আমাদের কাছে 'শ্রেণিবদ্ধ ডেটা' থাকে, তখন গড় নির্ণয়ের পদ্ধতি একটু ভিন্ন হয়। এর তিনটি প্রধান পদ্ধতি আছে: ১. প্রত্যক্ষ পদ্ধতি (Direct Method), ২. কল্পিত গড় পদ্ধতি (Assumed Mean Method), এবং ৩. ক্রমবিচ্যুতি পদ্ধতি (Step-Deviation Method)।

১. প্রত্যক্ষ পদ্ধতি (Direct Method)

অঙ্ক স্যার: চলো একটা উদাহরণ দিয়ে বুঝি। ধরা যাক, 50 জন ছাত্রের গণিত পরীক্ষার প্রাপ্ত নম্বরের পরিসংখ্যা বিভাজন সারণি নিচে দেওয়া হলো:

প্রাপ্ত নম্বর (শ্রেণি ব্যবধান) ছাত্র সংখ্যা (পরিসংখ্যা, f)
0-10 5
10-20 10
20-30 15
30-40 12
40-50 8
মোট 50

প্রত্যক্ষ পদ্ধতিতে গড় নির্ণয়ের সূত্র হলো: গড় (x̄) = Σ(fᵢxᵢ) / Σfᵢ

এখানে, fᵢ হলো i-তম শ্রেণির পরিসংখ্যা, এবং xᵢ হলো i-তম শ্রেণির মধ্যবিন্দু।

দিয়া: মধ্যবিন্দু মানে কী স্যার?

অঙ্ক স্যার: প্রতিটি শ্রেণি ব্যবধানের মাঝের মান। যেমন, 0-10 শ্রেণির মধ্যবিন্দু হলো (0+10)/2 = 5।

এবার সারণিটি সম্পূর্ণ করি:

প্রাপ্ত নম্বর (শ্রেণি ব্যবধান) ছাত্র সংখ্যা (fᵢ) মধ্যবিন্দু (xᵢ) fᵢxᵢ
0-10 5 (0+10)/2 = 5 5 * 5 = 25
10-20 10 (10+20)/2 = 15 10 * 15 = 150
20-30 15 (20+30)/2 = 25 15 * 25 = 375
30-40 12 (30+40)/2 = 35 12 * 35 = 420
40-50 8 (40+50)/2 = 45 8 * 45 = 360
মোট Σfᵢ = 50 Σfᵢxᵢ = 1330

এখন, গড় (x̄) = Σ(fᵢxᵢ) / Σfᵢ = 1330 / 50 = 26.6

সুতরাং, ছাত্রদের প্রাপ্ত নম্বরের গড় হলো 26.6।

২. কল্পিত গড় পদ্ধতি (Assumed Mean Method)

দিয়া: এটা তো একটু বড় গণনা। যদি সংখ্যাগুলো আরও বড় হয়, তখন কী হবে?

অঙ্ক স্যার: তোমার প্রশ্নটা খুব প্রাসঙ্গিক, দিয়া। যখন xᵢ এবং fᵢ এর মানগুলো বড় হয়, তখন fᵢxᵢ এর গুণফলও অনেক বড় হয়, যা গণনাকে জটিল করে তোলে। এই সমস্যা সমাধানের জন্য আমরা 'কল্পিত গড় পদ্ধতি' ব্যবহার করি। এখানে আমরা xᵢ এর মধ্য থেকে যেকোনো একটি মানকে কল্পিত গড় (A) হিসেবে ধরে নিই।

কল্পিত গড় পদ্ধতির সূত্র হলো: গড় (x̄) = A + [Σ(fᵢdᵢ) / Σfᵢ]

এখানে, dᵢ = xᵢ - A (মধ্যবিন্দু থেকে কল্পিত গড়ের বিচ্যুতি)।

সেই একই ডেটা ব্যবহার করে দেখি:

প্রাপ্ত নম্বর (শ্রেণি ব্যবধান) ছাত্র সংখ্যা (fᵢ) মধ্যবিন্দু (xᵢ) বিচ্যুতি (dᵢ = xᵢ - A)
(ধরি A = 25)
fᵢdᵢ
0-10 5 5 5 - 25 = -20 5 * (-20) = -100
10-20 10 15 15 - 25 = -10 10 * (-10) = -100
20-30 15 25 25 - 25 = 0 15 * 0 = 0
30-40 12 35 35 - 25 = 10 12 * 10 = 120
40-50 8 45 45 - 25 = 20 8 * 20 = 160
মোট Σfᵢ = 50 Σfᵢdᵢ = 80

এখানে A = 25 (আমরা 20-30 শ্রেণির মধ্যবিন্দুকে কল্পিত গড় হিসেবে ধরেছি, যা মাঝামাঝি একটি মান)।

এখন, গড় (x̄) = A + [Σ(fᵢdᵢ) / Σfᵢ] = 25 + (80 / 50) = 25 + 1.6 = 26.6

দেখো, ফলাফল একই এসেছে, কিন্তু গণনাগুলো কিছুটা ছোট হয়েছে।

৩. ক্রমবিচ্যুতি পদ্ধতি (Step-Deviation Method)

দিয়া: এটা তো আরও সহজ মনে হচ্ছে। তাহলে ক্রমবিচ্যুতি পদ্ধতিটা কখন ব্যবহার করা হয়?

অঙ্ক স্যার: যখন dᵢ এর মানগুলো একই সাধারণ গুণিতক (Common Factor) দ্বারা বিভাজ্য হয়, তখন গণনা আরও সহজ করার জন্য আমরা 'ক্রমবিচ্যুতি পদ্ধতি' ব্যবহার করি। এটি কল্পিত গড় পদ্ধতিরই একটি উন্নত সংস্করণ।

ক্রমবিচ্যুতি পদ্ধতির সূত্র হলো: গড় (x̄) = A + [(Σ(fᵢuᵢ) / Σfᵢ) * h]

এখানে, uᵢ = dᵢ / h = (xᵢ - A) / h (ক্রমবিচ্যুতি), এবং h হলো শ্রেণির দৈর্ঘ্য (বা dᵢ এর সাধারণ গুণিতক)। এই ক্ষেত্রে, h = 10 (কারণ শ্রেণি ব্যবধান 10-20, 20-30 ইত্যাদির দৈর্ঘ্য 10)।

একই ডেটা ব্যবহার করে সারণিটি সম্পূর্ণ করি:

প্রাপ্ত নম্বর (শ্রেণি ব্যবধান) ছাত্র সংখ্যা (fᵢ) মধ্যবিন্দু (xᵢ) বিচ্যুতি (dᵢ = xᵢ - A)
(ধরি A = 25)
ক্রমবিচ্যুতি (uᵢ = dᵢ / h)
(ধরি h = 10)
fᵢuᵢ
0-10 5 5 -20 -20/10 = -2 5 * (-2) = -10
10-20 10 15 -10 -10/10 = -1 10 * (-1) = -10
20-30 15 25 0 0/10 = 0 15 * 0 = 0
30-40 12 35 10 10/10 = 1 12 * 1 = 12
40-50 8 45 20 20/10 = 2 8 * 2 = 16
মোট Σfᵢ = 50 Σfᵢuᵢ = 8

এখানে A = 25 এবং h = 10।

এখন, গড় (x̄) = A + [(Σ(fᵢuᵢ) / Σfᵢ) * h] = 25 + [(8 / 50) * 10] = 25 + (0.16 * 10) = 25 + 1.6 = 26.6

আবারও ফলাফল একই, কিন্তু গণনাগুলো আরও সরল হয়ে গেল। তুমি নিজের সুবিধা অনুযায়ী যেকোনো পদ্ধতি ব্যবহার করতে পারো, তবে জটিল ডেটার ক্ষেত্রে কল্পিত গড় বা ক্রমবিচ্যুতি পদ্ধতি বেশ কার্যকর।

কেন্দ্রীয় প্রবণতার পরিমাপ: মধ্যমা (Median)

দিয়া: গড় তো বুঝলাম। মধ্যমা কী, স্যার?

অঙ্ক স্যার: মধ্যমা হলো ডেটার ঠিক মাঝের মান। অর্থাৎ, যখন তুমি ডেটাগুলোকে মানের ঊর্ধ্বক্রম বা অধঃক্রমে সাজাবে, তখন যে মানটি ডেটাকে দুটি সমান অংশে ভাগ করবে, সেটাই মধ্যমা।

অশ্রেণিবদ্ধ ডেটার মধ্যমা

অঙ্ক স্যার: ধরো, তোমার কাছে কিছু ডেটা আছে: 2, 5, 7, 8, 10। এগুলোকে সাজালে, মাঝের মানটি হলো 7। তাহলে মধ্যমা 7।

যদি ডেটার সংখ্যা বিজোড় (n) হয়, তাহলে মধ্যমা হবে (n+1)/2 তম পদ।

যদি ডেটার সংখ্যা জোড় (n) হয়, তাহলে মাঝের দুটি পদের গাণিতিক গড় হবে মধ্যমা। যেমন: 2, 5, 7, 8, 10, 12। এখানে মাঝের দুটি পদ 7 ও 8। মধ্যমা হবে (7+8)/2 = 7.5।

শ্রেণিবদ্ধ ডেটার মধ্যমা

অঙ্ক স্যার: শ্রেণিবদ্ধ ডেটার মধ্যমা নির্ণয়ের জন্য আমাদের একটি নির্দিষ্ট সূত্র ব্যবহার করতে হয়। সূত্রটি হলো:

মধ্যমা = L + [(N/2 - C) / f] * h

এখানে:

  • L = মধ্যমা শ্রেণির নিম্নসীমা (Lower limit of the median class)
  • N = মোট পরিসংখ্যা (Total frequency)
  • C = মধ্যমা শ্রেণির পূর্ববর্তী শ্রেণির ক্রমযৌগিক পরিসংখ্যা (Cumulative frequency of the class preceding the median class)
  • f = মধ্যমা শ্রেণির পরিসংখ্যা (Frequency of the median class)
  • h = শ্রেণি দৈর্ঘ্য (Class size)

সেই একই ডেটা সারণি ব্যবহার করে দেখি। প্রথমে আমাদের ক্রমযৌগিক পরিসংখ্যা (Cumulative Frequency, Cf) বের করতে হবে।

প্রাপ্ত নম্বর (শ্রেণি ব্যবধান) ছাত্র সংখ্যা (fᵢ) ক্রমযৌগিক পরিসংখ্যা (Cf)
0-10 5 5
10-20 10 5 + 10 = 15
20-30 15 15 + 15 = 30
30-40 12 30 + 12 = 42
40-50 8 42 + 8 = 50
মোট N = 50

এখানে মোট পরিসংখ্যা N = 50। তাহলে N/2 = 50/2 = 25।

এখন, আমাদের দেখতে হবে ক্রমযৌগিক পরিসংখ্যার কোন শ্রেণিতে N/2 = 25 আছে। '30' ক্রমযৌগিক পরিসংখ্যাটি 25 এর চেয়ে প্রথম বড় বা সমান। এই '30' এর সাথে সংশ্লিষ্ট শ্রেণি হলো 20-30। সুতরাং, 'মধ্যমা শ্রেণি' হলো 20-30।

  • L = মধ্যমা শ্রেণির নিম্নসীমা = 20
  • N = 50
  • C = মধ্যমা শ্রেণির পূর্ববর্তী শ্রেণির ক্রমযৌগিক পরিসংখ্যা (10-20 শ্রেণির Cf) = 15
  • f = মধ্যমা শ্রেণির পরিসংখ্যা (20-30 শ্রেণির f) = 15
  • h = শ্রেণি দৈর্ঘ্য = 10

মধ্যমা = L + [(N/2 - C) / f] * h

= 20 + [(25 - 15) / 15] * 10

= 20 + [10 / 15] * 10

= 20 + (2/3) * 10

= 20 + 20/3

= 20 + 6.67 (প্রায়)

= 26.67 (প্রায়)

সুতরাং, ছাত্রদের প্রাপ্ত নম্বরের মধ্যমা প্রায় 26.67।

কেন্দ্রীয় প্রবণতার পরিমাপ: সংখ্যাগুরু মান (Mode)

দিয়া: সংখ্যাগুরু মানটা কি স্যার? নামের সঙ্গে 'গুরু' আছে, মনে হচ্ছে এটা খুব গুরুত্বপূর্ণ?

অঙ্ক স্যার: হা হা, গুরুত্বপূর্ণ তো বটেই! সংখ্যাগুরু মান বা Mode হলো সেই মান, যা ডেটাসেটের মধ্যে সবচেয়ে বেশিবার আসে বা যেটার পরিসংখ্যা সবচেয়ে বেশি। তোমার পছন্দের খাবারের প্রজেক্টের ক্ষেত্রে, যে খাবারটা সবচেয়ে বেশি বন্ধু পছন্দ করেছে, সেটাই হবে সংখ্যাগুরু মান।

অশ্রেণিবদ্ধ ডেটার সংখ্যাগুরু মান

অঙ্ক স্যার: সেই খাবারের উদাহরণে, বিরিয়ানি ৭ জন পছন্দ করেছে, যা অন্যদের থেকে বেশি। তাহলে বিরিয়ানি হলো সংখ্যাগুরু মান। যদি 2, 3, 5, 3, 7, 3, 8 হয়, তাহলে 3 সবচেয়ে বেশিবার এসেছে, তাই 3 হলো সংখ্যাগুরু মান।

কখনও কখনও একটি ডেটাসেটে দুটি সংখ্যাগুরু মান থাকতে পারে (যেমন 2, 3, 3, 5, 5, 7 - এখানে 3 এবং 5 উভয়ই দুবার করে এসেছে)। একে 'দ্বি-সংখ্যাগুরু মান' (Bimodal) ডেটাসেট বলে।

শ্রেণিবদ্ধ ডেটার সংখ্যাগুরু মান

অঙ্ক স্যার: শ্রেণিবদ্ধ ডেটার ক্ষেত্রে সংখ্যাগুরু মান নির্ণয়ের জন্য আমরা এই সূত্রটি ব্যবহার করি:

সংখ্যাগুরু মান = L + [(f₁ - f₀) / (2f₁ - f₀ - f₂)] * h

এখানে:

  • L = সংখ্যাগুরু শ্রেণি বা মোডাল শ্রেণির নিম্নসীমা (Lower limit of the modal class)
  • f₁ = সংখ্যাগুরু শ্রেণির পরিসংখ্যা (Frequency of the modal class)
  • f₀ = সংখ্যাগুরু শ্রেণির পূর্ববর্তী শ্রেণির পরিসংখ্যা (Frequency of the class preceding the modal class)
  • f₂ = সংখ্যাগুরু শ্রেণির পরবর্তী শ্রেণির পরিসংখ্যা (Frequency of the class succeeding the modal class)
  • h = শ্রেণি দৈর্ঘ্য (Class size)

সেই একই ডেটা সারণিটি আবার দেখি:

প্রাপ্ত নম্বর (শ্রেণি ব্যবধান) ছাত্র সংখ্যা (fᵢ)
0-10 5 (f₀' এর পূর্ববর্তী, প্রয়োজন নেই)
10-20 10 (f₀)
20-30 15 (f₁) - সর্বোচ্চ পরিসংখ্যা
30-40 12 (f₂)
40-50 8 (f₂' এর পরবর্তী, প্রয়োজন নেই)
মোট N = 50

এখানে, সর্বোচ্চ পরিসংখ্যা হলো 15, যা 20-30 শ্রেণির মধ্যে আছে। সুতরাং, 'সংখ্যাগুরু শ্রেণি' বা 'মোডাল শ্রেণি' হলো 20-30।

  • L = সংখ্যাগুরু শ্রেণির নিম্নসীমা = 20
  • f₁ = সংখ্যাগুরু শ্রেণির পরিসংখ্যা = 15
  • f₀ = সংখ্যাগুরু শ্রেণির পূর্ববর্তী শ্রেণির পরিসংখ্যা (10-20 শ্রেণির f) = 10
  • f₂ = সংখ্যাগুরু শ্রেণির পরবর্তী শ্রেণির পরিসংখ্যা (30-40 শ্রেণির f) = 12
  • h = শ্রেণি দৈর্ঘ্য = 10

সংখ্যাগুরু মান = L + [(f₁ - f₀) / (2f₁ - f₀ - f₂)] * h

= 20 + [(15 - 10) / (2 * 15 - 10 - 12)] * 10

= 20 + [5 / (30 - 10 - 12)] * 10

= 20 + [5 / (20 - 12)] * 10

= 20 + [5 / 8] * 10

= 20 + (50 / 8)

= 20 + 6.25

= 26.25

সুতরাং, ছাত্রদের প্রাপ্ত নম্বরের সংখ্যাগুরু মান হলো 26.25।

গড়, মধ্যমা এবং সংখ্যাগুরু মানের ব্যবহারিক প্রয়োগ

দিয়া: স্যার, আমরা তো তিনটি পরিমাপ শিখলাম: গড়, মধ্যমা আর সংখ্যাগুরু মান। কিন্তু কখন কোনটা ব্যবহার করব?

অঙ্ক স্যার: খুব সুন্দর প্রশ্ন, দিয়া! এদের প্রত্যেকের নিজস্ব ব্যবহার আছে।

  • গড় (Mean): এটি সবচেয়ে বেশি ব্যবহৃত হয়। যখন ডেটাগুলো মোটামুটি সুষমভাবে বন্টিত থাকে এবং ডেটাসেটে কোনো চরম মান (Extremes) না থাকে, তখন গড় সবচেয়ে নির্ভরযোগ্য। যেমন, কোনো ক্লাসের ছাত্রদের গড় নম্বর, গড় আয় ইত্যাদি। তবে, যদি ডেটাসেটে কোনো খুব বড় বা খুব ছোট মান থাকে, তাহলে গড় প্রভাবিত হতে পারে।
  • মধ্যমা (Median): যখন ডেটাসেটে চরম মান থাকে, যা গড়কে প্রভাবিত করতে পারে, তখন মধ্যমা একটি ভালো বিকল্প। যেমন, আয়ের ডেটার ক্ষেত্রে মধ্যমা ব্যবহার করা হয়, কারণ কিছু মানুষের খুব বেশি আয় থাকলেও মধ্যমা আয়ের সাধারণ মানুষের প্রকৃত আয়কে ভালোভাবে প্রতিফলিত করে। এটি ডেটার মাঝের প্রবণতাকে নির্দেশ করে।
  • সংখ্যাগুরু মান (Mode): এটি মূলত 'গুণগত ডেটা' (Qualitative Data) এর ক্ষেত্রে বা যখন সবচেয়ে জনপ্রিয় বা প্রচলিত মানটি জানতে হয়, তখন ব্যবহার করা হয়। যেমন, তোমার পছন্দের খাবারের ডেটাতে কোন খাবারটি সবচেয়ে জনপ্রিয়, বা পোশাকের ক্ষেত্রে কোন সাইজের বিক্রি বেশি, তা জানতে। ডেটাসেটে যদি পুনরাবৃত্তি না থাকে, তাহলে সংখ্যাগুরু মান নাও থাকতে পারে।

দিয়া: তার মানে, ডেটার ধরন এবং আমাদের কী জানতে চাইছি, তার ওপর নির্ভর করে আমরা পরিমাপ বেছে নেব, তাই না?

অঙ্ক স্যার: একদম ঠিক বলেছ!

প্রশ্নোত্তর পর্ব

দিয়া: স্যার, আমার কিছু প্রশ্ন আছে।

অঙ্ক স্যার: অবশ্যই, দিয়া! জিজ্ঞাসা করো।

দিয়া: প্রথম প্রশ্ন: যদি কোনো পরিসংখ্যা বিভাজন সারণিতে সমস্ত পরিসংখ্যা একই হয়, তাহলে কি সংখ্যাগুরু মান নির্ণয় করা সম্ভব?

অঙ্ক স্যার: ভালো প্রশ্ন! না, তখন সংখ্যাগুরু মান নির্ণয় করা সম্ভব হবে না। কারণ, সংখ্যাগুরু মান হলো সেই শ্রেণি, যার পরিসংখ্যা সবচেয়ে বেশি। যদি সব শ্রেণির পরিসংখ্যা একই হয়, তাহলে কোনো একটি শ্রেণিকে 'সর্বোচ্চ পরিসংখ্যা'র শ্রেণি হিসেবে চিহ্নিত করা যায় না। এমন ক্ষেত্রে, ডেটাসেটে কোনো সুস্পষ্ট সংখ্যাগুরু মান থাকে না।

দিয়া: দ্বিতীয় প্রশ্ন: গড়, মধ্যমা এবং সংখ্যাগুরু মানের মধ্যে একটি গাণিতিক সম্পর্ক আছে কি?

অঙ্ক স্যার: হ্যাঁ, একটি প্রায়োগিক সম্পর্ক আছে, যা 'অভিজ্ঞতামূলক সম্পর্ক' (Empirical Relationship) নামে পরিচিত। সম্পর্কটি হলো: সংখ্যাগুরু মান ≈ 3 × মধ্যমা - 2 × গড়। তবে, এটি সমস্ত ডেটাসেটের জন্য হুবহু সঠিক নাও হতে পারে, কিন্তু অনেক ক্ষেত্রেই এটি বেশ কাছাকাছি ফল দেয়, বিশেষ করে যদি ডেটা সামান্য অসমমিত (moderately asymmetrical) হয়।

দিয়া: তৃতীয় প্রশ্ন: ক্রমবিচ্যুতি পদ্ধতিতে কল্পিত গড় (A) এবং শ্রেণি দৈর্ঘ্য (h) এর মান ভুল ধরলে কি ফলাফল ভুল আসবে?

অঙ্ক স্যার: হ্যাঁ, অবশ্যই ভুল আসবে! কল্পিত গড় (A) তুমি xᵢ থেকে যেকোনো একটি মান ধরতে পারো, তবে সাধারণত মাঝের মানটি ধরলে গণনা সহজ হয়। আর শ্রেণি দৈর্ঘ্য (h) হলো শ্রেণির উচ্চসীমা থেকে নিম্নসীমা বিয়োগ করে পাওয়া মান, যেমন 10-20 শ্রেণির জন্য h = 10। এই মানগুলো সঠিক না হলে dᵢ এবং uᵢ এর মান ভুল হবে, যার ফলে গড় নির্ণয়ও ভুল হবে। তাই, এই মানগুলো সাবধানে বেছে নিতে হয়।

দিয়া: চতুর্থ প্রশ্ন: শ্রেণিবদ্ধ ডেটার মধ্যমা বা সংখ্যাগুরু মান নির্ণয়ের সময়, যদি শ্রেণি ব্যবধান 'বর্জন পদ্ধতি' (Exclusive Method) তে না থাকে, যেমন 0-9, 10-19 এমন থাকে, তখন কী করতে হয়?

অঙ্ক স্যার: চমৎকার প্রশ্ন! যদি শ্রেণি ব্যবধান 'অন্তর্ভুক্তি পদ্ধতি' (Inclusive Method) তে থাকে (যেমন 0-9, 10-19), তাহলে আমাদের প্রথমে সেগুলোকে 'বর্জন পদ্ধতি' তে রূপান্তর করতে হয়। এর জন্য, প্রতিটি শ্রেণির নিম্নসীমা থেকে 0.5 বিয়োগ করতে হয় এবং উচ্চসীমার সাথে 0.5 যোগ করতে হয়। যেমন, 0-9 শ্রেণিটি হয়ে যাবে -0.5 থেকে 9.5। 10-19 শ্রেণিটি হবে 9.5 থেকে 19.5। এইভাবে শ্রেণি ব্যবধানগুলো অবিচ্ছিন্ন হয়ে যায়, যা মধ্যমা ও সংখ্যাগুরু মান নির্ণয়ের জন্য অপরিহার্য।

আজ আমরা কী শিখলাম?

অঙ্ক স্যার: তাহলে দিয়া, আজ আমরা রাশিবিজ্ঞানের একটি গুরুত্বপূর্ণ অংশ নিয়ে বিস্তারিত আলোচনা করলাম। চলো সংক্ষেপে দেখে নিই, আজ আমরা কী কী শিখলাম।

  • দিয়া: আমরা শিখলাম রাশিবিজ্ঞান কী এবং কেন ডেটা সংগ্রহ, বিন্যাস ও বিশ্লেষণের জন্য এটি প্রয়োজন।
  • অঙ্ক স্যার: ঠিক! এরপর আমরা ডেটার প্রকারভেদ, যেমন কাঁচা ডেটা এবং শ্রেণিবদ্ধ ডেটা সম্পর্কে জানলাম।
  • দিয়া: আর শিখলাম কেন্দ্রীয় প্রবণতার তিনটি প্রধান পরিমাপ – গড়, মধ্যমা এবং সংখ্যাগুরু মান।
  • অঙ্ক স্যার: একদম! গড়ের জন্য আমরা তিনটি পদ্ধতি দেখলাম: প্রত্যক্ষ পদ্ধতি, কল্পিত গড় পদ্ধতি এবং ক্রমবিচ্যুতি পদ্ধতি, এবং দেখলাম কীভাবে শ্রেণিবদ্ধ ডেটার জন্য এগুলি প্রয়োগ করতে হয়।
  • দিয়া: মধ্যমা কী, সেটা বুঝলাম এবং কীভাবে শ্রেণিবদ্ধ ডেটার মধ্যমা বের করতে হয়, সেই সূত্রটিও শিখলাম।
  • অঙ্ক স্যার: খুব ভালো! এছাড়াও, আমরা সংখ্যাগুরু মান কী, এবং কীভাবে শ্রেণিবদ্ধ ডেটার সংখ্যাগুরু মান নির্ণয় করতে হয়, তাও দেখলাম।
  • দিয়া: আর সবচেয়ে গুরুত্বপূর্ণ, কখন কোন পরিমাপ ব্যবহার করা উচিত, সে সম্পর্কেও আমরা জানলাম। যেমন, চরম মান থাকলে মধ্যমা ভালো, আর সবচেয়ে জনপ্রিয় মান জানতে হলে সংখ্যাগুরু মান।
  • অঙ্ক স্যার: অসাধারণ! তোমার প্রজেক্টের জন্য এই জ্ঞানগুলো খুবই সহায়ক হবে। এখন তুমি তোমার বন্ধুদের পছন্দের খাবারের ডেটা সংগ্রহ করে সেগুলোর গড়, মধ্যমা বা সংখ্যাগুরু মান বের করে একটি দারুণ রিপোর্ট তৈরি করতে পারবে।

দিয়া: হ্যাঁ স্যার! এখন মনে হচ্ছে, আমার প্রজেক্টটা মোটেও কঠিন নয়, বরং খুব মজার হবে। আপনাকে অসংখ্য ধন্যবাদ, স্যার! আজ আমার রাশিবিজ্ঞানের অনেক জটিল ধারণা পরিষ্কার হয়ে গেল।

অঙ্ক স্যার: তোমাকে স্বাগতম, দিয়া! এটাই তো গণিত শেখার মজা। যখন তুমি বুঝতে পারবে, তোমার চারপাশের জীবনে গণিত কীভাবে কাজ করে, তখন এর প্রতি তোমার ভালোবাসা আরও বাড়বে। মন দিয়ে অনুশীলন করো, আর যেকোনো প্রশ্ন নিয়ে আবার এসো!