E-Paper

সংখ্যার মধ্যে সত্য

মিথ্যা যখন সত্যের বেশ ধরে আসে, তখন তাকে চিনে নেওয়ার জন্য আমাদের শেষ পর্যন্ত আশ্রয় নিতে হয় সংখ্যারই, যার ভিতরে মানুষের অভিজ্ঞতা, স্মৃতি ও বাস্তবতার অগণিত ছাপ জমা হয়ে থাকে।

স্বাগতম দাস

শেষ আপডেট: ২৮ জুন ২০২৬ ০৫:৫৮
দিশারি: প্রশান্তচন্দ্র মহলানবিশ।

দিশারি: প্রশান্তচন্দ্র মহলানবিশ।

উনিশ শতকের আমেরিকান সাহিত্যিক মার্ক টোয়েনের প্রবাদপ্রতিম উদ্ধৃতি: মিথ্যা তিন রকমের— মিথ্যা, ডাহা মিথ্যা, আর পরিসংখ্যান! মজার কথা হল, পরিসংখ্যান আসলে অসংখ্য বিচ্ছিন্ন ঘটনার মধ্যে লুকিয়ে থাকা বৃহত্তর সত্যের সন্ধান। একটি বৃষ্টির ফোঁটা দেখে আবহাওয়া বোঝা যায় না, এক জন মানুষের আয় জেনে দেশের অর্থনীতির হাল জানা যায় না। কিন্তু কয়েক লক্ষ তথ্যবিন্দু এক সঙ্গে জুড়লে তাদের মধ্যে একটি ছন্দ, একটি প্রবণতা, একটি সত্য ফুটে ওঠে। সেই সত্য হয়তো চূড়ান্ত নয়, কিন্তু অন্ধ অনুমানের চেয়ে অনেক বেশি নির্ভরযোগ্য। বিচ্ছিন্ন তথ্যের সমুদ্র থেকে অর্থপূর্ণ ছবি ও নির্ভরযোগ্য জ্ঞান নির্মাণের শিল্পই পরিসংখ্যান; আর সেই শিল্পের নীতি, পদ্ধতি ও তত্ত্ব নিয়ে বৈজ্ঞানিক চর্চার নাম রাশিবিজ্ঞান।

ভারত পরিসংখ্যানের এই মাহাত্ম্য জানত। মহাভারতের বনপর্বে রাজা ঋতুপর্ণ নির্বাসিত নিষাদরাজ নলকে সংখ্যার বিদ্যায় তাঁর দখলের প্রমাণ দিয়েছিলেন— বিশাল বৃক্ষের শাখায় ফলের সংখ্যা এক মুহূর্তে বলে দিয়ে। চন্দ্রগুপ্ত মৌর্যের প্রধানমন্ত্রী কৌটিল্যের অর্থশাস্ত্রে (আনুমানিক খ্রি.পূ. ৩২১-২৯৬) রাজ্যের তথ্য সংগ্রহের এক আশ্চর্য নীতিমালা পাওয়া যায়। গ্রামের ‘গোপ’ বা হিসাবরক্ষক প্রতিটি পরিবারের কৃষক, কারিগর, পশু, সম্পদ— সবার তথ্য রাখতেন। কৌটিল্য শুধু তথ্য সংগ্রহের কথা ভাবেননি; ভেবেছিলেন তথ্যের গুণমান নিয়ন্ত্রণ, স্বাধীন যাচাই এবং প্রশাসনিক নির্ভরযোগ্যতার কথাও। মধ্যযুগে আনুমানিক ১৫৯০ খ্রিস্টাব্দে মোগল সম্রাট আকবরের সভায় বসে আবুল ফজ়ল লিখছিলেন আইন-ই-আকবরি। সেখানে যুদ্ধের হিসাব যেমন আছে, তেমনই আছে ফসলের পরিমাণ, বাজারদর, রাজস্ব ও সৈন্যসংখ্যা। যেন এক সাম্রাজ্যের নিঃশ্বাস-প্রশ্বাস কাগজে ধরে রাখার চেষ্টা।

তার পর এল উপনিবেশ। ইস্ট ইন্ডিয়া কোম্পানি, জনগণনা, জরিপ, গেজ়েটিয়ার— সংখ্যা ক্রমশ বড় হয়ে উঠল। ভারতের মাঠ, নদী, ফসল, মানুষ, ধর্ম ও পেশা— সব কিছুই খুঁটিয়ে খুঁটিয়ে নথিভুক্ত হতে লাগল। কিন্তু সেই সংখ্যার দৃষ্টি ছিল শাসকের লাভের দিকে, শাসিত মানুষের দিকে নয়। মানুষের দুঃখ, ক্ষুধা ও অপূর্ণতাও সংখ্যার পাতায় ধরা পড়ত, কিন্তু সেখান থেকে উন্নতির কোনও পথ বেরোত না।

ঠিক এই শূন্যস্থানটিতেই এসে দাঁড়ালেন এক বাঙালি বিজ্ঞানী— প্রশান্তচন্দ্র মহলানবিশ।

১৯১৫ সাল। কেমব্রিজ থেকে পদার্থবিজ্ঞানের ট্রাইপস শেষ করে দেশে ফেরার পথে প্রথম বিশ্বযুদ্ধের কারণে প্রশান্তচন্দ্রের জাহাজ আটকে গেল। সেই অপেক্ষায় কিংস কলেজের পাঠাগারে তাঁর শিক্ষক ম্যাকোলে দেখালেন বায়োমেট্রিকা পত্রিকার বাঁধানো সঙ্কলন। পুরো সেট কিনে নিলেন, জাহাজে পড়লেন, কলকাতায় ফিরেও পড়তে থাকলেন। পদার্থবিজ্ঞান সরে গেল, রাশিবিজ্ঞান এল সামনে। সেই আকস্মিক বিলম্বটি ভারতের বিজ্ঞান-ইতিহাসের মোড় ঘুরিয়ে দিয়েছিল।

দেশে ফিরে মহলানবিশ নৃতাত্ত্বিক তথ্য নিয়ে কাজ শুরু করলেন, এবং তৈরি করলেন তাঁর বিখ্যাত ‘মহলানবিশ ডিস্ট্যান্স’। দু’টি জনগোষ্ঠীর মধ্যে পার্থক্য মাপার এই পদ্ধতি শুধু গড়ের ফারাক দেখে না; তাদের বিস্তার ও পারস্পরিক সম্পর্ককেও হিসাবে নেয়। এই গণনার মাধ্যমে তিনি দেখিয়েছিলেন যে, বাংলার ব্রাহ্মণরা দেশের অন্যত্রের ব্রাহ্মণদের চেয়ে অন্যান্য বাঙালি জাতির অনেক বেশি কাছের। কিন্তু তিনি থামলেন না। রিসলির বিখ্যাত নৃতাত্ত্বিক তথ্যভান্ডারে ৫,৭৮৪ জন ব্যক্তির ২০,৭৯৭টি মানের মধ্যে ১৪২টি গুরুতর ভুল খুঁজে বার করলেন, সংশোধন করলেন। তথ্যের নির্ভুলতার প্রতি এই নিষ্ঠাই ছিল তাঁর অভিজ্ঞান।

১৯৩০-এর দশকে বাংলার পাটজমির পরিমাণ মাপতে গিয়ে প্রশান্তচন্দ্র তৈরি করলেন বৈজ্ঞানিক র‌্যান্ডম স্যাম্পলিং পদ্ধতি। সমগ্র বাংলার ৫৯,০০০ বর্গমাইল জুড়ে সরকারি পদ্ধতির পঞ্চাশ ভাগের এক ভাগ লোক দিয়ে, দশ ভাগের এক ভাগ খরচে, পাওয়া গেল আরও নির্ভুল ফলাফল।

মহলানবিশের আর একটি উদ্ভাবন একটু অন্য রকম সমস্যার সমাধান করল। ধরুন, দশ জন সমীক্ষক একই গ্রামে গিয়ে আলাদা আলাদা ভাবে জরিপ করলেন— দেখা গেল তাঁদের ফলাফল সামান্য আলাদা। এই আলাদা হওয়াটাই বলে দেয় কোথায় ভুল হচ্ছে, কোন সমীক্ষক ঠিক ভাবে প্রশ্ন করছেন না, কোথায় তথ্য লেখার সময় গোলমাল হচ্ছে। এই ধারণা থেকেই তিনি তৈরি করলেন ইন্টারপেনেট্রেটিং নেটওয়ার্কস অব স্যাম্পলস বা আইপিএনএস— একই জরিপকে পরস্পরের সঙ্গে মিলিয়ে দেখা যায়, এমন একাধিক দলে ভেঙে চালানো, যাতে ফলাফলের নির্ভুলতা শুধু দাবি করা নয়, গণনা করে প্রমাণ করা যায়। সহজ কথায়, শুধু উত্তর নয়, সেই উত্তরে কতটা ভুল থাকতে পারে তাও বলা— এটাই ছিল এই পদ্ধতির মূল শক্তি। আজকের কৃত্রিম বুদ্ধিমত্তার মডেল মূল্যায়নে যে ক্রস ভ্যালিডেশন ও অনিশ্চয়তার পরিমাপ ব্যবহার করা হয়, তার দার্শনিক শিকড় ঠিক সেখানেই।

স্বাধীনতার পরে প্রশান্তচন্দ্র এই ধারণাগুলিকে জাতীয় স্তরে নিয়ে গেলেন। জন্ম নিল জাতীয় নমুনা সমীক্ষা, গড়ে উঠল কেন্দ্রীয় পরিসংখ্যান সংগঠন। দ্বিতীয় পঞ্চবার্ষিক পরিকল্পনার গাণিতিক কাঠামো নির্মাণেও তাঁর ভূমিকা ছিল কেন্দ্রীয়। সি আর রাও বলেছিলেন, মহলানবিশ এটিকে অভ্রান্ত তত্ত্ব হিসাবে দেখতেন না; বরং বড় ছবিটা বোঝার উপায় হিসাবে দেখতেন। মূলত তাঁর উদ্যোগেই দেশের মানুষের পরিসংখ্যানের ভান্ডারে ভারত হয়ে উঠল পৃথিবীর শ্রেষ্ঠ দেশ।

ইন্টারনেট, মোবাইল ফোন এবং ডিজিটাল পেমেন্ট-নির্ভর আজকের পৃথিবী কি ১৯৭২ সালে প্রয়াত মহলানবিশের সময়ের থেকে সম্পূর্ণ আলাদা নয়? আজ একটি স্মার্টফোন প্রতি মিনিটে যে পরিমাণ তথ্য তৈরি করে, তা সংগ্রহ করতে মহলানবিশকে হয়তো একটি পূর্ণ জরিপ দল পাঠাতে হত। ইউপিআই লেনদেন, আধার তথ্য, স্বাস্থ্য রেকর্ড, স্মার্ট শহরের সেন্সর— ১৪০ কোটি মানুষের ভারত আজ তথ্যের এক মহাসমুদ্র। এই সমুদ্রকেই মন্থন করছে এআই বা কৃত্রিম বুদ্ধিমত্তা। এই পৃথিবী কিন্তু আজও মহলানবিশের সূত্র মেনে চলে।

আধুনিক কৃত্রিম বুদ্ধিমত্তাকে পরিসংখ্যানের উত্তরসূরি বলা যায়। তথ্যের ভিতরে থাকা নিয়ম, প্রবণতা ও অনিশ্চয়তাকে বিশাল পরিসরে শিখেই আজকের যন্ত্রশিক্ষা ব্যবস্থা সিদ্ধান্ত নিতে ও পূর্বাভাস দিতে সক্ষম হয়। মহলানবিশের দূরত্ব পরিমাপ আজ অস্বাভাবিকতা শনাক্তকরণের এক গুরুত্বপূর্ণ হাতিয়ার। কোনও রোগীর উপসর্গ স্বাভাবিকের বাইরে কি না, কোনও ব্যাঙ্ক লেনদেন সন্দেহজনক কি না— এই সব ক্ষেত্রেই বহুমাত্রিক তথ্য বিশ্লেষণের পদ্ধতিতে তাঁর চিন্তার প্রতিফলন দেখা যায়।

তাঁর আর একটি অবদান আজ নতুন তাৎপর্য নিয়ে ফিরে এসেছে— ভারযুক্ত গড় ও ওজনভিত্তিক নমুনা নির্বাচন। জাতীয় নমুনা সমীক্ষার নকশা তৈরি করতে গিয়ে তিনি গভীর ভাবে উপলব্ধি করেছিলেন যে, সমাজের সব অংশকে একই গুরুত্ব দিয়ে বিচার করলে বাস্তবতার যথাযথ প্রতিচ্ছবি ধরা পড়ে না। কারণ সংখ্যায় বা প্রভাবে শক্তিশালী গোষ্ঠীর কণ্ঠস্বর সহজেই প্রান্তিক ও বঞ্চিত মানুষের অভিজ্ঞতাকে আড়াল করে দিতে পারে। তখন পরিসংখ্যান সত্যের ভাষ্য হয়ে ওঠে না; বরং ক্ষমতার ভারসাম্যহীনতার প্রতিফলন হয়ে দাঁড়ায়। এই কারণেই মহলানবিশ তথ্য সংগ্রহের পর্যায়ে সচেতন ভাবে এমন নমুনা নির্বাচন করতেন, যাতে সমাজের অবহেলিত ও কম প্রতিনিধিত্বশীল অংশগুলিও যথাযথ গুরুত্ব পায়, এবং বিশ্লেষণের সময় উপযুক্ত ভার দিয়ে সেই প্রতিনিধিত্বের ভারসাম্য পুনঃস্থাপন করতেন। তাঁর এই পদ্ধতি শুধু পরিসংখ্যানের নির্ভুলতাই বাড়ায়নি, বরং তথ্যকে করে তুলেছিল আরও ন্যায়সঙ্গত ও সমাজসংবেদী।

আজকের এলএলএম বা বৃহৎ ভাষা মডেলগুলো ঠিক এই সমস্যাতেই আটকে আছে। এই মডেলগুলো শেখে ইন্টারনেটের লেখা থেকে। কিন্তু ইন্টারনেটের লেখার বড় অংশই ইংরেজি, শহুরে এবং পুরুষের ভাষ্য। প্রান্তিক মানুষের ভাষা, আদিবাসীর জ্ঞান বা মহিলাদের অভিজ্ঞতা সেখানে তুলনামূলক ভাবে কম। ফলে এই মডেল যখন বাংলায় কথা বলে বা ভারতীয় প্রেক্ষাপটে পরামর্শ দেয়, তখন তার মধ্যে অজানতেই ঢুকে পড়ে পক্ষপাত। প্রযুক্তিবিদরা একে বলেন ‘মডেল বায়াস’। মহলানবিশ এই সমস্যার সারবত্তা বহু আগেই বুঝেছিলেন। তাঁর সমাধানও ছিল স্পষ্ট— তথ্য সংগ্রহের শুরুতেই সমাজের প্রতিটি স্তরের প্রতিনিধিত্ব নিশ্চিত করতে হবে।

ঋতুপর্ণের বৃক্ষগণনা থেকে এআই অ্যালগরিদম— এই দীর্ঘ যাত্রাপথে একটি সূক্ষ্ম সুতো কখনও ছিঁড়ে যায়নি। তা হল সংখ্যার মধ্যে সত্যের আভাস খোঁজার চেষ্টা, আর সেই সত্য দিয়ে মানুষের জীবনকে আরও ন্যায়সঙ্গত করে তোলার স্বপ্ন। মিথ্যা যখন সত্যের বেশ ধরে আসে, তখন তাকে চিনে নেওয়ার জন্য আমাদের শেষ পর্যন্ত আশ্রয় নিতে হয় সংখ্যারই, যার ভিতরে মানুষের অভিজ্ঞতা, স্মৃতি ও বাস্তবতার অগণিত ছাপ জমা হয়ে থাকে।

(এই প্রতিবেদনটি আনন্দবাজার পত্রিকার মুদ্রিত সংস্করণ থেকে নেওয়া হয়েছে)

Prasanta Chandra Mahalanobis Indian Statistical System Statistics

সঠিক খবর পেতে গুগ্‌লে বেছে নিন আনন্দবাজার ডট কম

ফলো করুন আমাদের মাধ্যমগুলি

আরও পড়ুন:

Share this article

CLOSE

Log In / Create Account

We will send you a One Time Password on this mobile number or email id

Or

By proceeding you agree with our Terms of service & Privacy Policy