দিশারি: প্রশান্তচন্দ্র মহলানবিশ।
উনিশ শতকের আমেরিকান সাহিত্যিক মার্ক টোয়েনের প্রবাদপ্রতিম উদ্ধৃতি: মিথ্যা তিন রকমের— মিথ্যা, ডাহা মিথ্যা, আর পরিসংখ্যান! মজার কথা হল, পরিসংখ্যান আসলে অসংখ্য বিচ্ছিন্ন ঘটনার মধ্যে লুকিয়ে থাকা বৃহত্তর সত্যের সন্ধান। একটি বৃষ্টির ফোঁটা দেখে আবহাওয়া বোঝা যায় না, এক জন মানুষের আয় জেনে দেশের অর্থনীতির হাল জানা যায় না। কিন্তু কয়েক লক্ষ তথ্যবিন্দু এক সঙ্গে জুড়লে তাদের মধ্যে একটি ছন্দ, একটি প্রবণতা, একটি সত্য ফুটে ওঠে। সেই সত্য হয়তো চূড়ান্ত নয়, কিন্তু অন্ধ অনুমানের চেয়ে অনেক বেশি নির্ভরযোগ্য। বিচ্ছিন্ন তথ্যের সমুদ্র থেকে অর্থপূর্ণ ছবি ও নির্ভরযোগ্য জ্ঞান নির্মাণের শিল্পই পরিসংখ্যান; আর সেই শিল্পের নীতি, পদ্ধতি ও তত্ত্ব নিয়ে বৈজ্ঞানিক চর্চার নাম রাশিবিজ্ঞান।
ভারত পরিসংখ্যানের এই মাহাত্ম্য জানত। মহাভারতের বনপর্বে রাজা ঋতুপর্ণ নির্বাসিত নিষাদরাজ নলকে সংখ্যার বিদ্যায় তাঁর দখলের প্রমাণ দিয়েছিলেন— বিশাল বৃক্ষের শাখায় ফলের সংখ্যা এক মুহূর্তে বলে দিয়ে। চন্দ্রগুপ্ত মৌর্যের প্রধানমন্ত্রী কৌটিল্যের অর্থশাস্ত্রে (আনুমানিক খ্রি.পূ. ৩২১-২৯৬) রাজ্যের তথ্য সংগ্রহের এক আশ্চর্য নীতিমালা পাওয়া যায়। গ্রামের ‘গোপ’ বা হিসাবরক্ষক প্রতিটি পরিবারের কৃষক, কারিগর, পশু, সম্পদ— সবার তথ্য রাখতেন। কৌটিল্য শুধু তথ্য সংগ্রহের কথা ভাবেননি; ভেবেছিলেন তথ্যের গুণমান নিয়ন্ত্রণ, স্বাধীন যাচাই এবং প্রশাসনিক নির্ভরযোগ্যতার কথাও। মধ্যযুগে আনুমানিক ১৫৯০ খ্রিস্টাব্দে মোগল সম্রাট আকবরের সভায় বসে আবুল ফজ়ল লিখছিলেন আইন-ই-আকবরি। সেখানে যুদ্ধের হিসাব যেমন আছে, তেমনই আছে ফসলের পরিমাণ, বাজারদর, রাজস্ব ও সৈন্যসংখ্যা। যেন এক সাম্রাজ্যের নিঃশ্বাস-প্রশ্বাস কাগজে ধরে রাখার চেষ্টা।
তার পর এল উপনিবেশ। ইস্ট ইন্ডিয়া কোম্পানি, জনগণনা, জরিপ, গেজ়েটিয়ার— সংখ্যা ক্রমশ বড় হয়ে উঠল। ভারতের মাঠ, নদী, ফসল, মানুষ, ধর্ম ও পেশা— সব কিছুই খুঁটিয়ে খুঁটিয়ে নথিভুক্ত হতে লাগল। কিন্তু সেই সংখ্যার দৃষ্টি ছিল শাসকের লাভের দিকে, শাসিত মানুষের দিকে নয়। মানুষের দুঃখ, ক্ষুধা ও অপূর্ণতাও সংখ্যার পাতায় ধরা পড়ত, কিন্তু সেখান থেকে উন্নতির কোনও পথ বেরোত না।
ঠিক এই শূন্যস্থানটিতেই এসে দাঁড়ালেন এক বাঙালি বিজ্ঞানী— প্রশান্তচন্দ্র মহলানবিশ।
১৯১৫ সাল। কেমব্রিজ থেকে পদার্থবিজ্ঞানের ট্রাইপস শেষ করে দেশে ফেরার পথে প্রথম বিশ্বযুদ্ধের কারণে প্রশান্তচন্দ্রের জাহাজ আটকে গেল। সেই অপেক্ষায় কিংস কলেজের পাঠাগারে তাঁর শিক্ষক ম্যাকোলে দেখালেন বায়োমেট্রিকা পত্রিকার বাঁধানো সঙ্কলন। পুরো সেট কিনে নিলেন, জাহাজে পড়লেন, কলকাতায় ফিরেও পড়তে থাকলেন। পদার্থবিজ্ঞান সরে গেল, রাশিবিজ্ঞান এল সামনে। সেই আকস্মিক বিলম্বটি ভারতের বিজ্ঞান-ইতিহাসের মোড় ঘুরিয়ে দিয়েছিল।
দেশে ফিরে মহলানবিশ নৃতাত্ত্বিক তথ্য নিয়ে কাজ শুরু করলেন, এবং তৈরি করলেন তাঁর বিখ্যাত ‘মহলানবিশ ডিস্ট্যান্স’। দু’টি জনগোষ্ঠীর মধ্যে পার্থক্য মাপার এই পদ্ধতি শুধু গড়ের ফারাক দেখে না; তাদের বিস্তার ও পারস্পরিক সম্পর্ককেও হিসাবে নেয়। এই গণনার মাধ্যমে তিনি দেখিয়েছিলেন যে, বাংলার ব্রাহ্মণরা দেশের অন্যত্রের ব্রাহ্মণদের চেয়ে অন্যান্য বাঙালি জাতির অনেক বেশি কাছের। কিন্তু তিনি থামলেন না। রিসলির বিখ্যাত নৃতাত্ত্বিক তথ্যভান্ডারে ৫,৭৮৪ জন ব্যক্তির ২০,৭৯৭টি মানের মধ্যে ১৪২টি গুরুতর ভুল খুঁজে বার করলেন, সংশোধন করলেন। তথ্যের নির্ভুলতার প্রতি এই নিষ্ঠাই ছিল তাঁর অভিজ্ঞান।
১৯৩০-এর দশকে বাংলার পাটজমির পরিমাণ মাপতে গিয়ে প্রশান্তচন্দ্র তৈরি করলেন বৈজ্ঞানিক র্যান্ডম স্যাম্পলিং পদ্ধতি। সমগ্র বাংলার ৫৯,০০০ বর্গমাইল জুড়ে সরকারি পদ্ধতির পঞ্চাশ ভাগের এক ভাগ লোক দিয়ে, দশ ভাগের এক ভাগ খরচে, পাওয়া গেল আরও নির্ভুল ফলাফল।
মহলানবিশের আর একটি উদ্ভাবন একটু অন্য রকম সমস্যার সমাধান করল। ধরুন, দশ জন সমীক্ষক একই গ্রামে গিয়ে আলাদা আলাদা ভাবে জরিপ করলেন— দেখা গেল তাঁদের ফলাফল সামান্য আলাদা। এই আলাদা হওয়াটাই বলে দেয় কোথায় ভুল হচ্ছে, কোন সমীক্ষক ঠিক ভাবে প্রশ্ন করছেন না, কোথায় তথ্য লেখার সময় গোলমাল হচ্ছে। এই ধারণা থেকেই তিনি তৈরি করলেন ইন্টারপেনেট্রেটিং নেটওয়ার্কস অব স্যাম্পলস বা আইপিএনএস— একই জরিপকে পরস্পরের সঙ্গে মিলিয়ে দেখা যায়, এমন একাধিক দলে ভেঙে চালানো, যাতে ফলাফলের নির্ভুলতা শুধু দাবি করা নয়, গণনা করে প্রমাণ করা যায়। সহজ কথায়, শুধু উত্তর নয়, সেই উত্তরে কতটা ভুল থাকতে পারে তাও বলা— এটাই ছিল এই পদ্ধতির মূল শক্তি। আজকের কৃত্রিম বুদ্ধিমত্তার মডেল মূল্যায়নে যে ক্রস ভ্যালিডেশন ও অনিশ্চয়তার পরিমাপ ব্যবহার করা হয়, তার দার্শনিক শিকড় ঠিক সেখানেই।
স্বাধীনতার পরে প্রশান্তচন্দ্র এই ধারণাগুলিকে জাতীয় স্তরে নিয়ে গেলেন। জন্ম নিল জাতীয় নমুনা সমীক্ষা, গড়ে উঠল কেন্দ্রীয় পরিসংখ্যান সংগঠন। দ্বিতীয় পঞ্চবার্ষিক পরিকল্পনার গাণিতিক কাঠামো নির্মাণেও তাঁর ভূমিকা ছিল কেন্দ্রীয়। সি আর রাও বলেছিলেন, মহলানবিশ এটিকে অভ্রান্ত তত্ত্ব হিসাবে দেখতেন না; বরং বড় ছবিটা বোঝার উপায় হিসাবে দেখতেন। মূলত তাঁর উদ্যোগেই দেশের মানুষের পরিসংখ্যানের ভান্ডারে ভারত হয়ে উঠল পৃথিবীর শ্রেষ্ঠ দেশ।
ইন্টারনেট, মোবাইল ফোন এবং ডিজিটাল পেমেন্ট-নির্ভর আজকের পৃথিবী কি ১৯৭২ সালে প্রয়াত মহলানবিশের সময়ের থেকে সম্পূর্ণ আলাদা নয়? আজ একটি স্মার্টফোন প্রতি মিনিটে যে পরিমাণ তথ্য তৈরি করে, তা সংগ্রহ করতে মহলানবিশকে হয়তো একটি পূর্ণ জরিপ দল পাঠাতে হত। ইউপিআই লেনদেন, আধার তথ্য, স্বাস্থ্য রেকর্ড, স্মার্ট শহরের সেন্সর— ১৪০ কোটি মানুষের ভারত আজ তথ্যের এক মহাসমুদ্র। এই সমুদ্রকেই মন্থন করছে এআই বা কৃত্রিম বুদ্ধিমত্তা। এই পৃথিবী কিন্তু আজও মহলানবিশের সূত্র মেনে চলে।
আধুনিক কৃত্রিম বুদ্ধিমত্তাকে পরিসংখ্যানের উত্তরসূরি বলা যায়। তথ্যের ভিতরে থাকা নিয়ম, প্রবণতা ও অনিশ্চয়তাকে বিশাল পরিসরে শিখেই আজকের যন্ত্রশিক্ষা ব্যবস্থা সিদ্ধান্ত নিতে ও পূর্বাভাস দিতে সক্ষম হয়। মহলানবিশের দূরত্ব পরিমাপ আজ অস্বাভাবিকতা শনাক্তকরণের এক গুরুত্বপূর্ণ হাতিয়ার। কোনও রোগীর উপসর্গ স্বাভাবিকের বাইরে কি না, কোনও ব্যাঙ্ক লেনদেন সন্দেহজনক কি না— এই সব ক্ষেত্রেই বহুমাত্রিক তথ্য বিশ্লেষণের পদ্ধতিতে তাঁর চিন্তার প্রতিফলন দেখা যায়।
তাঁর আর একটি অবদান আজ নতুন তাৎপর্য নিয়ে ফিরে এসেছে— ভারযুক্ত গড় ও ওজনভিত্তিক নমুনা নির্বাচন। জাতীয় নমুনা সমীক্ষার নকশা তৈরি করতে গিয়ে তিনি গভীর ভাবে উপলব্ধি করেছিলেন যে, সমাজের সব অংশকে একই গুরুত্ব দিয়ে বিচার করলে বাস্তবতার যথাযথ প্রতিচ্ছবি ধরা পড়ে না। কারণ সংখ্যায় বা প্রভাবে শক্তিশালী গোষ্ঠীর কণ্ঠস্বর সহজেই প্রান্তিক ও বঞ্চিত মানুষের অভিজ্ঞতাকে আড়াল করে দিতে পারে। তখন পরিসংখ্যান সত্যের ভাষ্য হয়ে ওঠে না; বরং ক্ষমতার ভারসাম্যহীনতার প্রতিফলন হয়ে দাঁড়ায়। এই কারণেই মহলানবিশ তথ্য সংগ্রহের পর্যায়ে সচেতন ভাবে এমন নমুনা নির্বাচন করতেন, যাতে সমাজের অবহেলিত ও কম প্রতিনিধিত্বশীল অংশগুলিও যথাযথ গুরুত্ব পায়, এবং বিশ্লেষণের সময় উপযুক্ত ভার দিয়ে সেই প্রতিনিধিত্বের ভারসাম্য পুনঃস্থাপন করতেন। তাঁর এই পদ্ধতি শুধু পরিসংখ্যানের নির্ভুলতাই বাড়ায়নি, বরং তথ্যকে করে তুলেছিল আরও ন্যায়সঙ্গত ও সমাজসংবেদী।
আজকের এলএলএম বা বৃহৎ ভাষা মডেলগুলো ঠিক এই সমস্যাতেই আটকে আছে। এই মডেলগুলো শেখে ইন্টারনেটের লেখা থেকে। কিন্তু ইন্টারনেটের লেখার বড় অংশই ইংরেজি, শহুরে এবং পুরুষের ভাষ্য। প্রান্তিক মানুষের ভাষা, আদিবাসীর জ্ঞান বা মহিলাদের অভিজ্ঞতা সেখানে তুলনামূলক ভাবে কম। ফলে এই মডেল যখন বাংলায় কথা বলে বা ভারতীয় প্রেক্ষাপটে পরামর্শ দেয়, তখন তার মধ্যে অজানতেই ঢুকে পড়ে পক্ষপাত। প্রযুক্তিবিদরা একে বলেন ‘মডেল বায়াস’। মহলানবিশ এই সমস্যার সারবত্তা বহু আগেই বুঝেছিলেন। তাঁর সমাধানও ছিল স্পষ্ট— তথ্য সংগ্রহের শুরুতেই সমাজের প্রতিটি স্তরের প্রতিনিধিত্ব নিশ্চিত করতে হবে।
ঋতুপর্ণের বৃক্ষগণনা থেকে এআই অ্যালগরিদম— এই দীর্ঘ যাত্রাপথে একটি সূক্ষ্ম সুতো কখনও ছিঁড়ে যায়নি। তা হল সংখ্যার মধ্যে সত্যের আভাস খোঁজার চেষ্টা, আর সেই সত্য দিয়ে মানুষের জীবনকে আরও ন্যায়সঙ্গত করে তোলার স্বপ্ন। মিথ্যা যখন সত্যের বেশ ধরে আসে, তখন তাকে চিনে নেওয়ার জন্য আমাদের শেষ পর্যন্ত আশ্রয় নিতে হয় সংখ্যারই, যার ভিতরে মানুষের অভিজ্ঞতা, স্মৃতি ও বাস্তবতার অগণিত ছাপ জমা হয়ে থাকে।
প্রতিদিন ২০০’রও বেশি এমন প্রিমিয়াম খবর
সঙ্গে আনন্দবাজার পত্রিকার ই -পেপার পড়ার সুযোগ
সময়মতো পড়ুন, ‘সেভ আর্টিকল-এ ক্লিক করে