কৃত্রিম মেধার দুনিয়াও চলছে প্রশান্তচন্দ্র মহলানবিশের সূত্র মেনে
Prasanta Chandra Mahalanobis

সংখ্যার মধ্যে সত্য

মিথ্যা যখন সত্যের বেশ ধরে আসে, তখন তাকে চিনে নেওয়ার জন্য আমাদের শেষ পর্যন্ত আশ্রয় নিতে হয় সংখ্যারই, যার ভিতরে মানুষের অভিজ্ঞতা, স্মৃতি ও বাস্তবতার অগণিত ছাপ জমা হয়ে থাকে।

স্বাগতম দাস

শেষ আপডেট: ২৮ জুন ২০২৬ ০৫:৫৮
Share:

দিশারি: প্রশান্তচন্দ্র মহলানবিশ।

উনিশ শতকের আমেরিকান সাহিত্যিক মার্ক টোয়েনের প্রবাদপ্রতিম উদ্ধৃতি: মিথ্যা তিন রকমের— মিথ্যা, ডাহা মিথ্যা, আর পরিসংখ্যান! মজার কথা হল, পরিসংখ্যান আসলে অসংখ্য বিচ্ছিন্ন ঘটনার মধ্যে লুকিয়ে থাকা বৃহত্তর সত্যের সন্ধান। একটি বৃষ্টির ফোঁটা দেখে আবহাওয়া বোঝা যায় না, এক জন মানুষের আয় জেনে দেশের অর্থনীতির হাল জানা যায় না। কিন্তু কয়েক লক্ষ তথ্যবিন্দু এক সঙ্গে জুড়লে তাদের মধ্যে একটি ছন্দ, একটি প্রবণতা, একটি সত্য ফুটে ওঠে। সেই সত্য হয়তো চূড়ান্ত নয়, কিন্তু অন্ধ অনুমানের চেয়ে অনেক বেশি নির্ভরযোগ্য। বিচ্ছিন্ন তথ্যের সমুদ্র থেকে অর্থপূর্ণ ছবি ও নির্ভরযোগ্য জ্ঞান নির্মাণের শিল্পই পরিসংখ্যান; আর সেই শিল্পের নীতি, পদ্ধতি ও তত্ত্ব নিয়ে বৈজ্ঞানিক চর্চার নাম রাশিবিজ্ঞান।

ভারত পরিসংখ্যানের এই মাহাত্ম্য জানত। মহাভারতের বনপর্বে রাজা ঋতুপর্ণ নির্বাসিত নিষাদরাজ নলকে সংখ্যার বিদ্যায় তাঁর দখলের প্রমাণ দিয়েছিলেন— বিশাল বৃক্ষের শাখায় ফলের সংখ্যা এক মুহূর্তে বলে দিয়ে। চন্দ্রগুপ্ত মৌর্যের প্রধানমন্ত্রী কৌটিল্যের অর্থশাস্ত্রে (আনুমানিক খ্রি.পূ. ৩২১-২৯৬) রাজ্যের তথ্য সংগ্রহের এক আশ্চর্য নীতিমালা পাওয়া যায়। গ্রামের ‘গোপ’ বা হিসাবরক্ষক প্রতিটি পরিবারের কৃষক, কারিগর, পশু, সম্পদ— সবার তথ্য রাখতেন। কৌটিল্য শুধু তথ্য সংগ্রহের কথা ভাবেননি; ভেবেছিলেন তথ্যের গুণমান নিয়ন্ত্রণ, স্বাধীন যাচাই এবং প্রশাসনিক নির্ভরযোগ্যতার কথাও। মধ্যযুগে আনুমানিক ১৫৯০ খ্রিস্টাব্দে মোগল সম্রাট আকবরের সভায় বসে আবুল ফজ়ল লিখছিলেন আইন-ই-আকবরি। সেখানে যুদ্ধের হিসাব যেমন আছে, তেমনই আছে ফসলের পরিমাণ, বাজারদর, রাজস্ব ও সৈন্যসংখ্যা। যেন এক সাম্রাজ্যের নিঃশ্বাস-প্রশ্বাস কাগজে ধরে রাখার চেষ্টা।

তার পর এল উপনিবেশ। ইস্ট ইন্ডিয়া কোম্পানি, জনগণনা, জরিপ, গেজ়েটিয়ার— সংখ্যা ক্রমশ বড় হয়ে উঠল। ভারতের মাঠ, নদী, ফসল, মানুষ, ধর্ম ও পেশা— সব কিছুই খুঁটিয়ে খুঁটিয়ে নথিভুক্ত হতে লাগল। কিন্তু সেই সংখ্যার দৃষ্টি ছিল শাসকের লাভের দিকে, শাসিত মানুষের দিকে নয়। মানুষের দুঃখ, ক্ষুধা ও অপূর্ণতাও সংখ্যার পাতায় ধরা পড়ত, কিন্তু সেখান থেকে উন্নতির কোনও পথ বেরোত না।

ঠিক এই শূন্যস্থানটিতেই এসে দাঁড়ালেন এক বাঙালি বিজ্ঞানী— প্রশান্তচন্দ্র মহলানবিশ।

১৯১৫ সাল। কেমব্রিজ থেকে পদার্থবিজ্ঞানের ট্রাইপস শেষ করে দেশে ফেরার পথে প্রথম বিশ্বযুদ্ধের কারণে প্রশান্তচন্দ্রের জাহাজ আটকে গেল। সেই অপেক্ষায় কিংস কলেজের পাঠাগারে তাঁর শিক্ষক ম্যাকোলে দেখালেন বায়োমেট্রিকা পত্রিকার বাঁধানো সঙ্কলন। পুরো সেট কিনে নিলেন, জাহাজে পড়লেন, কলকাতায় ফিরেও পড়তে থাকলেন। পদার্থবিজ্ঞান সরে গেল, রাশিবিজ্ঞান এল সামনে। সেই আকস্মিক বিলম্বটি ভারতের বিজ্ঞান-ইতিহাসের মোড় ঘুরিয়ে দিয়েছিল।

দেশে ফিরে মহলানবিশ নৃতাত্ত্বিক তথ্য নিয়ে কাজ শুরু করলেন, এবং তৈরি করলেন তাঁর বিখ্যাত ‘মহলানবিশ ডিস্ট্যান্স’। দু’টি জনগোষ্ঠীর মধ্যে পার্থক্য মাপার এই পদ্ধতি শুধু গড়ের ফারাক দেখে না; তাদের বিস্তার ও পারস্পরিক সম্পর্ককেও হিসাবে নেয়। এই গণনার মাধ্যমে তিনি দেখিয়েছিলেন যে, বাংলার ব্রাহ্মণরা দেশের অন্যত্রের ব্রাহ্মণদের চেয়ে অন্যান্য বাঙালি জাতির অনেক বেশি কাছের। কিন্তু তিনি থামলেন না। রিসলির বিখ্যাত নৃতাত্ত্বিক তথ্যভান্ডারে ৫,৭৮৪ জন ব্যক্তির ২০,৭৯৭টি মানের মধ্যে ১৪২টি গুরুতর ভুল খুঁজে বার করলেন, সংশোধন করলেন। তথ্যের নির্ভুলতার প্রতি এই নিষ্ঠাই ছিল তাঁর অভিজ্ঞান।

১৯৩০-এর দশকে বাংলার পাটজমির পরিমাণ মাপতে গিয়ে প্রশান্তচন্দ্র তৈরি করলেন বৈজ্ঞানিক র‌্যান্ডম স্যাম্পলিং পদ্ধতি। সমগ্র বাংলার ৫৯,০০০ বর্গমাইল জুড়ে সরকারি পদ্ধতির পঞ্চাশ ভাগের এক ভাগ লোক দিয়ে, দশ ভাগের এক ভাগ খরচে, পাওয়া গেল আরও নির্ভুল ফলাফল।

মহলানবিশের আর একটি উদ্ভাবন একটু অন্য রকম সমস্যার সমাধান করল। ধরুন, দশ জন সমীক্ষক একই গ্রামে গিয়ে আলাদা আলাদা ভাবে জরিপ করলেন— দেখা গেল তাঁদের ফলাফল সামান্য আলাদা। এই আলাদা হওয়াটাই বলে দেয় কোথায় ভুল হচ্ছে, কোন সমীক্ষক ঠিক ভাবে প্রশ্ন করছেন না, কোথায় তথ্য লেখার সময় গোলমাল হচ্ছে। এই ধারণা থেকেই তিনি তৈরি করলেন ইন্টারপেনেট্রেটিং নেটওয়ার্কস অব স্যাম্পলস বা আইপিএনএস— একই জরিপকে পরস্পরের সঙ্গে মিলিয়ে দেখা যায়, এমন একাধিক দলে ভেঙে চালানো, যাতে ফলাফলের নির্ভুলতা শুধু দাবি করা নয়, গণনা করে প্রমাণ করা যায়। সহজ কথায়, শুধু উত্তর নয়, সেই উত্তরে কতটা ভুল থাকতে পারে তাও বলা— এটাই ছিল এই পদ্ধতির মূল শক্তি। আজকের কৃত্রিম বুদ্ধিমত্তার মডেল মূল্যায়নে যে ক্রস ভ্যালিডেশন ও অনিশ্চয়তার পরিমাপ ব্যবহার করা হয়, তার দার্শনিক শিকড় ঠিক সেখানেই।

স্বাধীনতার পরে প্রশান্তচন্দ্র এই ধারণাগুলিকে জাতীয় স্তরে নিয়ে গেলেন। জন্ম নিল জাতীয় নমুনা সমীক্ষা, গড়ে উঠল কেন্দ্রীয় পরিসংখ্যান সংগঠন। দ্বিতীয় পঞ্চবার্ষিক পরিকল্পনার গাণিতিক কাঠামো নির্মাণেও তাঁর ভূমিকা ছিল কেন্দ্রীয়। সি আর রাও বলেছিলেন, মহলানবিশ এটিকে অভ্রান্ত তত্ত্ব হিসাবে দেখতেন না; বরং বড় ছবিটা বোঝার উপায় হিসাবে দেখতেন। মূলত তাঁর উদ্যোগেই দেশের মানুষের পরিসংখ্যানের ভান্ডারে ভারত হয়ে উঠল পৃথিবীর শ্রেষ্ঠ দেশ।

ইন্টারনেট, মোবাইল ফোন এবং ডিজিটাল পেমেন্ট-নির্ভর আজকের পৃথিবী কি ১৯৭২ সালে প্রয়াত মহলানবিশের সময়ের থেকে সম্পূর্ণ আলাদা নয়? আজ একটি স্মার্টফোন প্রতি মিনিটে যে পরিমাণ তথ্য তৈরি করে, তা সংগ্রহ করতে মহলানবিশকে হয়তো একটি পূর্ণ জরিপ দল পাঠাতে হত। ইউপিআই লেনদেন, আধার তথ্য, স্বাস্থ্য রেকর্ড, স্মার্ট শহরের সেন্সর— ১৪০ কোটি মানুষের ভারত আজ তথ্যের এক মহাসমুদ্র। এই সমুদ্রকেই মন্থন করছে এআই বা কৃত্রিম বুদ্ধিমত্তা। এই পৃথিবী কিন্তু আজও মহলানবিশের সূত্র মেনে চলে।

আধুনিক কৃত্রিম বুদ্ধিমত্তাকে পরিসংখ্যানের উত্তরসূরি বলা যায়। তথ্যের ভিতরে থাকা নিয়ম, প্রবণতা ও অনিশ্চয়তাকে বিশাল পরিসরে শিখেই আজকের যন্ত্রশিক্ষা ব্যবস্থা সিদ্ধান্ত নিতে ও পূর্বাভাস দিতে সক্ষম হয়। মহলানবিশের দূরত্ব পরিমাপ আজ অস্বাভাবিকতা শনাক্তকরণের এক গুরুত্বপূর্ণ হাতিয়ার। কোনও রোগীর উপসর্গ স্বাভাবিকের বাইরে কি না, কোনও ব্যাঙ্ক লেনদেন সন্দেহজনক কি না— এই সব ক্ষেত্রেই বহুমাত্রিক তথ্য বিশ্লেষণের পদ্ধতিতে তাঁর চিন্তার প্রতিফলন দেখা যায়।

তাঁর আর একটি অবদান আজ নতুন তাৎপর্য নিয়ে ফিরে এসেছে— ভারযুক্ত গড় ও ওজনভিত্তিক নমুনা নির্বাচন। জাতীয় নমুনা সমীক্ষার নকশা তৈরি করতে গিয়ে তিনি গভীর ভাবে উপলব্ধি করেছিলেন যে, সমাজের সব অংশকে একই গুরুত্ব দিয়ে বিচার করলে বাস্তবতার যথাযথ প্রতিচ্ছবি ধরা পড়ে না। কারণ সংখ্যায় বা প্রভাবে শক্তিশালী গোষ্ঠীর কণ্ঠস্বর সহজেই প্রান্তিক ও বঞ্চিত মানুষের অভিজ্ঞতাকে আড়াল করে দিতে পারে। তখন পরিসংখ্যান সত্যের ভাষ্য হয়ে ওঠে না; বরং ক্ষমতার ভারসাম্যহীনতার প্রতিফলন হয়ে দাঁড়ায়। এই কারণেই মহলানবিশ তথ্য সংগ্রহের পর্যায়ে সচেতন ভাবে এমন নমুনা নির্বাচন করতেন, যাতে সমাজের অবহেলিত ও কম প্রতিনিধিত্বশীল অংশগুলিও যথাযথ গুরুত্ব পায়, এবং বিশ্লেষণের সময় উপযুক্ত ভার দিয়ে সেই প্রতিনিধিত্বের ভারসাম্য পুনঃস্থাপন করতেন। তাঁর এই পদ্ধতি শুধু পরিসংখ্যানের নির্ভুলতাই বাড়ায়নি, বরং তথ্যকে করে তুলেছিল আরও ন্যায়সঙ্গত ও সমাজসংবেদী।

আজকের এলএলএম বা বৃহৎ ভাষা মডেলগুলো ঠিক এই সমস্যাতেই আটকে আছে। এই মডেলগুলো শেখে ইন্টারনেটের লেখা থেকে। কিন্তু ইন্টারনেটের লেখার বড় অংশই ইংরেজি, শহুরে এবং পুরুষের ভাষ্য। প্রান্তিক মানুষের ভাষা, আদিবাসীর জ্ঞান বা মহিলাদের অভিজ্ঞতা সেখানে তুলনামূলক ভাবে কম। ফলে এই মডেল যখন বাংলায় কথা বলে বা ভারতীয় প্রেক্ষাপটে পরামর্শ দেয়, তখন তার মধ্যে অজানতেই ঢুকে পড়ে পক্ষপাত। প্রযুক্তিবিদরা একে বলেন ‘মডেল বায়াস’। মহলানবিশ এই সমস্যার সারবত্তা বহু আগেই বুঝেছিলেন। তাঁর সমাধানও ছিল স্পষ্ট— তথ্য সংগ্রহের শুরুতেই সমাজের প্রতিটি স্তরের প্রতিনিধিত্ব নিশ্চিত করতে হবে।

ঋতুপর্ণের বৃক্ষগণনা থেকে এআই অ্যালগরিদম— এই দীর্ঘ যাত্রাপথে একটি সূক্ষ্ম সুতো কখনও ছিঁড়ে যায়নি। তা হল সংখ্যার মধ্যে সত্যের আভাস খোঁজার চেষ্টা, আর সেই সত্য দিয়ে মানুষের জীবনকে আরও ন্যায়সঙ্গত করে তোলার স্বপ্ন। মিথ্যা যখন সত্যের বেশ ধরে আসে, তখন তাকে চিনে নেওয়ার জন্য আমাদের শেষ পর্যন্ত আশ্রয় নিতে হয় সংখ্যারই, যার ভিতরে মানুষের অভিজ্ঞতা, স্মৃতি ও বাস্তবতার অগণিত ছাপ জমা হয়ে থাকে।

আনন্দবাজার অনলাইন এখন

হোয়াট্‌সঅ্যাপেও

ফলো করুন
অন্য মাধ্যমগুলি:
আরও পড়ুন

এটি একটি প্রিমিয়াম খবর…

  • প্রতিদিন ২০০’রও বেশি এমন প্রিমিয়াম খবর

  • সঙ্গে আনন্দবাজার পত্রিকার ই -পেপার পড়ার সুযোগ

  • সময়মতো পড়ুন, ‘সেভ আর্টিকল-এ ক্লিক করে

সাবস্ক্রাইব করুন