Advertisement
০৩ মে ২০২৪
কোন তথ্য ব্যবহৃত হচ্ছে, সে দিকে নজর রাখা জরুরি
Artificial Intelligence

কৃত্রিম বুদ্ধিমত্তার বছর

বিদ্যালয় স্তরে আমরা আসলে অনেকটা ফাউন্ডেশন মডেলগুলোর মতোই এক বহুমাত্রিক শিক্ষণপ্রণালীর মধ্যে দিয়ে যাই। একই সঙ্গে শিখতে হয় ভাষা, অঙ্ক, ইতিহাস, ভূগোল, বিজ্ঞান; ভাল ছাত্র হতে গেলে পারদর্শিতা অর্জন করতে হয় সব ক’টাতেই।

Artificial Intelligence

—প্রতীকী ছবি।

স্বাগতম দাস
শেষ আপডেট: ২২ ডিসেম্বর ২০২৩ ০৮:১৪
Share: Save:

বছর দশেক আগেও কম্পিউটারকে দিয়ে কাজ করাতে হলে শিখতে হত সি, সি-প্লাস-প্লাস, জাভার মতো সব প্রোগ্রামিং ল্যাঙ্গুয়েজ। কম্পিউটারের সঙ্গে নিতান্ত সাধারণ ইংরেজিতে কথাবার্তা চালিয়ে যাওয়ার রাস্তা খুলে দিয়ে গত বছর নভেম্বরে আলোচনার কেন্দ্রে উঠে এল আমেরিকার ওপেনএআই নামের এক সংস্থা— তারা বাজারে আনল চ্যাটজিপিটি নামের একটি প্রায় সর্বজ্ঞ চ্যাটবট। পক্ষে-বিপক্ষে নানা সমালোচনার মধ্যে দিয়েই প্রায় সমস্ত পেশার সঙ্গে যুক্ত মানুষ এবং বিনিয়োগকারীদের মধ্যে প্রবল জনপ্রিয় হয়ে উঠেছে চ্যাটজিপিটি-র নেপথ্যে থাকা জিপিটি ৩.৫, ৪ এবং সমগোত্রীয়রা। এগুলি হল লার্জ ল্যাঙ্গুয়েজ মডেল (এলএলএম) বা বৃহৎ ভাষা-প্রক্রিয়াকরণ মডেল। গোটা ২০২৩ জুড়েই শোনা গেল জেনারেটিভ এআই বা সৃষ্টিশীল কৃত্রিম মেধার এই তুঙ্গ পর্যায়টির আলোচনা। ‘এলএলএম’, ‘জেন-এআই’, ‘জ়িরো-শট লার্নিং’-এর মতো শব্দ ঢুকে পড়ল আমাদের ঘরে।

২০২০-২১ যদি অতিমারির বছর হয়ে থাকে, ২০২৩ নিঃসন্দেহে কৃত্রিম মেধার। এক দিকে আমেরিকার বৃহৎ পুঁজিবাদী ব্যবস্থায় বেসরকারি সংস্থাগুলোর কৃত্রিম মেধা গবেষণায় অকল্পনীয় মাপের লগ্নি ও সারা পৃথিবীকেই বাজারে পরিণত করার চেষ্টা; অন্য দিকে চিনের মতো দেশে সম্পূর্ণ সরকারের নিয়ন্ত্রণে নাগরিকদের জীবনের আনাচেকানাচে কৃত্রিম মেধার অনুপ্রবেশ— এই দুই বিপ্রতীপ সীমার মধ্যে দাঁড়িয়ে দুনিয়া।

সৃষ্টিশীল কৃত্রিম বুদ্ধিমত্তার কেন্দ্রবিন্দুতে দাঁড়িয়ে এই মুহূর্তে সবচেয়ে আলোচিত গাণিতিক তন্ত্রটির পোশাকি নাম ‘ফাউন্ডেশন মডেল’। চ্যাটজিপিটি, বার্ড, লামা, পাম ইত্যাদি সংলাপধর্মী চ্যাটবটের নেপথ্যে রয়েছে অতিকায় এবং বহুমুখী কার্যশক্তিসম্পন্ন এই ধরনের ভাষা প্রক্রিয়াকরণ মডেল। এই মডেলগুলোকে আমাদের মানুষী ভাষার অনেক সাধারণ কার্যকলাপে (যেমন পাঠ সংক্ষেপণ, একটি অনুচ্ছেদ পড়ে তা থেকে প্রশ্নের উত্তর খোঁজা, শূন্যস্থান পূরণ ইত্যাদি) প্রশিক্ষিত করে তোলার জন্য ব্যবহার করতে হয় ইন্টারনেটের ভাঁড়ার থেকে বিপুল পরিমাণ ডিজিটাল টেক্সট-এর সম্ভার— উদাহরণ হিসাবে পেশ করা যায় গোটা উইকিপিডিয়াকেই। এর জন্য প্রয়োজন কার্যত ধারণাতীত মাপের গণনাশক্তি। তার জোগান আবার দিতে পারে গুগল, মাইক্রোসফট, মেটা বা ওপেনএআই-এর মতো সংস্থা, যাদের হাতে রয়েছে গোটা দুনিয়ার পুঁজির একটা বিরাট অংশ।

২০২৩-এ গড়ে ওঠা অনেক স্টার্ট আপ সংস্থাই নিজেদের ফাউন্ডেশন মডেল বানাতে পারেনি এই বিপুল পুঁজির অভাবে। তারা বরং এই বড় সংস্থাগুলির তৈরি মডেলগুলোকেই নিজেদের ব্যবহারিক ক্ষেত্রের সঙ্গে খাপ খাইয়ে নিতে চেষ্টা করে, তুলনায় অল্প পরিমাণ তথ্যের সাহায্যে বিশেষ প্রশিক্ষণ দিয়ে। এ ভাবে একটি সাধারণ ফাউন্ডেশন মডেলকে বিশেষ উদ্দেশ্যে ব্যবহার করার প্রক্রিয়াগুলোকে যন্ত্রমেধার পরিভাষায় বলে প্রি-ট্রেনিং, ফাইন-টিউনিং, এবং প্রম্পট এঞ্জিনিয়ারিং। এই প্রক্রিয়াগুলো ব্যবহার করে বানিয়ে ফেলা চলে নির্দিষ্ট ধরনের কাজের জন্য বিশেষ চ্যাটবট— যেমন মেড-পাম২, যা বিশেষ ভাবে প্রশিক্ষিত শুধুমাত্র চিকিৎসাবিদ্যা বিষয়ক প্রশ্নোত্তরের জন্য। এই চ্যাটবট শেক্সপিয়রের নাটক বিষয়ক প্রশ্নের সদুত্তর দিতে পারবে না, কিন্তু বুকের একটি এক্স-রে ছবি দেখে বলে দেবে ফুসফুসের অবস্থা ঠিক কী রকম, তৈরি করে দেবে একটি মেডিক্যাল রিপোর্ট।

বিদ্যালয় স্তরে আমরা আসলে অনেকটা ফাউন্ডেশন মডেলগুলোর মতোই এক বহুমাত্রিক শিক্ষণপ্রণালীর মধ্যে দিয়ে যাই। একই সঙ্গে শিখতে হয় ভাষা, অঙ্ক, ইতিহাস, ভূগোল, বিজ্ঞান; ভাল ছাত্র হতে গেলে পারদর্শিতা অর্জন করতে হয় সব ক’টাতেই। ক্রমে আমাদের শিক্ষা আরও সঙ্কীর্ণ এবং সুনির্দিষ্ট পরিসরে ন্যস্ত হয়। তার পর জীবিকা অর্জনের জন্য আমরা হয়তো কোনও একটি বিষয়ে বিশেষ ভাবে প্রশিক্ষিত হয়ে উঠি। এই বিশেষ প্রশিক্ষণ অনেকটা ভাষা প্রক্রিয়াকরণ মডেলগুলোর প্রি-ট্রেনিং এবং ফাইন-টিউনিংয়ের মতো। পরিণত বয়েসে সাফল্যের মূল চাবিকাঠি যেমন লুকিয়ে থাকে বিদ্যালয় স্তরের বহুমুখী শিক্ষার শক্ত বনিয়াদের উপরে, তেমনই বিশেষ ব্যবসায়িক প্রয়োজনে তৈরি চ্যাটবটগুলোর সাফল্য এবং সঠিক উত্তর দেওয়ার ক্ষমতাও এদের নেপথ্যে থাকা ফাউন্ডেশন মডেলগুলোর প্রশিক্ষণের উপরে নির্ভরশীল।

এই মুহূর্তে ভারতে দেড় হাজারেরও বেশি কৃত্রিম বুদ্ধিমত্তাভিত্তিক স্টার্ট আপ আছে, যেগুলোতে মোট বিনিয়োগের পরিমাণ প্রায় চারশো কোটি ডলার। কিন্তু, দুনিয়া জুড়ে সৃষ্টিশীল যন্ত্রমেধার ঝড়ের সঙ্গে পাল্লা দেওয়ার ক্ষমতা এখনও আমাদের আয়ত্তের অনেকটা বাইরে। সম্পূর্ণ দেশীয় উদ্যোগে তৈরি কোনও প্রতিষ্ঠান আজও জিপিটি-৪, বার্ড, লামা, কিংবা আন্থ্রপিকের মতো প্রতিষ্ঠিত জেনারেটিভ এআই প্ল্যাটফর্মের দিকে চ্যালেঞ্জ ছুড়ে দেওয়ার মতো প্রযুক্তি বাজারে আনতে পারেনি। ভাষা প্রক্রিয়াকরণ মডেলের উপরে নির্ভরশীল ভারতীয় স্টার্ট আপগুলোর কোনওটারই এখনও নিজস্ব ফাউন্ডেশন মডেল নেই। এই ধরনের সংস্থাগুলোর বৃদ্ধির পথে সবচেয়ে বড় বাধা হচ্ছে বিরাট মাপের গণনা-পরিকাঠামোর অভাব, যেটা পূরণ করতে গেলে প্রথমেই দরকার হবে বিশাল পুঁজির।

ওপেনএআই বা গুগলের মতো সংস্থার তৈরি ফাউন্ডেশন মডেলগুলোর মূল নকশা বা সোর্স-কোড প্রায় পুরোটাই গোপনীয় এবং সাধারণের ধরাছোঁয়ার বাইরে। সুতরাং, এই মডেলগুলোর অন্দরমহলে পক্ষপাতদুষ্টতা, তথ্য চুরি কিংবা তথ্যের অপলাপ ঘটিয়ে গ্রহীতাদের প্ররোচিত করার কোন খেলা চলছে, তা বোঝার এবং বন্ধ করার কোনও উপায় প্রায় নেই। বিভিন্ন আঞ্চলিক ভাষায় নিজেদের ফাউন্ডেশন মডেলকে প্রশিক্ষিত করার পথে ভারত-জিপিটি’র মতো প্রকল্প নিয়ে সরকারের সহায়তায় নেমে পড়েছে করোভার-এআই সংস্থা, যাদের গ্রহীতাদের লম্বা তালিকায় ভারতের বহু ব্যাঙ্কিং প্রতিষ্ঠান আছে। শোনা যাচ্ছে, গুগল এই কাজে ভারত সরকারের সঙ্গে হাত মিলিয়ে বড় অঙ্কের বিনিয়োগ করবে। আশার কথা বটে, শুধু অস্বস্তি বাড়িয়ে দিচ্ছে ২০২৩-এর শেষে ইন্টারনেটের জগতে যন্ত্রমেধার সাহায্যে মানবাধিকার লঙ্ঘনের ভয়ঙ্কর পরিসংখ্যান।

আজকের দুনিয়ায় কৃত্রিম বুদ্ধিমত্তার ব্যবহার নেটনাগরিকদের স্বাধীনতা এবং মানবাধিকারকে খর্ব করার কাজ অনেক সোজা করে দিয়েছে বিভিন্ন রাষ্ট্রযন্ত্রের কাছে। গত এক বছরে পৃথিবীর ৫৫টি দেশে নাগরিকরা জেলে নিক্ষিপ্ত হয়েছেন শুধু ইন্টারনেটে নিজেদের মতামত প্রকাশ করার অপরাধে, ৪১টি দেশের সরকার যন্ত্রমেধা-নির্ভর নজরদারি ব্যবস্থায় বিরুদ্ধমতের সামান্যতম প্রকাশেও বন্ধ করে দিয়েছে নানা ওয়েবসাইট। গত অক্টোবরে প্রকাশিত আমেরিকার সংস্থা ফ্রিডম হাউসের একটি রিপোর্ট বলছে, পৃথিবীর অন্তত ৪৭টি দেশে সৃষ্টিশীল কৃত্রিম মেধার অপব্যবহার করে নেটনাগরিকদের গেলানো হয়েছে রাষ্ট্রের পক্ষে লাভজনক বিভিন্ন মিথ্যা, যার সমর্থনে ব্যবহার করা হয়েছে নকল ছবি, ভিডিয়ো, বা টেক্সট। মায়ানমার, ইরান, চিনের মতো আরও অনেক দেশেই বেশ খোলাখুলি ভাবে সরকার বিভিন্ন মুনাফাসন্ধানী সংস্থার সঙ্গে হাত মিলিয়ে কৃত্রিম মেধার আধুনিকতম আবিষ্কারগুলোকে ব্যবহার করছে জনমত নিয়ন্ত্রণে রাখার পাশাপাশি বিরুদ্ধস্বরকে চিহ্নিত ও নির্মূল করতে।

শেষে একটা কথা মনে করিয়ে দেওয়া জরুরি। সমাজ থেকেই আসে তথ্য, সেই তথ্যের ভিত্তিতেই প্রশিক্ষণ লাভ করে কৃত্রিম মেধার সংস্থাগুলো। আবার সমাজের বিশেষ সুবিধাভোগী ও ক্ষমতাবানরাই ইন্টারনেটের মাধ্যমে বিভিন্ন ডিজিটাল প্ল্যাটফর্মে তথ্য জোগান। উইকিপিডিয়ার অধিকাংশ লেখা যেমন আসে ইউরোপ বা আমেরিকা থেকে, আফ্রিকার এমন কোনও দেশ থেকে নয়, যেখানে দিনে কয়েক ঘণ্টার বিদ্যুৎই রাজকীয় বিলাসিতা। সুতরাং, সেই সুবিধাভোগী অংশটির রাজনৈতিক, সাম্প্রদায়িক বা লিঙ্গভিত্তিক পক্ষপাত অনায়াসেই ছাপ ফেলে তথ্যভান্ডারে। এই তথ্যভান্ডার বিপুল হওয়া সত্ত্বেও নিরপেক্ষ নয়, আর তাই তার ভিত্তিতে প্রশিক্ষিত যন্ত্রমেধা নিয়ে ফেলে পক্ষপাতদুষ্ট সিদ্ধান্ত।

সুতরাং, শুধু নিজস্ব ফাউন্ডেশন মডেল বানালেই কাজ শেষ হচ্ছে না। সরকারপক্ষের যাঁরা চাইছেন যে, আগামী বছরগুলোতে ভারতের সমস্ত আঞ্চলিক ভাষায় তৈরি হোক ‘মেক ইন ইন্ডিয়া’ চ্যাটবট, তাঁদের এখনও কৃত্রিম মেধা নামের ইঞ্জিনটির আসল জ্বালানি, অর্থাৎ আমজনতার থেকে আহরিত তথ্যভান্ডারকে পরিচ্ছন্ন, সুষম, এবং সুরক্ষিত করার পথে অনেকটা হাঁটতে হবে।

(সবচেয়ে আগে সব খবর, ঠিক খবর, প্রতি মুহূর্তে। ফলো করুন আমাদের Google News, X (Twitter), Facebook, Youtube, Threads এবং Instagram পেজ)

অন্য বিষয়গুলি:

Artificial Intelligence Science Society
সবচেয়ে আগে সব খবর, ঠিক খবর, প্রতি মুহূর্তে। ফলো করুন আমাদের মাধ্যমগুলি:
Advertisement
Advertisement

Share this article

CLOSE