Advertisement
১৮ এপ্রিল ২০২৪
Data Science

বিগ ডেটা ও ষষ্ঠীচরণ

অতিমারির ফলে জোয়ার এসেছে আন্তর্জালের ব্যবহারে। মহাসমুদ্রের জমাট-বাঁধা তরঙ্গের মতো ‘ডেটা’ তাই হয়ে উঠেছে ‘বিগ ডেটা’। 

— ফাইল চিত্র

— ফাইল চিত্র

অতনু বিশ্বাস
শেষ আপডেট: ২৩ ডিসেম্বর ২০২০ ০১:৫২
Share: Save:

ডিজিটাল তথ্যের সাগরে প্লাবন এসেছে। এমনিতেই জীবনযাপনের প্রতিটি ক্ষণ আজ বাঁধা আন্তর্জালের দুনিয়াতে। সোশ্যাল মিডিয়ায় ‘ইন্টারনেট অব থিংস’-এর (ইন্দ্র)জালে জড়ানো অগণিত বস্তুও প্রতি মুহূর্তে জোগান দিয়ে চলেছে গাদা গাদা তথ্যের। এরই মাঝে অতিমারির ফলে জোয়ার এসেছে আন্তর্জালের ব্যবহারে। মহাসমুদ্রের জমাট-বাঁধা তরঙ্গের মতো ‘ডেটা’ তাই হয়ে উঠেছে ‘বিগ ডেটা’।

এই তথ্যসমুদ্র মন্থন করে অমৃত আহরণের প্রচেষ্টাও চলেছে পুরোদস্তুর, কয়েক দশক ধরেই। নতুন একদল পেশাদারই তৈরি হয়ে গেলেন— ‘ডেটা সায়েন্টিস্ট’। প্রধানত কিছু গড়পড়তা সফটওয়্যার চালিয়ে বিপুল পরিমাণে ডেটা-র বিশ্লেষণ করে পরিকল্পনার পথ-নির্দেশ করে চলেছেন এঁরা। ব্যবসা-বাণিজ্যে, খেলায়, ভোটের রাজনীতিতে, স্বাস্থ্যে, মানব-সম্পদে, কোথায় নয়!

এই শতকের গোড়ার দিকে আমেরিকার বেসবল টিম ‘ওকল্যান্ড অ্যাথলেটিক্স’-এর সাফল্যের গল্প এখন প্রায় রূপকথার পর্যায়ভুক্ত। এদের ম্যানেজার বিলি বিন খুব অল্প বাজেটেও সাফল্য এনে দিয়েছেন তাঁর দলকে, ‘মেজর লিগ বেসবল’ প্রতিযোগিতায়— শুধুমাত্র রাশিবিজ্ঞান, প্রজ্ঞা আর বাস্তব বুদ্ধিকে ব্যবহার করে। অন্য দলগুলি যেখানে ব্যাটিং গড়, স্বাস্থ্য, গতি ইত্যাদিতে গুরুত্ব দিয়ে খেলোয়াড় নিয়োগ করে, বিলি বিন পুরনো তথ্য বিশ্লেষণ করে দেখলেন, ‘অন-বেস পারসেন্টেজ’ নামে এক সূচক খেলোয়াড়দের অর্থমূল্যের ভাল নির্ণায়ক হতে পারে। তার ভিত্তিতেই দল গঠন করেন বিন। পর পর ২০টা খেলায় জিতে তৈরি হয় এক নতুন রেকর্ড। এ নিয়ে ২০০৩ সালে জমিয়ে বই লিখেছেন মাইকেল ল্যুইস। মানিবল। হলিউডে তা নিয়ে ছবি হয়েছে ২০১১ সালে। বিলি বিনের ভূমিকায় ব্র্যাড পিট। ক্রমে জীবনের প্রায় সর্ব ক্ষেত্রের দখল নিয়ে ফেলল এই ‘মানিবল’-সংস্কৃতি। আর সিলিকন ভ্যালি এক জাদুর ঝাঁপি নিয়ে এর মধ্যে ঢুকে পড়ল।

কোভিড-১৯ অতিমারি মোকাবিলায় ‘বিগ ডেটা’ ম্যাজিক দেখাবে, এমনটাই প্রত্যাশা ছিল অনেকের। ডেটা সায়েন্টিস্টদের সামনেও এ ছিল অগ্নিপরীক্ষা। এপ্রিলে ‘হার্ভার্ড বিজ়নেস রিভিউ’-এর এক প্রবন্ধে বলা হল, শতাব্দী-প্রাচীন স্প্যানিশ ফ্লু-র সঙ্গে আজকের অতিমারির প্রধান পার্থক্য হল প্রযুক্তির বিবর্তন। বলা হল, এটাই ‘বিগ ডেটা’-র সবচেয়ে অর্থবহ চ্যালেঞ্জ। ইচ্ছাশক্তি এবং উদ্ভাবনী ক্ষমতার প্রয়োগে নাকি ক্ষুদ্রাতিক্ষুদ্র স্তরে, এমনকি পাড়ায় পাড়ায়ও, ভাইরাস সংক্রমণের দ্রুত পূর্বাভাস দেওয়া সম্ভব। দক্ষিণ কোরিয়া বা তাইওয়ানের কোভিড নিয়ন্ত্রণে সাফল্যকে ‘বিগ ডেটা’ বিশ্লেষণের সাফল্যের সঙ্গে জুড়বার চেষ্টাও হল।

কিন্তু অতিমারির দাপট বাড়তেই স্পষ্ট হল ‘বিগ ডেটা’-র অসহায় ব্যর্থতাও। কোভিড অতিমারি সামলাতে ‘বিগ ডেটা’ জাদুকাঠি হয়ে উঠতে পারলে তা বড় বিজ্ঞাপন হত ডেটা সায়েন্টিস্টদের পক্ষে। এই কঠিনতম এবং অতি-প্রয়োজনীয় পরীক্ষায় বিগ ডেটা-র ব্যর্থতাকেও তাই তুলে ধরা প্রয়োজন।
আমেরিকা থেকে ভারত, বিভিন্ন দেশের নির্বাচনের ফলাফল নির্ধারণে বিগ ডেটার ভূমিকাই হোক, বা ২০১৪-র ব্রাজিল বিশ্বকাপে জার্মানির চ্যাম্পিয়ন হওয়ার পিছনে ‘বিগ ডেটা’-র বিশ্লেষণ-ভিত্তিক পরিকল্পনার অবদানই হোক, এই নতুন প্রযুক্তি নিয়ে গত কয়েক বছরে আলোচনা হয়েছে প্রচুর। কোভিড-১৯’পর্ব কিন্তু দেখাল, এখনও ‘বিগ ডেটা’ নামের মস্ত হাতিটাকে নিয়ে লোফালুফি করবার মতো ষষ্ঠীচরণ হয়ে উঠতে পারেনি আমাদের প্রযুক্তি। ২০০৮-এ খুব ঢাক-ঢোল পিটিয়ে গুগল শুরু করেছিল ফ্লু-র পূর্বাভাস দেওয়া। ফ্লু হওয়ার উপক্রম হলে সে সংক্রান্ত যে সব সার্চ করা হয় গুগলের সার্চ ইঞ্জিনে, তার বিশ্লেষণ করে সরকারি স্বাস্থ্য সংস্থার আগে ফ্লু-র পূর্বাভাস দেওয়াই ছিল এই প্রকল্পের উদ্দেশ্য। প্রকল্পটা মুখ থুবড়ে পড়ে। আসলে মানুষ যখন ফ্লু হয়েছে ভাবে, তার প্রায় নব্বই শতাংশ ক্ষেত্রেই সেটা বাস্তবে ফ্লু নয়। তাই তথ্যটা বিপুল হলেও, কতটা নির্ভরযোগ্য, সন্দেহ থেকেই যায়।

তবু, প্রযুক্তির উন্নতির সঙ্গে সঙ্গে উপচে পড়া ‘বিগ ডেটা’-কে ঠিকঠাক বিশ্লেষণ করার ক্ষমতা কি সত্যিই আছে আজকের রাশিবিজ্ঞানের? ডেটা সায়েন্টিস্ট-দের? সমস্যা দ্বিবিধ। এই বিপুল তথ্যভান্ডারে থাকে হাজার হাজার বিষয়ের উপর কোটি কোটি তথ্যবিন্দু। রাশিবিজ্ঞানের বেশির ভাগ তত্ত্বই বিশাল সংখ্যক ভেরিয়েব্‌ল বা চলকের ক্ষেত্রে নড়বড়ে হয়ে যায়। তথ্য যে হারে বেড়েছে, আমাদের বিশ্লেষণ-ক্ষমতা তার সঙ্গে পাল্লা দিতে পারেনি। তথ্য বাড়লে যেমন খানিক প্রয়োজনীয় তথ্য বাড়ে, তেমনই তার সঙ্গে পাল্লা দিয়ে বাড়তে থাকে অপ্রয়োজনীয় অনেক কিছু। আর খড়ের গাদাটা বাড়তে থাকলে, কঠিন থেকে কঠিনতর হতে পড়ে তার ভিতর থেকে সুচ খোঁজার কাজটাও। ও দিকে আজকের শক্তিশালী কম্পিউটারও সাধারণ ভাবে এই বিপুল তথ্যকে বিশ্লেষণ করার উপযুক্ত নয়। কম্পিউটারের স্মৃতির ভাঁড়ার উপচে পড়ে এক বিশ্রী ব্যাপার হয়ে দাঁড়ায়। ভবিষ্যতে কোয়ান্টাম কম্পিউটারের বিপ্লব এলে তথ্যের মহাসমুদ্র থেকে অমৃত খোঁজার কাজটা সহজ হবে নিশ্চয়ই। তাই দক্ষ রাশিবিজ্ঞানী, প্রযুক্তিবিদ এবং কম্পিউটার বিশেষজ্ঞকে একসঙ্গে বসেই গড়ে তুলতে হবে এই তথ্য-সমুদ্র মন্থনের কৌশল।

তবে এটাও ঠিক যে, বিপুল তথ্যের মহাসমুদ্রের মধ্যে কোথাও লুকিয়ে রয়েছে অমৃত-কুম্ভ। বাস্তবিকই ‘বিগ ডেটা’ থেকে অমৃত উদ্ধারের সাধনাটা মহাসমুদ্রের অতল থেকে পীযূষভাণ্ড তোলার চাইতে কম কিছু নয়। ভুললে চলবে না, কালকূট বিষও কিন্তু এই সমুদ্র মন্থনের এক ফসল। তাই ‘বিগ ডেটা’-র মহাসমুদ্র সেচে ঠিক কী পাওয়া যাবে— অমৃত না হলাহল— তা নির্ভর করবে মন্থনকারীদের দক্ষতা, প্রযুক্তি, সদিচ্ছা এবং অনমনীয়তার উপরে।

ইন্ডিয়ান স্ট্যাটিস্টিক্যাল ইনস্টিটিউট, কলকাতা

(সবচেয়ে আগে সব খবর, ঠিক খবর, প্রতি মুহূর্তে। ফলো করুন আমাদের Google News, X (Twitter), Facebook, Youtube, Threads এবং Instagram পেজ)

অন্য বিষয়গুলি:

Data Science Coronavirus Big Data
সবচেয়ে আগে সব খবর, ঠিক খবর, প্রতি মুহূর্তে। ফলো করুন আমাদের মাধ্যমগুলি:
Advertisement
Advertisement

Share this article

CLOSE