Sunday, February 19, 2023

প্রযুক্তি ও ভবিষ্যৎ ৫ (AI in the Wild)

ChatGPT সম্বন্ধে এতদিনে অনেকেই জানেন। যদিও এই সফ্টওয়্যারের পিছনে যে প্রযুক্তি রয়েছে, তার অন্দরের খবর তেমন পরিষ্কার নয়। গত কয়েক বছরের মধ্যে নিঃসন্দেহে এটি একটি অন্যতম উল্লেখযোগ্য technological product। ChatGPT একটি conversational robot (অথবা bot), যাকে একটি ওয়েবসাইটের (chat.openai.com) মাধ্যমে ব্যবহার করা যাচ্ছে। এই ওয়েবসাইটে একটি চ্যাটবক্সের মাধ্যমে আপনি এই bot-এর সাথে যে কোনো বিষয়ে কথাবার্তা বলতে পারেন ও একে প্রশ্ন করতে পারেন। এই bot-টির পিছনে কাজ করছে একটি Artificial Intelligence (AI) ইঞ্জিন, যা ইন্টারনেটের বিভিন্ন অন্দরে ছড়িয়ে ছিটিয়ে থাকা তথ্যকে বিশ্লেষণ করে তৈরী করেছে একটি সফ্টওয়্যার মডেল। সেই মডেলটিকে ব্যবহার করে ChatGPT কথোপকথনের মতো করে উত্তর দিতে পারে আপনার যে কোনো প্রশ্নের।

ChatGPT-র সঙ্গে Google-এর মতো সাধারণ সার্চ ইঞ্জিনের বিস্তর পার্থক্য আছে। Google শুধুমাত্র আমাদের দেওয়া কিছু শব্দের ভিত্তিতে ইন্টারনেট থেকে কিছু প্রাসঙ্গিক ওয়েবসাইটের খোঁজ দিতে পারে। কিন্তু ChatGPT-কে আমরা কোনো প্রশ্ন করলে, সে তার সঞ্চিত তথ্যকে বিশ্লেষণ করে একটি সংক্ষিপ্ত উত্তর দিতে সক্ষম। সবথেকে চমকপ্রদ বিষয় হলো, ChatGPT-র বিশ্লেষণী ও সৃষ্টিশীল ক্ষমতার সংমিশ্রণ। মানে এটি তথ্যকে বিশ্লেষণ করে এমন অভিনব আঙ্গিকে উত্তর দিতে পারে, যে উত্তর হয়তো আগে কোথাও প্রকাশিত হয়নি। ফলতঃ খানিকটা একজন প্রতিক্রিয়াশীল মানুষের মতোই, ChatGPT তার সফ্টওয়্যার মডেলকে সম্বল করে নতুন বিশ্লেষণ তুলে আনতে পারে, এবং সেটা প্রায় যে কোনো বিষয়েই। Google-এর মতো সার্চ ইঞ্জিনগুলোর এই ক্ষমতা এখনো নেই। 

তবে ChatGPT-এর উত্তরকে সব বিষয়ে যে সর্বক্ষণ ভরসা করা যায়, এমন নয়। যেমন কোনো গাণিতিক প্রশ্নে এর উত্তর অনেক সময়ই ভুল হতে পারে। আবার ChatGPT-র সাথে বেশিক্ষন ধরে কথাবার্তা চালিয়ে গেলে, কিছু সময় পর থেকে সে প্রাসঙ্গিক উত্তর হয়তো নাও দিতে পারে। এতদসত্ত্বেও ChatGPT-এর মূল কার্যকারিতা একটি Knowledge Synthesis Assistant-এর মতো। মানে কোনো বিষয়ে আপনি যদি সংক্ষেপে কিছু জানতে চান, সেক্ষেত্রে ChatGPT খুবই উপকারী। যেমন ধরুন, সত্যজিৎ রায় এবং মৃনাল সেনের মধ্যে সম্পর্ক কেমন ছিল, সেই বিষয়ে সংক্ষিপ্ত একটা ধারণা আপনাকে দিয়ে দিতে পারে। কিংবা মোদী সরকারের আমলে ভারতের অর্থনৈতিক হাল কেমন, সে বিষয়ে ছোট্ট একটি ধারণা দিতে পারে। এছাড়া, ChatGPT computer programming বা coding-এর জন্য ভীষণরকমভাবে উপকারী। ইন্টারনেটের বিভিন্ন কোণ ঘেঁটে, বিশ্লেষণ করে coding-এর বিষয়ে খুব প্রাসঙ্গিক উত্তর দিতে এটি সক্ষম। ChatGPT-এর মতো উন্নত একটি সফ্টওয়্যার-এর উত্থানের পরিপ্রেক্ষিতে আর্টিফিশিয়াল ইন্টেলিজেন্সের সাম্প্রতিক ইতিহাসের দিকে একটু চোখ ফেরানো যাক। 

গত এক দশকে আর্টিফিশিয়াল ইন্টেলিজেন্স আমাদের জীবনের বিভিন্ন দিকেই ধীরে ধীরে ঢুকে পড়েছে। আর্টিফিশিয়াল ইন্টেলিজেন্সে এক বিশেষ ধরণের অ্যালগরিদম ব্যবহার করা হয়, যাদের মেশিন লার্নিং অ্যালগরিদম বলা হয়ে থাকে। গুগল ফোটোস যে আমাদের পরিবার পরিজন এবং বন্ধুবান্ধবদের মধ্যে সকলকে আলাদা আলাদা করে চিহ্নিত করে রাখতে পারে, তা কিন্তু হয় মেশিন লার্নিং-এর সাহায্যেই। ইউটিউব খুললেই আজকাল আমরা আমাদের পছন্দমতো ভিডিও রেকমেন্ডেশন পেতে থাকি। এর পিছনেও আছে মেশিন লার্নিং। তবে মেশিন লার্নিং এবং আর্টিফিশিয়াল ইন্টেলিজেন্স নিয়ে গবেষণা কিন্তু চলছে প্রায় ৩৫ বছরেরও বেশি সময় ধরে। তবে এক্ষেত্রে টার্নিং পয়েন্ট ২০১২ সাল।

২০১২ সালের আগে মেশিন লার্নিং নিয়ে বহু রিসার্চ ল্যাবে ও বিশ্ববিদ্যালয়ে গবেষণা হতো ঠিকই, কিন্তু বেশিরভাগ গবেষণা শুধুই গাণিতিক কিছু তত্ত্বের মধ্যে সীমাবদ্ধ ছিল, তাদের ব্যবহারিক ক্ষেত্রে কাজে লাগানো যেত না। এর মূলত দুটো কারণ ছিল: data এবং computing power। আমাদের কাছে ডিজিটাল ফর্মে যথেষ্ট data ছিল না, যা মেশিন লার্নিং অ্যালগরিদমগুলি কার্যকরী হওয়ার জন্য অপরিহার্য। মেশিন লার্নিং অ্যালগরিদমগুলি ডেটা বা তথ্য থেকেই কোনো প্রশ্নের সমাধান অনুমান করার চেষ্টা করে, data-ই তাদের মূল চালিকাশক্তি। ২০০০ সালের কাছাকাছি সময় থেকেই digitally data ধরে রাখার কাজটা মোটামুটি জোরকদমে এগোচ্ছিল, এবং ২০১০-এর মধ্যে মেশিন লার্নিং প্রয়োগ করার জন্য বেশ ভালোরকম datasets তৈরী হয়ে গেছিল। 

কিন্তু যেদিকটায় তখনো খামতি ছিল, তা হল কম্পিউটিং পাওয়ার। মানে মেশিন লার্নিং প্রয়োগ করার জন্য যে কম্পিউটার দরকার হতো, তা সাধারণভাবে পাওয়া যেত না। এই পুরো চিত্রটা বদলে গেল ২০১২-এর সেপ্টেম্বরে। ইউনিভার্সিটি অফ টরোন্টোর তিনজন বিজ্ঞানী দেখালেন যে, মেশিন লার্নিং-এর ক্ষেত্রে আমরা সাধারণত যে CPU (Central Procesing Unit) ব্যবহার করি, তা কার্যকরী নয়।। বরং যদি Graphics Processing Unit বা GPU ব্যবহার করা যায়, তাহলে মেশিন লার্নিং অ্যালগরিদম খুব দ্রুত কাজ করতে পারে। ইতিমধ্যে ভিডিও গেম, ভিডিও প্রসেসিং এবং সিনেমার কাজে GPU-র ব্যবহার খুবই জনপ্রিয় ছিল। কিন্তু এরপর থেকে মেশিন লার্নিং-এও ব্যাপক হারে GPU-র ব্যবহার শুরু হয়। গবেষণাও তীব্র গতিতে এগোতে থাকে, সাথে সাথে AI-বিষয়ক পরীক্ষা-নিরিক্ষাও। গত এক দশকের ব্যাপক এবং বিবিধ AI গবেষণার অন্যতম সফল সফটওয়্যার হল ChatGPT । 

ChatGPT নিয়ে এতো উত্তেজনার কারণ হল যে, এটি কোনো একটি নির্দিষ্ট বিষয়ের জন্য তৈরী নয়। যেমন এটি শুধুমাত্র একটি computer programming assistant নয়, বা এটি শুধুমাত্র একটি ছবির ভিতর কি কি বস্তু আছে তা চিহ্নিত করছে না। এর আগে বিভিন্ন মেশিন লার্নিং সফ্টওয়্যার কোনো একটি নির্দিষ্ট ধরণের কাজের বিষয়ে বেশ কার্যকরী হয়েছে। কিন্তু এই আগের সফ্টওয়্যারের তুলনায় ChatGPT অনেক বেশি সাধারণ কাজ করতে পারে, কতকটা মানুষের মতোই। কোনো বিশ্লেষণ থেকে আমরা যেমন কোনো উপলব্ধিতে পৌঁছোই, সেরকম বিশ্লেষণ ও উপলব্ধির ক্ষমতাও ChatGPT-র আছে, বরং মানুষের থেকে কিছুটা বেশিই আছে। এর একটা মূল কারণ হল, বিশ্লেষণের জন্য সে আর এখন আমাদের উপর বা আমাদের দেওয়া তথ্যের উপর নির্ভরশীল নয়। মনে রাখতে হবে, নতুন বিশ্লেষণের উদ্ভাবনী ক্ষমতাও আছে ChatGPT-র কাছে। সে নিজেই নতুন নতুন বিশ্লেষণ তৈরী করে সেখান থেকে নতুন উপলব্ধি করতে পারে। সেটা স্বভাবতই মানুষের উপলব্ধির গতিবেগের থেকে কয়েক গুন্ বেশি। ChatGPT-এর এই বিশ্লেষণ এবং সেখান থেকে উপলব্ধিতে উত্তরণের যে শেষ কোথায়, তা হয়তো মানুষ হিসেবে আমাদের উপলব্ধির বাইরে।

নোট: লেখক এই লেখার সময় GPU-র সর্ববৃহৎ কোম্পানি Nvidia-তে চাকরিরত