OpenAI-এর নতুন ওপেন-ওয়েট মডেল GPT-OSS-120b এবং GPT-OSS-20b সামনে এলো
দীর্ঘ প্রতীক্ষার পর অবশেষে OpenAI তাদের নতুন ওপেন-ওয়েট (open-weight) লার্জ ল্যাঙ্গুয়েজ মডেল (LLMs) প্রকাশ করেছে। নতুন মডেল দুটিকে বলা হচ্ছে GPT-OSS, যার মধ্যে রয়েছে gpt-oss-120b এবং gpt-oss-20b। এই মডেলগুলোকে "রিজনিং মডেলস" বা যুক্তি-ভিত্তিক মডেল হিসেবে চিহ্নিত করা হয়েছে। OpenAI-এর দাবি অনুযায়ী, এই মডেলগুলো একই আকারের অন্যান্য ওপেন মডেলের তুলনায় যুক্তিনির্ভর কাজে অনেক ভালো ফল দেয়।
এই পদক্ষেপ OpenAI-কে তাদের মূল লক্ষ্য—"এমন এআই সিস্টেম তৈরি করা যা সমগ্র মানবজাতির উপকারে আসে"—তার কাছাকাছি ফিরিয়ে নিয়ে এসেছে।
ওপেন-ওয়েট এবং রিজনিং মডেল কী?
এই মডেলগুলোর বিষয়ে বিস্তারিত জানার আগে দুটি গুরুত্বপূর্ণ বিষয় বোঝা দরকার:
ওপেন-ওয়েট LLM: এটি এমন একটি লার্জ ল্যাঙ্গুয়েজ মডেল যা একটি কোম্পানি তার সমস্ত মডেল ওজন (যা প্যারামিটার নামে পরিচিত) সহ সর্বসাধারণের জন্য প্রকাশ করে। এর ফলে যেকোনো ব্যবহারকারী নিজের হার্ডওয়্যারে এই মডেলগুলো সম্পূর্ণ ডাউনলোড করে চালাতে পারে।
- ওপেন-ওয়েট মডেল এবং ওপেন-সোর্স মডেল (open-source models)-এর মধ্যে একটি সূক্ষ্ম পার্থক্য রয়েছে। ওপেন-সোর্স মডেলগুলো তাদের ট্রেনিং কোড এবং ডেটাসেটও সবার জন্য উন্মুক্ত করে, যা ওপেন-ওয়েট মডেলে থাকে না।
এর বিপরীতে, OpenAI-এর GPT, Google Gemini 2.5 এবং Anthropic-এর Claude Sonnet 4-এর মতো মডেলগুলো হলো ক্লোজড মডেল (closed models)। এগুলোর মডেল ওজন সর্বসাধারণের জন্য উন্মুক্ত নয় এবং কেবল অ্যাপ্লিকেশন স্তরের মাধ্যমে ব্যবহার করা যায়।
রিজনিং মডেল (Reasoning Models): এই মডেলগুলো অন্য LLM থেকে কিছুটা আলাদা। এগুলো জটিল সমস্যার সমাধানের জন্য চূড়ান্ত উত্তর দেওয়ার আগে বেশি সময় ধরে "চিন্তা করার" জন্য ডিজাইন করা হয়েছে। এগুলোর প্রধান কাজ হলো একাধিক ধাপের সমস্যা সমাধানের জন্য একটি দীর্ঘ যুক্তি প্রক্রিয়া ব্যবহার করা।
নতুন GPT-OSS মডেলগুলোর বৈশিষ্ট্য
gpt-oss-120b এবং gpt-oss-20b মডেল দুটির মধ্যে প্রধান পার্থক্য হলো এদের প্যারামিটার (parameters) সংখ্যায়। প্যারামিটার হলো একটি নিউরাল নেটওয়ার্কের অভ্যন্তরীণ সংযোগগুলোর শক্তি, যা একটি প্রশ্নের উত্তর দেওয়ার আগে বিভিন্ন "নিউরণ" কীভাবে একে অপরকে প্রভাবিত করবে তা নির্ধারণ করে। এখানে নামকরণে কিছুটা বিভ্রান্তি আছে—gpt-oss-120b আসলে ১১৭ বিলিয়ন প্যারামিটারের মডেল এবং gpt-oss-20b হলো ২১ বিলিয়ন প্যারামিটারের মডেল।
কর্মক্ষমতা (Performance): OpenAI-এর করা বিভিন্ন বেঞ্চমার্ক পরীক্ষায় দেখা গেছে, gpt-oss-120b এবং gpt-oss-20b মডেল দুটি o3 এবং o4-mini মডেলের কাছাকাছি পারফর্ম করে। যেমন, MMLU বেঞ্চমার্ক পরীক্ষায় gpt-oss-120b ৯০% এবং gpt-oss-20b ৮৫.৩% সঠিক উত্তর দিয়েছে, যা o3 (৯৩.৪%) এবং o4-mini (৯৩%)-এর খুব কাছাকাছি।
সিস্টেমের প্রয়োজনীয়তা: এই মডেলগুলো ব্যবহারের জন্য প্রয়োজনীয় মেমরি সম্পর্কে OpenAI জানিয়েছে, gpt-oss-120b মডেল চালানোর জন্য সিস্টেমে ৮০ GB মেমরি লাগবে, এবং gpt-oss-20b মডেলের জন্য ১৬ GB মেমরি প্রয়োজন। মাইক্রোসফট উইন্ডোজ ডিভাইসের জন্য gpt-oss-20b মডেলের GPU-অপ্টিমাইজড ভার্সন নিয়ে আসছে বলেও জানানো হয়েছে।
0 মন্তব্যসমূহ
Thank you so much for your kindness and support. Your generosity means the world to me. 😊