OpenAI-এর নতুন ওপেন-ওয়েট মডেল GPT-OSS-120b এবং GPT-OSS-20b সামনে এলো

দীর্ঘ প্রতীক্ষার পর অবশেষে OpenAI তাদের নতুন ওপেন-ওয়েট (open-weight) লার্জ ল্যাঙ্গুয়েজ মডেল (LLMs) প্রকাশ করেছে। নতুন মডেল দুটিকে বলা হচ্ছে GPT-OSS, যার মধ্যে রয়েছে gpt-oss-120b এবং gpt-oss-20b। এই মডেলগুলোকে "রিজনিং মডেলস" বা যুক্তি-ভিত্তিক মডেল হিসেবে চিহ্নিত করা হয়েছে। OpenAI-এর দাবি অনুযায়ী, এই মডেলগুলো একই আকারের অন্যান্য ওপেন মডেলের তুলনায় যুক্তিনির্ভর কাজে অনেক ভালো ফল দেয়।

এই পদক্ষেপ OpenAI-কে তাদের মূল লক্ষ্য—"এমন এআই সিস্টেম তৈরি করা যা সমগ্র মানবজাতির উপকারে আসে"—তার কাছাকাছি ফিরিয়ে নিয়ে এসেছে।

ওপেন-ওয়েট এবং রিজনিং মডেল কী?

এই মডেলগুলোর বিষয়ে বিস্তারিত জানার আগে দুটি গুরুত্বপূর্ণ বিষয় বোঝা দরকার:

ওপেন-ওয়েট LLM: এটি এমন একটি লার্জ ল্যাঙ্গুয়েজ মডেল যা একটি কোম্পানি তার সমস্ত মডেল ওজন (যা প্যারামিটার নামে পরিচিত) সহ সর্বসাধারণের জন্য প্রকাশ করে। এর ফলে যেকোনো ব্যবহারকারী নিজের হার্ডওয়্যারে এই মডেলগুলো সম্পূর্ণ ডাউনলোড করে চালাতে পারে।

ওপেন-ওয়েট মডেল এবং ওপেন-সোর্স মডেল (open-source models)-এর মধ্যে একটি সূক্ষ্ম পার্থক্য রয়েছে। ওপেন-সোর্স মডেলগুলো তাদের ট্রেনিং কোড এবং ডেটাসেটও সবার জন্য উন্মুক্ত করে, যা ওপেন-ওয়েট মডেলে থাকে না।

এর বিপরীতে, OpenAI-এর GPT, Google Gemini 2.5 এবং Anthropic-এর Claude Sonnet 4-এর মতো মডেলগুলো হলো ক্লোজড মডেল (closed models)। এগুলোর মডেল ওজন সর্বসাধারণের জন্য উন্মুক্ত নয় এবং কেবল অ্যাপ্লিকেশন স্তরের মাধ্যমে ব্যবহার করা যায়।
রিজনিং মডেল (Reasoning Models): এই মডেলগুলো অন্য LLM থেকে কিছুটা আলাদা। এগুলো জটিল সমস্যার সমাধানের জন্য চূড়ান্ত উত্তর দেওয়ার আগে বেশি সময় ধরে "চিন্তা করার" জন্য ডিজাইন করা হয়েছে। এগুলোর প্রধান কাজ হলো একাধিক ধাপের সমস্যা সমাধানের জন্য একটি দীর্ঘ যুক্তি প্রক্রিয়া ব্যবহার করা।

নতুন GPT-OSS মডেলগুলোর বৈশিষ্ট্য

gpt-oss-120b এবং gpt-oss-20b মডেল দুটির মধ্যে প্রধান পার্থক্য হলো এদের প্যারামিটার (parameters) সংখ্যায়। প্যারামিটার হলো একটি নিউরাল নেটওয়ার্কের অভ্যন্তরীণ সংযোগগুলোর শক্তি, যা একটি প্রশ্নের উত্তর দেওয়ার আগে বিভিন্ন "নিউরণ" কীভাবে একে অপরকে প্রভাবিত করবে তা নির্ধারণ করে। এখানে নামকরণে কিছুটা বিভ্রান্তি আছে—gpt-oss-120b আসলে ১১৭ বিলিয়ন প্যারামিটারের মডেল এবং gpt-oss-20b হলো ২১ বিলিয়ন প্যারামিটারের মডেল।

কর্মক্ষমতা (Performance): OpenAI-এর করা বিভিন্ন বেঞ্চমার্ক পরীক্ষায় দেখা গেছে, gpt-oss-120b এবং gpt-oss-20b মডেল দুটি o3 এবং o4-mini মডেলের কাছাকাছি পারফর্ম করে। যেমন, MMLU বেঞ্চমার্ক পরীক্ষায় gpt-oss-120b ৯০% এবং gpt-oss-20b ৮৫.৩% সঠিক উত্তর দিয়েছে, যা o3 (৯৩.৪%) এবং o4-mini (৯৩%)-এর খুব কাছাকাছি।

সিস্টেমের প্রয়োজনীয়তা: এই মডেলগুলো ব্যবহারের জন্য প্রয়োজনীয় মেমরি সম্পর্কে OpenAI জানিয়েছে, gpt-oss-120b মডেল চালানোর জন্য সিস্টেমে ৮০ GB মেমরি লাগবে, এবং gpt-oss-20b মডেলের জন্য ১৬ GB মেমরি প্রয়োজন। মাইক্রোসফট উইন্ডোজ ডিভাইসের জন্য gpt-oss-20b মডেলের GPU-অপ্টিমাইজড ভার্সন নিয়ে আসছে বলেও জানানো হয়েছে।

Latest News

Sangbad Ekalavya

OpenAI-এর নতুন ওপেন-ওয়েট মডেল GPT-OSS-120b এবং GPT-OSS-20b সামনে এলো