Latest News

6/recent/ticker-posts

Ad Code

OpenAI-এর নতুন ওপেন-ওয়েট মডেল GPT-OSS-120b এবং GPT-OSS-20b সামনে এলো

OpenAI-এর নতুন ওপেন-ওয়েট মডেল GPT-OSS-120b এবং GPT-OSS-20b সামনে এলো

openai gpt oss 20b


দীর্ঘ প্রতীক্ষার পর অবশেষে OpenAI তাদের নতুন ওপেন-ওয়েট (open-weight) লার্জ ল্যাঙ্গুয়েজ মডেল (LLMs) প্রকাশ করেছে। নতুন মডেল দুটিকে বলা হচ্ছে GPT-OSS, যার মধ্যে রয়েছে gpt-oss-120b এবং gpt-oss-20b। এই মডেলগুলোকে "রিজনিং মডেলস" বা যুক্তি-ভিত্তিক মডেল হিসেবে চিহ্নিত করা হয়েছে। OpenAI-এর দাবি অনুযায়ী, এই মডেলগুলো একই আকারের অন্যান্য ওপেন মডেলের তুলনায় যুক্তিনির্ভর কাজে অনেক ভালো ফল দেয়।

এই পদক্ষেপ OpenAI-কে তাদের মূল লক্ষ্য—"এমন এআই সিস্টেম তৈরি করা যা সমগ্র মানবজাতির উপকারে আসে"—তার কাছাকাছি ফিরিয়ে নিয়ে এসেছে।

ওপেন-ওয়েট এবং রিজনিং মডেল কী?

এই মডেলগুলোর বিষয়ে বিস্তারিত জানার আগে দুটি গুরুত্বপূর্ণ বিষয় বোঝা দরকার:

  1. ওপেন-ওয়েট LLM: এটি এমন একটি লার্জ ল্যাঙ্গুয়েজ মডেল যা একটি কোম্পানি তার সমস্ত মডেল ওজন (যা প্যারামিটার নামে পরিচিত) সহ সর্বসাধারণের জন্য প্রকাশ করে। এর ফলে যেকোনো ব্যবহারকারী নিজের হার্ডওয়্যারে এই মডেলগুলো সম্পূর্ণ ডাউনলোড করে চালাতে পারে।

  • ওপেন-ওয়েট মডেল এবং ওপেন-সোর্স মডেল (open-source models)-এর মধ্যে একটি সূক্ষ্ম পার্থক্য রয়েছে। ওপেন-সোর্স মডেলগুলো তাদের ট্রেনিং কোড এবং ডেটাসেটও সবার জন্য উন্মুক্ত করে, যা ওপেন-ওয়েট মডেলে থাকে না।
  • এর বিপরীতে, OpenAI-এর GPT, Google Gemini 2.5 এবং Anthropic-এর Claude Sonnet 4-এর মতো মডেলগুলো হলো ক্লোজড মডেল (closed models)। এগুলোর মডেল ওজন সর্বসাধারণের জন্য উন্মুক্ত নয় এবং কেবল অ্যাপ্লিকেশন স্তরের মাধ্যমে ব্যবহার করা যায়।

  • রিজনিং মডেল (Reasoning Models): এই মডেলগুলো অন্য LLM থেকে কিছুটা আলাদা। এগুলো জটিল সমস্যার সমাধানের জন্য চূড়ান্ত উত্তর দেওয়ার আগে বেশি সময় ধরে "চিন্তা করার" জন্য ডিজাইন করা হয়েছে। এগুলোর প্রধান কাজ হলো একাধিক ধাপের সমস্যা সমাধানের জন্য একটি দীর্ঘ যুক্তি প্রক্রিয়া ব্যবহার করা।

নতুন GPT-OSS মডেলগুলোর বৈশিষ্ট্য

gpt-oss-120b এবং gpt-oss-20b মডেল দুটির মধ্যে প্রধান পার্থক্য হলো এদের প্যারামিটার (parameters) সংখ্যায়। প্যারামিটার হলো একটি নিউরাল নেটওয়ার্কের অভ্যন্তরীণ সংযোগগুলোর শক্তি, যা একটি প্রশ্নের উত্তর দেওয়ার আগে বিভিন্ন "নিউরণ" কীভাবে একে অপরকে প্রভাবিত করবে তা নির্ধারণ করে। এখানে নামকরণে কিছুটা বিভ্রান্তি আছে—gpt-oss-120b আসলে ১১৭ বিলিয়ন প্যারামিটারের মডেল এবং gpt-oss-20b হলো ২১ বিলিয়ন প্যারামিটারের মডেল।

কর্মক্ষমতা (Performance): OpenAI-এর করা বিভিন্ন বেঞ্চমার্ক পরীক্ষায় দেখা গেছে, gpt-oss-120b এবং gpt-oss-20b মডেল দুটি o3 এবং o4-mini মডেলের কাছাকাছি পারফর্ম করে। যেমন, MMLU বেঞ্চমার্ক পরীক্ষায় gpt-oss-120b ৯০% এবং gpt-oss-20b ৮৫.৩% সঠিক উত্তর দিয়েছে, যা o3 (৯৩.৪%) এবং o4-mini (৯৩%)-এর খুব কাছাকাছি।

সিস্টেমের প্রয়োজনীয়তা: এই মডেলগুলো ব্যবহারের জন্য প্রয়োজনীয় মেমরি সম্পর্কে OpenAI জানিয়েছে, gpt-oss-120b মডেল চালানোর জন্য সিস্টেমে ৮০ GB মেমরি লাগবে, এবং gpt-oss-20b মডেলের জন্য ১৬ GB মেমরি প্রয়োজন। মাইক্রোসফট উইন্ডোজ ডিভাইসের জন্য gpt-oss-20b মডেলের GPU-অপ্টিমাইজড ভার্সন নিয়ে আসছে বলেও জানানো হয়েছে।

একটি মন্তব্য পোস্ট করুন

0 মন্তব্যসমূহ

Ad Code