বিজ্ঞাপন

নতুন ‘ইমেজেস ২.০’ মডেলে লেখা তৈরিতেও এগিয়েছে চ্যাটজিপিটি

ছবির ভেতরে সঠিকভাবে লেখা তৈরিতে বড় উন্নতি এনেছে অপেনএআই। চ্যাটজিপিটির নতুন ‘ইমেজেস ২.০’ মডেল এখন এমন ছবি তৈরি করতে পারে। যেখানে লেখা প্রায় নিখুঁতভাবে উপস্থাপন করা যায়। যা আগে এআইয়ের জন্য বড় চ্যালেঞ্জ ছিল।

বিজ্ঞাপন

প্রযুক্তিবিষয়ক সাইট টেকক্রাঞ্চের এক প্রতিবেদনে বলা হয়েছে, চ্যাটজিপিটির ‘ইমেজেস ২.০’ মডেল এখন এমন মানের লেখা তৈরি করতে পারে। যা সরাসরি ব্যবহারযোগ্য। উদাহরণ হিসেবে একটি রেস্টুরেন্টের মেনু তৈরি করে দেখা গেছে সেটি বাস্তব মেনুর মতোই স্বাভাবিক দেখাচ্ছে।

এর আগে ছবি তৈরির এআই মডেলগুলো মূলত ‘ডিফিউশন মডেল’ ব্যবহার করত। এই পদ্ধতিতে এলোমেলো পিক্সেল থেকে ধীরে ধীরে ছবি তৈরি করা হয়। ফলে ছবির মূল অবজেক্ট ভালোভাবে তৈরি হলেও ছোট অংশ প্রায়ই ভুল হতো।

বিশেষজ্ঞদের ভাষায়, লেখার অংশটি ছবির খুব ছোট একটি অংশ হওয়ায় মডেল সেটিকে ঠিকভাবে শেখাতে পারত না। তাই অদ্ভুত বানান বা বিকৃত শব্দ দেখা যেত।

তবে নতুন মডেলে এই সীমাবদ্ধতা কমেছে। গবেষকেরা ‘অটোরিগ্রেসিভ’ মডেলের মতো নতুন পদ্ধতি ব্যবহার করছেন। যা ভাষা মডেলের মতো কাজ করে। এতে ছবি তৈরির সময় লেখা বা সূক্ষ্ম উপাদানগুলোও বেশি নির্ভুলভাবে তৈরি করা সম্ভব হচ্ছে। যদিও নতুন মডেলের পেছনে ঠিক কোন প্রযুক্তি ব্যবহার করা হয়েছে সে বিষয়ে বিস্তারিত জানায়নি অপেনএআই।

প্রতিষ্ঠানটি জানিয়েছে, ‘ইমেজেস ২.০’ মডেলে “থিংকিং ক্যাপাবিলিটি” বা চিন্তাভাবনার সক্ষমতা যুক্ত করা হয়েছে। এর ফলে এটি একটি প্রম্পট থেকে একাধিক ছবি তৈরি করতে পারে। প্রয়োজনে তথ্য যাচাই করতে পারে এবং জটিল ডিজাইনও তৈরি করতে সক্ষম।

এই মডেল দিয়ে বিভিন্ন আকারের মার্কেটিং ভিজ্যুয়াল, কমিক স্ট্রিপ বা ইউআই ডিজাইন তৈরি করা সম্ভব। এমনকি জাপানি, কোরিয়ান, হিন্দি ও বাংলার মতো নন-ল্যাটিন ভাষার লেখাও তুলনামূলকভাবে ভালোভাবে তৈরি করতে পারে।

তবে এই উন্নতির একটি সীমাবদ্ধতাও রয়েছে। মডেলটির জ্ঞানভান্ডার ২০২৫ সালের ডিসেম্বর পর্যন্ত। ফলে সাম্প্রতিক কোনো তথ্য বা ঘটনার ক্ষেত্রে এটি সব সময় নির্ভুল নাও হতে পারে।

অপেনএআই বলছে, নতুন মডেলটি আগের তুলনায় আরও নির্দিষ্ট নির্দেশনা বুঝতে পারে এবং সূক্ষ্ম বিষয়গুলো ভালোভাবে ফুটিয়ে তুলতে সক্ষম। ছোট লেখা, আইকন, জটিল কম্পোজিশন এসব ক্ষেত্রেও উন্নতি দেখা যাচ্ছে। সর্বোচ্চ টু-কে রেজোলিউশনের ছবি তৈরি করা সম্ভব।

তবে এই মানের ছবি তৈরি করতে কিছুটা বেশি সময় লাগে। সাধারণ প্রশ্নের উত্তর দেওয়ার মতো দ্রুত না হলেও জটিল ছবি তৈরিতে কয়েক মিনিট সময় লাগতে পারে।

প্রতিষ্ঠানটি জানিয়েছে, চ্যাটজিপিটি ও কোডেক্স ব্যবহারকারীরা ধাপে ধাপে এই ফিচার ব্যবহার করতে পারবেন। পেইড ব্যবহারকারীরা উন্নত মানের আউটপুট তৈরি করার সুযোগ পাবেন। পাশাপাশি ‘জিপিটি-ইমেজ-২’ নামে একটি এপিআইও উন্মুক্ত করা হবে। যার খরচ নির্ভর করবে ছবির মান ও রেজুলেশনের ওপর।

বিশ্লেষকদের মতে, এই উন্নয়ন ডিজিটাল কনটেন্ট তৈরির ক্ষেত্রে বড় পরিবর্তন আনতে পারে। ডিজাইনার, বিপণনকর্মী ও সাধারণ ব্যবহারকারীদের জন্য দ্রুত এবং কম খরচে মানসম্মত ভিজ্যুয়াল তৈরি করা আরও সহজ হবে। একই সঙ্গে এআই-তৈরি কনটেন্ট ও বাস্তব কনটেন্ট আলাদা করা আরও কঠিন হয়ে উঠতে পারে।

পড়ুন:শিল্প কারখানায় নিয়োগ দিচ্ছে এসিআই কোম্পানি

দেখুন:ভেসে উঠেছে ইরানের মি/সা/ই/ল সিটি, আন্তর্জাতিক সব খবর 

ইমি/

বিজ্ঞাপন

আরও পড়ুন

বিজ্ঞাপন

LEAVE A REPLY

Please enter your comment!
Please enter your name here

This site uses Akismet to reduce spam. Learn how your comment data is processed.

বিশেষ প্রতিবেদন