ছবির ভেতরে সঠিকভাবে লেখা তৈরিতে বড় উন্নতি এনেছে অপেনএআই। চ্যাটজিপিটির নতুন ‘ইমেজেস ২.০’ মডেল এখন এমন ছবি তৈরি করতে পারে। যেখানে লেখা প্রায় নিখুঁতভাবে উপস্থাপন করা যায়। যা আগে এআইয়ের জন্য বড় চ্যালেঞ্জ ছিল।
প্রযুক্তিবিষয়ক সাইট টেকক্রাঞ্চের এক প্রতিবেদনে বলা হয়েছে, চ্যাটজিপিটির ‘ইমেজেস ২.০’ মডেল এখন এমন মানের লেখা তৈরি করতে পারে। যা সরাসরি ব্যবহারযোগ্য। উদাহরণ হিসেবে একটি রেস্টুরেন্টের মেনু তৈরি করে দেখা গেছে সেটি বাস্তব মেনুর মতোই স্বাভাবিক দেখাচ্ছে।
এর আগে ছবি তৈরির এআই মডেলগুলো মূলত ‘ডিফিউশন মডেল’ ব্যবহার করত। এই পদ্ধতিতে এলোমেলো পিক্সেল থেকে ধীরে ধীরে ছবি তৈরি করা হয়। ফলে ছবির মূল অবজেক্ট ভালোভাবে তৈরি হলেও ছোট অংশ প্রায়ই ভুল হতো।
বিশেষজ্ঞদের ভাষায়, লেখার অংশটি ছবির খুব ছোট একটি অংশ হওয়ায় মডেল সেটিকে ঠিকভাবে শেখাতে পারত না। তাই অদ্ভুত বানান বা বিকৃত শব্দ দেখা যেত।
তবে নতুন মডেলে এই সীমাবদ্ধতা কমেছে। গবেষকেরা ‘অটোরিগ্রেসিভ’ মডেলের মতো নতুন পদ্ধতি ব্যবহার করছেন। যা ভাষা মডেলের মতো কাজ করে। এতে ছবি তৈরির সময় লেখা বা সূক্ষ্ম উপাদানগুলোও বেশি নির্ভুলভাবে তৈরি করা সম্ভব হচ্ছে। যদিও নতুন মডেলের পেছনে ঠিক কোন প্রযুক্তি ব্যবহার করা হয়েছে সে বিষয়ে বিস্তারিত জানায়নি অপেনএআই।
প্রতিষ্ঠানটি জানিয়েছে, ‘ইমেজেস ২.০’ মডেলে “থিংকিং ক্যাপাবিলিটি” বা চিন্তাভাবনার সক্ষমতা যুক্ত করা হয়েছে। এর ফলে এটি একটি প্রম্পট থেকে একাধিক ছবি তৈরি করতে পারে। প্রয়োজনে তথ্য যাচাই করতে পারে এবং জটিল ডিজাইনও তৈরি করতে সক্ষম।
এই মডেল দিয়ে বিভিন্ন আকারের মার্কেটিং ভিজ্যুয়াল, কমিক স্ট্রিপ বা ইউআই ডিজাইন তৈরি করা সম্ভব। এমনকি জাপানি, কোরিয়ান, হিন্দি ও বাংলার মতো নন-ল্যাটিন ভাষার লেখাও তুলনামূলকভাবে ভালোভাবে তৈরি করতে পারে।
তবে এই উন্নতির একটি সীমাবদ্ধতাও রয়েছে। মডেলটির জ্ঞানভান্ডার ২০২৫ সালের ডিসেম্বর পর্যন্ত। ফলে সাম্প্রতিক কোনো তথ্য বা ঘটনার ক্ষেত্রে এটি সব সময় নির্ভুল নাও হতে পারে।
অপেনএআই বলছে, নতুন মডেলটি আগের তুলনায় আরও নির্দিষ্ট নির্দেশনা বুঝতে পারে এবং সূক্ষ্ম বিষয়গুলো ভালোভাবে ফুটিয়ে তুলতে সক্ষম। ছোট লেখা, আইকন, জটিল কম্পোজিশন এসব ক্ষেত্রেও উন্নতি দেখা যাচ্ছে। সর্বোচ্চ টু-কে রেজোলিউশনের ছবি তৈরি করা সম্ভব।
তবে এই মানের ছবি তৈরি করতে কিছুটা বেশি সময় লাগে। সাধারণ প্রশ্নের উত্তর দেওয়ার মতো দ্রুত না হলেও জটিল ছবি তৈরিতে কয়েক মিনিট সময় লাগতে পারে।
প্রতিষ্ঠানটি জানিয়েছে, চ্যাটজিপিটি ও কোডেক্স ব্যবহারকারীরা ধাপে ধাপে এই ফিচার ব্যবহার করতে পারবেন। পেইড ব্যবহারকারীরা উন্নত মানের আউটপুট তৈরি করার সুযোগ পাবেন। পাশাপাশি ‘জিপিটি-ইমেজ-২’ নামে একটি এপিআইও উন্মুক্ত করা হবে। যার খরচ নির্ভর করবে ছবির মান ও রেজুলেশনের ওপর।
বিশ্লেষকদের মতে, এই উন্নয়ন ডিজিটাল কনটেন্ট তৈরির ক্ষেত্রে বড় পরিবর্তন আনতে পারে। ডিজাইনার, বিপণনকর্মী ও সাধারণ ব্যবহারকারীদের জন্য দ্রুত এবং কম খরচে মানসম্মত ভিজ্যুয়াল তৈরি করা আরও সহজ হবে। একই সঙ্গে এআই-তৈরি কনটেন্ট ও বাস্তব কনটেন্ট আলাদা করা আরও কঠিন হয়ে উঠতে পারে।
পড়ুন:শিল্প কারখানায় নিয়োগ দিচ্ছে এসিআই কোম্পানি
দেখুন:ভেসে উঠেছে ইরানের মি/সা/ই/ল সিটি, আন্তর্জাতিক সব খবর
ইমি/


