আর্টিফিশিয়াল ইন্টিলিজেন্স দিন দিন অনেক উন্নত হয়েছে। আমরা অনেকেই প্রিজমা অ্যাপ দেখেছি বা ব্যবহার করেছি, যেখানে অ্যাপ ব্যবহার করে যে কোন ছবিকে আর্টে পরিণত করা যায়। আর সম্পূর্ণ কাজটা করা হয় আর্টিফিশিয়াল ইন্টিলিজেন্সের মাধ্যমে। এছাড়া হয়তো দেখে থাকব ফেইসঅ্যাপ, যা দিয়ে আর্টিফিশিয়াল ইন্টিলিজেন্সের মাধ্যমে যে কারো বয়স কমানো বা বাড়ানো যায়, মুখের অভিব্যাক্তি পরিবর্তন করা যায়, মুখের উপর বিভিন্ন ইফেক্ট দেওয়া যায়। আর্টিফিশিয়াল ইন্টিলিজেন্স যুক্ত অনেক গুলো ফটো এডিটরই রয়েছে। কিন্তু কয়টা অ্যাপ দেখেছি যেখানে যে কোন ছবির বর্ণনা দিলে তা এঁকে দেয়? আপনাদের সাথে আজ তেমনি একটা আর্টিফিশিয়াল ইন্টিলিজেন্স বটের পরিচয় করে দিব, যে আপনার পছন্দ অনুযায়ী যে কোন ছবি এঁকে দিবে। আর এই বটের নাম মিডজার্নি (Midjourney)। এই বট আপনার যে কোন চিন্তাকে ইমেজে পরিণত করতে সক্ষম। কিছু কিছু ক্ষেত্রে আমরা যতটুকু না চিন্তা করতে পারি, তার থেকে বেশি সুন্দর করেই ইমেজ তৈরি করে দেয়। বিশ্বাস হচ্ছে না? নিজেই এক্সপেরিয়েন্স করে দেখুন।
মিডজার্নি বট ব্যবহার করে ইমেজ তৈরি করার প্রথমে আমাদের একটা ডিসকর্ড একাউন্ট (discord.com) লাগবে। ডিসকর্ড মূলত একটা ম্যাসেজিং প্লাটফর্ম। ফেসবুক মেজেঞ্জার বা হোয়াটসঅ্যাপের মতই। ডিসকর্ড আমরা ব্রাউজার, ডেস্কটপ বা মোবাইল থেকে ব্যবহার করতে পারব। মোবাইলে ডিসকর্ড অ্যাপ ইন্সটল করে নেওয়া যাবে প্লে স্টোর বা অ্যাপ স্টোর থেকে। এরপর এই ডিসকোর্ড অ্যাপ বা ব্রাউজারে মিডজার্নি বট প্রোফাইলে যেতে হবে। বট লিঙ্ক। বটের প্রোফাইলে গেলে সাইডবারে আমরা অনেক গুলো চ্যানেল দেখব। এই চ্যানেল গুলোতে মিডজার্নি বট ইন্সটল করা থাকে। যেমন # newbies-112, # newbies-172 ইত্যাদি। এই চ্যানেল গুলোর যে কোন একটাতে ঢুকলে আমরা চ্যাট করতে পারব বটের সাথে।
মিডজার্নি বটকে যে কমান্ড লিখব, যে অনুযায়ী আমাদের ইমেজ তৈরি করে দিবে। ইমেজ তৈরি করার জন্য প্রথমে লিখতে হবে /imagine এরপর এন্টার প্রেস করলে আমরা যে ইমেজ তৈরি করতে চাই, তার কিওয়ার্ড বা বর্ণনা লিখতে পারব। এরপর এন্টার প্রেস করলে আমাদের জন্য ইমেজ তৈরি করা শুরু করবে। কিছুটা সময় নিবে ইমেজ তৈরি করতে। আমরা দেখতে পাবো কত পার্সেন্ট কাজ হয়েছে এবং আউটপুটও দেখতে পারব। প্রতিটা কমান্ডের জন্য ৪টা ইমেজ তৈরি করে দিবে। যেমন আমি লিখলাম Human colony on Mars, এর ফলে মিডজার্নি বট আমাকে নিচের মত ছারটা ইমেজ তৈরি করে দিয়েছেঃ
প্রতিটা রেজাল্টের নিচে দেখব
U1, U2, U3, U4
V1, V2, V3, V4
এমন দুইটা লাইন। এখানে U মানে হচ্ছে Upscale। V মানে হচ্ছে Varient। কোন ইমেজ পছন্দ হলে তাকে বড় করার জন্য বলতে পারি। যদি আমাদের প্রথম ইমেজ পছন্দ হলে আমরা প্রেস করব U1, তাহলে প্রথম ইমেজটি আমাদের বড় করে তৈরি করে দিবে। যেমন আমার V3 ইমেজটি পছন্দ হয়েছে। তাই আমি v3 ইমেজটি আপস্কেল করে নিলাম। যার আউটপুটঃ
এছাড়া ছাইলে যে কোন ইমেজের আরো ভ্যারিয়েন্ট তৈরি করতে পারি। যেমন প্রথম ইমেজের যদি আরো ভ্যারিয়েন্ট তৈরি করতে চাই, তাহলে প্রেস করব V1। তাহলে প্রথম ইমেজের আরো চারটা ভার্সন তৈরি করে দিবে। একই ভাবে এই চারটা ইমেজে থেকে চাইলে যে কোন ইমেজকে আপস্কেল করতে পারব অথবা নতুন ভ্যারিয়েন্ট তৈরি করতে পারব।
আউটপুটের পাশে আরেকটা বাটন দেখব, পুনরায় তৈরি করার জন্য। যদি আউটপুট আমাদের পছন্দ না হয়, তাহলে ঐ বাটনে ক্লিক করলে নতুন করে আরো চারটা ইমেজ তৈরি করে দেখাবে।
একটা ইমেজকে আপস্কেল করার পর আমরা চাইলে আরো তিনটে অপারেশন করতে পারি।
Make Variation: ঐ ইমেজটির নতুন ভ্যারিয়েন্ট তৈরি।
Upscale to Max: ইমেজটিকে আরো বড় করে আউটপুট দেওয়া। যা আমাদের 1664×1664 পিক্সেলের একটি ইমেজ রিটার্ণ করবে।
Light Upscale Redo: ইমেজটাকে কিছুটা পরিবর্তন করে নতুন করে আপস্কেল করবে।
ইমেজ তৈরি করার পর তার উপর ক্লিক করলে তা সেভ করার অপশন পাবো। এরপর চাইলে তা আমাদের ডিভাইসে সেভ করে রাখতে পারি। আমাদের কাজ গুলো পরবর্তীতেও আমরা এক্সেস করতে পারব মিডজার্নি প্রোফাইল থেকে। https://www.midjourney.com/app/ এ গিয়ে সাইনইন করলে আমাদের কাজ গুলো দেখাবে।
মিডজার্নি বট ব্যবহার করে ফ্রিতে আমরা ২৫টি কাজ করতে পারব। এরপরও যদি আমরা মিডজার্নি ব্যবহার করে ইমেজ তৈরি করতে চাই, তাহলে আমাদের পে করতে হবে। ব্যাসিক মেম্বারশিপ ১০ ডলার প্রতি মাসে, যেখানে ২০০টা কাজ করা যাবে। স্ট্যান্ডার্ড মেম্বারশিপ ৩০ ডলার প্রতি মাসে, যেখানে আনলিমিটেড কাজ করা যাবে। এছাড়া রয়েছে এন্টারপ্রাইজ মেম্বারশিপ।
এই পর্যন্ত যতগুলো আর্টিফিসিয়াল ইন্টিলিজেন্ট ইমেজ জেনারেটর এসেছে, তার মধ্যে এই মিডজার্নি সবচেয়ে অগ্রগামী। এত সহজে এত ডিটেইলস যুক্ত ইমেজ তৈরির অ্যাপ বলা যায় আর নেই। ইমেজ জেনারেশন নিয়ে যারা কাজ করেন, তাদের নিশ্চিত এই অ্যাপ অনেক ভালো লাগবে।
লেখাটি কালেরকন্ঠে প্রকাশিত হয়েছে। অনলাইন ভার্সন। ই-পেপার ভার্সন।
Good post