আমরা একটা মেশিন লার্নিং মডেলকে ট্রেইন করব যেন একটা সেলসিয়াস ভ্যালু ইনপুট দিলে এর ফারেনহাইট ভ্যালু প্রিডিক্ট করতে পারবে। আর তা করব টেনসরফ্লো ব্যবহার করে। মডেল হিসেবে ব্যবহার করব ডীপ নিউরাল নেটওয়ার্ক ।
যদিও সেলসিয়াসের ভ্যালু জানলে আমরা ফারেনহাইটের ভ্যালু নিচের সমীকরণের মাধ্যমে ব্যবহার করতে পারি।
𝑓=𝑐×1.8+32
এই সিম্পল সমস্যার জন্য আসলে মেশিন লার্নিং প্রোগ্রামের দরকার হয় না। আমরা একটা ফাংশন লিখেই সমস্যাটা সমাধান করে ফেলতে পারি। তবে এই সিম্পল সমস্যাটা মেশিন লার্নিং পোগ্রামের সাহায্যে সমাধান করতে গিয়ে মেশিন লার্নিং এর দরকারি বিষয় গুলো শিখে ফেলতে পারব। কমপ্লিকেটেড কোন সমস্যা সমাধানের জন্য যে স্টেপ গুলো লাগবে, এই সিম্পল সমস্যায় ঠিক সেই স্টেপ গুলোই থাকবে। তাই বুঝতে সুবিধে হবে।
আমরা যেহেতু টেনসরফ্লো ব্যববার করব, তাই আমাদের টেনসরফ্লো ইম্পোর্ট করে নিতে হবে। সাথে লাগবে Numpy। সম্পূর্ণ প্রোগ্রামটি দেখা এবং রান করা যাবে গুগল কো-ল্যাবে। এছাড়া নিজের কম্পিউটারেও টেনসরফ্লো ব্যবহার করে কাজ করা যাবে। তা সম্পর্কে বিস্তারিত জানা যাবে টেনসরফ্লো / TensorFlow – মেশিন লার্নিং লাইব্রেরী ইন্সটলেশন এবং ব্যবহার লেখা থেকে। টার্ম গুলো নতুন মনে হলে নিচের লেখা দুইটি পড়ে দেখতে পারেনঃ
- মেশিন লার্নিং, আর্টিফিশিয়াল ইন্টিলিজেন্স, ডীপ লার্নিং, টেনসরফ্লো ইত্যাদির একটার সাথে আরেকটার সম্পর্ক
- মেশিন লার্নিং এর কিছু টার্ম
import tensorflow as tf import numpy as np
নিচের ডেটা গুলো দিয়ে আমাদের মডেল ট্রেইন করবঃ
# training data celsius = np.array([-40, -10, 0, 8, 15, 22, 38], dtype=float) fahrenheit = np.array([-40, 14, 32, 46.4, 59, 71.6, 100.4], dtype=float)
মডেল তৈরিঃ
আমাদের সমস্যাটা খুবি সিম্পল। তাই একটা লেয়ার এবং একটা নিউরন দিয়েই সমাধান করতে পারব।
l0 = tf.keras.layers.Dense(units=1, input_shape=[1])
আমাদের লেয়ারের নাম দিয়েছি l0। যে লেয়ারটি আমরা ইন্সটেনশিয়েট করেছি, তা একটা Dens লেয়ার এই ডেনস লেয়ার হচ্ছে ফুল কানেক্টেড নিউরাল নেটওয়ার্ক । এসব নিয়ে পরে হয়তো বিস্তারিত জানব। এখানে দুইটি কনফিগারেশন রয়েছে।
units মানে হচ্ছে কয়টা নিউরন থাকবে আমাদের লেয়ারে। আমাদের একটি নিউরন হলেই হবে, তাই আমরা units=1 দিয়েছি। যত গুলো নিউরন থাকবে, লেয়ারটি তত বেশি ভ্যারিয়েবল ব্যবহার করবে সমস্যা সমাধানের জন্য।
input_shape হচ্ছে ইনপুট হিসেবে আমরা কয়টা ভ্যালু দিব। যেহেতু আমরা ইনপুট হিসেবে একটি ভ্যালু দিচ্ছি, তাই আমরা ব্যবহার করেছি input_shape=[1]।
লেয়ারটি মডেলে যুক্ত করাঃ
model = tf.keras.Sequential([l0])
লেয়ার তৈরি এবং মডেলে যুক্ত করা এক স্টেপেই করতে পারি এভাবেঃ
model.compile(loss='mean_squared_error', optimizer=tf.keras.optimizers.Adam(0.1))
মডেল কম্পাইলেশনঃ
model.compile(loss='mean_squared_error', optimizer=tf.keras.optimizers.Adam(0.1))
এখানে Loss function হিসেবে mean_squared_error ব্যবহার করা হয়েছে। প্রিডিকশন এবং কাঙ্ক্ষিত ফলাফলের দূরত্ব/পার্থক্য এই লস ফাংশন দিয়ে বের করা হয়।
Optimizer function হিসেবে ব্যবহার করা হয়েছে Adam Optimiser। এর কাজ হচ্ছে লস কমানোর জন্য লেয়ারের ইন্টারনাল ভ্যালু গুলো পরিবর্তন করা।
মডেল ট্রেইনিং এর সময় লস ক্যালকুলেট করে এরপর মডেলটি ইম্প্রুভ করার চেষ্টা করবে। আর ট্রেনিং এর কাজই হচ্ছে এটা। প্রতিটা ধাপে ইম্প্রুভ করা।
মডেল ট্রেইন করাঃ
model.fit(celsius, fahrenheit, epochs=500, verbose=False)
মডেল ট্রেইন করার জন্য আমরা ট্রেনিং ডেটা দিয়েছি। এখানে epochs হচ্ছে ট্রেইনিং ডেটার উপর কতবার ইটারেট করবে। আমরা ৫০০ বার ইটারেট করছি। আমাদের মোট ডেটা সেট রয়েছে ৭টি। তাহলে সঠিক ভ্যালু পাওয়ার জন্য টোটাল 7*500 = 3500 বার মডেলটি নিজেকে ইম্প্রুভ করার চেষ্টা করবে। verbose=False দিয়ে ট্রেইনিং এর ইনফমেশন গুলো না দেখানোর জন্য বলছি। এটা তুলে দিলে আমরা প্রতিটা স্টেপে লস এবং কত সময় লেগেছে ট্রেইং এ, তা দেখতে পাবো।
প্রিডিকশনঃ
এবার আমরা দেখব আমাদের মডেল সেলসিয়াল ভ্যালুর জন্য ফারেনহাইট ভ্যালু কত দেয়।
print(model.predict([100.0]))
আউটপুট পাবো 211.58559 এর মত। যেখানে ফারেনহাইট থেকে সেলসিয়াস বের করার সূত্র হচ্ছেঃ 𝑓=𝑐×1.8+32। তাহলে 100 এর জন্য ফারেনহাইট ভ্যালু হবেঃ 100×1.8+32 = 212। অনেকটাই কাছাকাছি।
সম্পূর্ণ প্রোগ্রামঃ
import tensorflow as tf import numpy as np # training data celsius = np.array([-40, -10, 0, 8, 15, 22, 38], dtype=float) fahrenheit = np.array([-40, 14, 32, 46.4, 59, 71.6, 100.4], dtype=float) # model creation l0 = tf.keras.layers.Dense(units=1, input_shape=[1]) model = tf.keras.Sequential([l0]) # model compilation model.compile(loss='mean_squared_error', optimizer=tf.keras.optimizers.Adam(0.1)) # model training model.fit(celsius, fahrenheit, epochs=500, verbose=False) print("Finished training the model") # predict print(model.predict([100.0]))
এখনের প্রোগ্রামটি অনেক সিম্পল। কিন্তু যে কোন কমপ্লিকেটেড প্রোগ্রামে ঠিক এই স্টেপ গুলোই থাকবে। ডেটা অনেক বেশি থাকবে, আবার ডেটাকে ট্রেইনিং সেট, টেস্টিং সেটে আলাদা করতে হবে, দরকার হলে ডেটা ক্লিনিং এর কাজ থাকবে আরো অনেক স্টেপ। তবে মূল স্টাকচার এটাই। এই স্টেপ গুলো বুঝতে পারবে বাকি কাজ গুলো সহজ হয়ে যাবে।
মেশিন লার্নিং নিয়ে এই ব্লগে অনেক গুলো লেখা রয়েছে, সেগুলো পাওয়া যাবে আর্টিফিশিয়াল ইন্টিলিজেন্স এবং মেশিন লার্নিং পেইজে।