টেনসরফ্লো ব্যবহার করে নিউরাল নেটওয়ার্ক ট্রেনিং এবং প্রিডিকশন

আমরা একটা মেশিন লার্নিং মডেলকে ট্রেইন করব যেন একটা সেলসিয়াস ভ্যালু ইনপুট দিলে এর ফারেনহাইট ভ্যালু প্রিডিক্ট করতে পারবে। আর তা করব টেনসরফ্লো ব্যবহার করে। মডেল হিসেবে ব্যবহার করব ডীপ নিউরাল নেটওয়ার্ক ।

যদিও সেলসিয়াসের ভ্যালু জানলে আমরা ফারেনহাইটের ভ্যালু নিচের সমীকরণের মাধ্যমে ব্যবহার করতে পারি।

𝑓=𝑐×1.8+32

এই সিম্পল সমস্যার জন্য আসলে মেশিন লার্নিং প্রোগ্রামের দরকার হয় না। আমরা একটা ফাংশন লিখেই সমস্যাটা সমাধান করে ফেলতে পারি। তবে এই সিম্পল সমস্যাটা মেশিন লার্নিং পোগ্রামের সাহায্যে সমাধান করতে গিয়ে মেশিন লার্নিং এর দরকারি বিষয় গুলো শিখে ফেলতে পারব। কমপ্লিকেটেড কোন সমস্যা সমাধানের জন্য যে স্টেপ গুলো লাগবে, এই সিম্পল সমস্যায় ঠিক সেই স্টেপ গুলোই থাকবে। তাই বুঝতে সুবিধে হবে।

আমরা যেহেতু টেনসরফ্লো ব্যববার করব, তাই আমাদের টেনসরফ্লো ইম্পোর্ট করে নিতে হবে। সাথে লাগবে Numpy। সম্পূর্ণ প্রোগ্রামটি দেখা এবং রান করা যাবে গুগল কো-ল্যাবে। এছাড়া  নিজের কম্পিউটারেও টেনসরফ্লো ব্যবহার করে কাজ করা যাবে। তা সম্পর্কে বিস্তারিত জানা যাবে টেনসরফ্লো / TensorFlow – মেশিন লার্নিং লাইব্রেরী ইন্সটলেশন এবং ব্যবহার লেখা থেকে। টার্ম গুলো নতুন মনে হলে নিচের লেখা দুইটি পড়ে দেখতে পারেনঃ

import tensorflow as tf
import numpy as np

নিচের ডেটা গুলো দিয়ে আমাদের মডেল ট্রেইন করবঃ

# training data 
celsius    = np.array([-40, -10,  0,  8, 15, 22,  38],  dtype=float)
fahrenheit = np.array([-40,  14, 32, 46.4, 59, 71.6, 100.4],  dtype=float)

মডেল তৈরিঃ

আমাদের সমস্যাটা খুবি সিম্পল। তাই একটা লেয়ার এবং একটা নিউরন দিয়েই সমাধান করতে পারব।

l0 = tf.keras.layers.Dense(units=1, input_shape=[1])

আমাদের লেয়ারের নাম দিয়েছি l0। যে লেয়ারটি আমরা ইন্সটেনশিয়েট করেছি, তা একটা Dens লেয়ার এই ডেনস লেয়ার হচ্ছে ফুল কানেক্টেড নিউরাল নেটওয়ার্ক । এসব নিয়ে পরে হয়তো বিস্তারিত জানব। এখানে দুইটি কনফিগারেশন রয়েছে।

units মানে হচ্ছে কয়টা নিউরন থাকবে আমাদের লেয়ারে। আমাদের একটি নিউরন হলেই হবে, তাই আমরা units=1 দিয়েছি। যত গুলো নিউরন থাকবে, লেয়ারটি তত বেশি ভ্যারিয়েবল ব্যবহার করবে সমস্যা সমাধানের জন্য।

input_shape হচ্ছে ইনপুট হিসেবে আমরা কয়টা ভ্যালু দিব। যেহেতু আমরা ইনপুট হিসেবে একটি ভ্যালু দিচ্ছি, তাই আমরা ব্যবহার করেছি input_shape=[1]।

লেয়ারটি মডেলে যুক্ত করাঃ

model = tf.keras.Sequential([l0])

লেয়ার তৈরি এবং মডেলে যুক্ত করা এক স্টেপেই করতে পারি এভাবেঃ

model.compile(loss='mean_squared_error',
              optimizer=tf.keras.optimizers.Adam(0.1))

মডেল কম্পাইলেশনঃ

model.compile(loss='mean_squared_error',
              optimizer=tf.keras.optimizers.Adam(0.1))

এখানে Loss function হিসেবে mean_squared_error ব্যবহার করা হয়েছে। প্রিডিকশন এবং কাঙ্ক্ষিত ফলাফলের দূরত্ব/পার্থক্য এই লস ফাংশন দিয়ে বের করা হয়।
Optimizer function হিসেবে ব্যবহার করা হয়েছে Adam Optimiser। এর কাজ হচ্ছে লস কমানোর জন্য লেয়ারের ইন্টারনাল ভ্যালু গুলো পরিবর্তন করা।
মডেল ট্রেইনিং এর সময় লস ক্যালকুলেট করে এরপর মডেলটি ইম্প্রুভ করার চেষ্টা করবে। আর ট্রেনিং এর কাজই হচ্ছে এটা। প্রতিটা ধাপে ইম্প্রুভ করা।

মডেল ট্রেইন করাঃ

model.fit(celsius, fahrenheit, epochs=500, verbose=False)

মডেল ট্রেইন করার জন্য আমরা ট্রেনিং ডেটা দিয়েছি। এখানে epochs হচ্ছে ট্রেইনিং ডেটার উপর কতবার ইটারেট করবে। আমরা ৫০০ বার ইটারেট করছি। আমাদের মোট ডেটা সেট রয়েছে ৭টি। তাহলে সঠিক ভ্যালু পাওয়ার জন্য টোটাল 7*500 = 3500 বার মডেলটি নিজেকে ইম্প্রুভ করার চেষ্টা করবে। verbose=False দিয়ে ট্রেইনিং এর ইনফমেশন গুলো না দেখানোর জন্য বলছি। এটা তুলে দিলে আমরা প্রতিটা স্টেপে লস এবং কত সময় লেগেছে ট্রেইং এ, তা দেখতে পাবো।

প্রিডিকশনঃ

এবার আমরা দেখব আমাদের মডেল সেলসিয়াল ভ্যালুর জন্য ফারেনহাইট ভ্যালু কত দেয়।

print(model.predict([100.0]))

আউটপুট পাবো 211.58559  এর মত। যেখানে ফারেনহাইট থেকে সেলসিয়াস বের করার সূত্র হচ্ছেঃ 𝑓=𝑐×1.8+32। তাহলে 100 এর জন্য ফারেনহাইট ভ্যালু হবেঃ 100×1.8+32 = 212। অনেকটাই কাছাকাছি।

সম্পূর্ণ প্রোগ্রামঃ

import tensorflow as tf
import numpy as np

# training data 
celsius    = np.array([-40, -10,  0,  8, 15, 22,  38],  dtype=float)
fahrenheit = np.array([-40,  14, 32, 46.4, 59, 71.6, 100.4],  dtype=float)


# model creation
l0 = tf.keras.layers.Dense(units=1, input_shape=[1])
model = tf.keras.Sequential([l0])

# model compilation 
model.compile(loss='mean_squared_error',
              optimizer=tf.keras.optimizers.Adam(0.1))
# model training 
model.fit(celsius, fahrenheit, epochs=500, verbose=False)
print("Finished training the model")

# predict
print(model.predict([100.0]))

এখনের প্রোগ্রামটি অনেক সিম্পল। কিন্তু যে কোন কমপ্লিকেটেড প্রোগ্রামে ঠিক এই স্টেপ গুলোই থাকবে। ডেটা অনেক বেশি থাকবে, আবার ডেটাকে ট্রেইনিং সেট, টেস্টিং সেটে আলাদা করতে হবে, দরকার হলে ডেটা ক্লিনিং এর কাজ থাকবে আরো অনেক স্টেপ। তবে মূল স্টাকচার এটাই। এই স্টেপ গুলো বুঝতে পারবে বাকি কাজ গুলো সহজ হয়ে যাবে।

 

মেশিন লার্নিং নিয়ে এই ব্লগে অনেক গুলো লেখা রয়েছে, সেগুলো পাওয়া যাবে আর্টিফিশিয়াল ইন্টিলিজেন্স এবং মেশিন লার্নিং পেইজে।

 

Leave a Reply

Your email address will not be published. Required fields are marked *