ডেটাকে বলা হয় নিউ ফুয়েল। এই ডেটা তখনই ফুয়েল, যখন এটাকে কাজে লাগানো হয়। প্রতিটা ওয়েবটাইট, স্মার্ট ফোন, স্মার্ট ডিভাইস প্রচুর ডেটা কালেক্ট করে। এই ডেটা গুলো এনালাইসিস করে বিভিন্ন কাজে লাগানো হয়। ডেটা এনালাইসিস করার জন্য রয়েছে অনেক গুলো ল্যাঙ্গুয়েজ। এগুলোর মধ্যে R দারুণ একটা ল্যাঙ্গুয়েজ। এর আগে ডেটা সাইন্স নিয়ে একটা লেখা লিখেছি। যা পড়া যাবে ডেটা সাইন্স পেইজ থেকে। আমার কাছে মনে হচ্ছে ডেটা সাইন্স শেখার জন্য এখনই দারুণ একটা সময়।
আর প্রোগ্রামিং একটা সুবিধে হচ্ছে সব গুলো প্লাটফর্মেই রান করা যায়। এছাড়া ল্যাঙ্গুয়েজের পাশাপাশি অনেক গুলো দারুণ প্যাকেজ রয়েছে যেগুলো আমরা আমাদের দরকার অনুযায়ী ব্যবহার করতে পারি। কমান্ডলাইনে সরাসরি ‘আর প্রোগ্রাম’ রান করা যায়। এছাড়া রয়েছে অনেক গুলো আইডিই। আমরা ব্যবহার করব ‘আর স্টুডিও’। ‘আর স্টুডিও’ আর প্রোগ্রাম লেখার জন্য দারুণ একটা আইডিই।
ডাউনলোডের জন্য আর প্রোগ্রামিং এর ওয়েব সাইটে গেলে বাম পাশে ডাউনলোড সেকশন থেকে CRAN (Comprehensive R Archive Network) ওয়েব সাইটের লিঙ্ক পাওয়া যাবে। CRAN এ ক্লিক করলে প্রজেক্টের মিরর লিস্টে নিয়ে যাবে। ঐখান থেকে যে কোন একটা লিঙ্কে ঢুকে উইন্ডোজ, ম্যাক অথবা লিনাক্সের জন্য আর প্রোগ্রামিং ডাউনলোড করে নেওয়া যাবে। ডাউনলোড শেষে ইন্সটল করে নিব।
আর স্টুডিও ডাউনলোড করা যাবে rstudio.com থেকে।
আর স্টুডিও এর বিভিন্ন অংশ
আর স্টুডিও নিজের মত করে কাস্টোমাইজ করা যায়। ডিফল্ট ভাবে সাধারণত নিচের মত ইন্টারফেস দেখব আমরাঃ
- বাম দিকে উপরে রয়েছে কোড এডিটর। যেখানে আমরা কোড লিখতে পারব। এতে রয়েছে সিনট্যাক্স হাইলাটার। কোডে কোন ভুল থাকতে তা দেখিয়ে দিবে।
- ডানদিকে উপরে রয়েছে ওয়ার্কিং এনভারনমেন্ট। ডেটাসেট, কমান্ড হিস্টোরি ইত্যাদি থাকবে এখানে।
- বামদিকে নিচে রয়েছে কমান্ড লাইন বা কনসোল।
- ডানদিকে নিচে রয়েছে ফাইল ট্যাব, প্লট ট্যাব, প্যাকেজ ট্যাব ইত্যাদি। ওয়ার্কিং ডিরেক্টরিতে কি কি ফাইল রয়েছে, তা দেখাবে ফাইল ট্যাবে। কোন প্লট তৈরি করলে তা দেখাবে প্লট ট্যাবে।
এগুলো ছিল সাধারণ ধারণা। বিস্তারিত কাজ করতে করতে নিজেই শিখে নেওয়া যাবে প্রয়োজন মত।আপনার স্ক্রিনের সাথে এটি না মিললেও সমস্যা নেই।আপনি চাইলে নিজের মত করে এই অংশ গুলো কাস্টোমাইজ করে নিতে পারবেন। শুরুতে আপনি তিনটে সেকশন দেখতে পাবেন। নতুন একটা স্ক্রিপ্ট তৈরি করে নিলেই চারটা সেকশন দেখাবে।
একটা আর স্ক্রিপ্ট তৈরিঃ
বামদিকে উপরের কোনা থেকে New আইকনে ক্লিক করে R Script সিলেক্ট করলে একটি আর স্ক্রিপ্ট তৈরি হবে। এরপর আমরা চাইলে এটিকে সেভ করে রাখতে পারি।
প্রথম আর প্রোগ্রামঃ
সিম্পল কিছু দিয়েই শুরু করি। ধরে নিচ্ছি আমাদের কাছে বিভিন্ন রকমের দশটি প্রাণীর লিস্ট রয়েছে। এই প্রাণী গুলো কোনটা কতটি রয়েছে, তা পাই চার্ট তৈরি করতে পারি আমরা এভাবেঃ
# define number of animals in a vector animals <- c(1, 3, 5, 4, 7) # Pie of animals pie(animals)
এ কোড গুলো একটি আর স্ক্রিপ্টে রেখে আমরা রান করে দেখতে পারি। দেখব নিচের মত করে একটা পাই চার্ট তৈরি করে দিয়েছে আমাদেরঃ
আমরা যে কোন স্ট্যাসিটিক্যাল ক্যালকুলেশন সহজেই করতে পারি। যেমন কিছু নাম্বারের গড়, মধ্যমা, স্ট্যান্ডার্ড ডেভিয়েশন ইত্যাদি নিচের মত করে বের করতে পারিঃ
n <- c(1,2,3,4,5,6) print(mean(n)) print(median(n)) print(sd(n))
এখানে আর এবং আর স্টুডিও নিয়ে কিভাবে কাজ শুরু করা যায়, তা দেখিয়েছি। আর ব্যবহার করে কিভাবে ডেটা এনালাইসিস করা যায়, ইনশাহ আল্লাহ সামনে তা নিয়ে লিখব।