প্র্যাক্টিক্যাল লিনিয়ার রিগ্রেশন

প্র্যাক্টিক্যাল লিনিয়ার রিগ্রেশন : গ্রেডিয়েন্ট ডিসেন্ট

আমরা আজকের অধ্যায়ে লিনিয়ার রিগ্রেশন মডেল স্ক্র্যাচ থেকে তৈরি করা শিখব। তবে এটা করার আগে আপনার অবশ্যই Numpy সম্পর্কে ধারণা থাকতে হবে। না থাকলে এই অধ্যায়টি পড়ে নিন। তাহলে শুরু করা যাক।

ডেটাসেট

লিনিয়ার রিগ্রেশন মডেল বিল্ড করার জন্য আমি এখানে ব্যবহার করছি Andrew Ng এর Machine Learning কোর্সের লিনিয়ার রিগ্রেশন চ্যাপ্টারের ডেটাসেট। তবে সামান্য একটু পার্থক্য আছে। আমার দেওয়া ডেটাসেট কিছুটা পরিবর্তিত এবং পরিবর্তনটা হল প্রথম সারিতে শুধু দুইটা কলাম যোগ করে দিয়েছি। ডেটাসেট দেখতে বা ডাউনলোড করতে এখানে ক্লিক করুন

ডেটা ভিজুয়ালাইজেশন

সর্বপ্রথম আমরা যে কাজটি করব, সেটা হল আমার সংগৃহীত ডেটাসেট এর একটি স্ক্যাটার প্লট ড্র করা। আমি এখানে Seaborn লাইব্রেরি ব্যবহার করব। Seaborn লাইব্রেরিটি matplotlib এর উপর ভিত্তি করে তৈরি করা। ডেটা ভিজুয়ালাইজেশন সহজ করার জন্য অনেক ফিচার এতে বিল্ট-ইন আছে।

Seaborn ইন্সটলেশন

কমান্ড উইন্ডো বা টার্মিনালে নিচের কমান্ডটি রান করুন,

pip install seaborn

Seaborn ব্যবহার করে স্ক্যাটারপ্লট তৈরি করা

import csv
import matplotlib.pyplot as plt
%matplotlib inline
import seaborn as sns
import pandas as pd
import numpy as np

# Loading Dataset
with open('ex1data1.txt') as csvfile:
    population, profit = zip(*[(float(row['Population']), float(row['Profit'])) for row in csv.DictReader(csvfile)])

# Creating DataFrame
df = pd.DataFrame()
df['Population'] = population
df['Profit'] = profit

# Plotting using Seaborn
sns.lmplot(x="Population", y="Profit", data=df, fit_reg=False, scatter_kws={'s':45})

প্লট আউটপুট

plot

ব্যাখ্যা

ডেটাসেট লোড ও ডেটাফ্রেম তৈরি

প্রথমেই আমি ডেটাসেট লোড করে দুইটা পাইথন লিস্টে ইনপুট ডেটা ‍‍‍Population ও আউটপুট ডেটা / টার্গেট / লেবেল নিলাম Profit লিস্টে। দুইটা লিস্ট দিয়ে একটা পান্ডাস ডেটাফ্রেম তৈরি করলাম।

প্লটিং

lmplot ফাংশন ব্যবহার করে স্ক্যাটারপ্লট তৈরি করলাম যেখানে xy দিয়ে যথাক্রমে XY অক্ষে লেবেলিং করলাম এবং তৈরিকৃত ডেটাফ্রেমকে ডেটা হিসেবে পাস করলাম। fit_reg এর মান যদি True হত তাহলে গ্রাফটি দেখাত এমন, অর্থাৎ Seaborn একটা লিনিয়ার মডেলকে ফিট করে দেখাত। কিন্তু আমাদের মূল কাজটা সেটাই, গ্রেডিয়েন্ট ডিসেন্ট অ্যালগরিদম ব্যবহারের মাধ্যমে করতে হবে। scatter_kws={'s':45} দিয়ে আমি স্ক্যাটার ডট গুলোর আকার পরিবর্তন করলাম।

fit_reg=True হলে প্লট যেমন দেখাত

fit_reg_true

কস্ট ক্যালকুলেশন ও গ্রেডিয়েন্ট ডিসেন্ট : ম্যাট্রিক্স অপারেশন

এই পর্যন্ত আমরা গ্রেডিয়েন্ট ডিসেন্ট ও কস্ট ক্যালকুলেশনের ব্যাপার স্যাপার দেখলাম। কিন্তু কোড এ হাত দেওয়ার আগে, থিওরি টা আরেকটু ভালভাবে ঝালাই দেওয়া দরকার। কোড লেখার চাইতে গুরুত্বপূর্ণ বিষয় হল ভিজুয়ালাইজেশন। চলুন আমরা একটু ভিজুয়ালাইজ করে গ্রেডিয়েন্ট ডিসেন্ট প্রয়োগ করি।

কস্ট ক্যালকুলেশন

আমরা কস্ট ক্যালকুলেশনের সূত্রানুযায়ী জানি,

J(θ0,θ1)=12mi=1m(hθ(X(i))Y(i))2J (\theta_{0}, \theta_{1}) = \frac{1}{2m} \sum_{i=1}^{m} \left ( h_{\theta} ( X^{(i)}) - Y^{(i)} \right )^{2}

এই ফরমুলা অ্যাপ্লাই করতে গেলে বুঝতেই পারছেন, লুপের ব্যবহার লাগবে। কিন্তু না, আমরা কাজটা Numpy ব্যবহার করে খুব সহজেই করতে পারি ম্যাট্রিক্স অপারেশনের মাধ্যমে। কোন নোটেশনের মানে কী সেটা আগের অধ্যায়গুলোতে বলা আছে। তাও আমি একটা সাধারণ উদাহরণের মাধ্যমে আবার দেখাই।

ধরি আমার ডেটাসেট এইটা,

ii

আয় (X)(X)

ব্যয় (Y)(Y)

1

10

5

2

20

10

3

30

15

যেখানে, m=3m=3

X1=10,Y1=5X^{1} = 10, Y^{1} = 5

X2=20,Y2=10X^{2} = 20, Y^{2} = 10

X3=30,Y3=15X^{3} = 30, Y^{3} = 15

লিনিয়ার রিগ্রেশন সূত্র,

hθ(X)=θ×X=θ0×Xi0+θ1×Xi1=θ0+θ1×Xh_{\theta}(X)=\theta \times X = \theta_{0} \times X^{0}_{i} + \theta_{1} \times X^{1}_{i} = \theta_{0} + \theta_{1} \times X

কিন্তু আমাদের থিটা এর ডাইমেনশন 2×12 \times 1 অর্থাৎ, দুইটা সারি এবং একটা কলাম। ম্যাট্রিক্স আকারে,

θ=[θ0θ1]\theta = \left[ \begin{array} {cc} \theta_{0} \\ \theta_{1} \end{array} \right]

এবং XX এর ডাইমেনশন সিঙ্গেল ভ্যারিয়েল লিনিয়ার রিগ্রেশনের ক্ষেত্রে তাই আমরা একটি 11 এলিমেন্ট বিশিষ্ট কলাম যুক্ত করি। অর্থাৎ,

X=[1x11x21x3]X = \left[ \begin{array} {cc} 1&x_{1} \\ 1& x_{2} \\1& x_{3} \end{array} \right]

তাহলে আমাদের হাইপোথিসিস হবে প্রতিটা কলামের জন্য, X×θX\times \theta

h1(X)=θ0×1+θ1×x1h2(X)=θ0×1+θ1×x2 h3(X)=θ0×1+θ1×x3h_{1}(X) = \theta_{0} \times 1 + \theta_{1} \times x_{1} \\ h_{2}(X) = \theta_{0} \times 1 + \theta_{1} \times x_{2} \\\ h_{3}(X) = \theta_{0} \times 1 + \theta_{1} \times x_{3}

ম্যাট্রিক্স আকারে লিখলে,

hθ=[h1h2h3]h_{\theta}= \left[ \begin{array} {cc} h_{1} \\ h_{2} \\ h_{3} \end{array} \right]

আউটপুট বা টার্গেট ম্যাট্রিক্স,

Y=[y1y2y3]Y = \left[ \begin{array} {cc} y_{1} \\ y_{2} \\ y_{3} \end{array} \right]

ম্যাট্রিক্স আকারে ক্যালকুলেটেড কস্ট সূত্র

J(θ0,θ1)=12×3i=13([1x11x21x3]×[θ0θ1][y1y2y3])2=16i=13([θ0×1+θ1×x1θ0×1+θ1×x2θ0×1+θ1×x3][y1y2y3])2=16i=13([θ0+θ1×x1y1θ0+θ1×x2y2θ0+θ1×x3y3])2=16{(θ0+θ1x1y1)2+(θ0+θ1x2y2)2+(θ0+θ1x3y3)2}J(\theta_{0}, \theta_{1}) = \frac{1}{2\times3} \sum_{i=1}^{3} \left( \left[ \begin{array} {cc} 1&x_{1} \\ 1& x_{2} \\1& x_{3} \end{array} \right] \times \left[ \begin{array} {cc} \theta_{0} \\ \theta_{1} \end{array} \right] - \left[ \begin{array} {cc} y_{1} \\ y_{2} \\ y_{3} \end{array} \right] \right)^{2} \\ =\frac{1}{6} \sum_{i=1}^{3} \left( \left[ \begin{array} {cc} \theta_{0} \times 1 + \theta_{1} \times x_{1} \\ \theta_{0} \times 1 + \theta_{1} \times x_{2} \\\theta_{0} \times 1 + \theta_{1} \times x_{3} \end{array} \right] - \left[ \begin{array} {cc} y_{1} \\ y_{2} \\ y_{3} \end{array} \right] \right)^{2} \\ = \frac{1}{6} \sum_{i=1}^{3} \left( \left[ \begin{array} {cc} \theta_{0} + \theta_{1} \times x_{1} - y_{1} \\ \theta_{0} + \theta_{1} \times x_{2} - y_{2} \\\theta_{0} + \theta_{1} \times x_{3} - y_{3} \end{array} \right] \right)^{2} \\ = \frac{1}{6} \left\{ (\theta_{0}+\theta_{1}x_{1}-y_{1})^{2} + (\theta_{0}+\theta_{1}x_{2}-y_{2})^{2} + (\theta_{0}+\theta_{1}x_{3}-y_{3})^{2} \right\}

বাড়ির কাজ

গ্রেডিয়েন্ট ডিসেন্ট ফরমুলা ম্যাট্রিক্স আকারে লিখুন।

এই ম্যাট্রিক্স ক্যালকুলেশনটাই আমরা পাইথনে লিখব। এসব কারণেই মেশিন লার্নিংয়ের ক্যালকুলশন দ্রুত বুঝতে ও করতে লিনিয়ার অ্যালজেব্রার সলিড ফাউন্ডেশন দরকার। যে ভাল লিনিয়ার অ্যালজেব্রা ও ক্যালকুলাস বোঝে তার জন্য মেশিন লার্নিংয়ের অ্যালগরিদম অ্যাপ্লাই করা খুবই সহজ।

Numpy ব্যবহার করে কস্ট ক্যালকুলেশন ও গ্রেডিয়েন্ট ডিসেন্ট অ্যালগরিদম অ্যাপ্লাই করার পদ্ধতি

এখন আমরা Numpy ব্যবহার করে 97 অবজারভেশনের ডেটাসেট এর কস্ট ক্যালকুলেশন ও গ্রেডিয়েন্ট ডিসেন্ট এর ফাংশন লিখব।

পাইথনে কস্ট ক্যালকুলেশনের ফাংশন

  • কতটা অবজারভেশন আছে সেটা একটা m এ রাখলাম

  • হাইপোথিসিস ভ্যালু বের করলাম

  • loss বের করলাম, যেটা কিনা আসল মান ও প্রেডিক্টেড মানের বিয়োগফল

  • cost বের করলাম, যেটা loss এর বর্গের যোগফল

  • average cost রিটার্ন করলাম

    পাইথনে গ্রেডিয়েন্ট ডিসেন্ট ক্যালকুলেশন ফাংশন

  • আমরা একটা নির্দিষ্ট ইটারেশন রেঞ্জের মধ্যে প্যারামিটার আপডেট করব, অর্থাৎ, কস্ট একটা নির্দিষ্ট পরিমাণ কমে গেল সেটা আমাদের দেখার বিষয় না, একটা নির্দিষ্ট ইটারেশনে কতটুকু কস্ট কমে গেল। তাই আমরা ইটারেশন ফিক্স করলাম। আরেকটা উপায় হতে পারে, একটা নির্দিষ্ট কস্ট হওয়ার আগ পর্যন্ত ইটারেশন চালিয়েই যাবে। কিন্তু সেটা অনেক ক্ষেত্রে বিপদজনক হতে পারে যেটা আমরা একটু পরেই দেখতে পারব।

তৈরিকৃত ফাংশন ব্যবহার করে এরর ক্যালকুলেশন প্লট বানানো

আউটপুট

গ্রেডিয়েন্ট ডিসেন্ট ফরমুলা কাজ করছে না কেন?

গ্রেডিয়েন্ট ডিসেন্ট অ্যালগরিদমের মূল কাজ কস্ট মিনিমাইজ করা, কিন্তু ইটারেশন 29 এই দেখুন কস্ট বেড়ে কত হয়েছে! এটা হওয়ার কারণ কী?

আসল কালপ্রিট : লার্নিং রেট

আমরা যদি লার্নিং রেট আরেকটু কমিয়ে কোড রান করি তাহলে,

আউটপুট

এবার দেখুন কস্ট আসলেই কমছে। অর্থাৎ আমাদের গ্রেডিয়েন্ট ডিসেন্ট অ্যালগরিদম ঠিকঠাক কাজ করছে। লার্নিং রেট কমাতেই ওভারশুটিং হচ্ছে না এবং গ্রেডিয়েন্ট হিল বেয়েই সে নিচে নামছে!

তাহলে কী সমস্যা হয়েছিল?

আপনি যদি এই অধ্যায়টি পড়ে থাকেন তাহলে বুঝবেন লার্নিং রেট বেশি হওয়ার কারণে সে মিনিমাম পয়েন্টে কনভার্জ না করে ওভারশুট হওয়াতে শুধু উপরের দিকে যাচ্ছিল।

not_converge

কস্ট বনাম ইটারেশন গ্রাফ

আমরা যদি ইটারেশন vs কস্ট এর গ্রাফ প্লট করি তাহলে এটা দেখাবে এইরকম,

আউটপুট

grad_desc

মাল্টিভ্যারিয়েবল লিনিয়ার রিগ্রেশন

আমরা এতক্ষণ সিঙ্গেল ভ্যারিয়েবল লিনিয়ার রিগ্রেশন দেখলাম। মাল্টিভ্যারিয়েবলের ক্ষেত্রে কাজ পুরোপুরি একই, তবে কলাম সংখ্যা বেড়ে যাবে। তাতেও ম্যাট্রিক্স নোটেশন একই থাকবে।

পরবর্তী পর্বে গ্রেডিয়েন্ট ডিসেন্ট ম্যাট্রিক্স নোটেশনে প্রকাশ ও মাল্টিভ্যারিয়েবল লিনিয়ার রিগ্রেশনের জন্য মডেল তৈরি করব।

Last updated