අද Post එකෙන් කතා කරන්නේ Linear Regression කියන්නේ මොකක්ද?

Linear Regression කියන්නේ Supervised Learning model එක යටතේ එන Algorithm එකක්.

Regression කියන්නේ මොකක් ද?

Regression කියන්නේ ස්වායක්ත අනාවැකිකරුවන්(independent predictors) මත පදනම්ව ඉලක්කගත වටිනාකමක් සැකසීමේ ක්‍රමයක්.

Linear Regression මගින් independent variable සහ dependent variable අතර තිබෙන සම්බන්ධය පෙන්නුම් කරනවා.

අපි උදාහරණයක් බලමු

පහත දක්වලා තියෙන්නේ සිසුවකු සාමාන්‍යයෙන් ඉගෙනුම ලබන පැය ගණන හා ඒ අනුව ලබා ගත් ලකුණු.මේක සරල dataset එකක්

Sturdy Hours(x)

 

Test Score(Y)

2

65

3

75

5

85

7

75

8

90

9

95

10

80

12

85

14

90

15

95


Study Hour (x) කියන්නේ independent variable සහ test score (y) කියන්නේ dependent variable. දැන් අපි මේක ප්‍රස්ථාරයක ලකුණු කරමු


Linear Regression වලදී කරන්නේ ඉහත ප්‍රස්ථාරයේ data point වලට අනුව සාධාරණ රේඛාව (best fit Linear Regression Line) සොයා ගන්න එක.



දැන් අපිට ඉහත ප්‍රස්තාරය භාවිතා කරලා සිසුවකු ඉගෙන ගන්න පැය ගණන අනුව ලබා ගන්න ලකුණු ගණන තීරණය කරන්න පුළුවන්.

 

අපි බලමු ඒක කොහොම ද සොයා ගන්නේ කියලා.

මේක රේඛීය ප්‍රස්තාරයක් නිසා අපිට සමීකරණයක් ගන්න පුළුවන්

y = mx + c කියලා

මේකේ y කියන්නේ dependent variable  එකෙන් පෙන්වන්නේ Test Score. මේකේ X කියලා ගන්නේ study hour  ඒක independent variable.

Dataset එකට අනුව මේක හැදුවම අපිට සාධාරණ සරල රේඛාවක් සොයා ගන්න පුළුවන්. ඒ කියන්නේ අපිට m සහ c කියන අගයයන් දෙක ලැබෙනවා.

දැන් අපිට පුළුවන් study hour එකක් දුන්නම ආසන්න වශයෙන් කොතරම් ලකුණූ ප්‍රමාණයක් ගන්නව ද කියලා බලන්න.

දැන් මේ dataset එක යොදා ගෙන මේ machine learning model එක train කරාට පස්සේ m හා c සොයා ගන්න පුළුවන්.

ඒ අනුව සිසුවකු පාඩම් කරන පැය ගණන අනුව ඔහුට ලැබෙන ලකුණු ප්‍රමාණය පුරොකථනය කරන්න පුළුවන්. මේක තමයි Linear Regression කියන්නේ.

අපි ඊලඟ post එකෙන් කථා කරමු කොහොම ද මේක python භාවිතා කරලා කරන්නේ කියලා.