අපි කලින් Post වලින් කතා කලා supervised Learning සහ Unsupervised Learning ගැන. අද POST එකෙන් කතා කරමු Reinforcement Learning ගැන.

Reinforcement Learning වලදී model එක පුහුණු කරන්නේ ඒයාගෙම අත්දැකීම් වලින්. එහෙම නැත්නම් එයා ඉගෙන ගත්ත දේවල් වලින්.

අපි උදාහරණයක් බලමු

පහළ රූපයේ හරකෙක් ඉන්නවා . තණකොළ තියනවා . මේ හරකට මේ තණකොළ කන්න යන්න ඕනි කියලා හිතන්න.

මේ හරකා තණකොළ කන්න නිල් පාට ඊතලය පාරේ යන්න බලනවා. එහෙම ගියාම ඌ පිච්චෙනවා. එතකොට හරකා ඉගෙන ගන්නවා ගින්දර තියන කොට පිච්චෙනවා යන්න බැහැ කියලා. ඊට පස්සේ එයා වෙන මාර්ගයක් තෝර ගන්නවා යන්න. එයා යන්න හදනවා තැඹිලි පාට ඊතලය මාර්ගය. නමුත් ගින්දර දකිනවා .එතකොට එයා කලින් අතදැකීමක් තියන නිසා ඒ හරහා යන්නේ නැහැ. ඒ වෙනුවට පහල කොටුවෙන් කොළ පාට ඊතල හරහා තණකොළ තියන තැනට යනවා. මේ හරකා තීරණ ගත්තේ එයාම ඉගෙන ගත්ත දේවල් වලින්.



මේ කතා කරපු උදාහරනයත් එක්ක අපිට Reinforcement Learning පෙන්නුම් කරන්න පුළුවන් පහතින් දක්වලා තියෙන සරල සටහනින්.



මේ රූපසටහනට අනුව AGENT විදියට සලකන්න පුළුවන් හරකා. එතකොට ඒ හරකා ගන්න එක එක Action වලට අනුව ඒ කියන්නේ යන්න හදන කොටු වලට අනුව environment එකෙන් ඌට එක එක Rewards ලැබෙනවා. එයාට ඍණාත්මක Reward එකක් ඒ කියන්නේ ගින්දර හරහා යන්න හැදුවොත් ඌ එතනින් ඉගෙන ගන්නවා ආයිත් ඒ දේ නොකරන්න. ඒ වගෙම තමයි ධනාත්මක Reward එකක් ලැබුනොත් ඌ ඒකත් ඉගෙන ගන්නවා. ඊට පස්සේ ඌ ඉගෙන ගත්ත දේවල් එක්ක ආපහු විවිධ Action ගන්නවා. මේ විදියට තමයි සරලව Reinforcement algorithm එකක් ක්‍රියාත්මක වෙන්නේ.

මේ විදියට භාවිතා කරන්න පුළුවන් 

Reinforcement Learning Techniques 

·        Markov decision process (MDP)

·        Bellman equation.

·        Dynamic programming.

·        Value iteration.

·        Policy iteration.

·        Q-learning.   

 හඳුන්වන්න පුළුවන්.

Reinforcement Learning Application බලමු

·        Natural Language Processing

·        Health care

·        Robotics and industries

 

අපි එහෙනම් ඊලඟ POST එකෙන් Linear Regression  ගැන කතා කරමු.

ප්‍රශ්න තියනවනම් comment කරන්න.