අපි කලින් Post
වලින් කතා කලා supervised Learning සහ Unsupervised
Learning ගැන. අද POST
එකෙන් කතා කරමු Reinforcement Learning ගැන.
Reinforcement Learning
වලදී model
එක පුහුණු කරන්නේ ඒයාගෙම අත්දැකීම් වලින්. එහෙම නැත්නම්
එයා ඉගෙන ගත්ත දේවල් වලින්.
අපි උදාහරණයක් බලමු
පහළ රූපයේ හරකෙක් ඉන්නවා . තණකොළ තියනවා . මේ හරකට මේ තණකොළ
කන්න යන්න ඕනි කියලා හිතන්න.
මේ හරකා තණකොළ කන්න නිල් පාට ඊතලය පාරේ යන්න බලනවා. එහෙම
ගියාම ඌ පිච්චෙනවා. එතකොට හරකා ඉගෙන ගන්නවා ගින්දර තියන කොට පිච්චෙනවා යන්න බැහැ
කියලා. ඊට පස්සේ එයා වෙන මාර්ගයක් තෝර ගන්නවා යන්න. එයා යන්න හදනවා තැඹිලි පාට ඊතලය
මාර්ගය. නමුත් ගින්දර දකිනවා .එතකොට එයා කලින් අතදැකීමක් තියන නිසා ඒ හරහා යන්නේ
නැහැ. ඒ වෙනුවට පහල කොටුවෙන් කොළ පාට ඊතල හරහා තණකොළ තියන තැනට යනවා. මේ හරකා තීරණ
ගත්තේ එයාම ඉගෙන ගත්ත දේවල් වලින්.
මේ කතා කරපු උදාහරනයත්
එක්ක අපිට Reinforcement Learning පෙන්නුම් කරන්න පුළුවන් පහතින් දක්වලා තියෙන සරල සටහනින්.
මේ රූපසටහනට අනුව AGENT විදියට සලකන්න පුළුවන් හරකා. එතකොට ඒ හරකා ගන්න එක එක Action වලට අනුව ඒ
කියන්නේ යන්න හදන කොටු වලට අනුව environment
එකෙන් ඌට එක එක Rewards ලැබෙනවා. එයාට ඍණාත්මක Reward එකක් ඒ කියන්නේ ගින්දර හරහා යන්න හැදුවොත් ඌ එතනින් ඉගෙන
ගන්නවා ආයිත් ඒ දේ නොකරන්න. ඒ වගෙම තමයි ධනාත්මක Reward එකක් ලැබුනොත් ඌ ඒකත් ඉගෙන ගන්නවා. ඊට පස්සේ ඌ ඉගෙන ගත්ත
දේවල් එක්ක ආපහු විවිධ Action ගන්නවා. මේ විදියට තමයි සරලව Reinforcement
algorithm එකක් ක්රියාත්මක වෙන්නේ.
මේ විදියට භාවිතා කරන්න පුළුවන්
Reinforcement Learning Techniques
· Markov decision process (MDP)
· Bellman equation.
· Dynamic programming.
· Value iteration.
· Policy iteration.
· Q-learning.
හඳුන්වන්න පුළුවන්.
Reinforcement Learning
Application බලමු
· Natural Language Processing
· Health care
· Robotics and industries
අපි එහෙනම් ඊලඟ POST එකෙන් Linear Regression ගැන
කතා කරමු.
ප්රශ්න තියනවනම් comment කරන්න.
0 Comments