强化学习
wongHome
种一棵树最好的时间是十年前,其次是现在.
展开
-
【百度飞桨强化学习7日打卡营】学习笔记 -- 第五课:连续动作空间求解RL
写在前面本次课程是参加百度飞桨7日打卡营活动的第四天笔记。课程链接:https://aistudio.baidu.com/aistudio/education/group/info/1335主要内容:DDPG实践:DDPG一、强化学习原创 2020-06-25 21:49:38 · 538 阅读 · 0 评论 -
【百度飞桨强化学习7日打卡营】学习笔记 -- 第四课:基于策略梯度求解RL
写在前面本次课程是参加百度飞桨7日打卡营活动的第四天笔记。课程链接:https://aistudio.baidu.com/aistudio/education/group/info/1335主要内容:策路近似、策路梯度实践:Policy Gradient一、强化学习原创 2020-06-25 15:38:56 · 344 阅读 · 0 评论 -
【百度飞桨强化学习7日打卡营】学习笔记 -- 第三课:基于神经网络方法求解RL
写在前面本次课程是参加百度飞桨7日打卡营活动的第二天笔记。课程链接:https://aistudio.baidu.com/aistudio/education/group/info/1335主要内容:函数逼近方法实践:DQN一、强化学习原创 2020-06-25 00:33:16 · 275 阅读 · 0 评论 -
【百度飞桨强化学习7日打卡营】学习笔记 -- 第二课:基于表格型方法求解RL
写在前面本次课程是参加百度飞桨7日打卡营活动的第二天笔记。课程链接:https://aistudio.baidu.com/aistudio/education/group/info/1335主要介绍RL概述、入门路线、环境搭建一、强化学习原创 2020-06-24 16:40:09 · 319 阅读 · 0 评论 -
【百度飞桨强化学习7日打卡营】学习笔记 -- 第一课:强化学习(RL)初印象
写在前面本次课程是参加百度飞桨7日打卡营活动的第一天笔记。课程导入人工智能可以像人一样模仿、像人一样自学。强化学习的推荐学习路线:课程需要提前学习的知识与资料推荐:第一课:强化学习(RL)初印象主要介绍RL概述、入门路线、环境搭建一、什么是强化学习走迷宫的例子显示了强化学习的特点:与环境的交互特点:agent的策略是一连串的序列决策,会不断与环境进行交互;奖励的延迟特点:不会运行每一步都会告诉你输出的动作对不对,只有把所有的步骤都执行结束之后,才知道是否成功。二、强化原创 2020-06-24 09:42:52 · 421 阅读 · 0 评论