深度学习技术开发与应用

helloworld_82640923
• 阅读 1084

关键点
1.强化学习的发展历程 2.马尔可夫决策过程 3.动态规划 4.无模型预测学习 5.无模型控制学习 6.价值函数逼近 7.策略梯度方法 8.深度强化学习-DQN算法系列 9.深度策略梯度-DDPG,PPO等 第一天 9:00-12:00 14:00-17:00 一、强化学习概述 1.强化学习介绍 2.强化学习与其它机器学习的不同 3.强化学习发展历史 4.强化学习典型应用 5.强化学习基本元素 6.强化学习算法分类 二、马尔科夫决策过程 1.马尔可夫性 2.马尔可夫决策过程 3.策略与价值 4.最优化原理 5.MDPs扩展 三、动态规划 1.动态规划 2.价值迭代 3.策略迭代 4.迭代策略评估 5.广义策略迭代 6.维数灾 1.python环境下简单扫地机器人环境 2.价值迭代python实现 3.策略迭代python实现 4.迭代策略评估python实现 四、无模型预测学习 1.蒙特卡洛方法 2.时间差分学习 3.n-步回报 4.TD(lambda) 5.资格迹 1.蒙特卡洛方法python实现 2.时间差分方法python实现 第二天 9:00-12:00 14:00-17:00 五、无模型控制学习 1.蒙特卡洛控制 2.Sarsa 3.重要性采样 4.Q-学习 4.Double Q学习 5.探索与利用 1. Sarsa方法python实现 2. Q学习方法python实现 3. Sarsa(lambda)方法python实现 六、价值函数逼近 1.函数逼近器 2.线性函数逼近 3.常见的特征表示方法 4.价值迭代+离散化方法 5.Fitted Q Iteration 6.策略迭代+最小二乘 7.预测学习+随机梯度下降法 8.控制学习+随机梯度下降法 1. 离散化Q迭代方法python实现 2. LSPI方法python实现 七、策略梯度方法 1.基于策略的强化学习 2.有限差分策略梯度 3.解析法策略梯度 4.REINFORCE算法 5.Actor-Critic 6.策略梯度引入基准 7.自然梯度 8.确定型Actor-Critic 1. 策略迭代方法python实现 2. actor-critic方法python实现 第三天 9:00-12:00 14:00-17:00 八、深度强化学习 1.Deep Q learning(DQN) 2.Double DQN 3.Dueling DQN 4.Prioritized Experience Replay 5.A3C/A2C 6.DDPG 7.PPO 8.SAC 1.深度强化学习训练场-OpenAI Gym 安装与使用 2.Pytorch安装与使用 3.自动驾驶赛车任务 4.月球飞船降落任务 实操解析与训练一 实验:倒立摆和冰壶控制实践 1.环境编写 2.算法设计 3.实验结果 高频问题: 如何将一个控制问题设计成马尔可夫决策问题并使用强化学习算法进行训练 关键点: 1.基于模型的离线强化学习方法 2.基于数据的在线强化学习方法 实操解析与训练二 实验:OpenAI Gym实践 1.Gym安装 2.Gym使用 3.强化学习 高频问题: 1.如何基于Gym实现强化学习训练与测试 关键点: 1.掌握马尔可夫决策过程 2.低维输入的强化学习方法 实操解析与训练三 实验:月球飞船降落任务 1.DQN/Double DQN/Dueling DQN 2.PER 高频问题: 1.深度强化学习网络训练稳定性 2.探索与利用 关键点: 1.经验回放技术的实现 2.目标网络更新 实操解析与训练四 实验:自动驾驶赛车任务 1.连续控制任务 2.策略梯度方法DDPG/PPO 高频问题: 1.适用于高维输入的连续控制任务的深度强化学习方法 关键点: 1.掌握DDPG和PPO具体编程实现
2.根据实际需求,选用合理的深度强化学习方法

感兴趣的朋友欢迎留言讨论

点赞
收藏
评论区
推荐文章
深度强化学习
2022年数字信息化培训项目系列各企、事业单位:随着科技的快速发展,人工智能俨然成了当今社会的关注焦点。而在人工智能的发展上,深度学习、强化学习、迁移学习等成为了科学界、工业界研究和应用的热点。在实际研究和应用过程当中,研究人员逐渐发现了深度学习单独应用的缺点,如没有决策能力,不可推理等。而深度强化学习,作为一种崭新的机器学习方法,同时具有感知能力和决策能力
Deepracer比赛一般性问题
问:什么是AWSDeepRacer?AWSDeepRacer是开启强化学习(RL)的最快方式,字面意思是一款由强化学习、3D赛车模拟器和全球赛车联盟驱动的1/18比例的完全自动驾驶赛车。开发人员可以在在线模拟器中训练、评估和调整RL模型,将他们的模型部署到AWSDeepRacer上,从而获得现实世界的自动驾驶经验,并参加AWS
Deepracer比赛一般性问题
问:什么是AWSDeepRacer?AWSDeepRacer是开启强化学习(RL)的最快方式,字面意思是一款由强化学习、3D赛车模拟器和全球赛车联盟驱动的1/18比例的完全自动驾驶赛车。开发人员可以在在线模拟器中训练、评估和调整RL模型,将他们的模型部署到AWSDeepRacer上,从而获得现实世界的自动驾驶经验,并参加AWS
Wesley13 Wesley13
3年前
AI小白必读:深度学习、迁移学习、强化学习别再傻傻分不清
摘要:诸多关于人工智能的流行词汇萦绕在我们耳边,比如深度学习(DeepLearning)、强化学习(ReinforcementLearning)、迁移学习(TransferLearning),不少人对这些高频词汇的含义及其背后的关系感到困惑,今天就为大家理清它们之间的关系和区别。一.深度学习:
高耸入云 高耸入云
10个月前
LLM成功不可或缺的RLHF基于人类反馈的强化学习是如何运作的?OJAC近屿智能带你揭秘
基于人类反馈的强化学习(RLHF,ReinforcementLearningfromHumanFeedback)是人工智能(AI)领域的一个新兴研究领域,它将强化学习技术与人类反馈相结合,以训练能够学习复杂任务的个体。该方法在提高人工智能系统的性能方面显示
胡赤儿 胡赤儿
7个月前
探索人工智能与强化学习:从基础原理到应用前景
人工智能(ArtificialIntelligence,AI)是当今科技领域的热点话题,而强化学习(ReinforcementLearning,RL)作为其重要分支,在推动着智能系统向前迈进。本文将深入探讨AI与强化学习的基本原理、关键技术以及未来的应用前
迁移学习核心技术的开发与应用
一、机器学习简介与经典机器学习算法介绍1.什么是机器学习?2.机器学习框架与基本组成3.机器学习的训练步骤4.机器学习问题的分类5.经典机器学习算法介绍章节目标:机器学习是人工智能的重要技术之一,详细了解机器学习的原理、机制和方法,为学习深度学习与迁移学习打下坚实的基础。二、深度学习简介与经典网络结构介绍1.神经网络简介2.神经网络组件简介3.神经网
人工智能人才培养
No.1第一天一、机器学习简介与经典机器学习算法介绍什么是机器学习?机器学习框架与基本组成机器学习的训练步骤机器学习问题的分类经典机器学习算法介绍章节目标:机器学习是人工智能的重要技术之一,详细了解机器学习的原理、机制和方法,为学习深度学习与迁移学习打下坚实的基础。二、深度学习简介与经典网络结构介绍神经网络简介神经网络组件简介神经网络训练方法卷积神经网络介
迁移学习(Transfer Learning)
1.深入了解神经网络的组成、训练和实现,掌握深度空间特征分布等关键概念;2.掌握迁移学习的思想与基本形式,了解传统迁移学习的基本方法,对比各种方法的优缺点;3.握深度迁移学习的思想与组成模块,学习深度迁移学习的各种方法;4.掌握深度迁移学习的网络结构设计、目标函数设计的前沿方法,了解迁移学习在PDA、SourceFreeDA上的应用;5.掌握深度迁移学习在
helloworld_82640923
helloworld_82640923
Lv1
你可知?爱沵莪不怕输,只怕沵不快乐!
文章
2
粉丝
2
获赞
2