决策智能入门公开课PPO×Family 宣传片
PPO是2017年由OpenAI提出的一种深度强化学习算法,随着研究者们持续从多方面增添其算法技巧,时至今日已成为最受欢迎的算法之一。OpenDILab总结各方面研究工作,并结合开源发布一年来在40多种决策环境中调优和实践经验,最终凝练推出了PPO×Family决策智能入门公开课。
课程采用“算法理论-代码实现-应用实践”三合一讲解模式,从实际应用出发“自底向上”授课,讲解将算法理论应用到决策问题时常用的分析方法与优化技巧。通过学习,学员可盘清算法理论、理顺代码逻辑,最终结课时将完成自动驾驶、量化交易、机器人控制、游戏AI等多个领域相关决策任务的入门实践。
示例:算法理论公式和代码实现一一对应讲解
本套课程共包含8节线上公开课,每节时长40至50分钟。第1节课,通过多重对比来讲解决策AI问题定义和研究的特殊之处;第2至7节课,分别以子领域专题形式扩充PPO×Family相关成员;第8节课,综合运用前期累积知识设计并搭建“终极”智能体。12月8日,第1节《开启决策AI探索之旅》正式推出,此后每一至两周更新一节内容。
课程大纲
此外,OpenDILab特地优化了课程实践任务的计算开销,本课程无需大量计算资源,具备一定配置的个人电脑即可应对各种挑战。课程将布置算法理论分析作业,能够坚持完成并参与讨论者将获得由中国计算机学会颁发的课程学习认证证书。
目前,OpenDILab已经建立了课程GitHub相关仓库(https://github.com/opendilab/PPOxFamily),其中包含课件、文字讲稿、代码及答疑等教学素材。课程录像将在哔哩哔哩(账号:OpenDILab)、微信公众号(账号:OpenDILab决策AI)、知乎(账号:OpenDILab浦策)同步发布。欢迎共建“知识共享”的开源社区。
扫码添加课程小助手微信(账号:OpenDILab)
备注“课程”入群学习
上海市徐汇区龙文路129号
国际传媒港L1楼
联系我们
comm@pjlab.org.cn
Copyright © 2025 Shanghai Artificial Intelligence Laboratory
沪ICP备2021009351号-1