OpenDILab推出决策智能入门公开课PPO×Family | 课程预告

来源：上海人工智能实验室｜ 2022-12-02

12月8日，由上海人工智能实验室开源决策智能平台OpenDILab推出的决策智能入门级公开课PPO×Family将正式线上开讲。公开课旨在从应用场景出发，打造决策智能科普系列教程，丰富“知识共享”的开源生态。本活动由中国计算机学会主办，上海人工智能实验室承办，全球高校人工智能学术联盟、北京大学人工智能研究院多智能体中心、浙江大学上海高等研究院、商汤科技协办，知乎、机器之心、智海平台、Paperweekly支持。中国计算机学会将为顺利结课学员颁发认证证书。

决策智能是人工智能发展的关键领域，将驱动下一代人工智能技术的重要创新与应用。从2016年AlphaGo击败人类顶级棋手，到2019年 AlphaStar、OpenAI Five问世，以深度强化学习为核心的决策智能，在具有高复杂度和博弈性的游戏中不断实现突破。

上海人工智能实验室开源决策智能平台OpenDILab，是国际首个覆盖最全学术界算法和工业级规模的决策AI平台，致力于自下而上打通研究与产业需求的闭环。平台拥有全球首个开源的大规模强化学习应用DI-star，统一模仿、强化学习驾驶策略的自动驾驶训练平台DI-drive ，同时具有支持全领域决策智能算法和应用的训练引擎DI-engine以及各类开源活动。

面向深度强化学习技术爱好者，OpenDILab计划推出一系列决策智能公开课，分享前沿知识、共建开源社区。该系列公开课的首套课程——决策智能入门级公开课PPO×Family将于近日线上开讲。课程运用经典深度强化学习算法 Proximal Policy Optimization（PPO）解决各类决策智能问题，帮助学习者轻便高效制作应用原型，并将知识进一步应用于相关领域探索。

决策智能入门公开课PPO×Family 宣传片

PPO是2017年由OpenAI提出的一种深度强化学习算法，随着研究者们持续从多方面增添其算法技巧，时至今日已成为最受欢迎的算法之一。OpenDILab总结各方面研究工作，并结合开源发布一年来在40多种决策环境中调优和实践经验，最终凝练推出了PPO×Family决策智能入门公开课。

课程采用“算法理论-代码实现-应用实践”三合一讲解模式，从实际应用出发“自底向上”授课，讲解将算法理论应用到决策问题时常用的分析方法与优化技巧。通过学习，学员可盘清算法理论、理顺代码逻辑，最终结课时将完成自动驾驶、量化交易、机器人控制、游戏AI等多个领域相关决策任务的入门实践。

示例：算法理论公式和代码实现一一对应讲解

本套课程共包含8节线上公开课，每节时长40至50分钟。第1节课，通过多重对比来讲解决策AI问题定义和研究的特殊之处；第2至7节课，分别以子领域专题形式扩充PPO×Family相关成员；第8节课，综合运用前期累积知识设计并搭建“终极”智能体。12月8日，第1节《开启决策AI探索之旅》正式推出，此后每一至两周更新一节内容。

课程大纲

此外，OpenDILab特地优化了课程实践任务的计算开销，本课程无需大量计算资源，具备一定配置的个人电脑即可应对各种挑战。课程将布置算法理论分析作业，能够坚持完成并参与讨论者将获得由中国计算机学会颁发的课程学习认证证书。

目前，OpenDILab已经建立了课程GitHub相关仓库（https://github.com/opendilab/PPOxFamily），其中包含课件、文字讲稿、代码及答疑等教学素材。课程录像将在哔哩哔哩（账号：OpenDILab）、微信公众号（账号：OpenDILab决策AI）、知乎（账号：OpenDILab浦策）同步发布。欢迎共建“知识共享”的开源社区。

扫码添加课程小助手微信（账号：OpenDILab）

${ v.newstitle }

${ v.newstitle }

新闻动态

科研活动

${ v.newstitle }

${ v.newstitle }

InternVL

MinerU

LMDeploy

InternLM

OpenCompass

XTuner

${ v.newstitle }

${ v.newstitle }

社会招聘和校园招聘

招生信息

${ v.newstitle }

OpenDILab推出决策智能入门公开课PPO×Family | 课程预告

来源：上海人工智能实验室｜ 2022-12-02