活动时间
UTC+8 中国:00:00—03:00 AM(6 月 19 日)
UTC-7 加拿大:09:00 —12:00 AM(6 月 18 日)
参与方式
线下:CVPR 现场
线上:ZOOM 线上会议(需注册)
【分享主题】
Talk 1
通用、统一且灵活的开源算法平台 —— OpenMMLab 2.0
Kai Chen
上海AI实验室 青年科学家
本科毕业于清华大学,在香港中文大学获得博士学位。在计算机视觉顶级会议和期刊上发表了三十余篇论文,谷歌学术引用超过 6900 次,并多次在国际学术竞赛中获奖。其所负责的 OpenMMLab 开源项目在 GitHub 上获得了超过 8.5万星标,是深度学习时代极具影响力的计算机视觉开源算法体系,用户遍及 110 个国家和地区,获国内 600 余家企业和高校使用,在学术界和工业界产生了广泛影响。
分享内容
第一部分:OpenMMLab 总体介绍,包括整体架构、模块设计及其影响力。
第二部分:工具箱的基本使用和示例研究项目展示。
第三部分:展示使用 OpenMMLab 工具链进行模型部署,以及运用 OpenMMLab 进行研究和生产的实践。
Talk 2
OpenMMLab 视觉基础模型的探索——MMPreTrain
Songyang Zhang
上海AI实验室 青年研究员
博士毕业于中国科学院大学,入选上海超级博士后计划,目前在 OpenMMLab 团队负责基础模型相关的开源体系建设与算法研究。其研究方向包括基础模型架构设计、多模态大模型和大语言模型。
分享内容
视觉基础模型与多模态模型的最新进展及相关开源库(MMPreTrain)。
第一部分:深度学习基础模型及相关库(MMPreTrain)介绍,MMPretrian 支持的各类深度学习算法,算法库的设计思路和主要功能。
第二部分:多模态学习,多模态学习的最新进展,以及如何使用 MMPreTrain 进行各类多模态任务的具体实践。
第三部分:基于图像分类的基础模型应用,如何使用 MMPreTrain 进行经典的图像分类任务,并分享快速掌握应用基础模型。
第四部分:基于自监督学习的基础模型实践,自监督学习的概念和流程,以及如何使用 MMPreTrain 进行自监督学习探索。
Talk 3
MMDetection 3.0:通用目标检测实践指南
Wenwei Zhang
上海AI实验室 青年研究员
负责 OpenMMLab 计算机视觉算法开放体系中算法库基础架构的整体设计、 MMDetection 和 MMDetection3D 等算法库的设计与开发。曾在顶级会议上发表 11 篇论文,获 2019 年目标检测领域权威学术竞赛 COCO比赛第一名,2020 年 3D 目标检测领域权威竞赛 nuScenes 比赛 Best PKL Award。
分享内容
如何高效地运用 MMDetection 3.0 进行与目标检测相关的研究项目。
第一部分:目标检测、实例分割和全景分割。深入探讨上述领域的问题定义、挑战和代表性方法,展现目标检测全景。
第二部分:MMDetection,即 OpenMMLab 检测工具箱和基准测试、目标检测中最受欢迎的工具箱之一,也是 MMDetection3D 和 MMTracking 等许多工具箱的基础。深入讲解 MMDetection 3.0 的模块化设计和模型库。
第三部分:介绍 OpenMMLab 的检测工具箱 MMDetection,它不仅是目标检测中最受欢迎的工具箱之一,也是许多其他工具箱(如 MMDetection3D 和 MMTracking)的基础。深入讲解 MMDetection 3.0 的模块化设计和其丰富的模型库。同时,通过实践教程展示如何使用 MMDetection 3.0 进行模型推断和训练以促进研究项目。
Talk 4
MMagic —— 图像与视频生成、编辑和增强的魔法之旅
Yanhong Zeng
上海AI实验室 青年研究员
在 OpenMMLab 团队负责图像视频生成与编辑相关的开源体系建设与算法研究。
中山大学计算机科学与技术博士。博士期间参与中山大学-微软亚洲研究院联合培养项目,师从朝红阳教授和郭百宁博士,研究方向为图像和视频的生成与编辑。迄今在顶级国际学术期刊与会议上发表多篇论文,包括 CVPR、ECCV、NeurIPS、TVCG等;同时曾担任多个国际顶级会议和期刊的审稿人,包括 ICML、ICLR、NeurIPS、CVPR、TIP、TVCG 等,2022年获评 ICML Outstanding Reviewer。
分享内容
前沿开源工具箱 MMagic,以及图像和视频生成、编辑和增强领域的先进研究成果。
第一部分:图像和视频生成、编辑和增强任务,领域中经典且受欢迎的任务、挑战以及最先进的方法。
第二部分:开源工具箱和基准测试MMagic如何为图像和视频生成、编辑和增强领域的各种任务(如图像超分辨率、文本到图像等)、模型(如 GAN、扩散模型等)提供统一而灵活的解决方案;以及MMagic 的整体设计和实现。
第三部分:如何使用 MMagic 快速运行预训练模型及如何为不同任务设计全新模型。
Talk 5
OpenDataLab —— 一个面向人工智能的开放数据平台
Conghui He
上海AI实验室 青年科学家
OpenDataLab团队负责人
清华大学博士,曾于斯坦福大学和伦敦帝国学院访学。曾任腾讯微信的高级研究员。目前带领OpenDataLab 团队致力于 AI 数据领域的研究,并建立具有影响力的开放数据和开源项目。其主要研究包括高性能计算、可重构计算、分布式计算、计算机视觉等。在 ICCV、TC、 SC、 FPGA、 FCCM、FPL、FPT 等学术会议上发表多篇论文,并为 FPT 会议担任审稿人。曾赢得 IEEE/IBM Smarter Earth Challenge 全球冠军和 Gordon Bell 奖(高性能计算应用领域的最高奖项)。
分享内容
OpenDataLab的整体介绍,包括开放数据集平台、开源数据处理工具包和数据集描述语言(DSDL),OpenDataLab 支持的开源数据工具包相关的研究工作,以及探索定义数据集描述语言以及如何使用它来规范不同任务、格式和模态的数据集。
浦视学术俱乐部
自 2018 年开源以来,OpenMMLab 系列算法库在 Github 上已获得了超过 8.5 万 星标。高质量的代码和文档、多样化的模型和算法以及强大的社区支持为开发者们提供了便利的平台,OpenMMLab 作为“学术利器”吸引了众多学者和从业者的关注,他们纷纷加入共同建设社区。
基于此,上海AI实验室浦视开源体系发起了人工智能领域学术社群——浦视学术俱乐部,旨在通过学术直播、论文分享、线下研讨会等形式促进人工智能领域学者之间的互动交流,推动学术研究的发展,为人工智能领域的科研同仁搭建高知圈层。
上海市徐汇区龙文路129号
国际传媒港L1楼
联系我们
comm@pjlab.org.cn
Copyright © 2025 Shanghai Artificial Intelligence Laboratory
沪ICP备2021009351号-1