Kai Chen
上海AI实验室
青年科学家
所负责的OpenMMLab开源项目在GitHub上获得了超过9.2万个星标,是深度学习时代极具影响力的计算机视觉开源算法体系,用户遍及110个国家和地区, 获国内600余家企业和高校使用,在学术界和工业界产生了广泛影响。在计算机视觉顶级会议和期刊上发表了三十余篇论文,谷歌学术引用超过8000次,并多次在国际学术竞赛中获奖。
分享内容
第一部分:OpenMMLab总体介绍,包括整体架构、模块设计及其影响力。
第二部分:工具箱的基本使用,包括训练和模型部署,以及运用 OpenMMLab 进行研究和生产的实践。
第三部分:书生·浦语(InternLM)开源体系介绍。
Talk 2:OpenMMLab基础模型研究进展
Songyang Zhang
上海AI实验室
青年研究员
在基础模型相关方向开展的算法研究和开源平台建设,带领团队开发并维护了OpenMMLab中的多模态算法库MMPreTrain、以及大模型评测平台OpenCompass。在计算机视觉领域的顶级会议和期刊上发表了约20篇论文,谷歌学术论文引用1000余次。
分享内容
将分享视觉基础模型与多模态模型的最新进展,并介绍相关的开源算法库。内容分为以下四个部分:
第一部分:深度学习基础模型库(MMPreTrain)。将展示该基础模型发展的里程碑工作,并详细展示该模型库的整体设计和特点。
第二部分:多模态学习的最新进展。本部分将首先介绍多模态学习的社区进展,并分享如何使用MMPreTrain进行多模态学习。
第三部分:使用基础模型进行图像分类和自监督学习实践,并展示如何使用MMPreTrain来进行图像分类任务和自监督学习。
第四部分:介绍如何使用OpenCompass开展基础模型的评测与分析工作(包括视觉模型、大语言模型和多模态模型)。
Talk 3:MMDetection:从通用目标检测迈向多模态智能体
Wenwei Zhang
上海AI实验室
青年研究员
负责OpenMMLab计算机视觉算法开放体系中算法库基础架构的整体设计、MMDetection和MMDetection3D等算法库的设计与开发。在顶级会议和期刊上发表论文约20篇,曾2019年目标检测领域权威学术竞赛COCO 比赛第一名,2020年3D目标检测领域权威竞赛nuScenes比赛 Best PKL Award。
分享内容
高效运用MMDetection 3.0进行与目标检测相关的研究项目。
第一部分:目标检测、实例分割和全景分割。深入探讨上述领域的问题定义、挑战和代表性方法,展现目标检测全景。
第二部分:MMDetection,即OpenMMLab检测工具箱和基准测试、目标检测中最受欢迎的工具箱之一,也是MMDetection3D和MMTracking等许多工具箱的基础。深入讲解MMDetection 3.0的模块化设计和模型库。
第三部分:智能体工具箱Lagent,该工具箱实现了基于大语言模型的智能体系统,能够支持大语言模型调用MMDetection提供的目标检测器。本部分将介绍Lagent的简洁设计以及它如何使用目标检测器完成多模态智能体的任务。
Talk 4:MMagic —— 图像与视频生成、编辑及增强工具库
Yanhong Zeng
上海AI实验室
青年研究员
研究方向为图像和视频的生成与编辑,在顶级国际学术期刊与会议上发表多篇论文,包括CVPR/ECCV/NeurIPS/TVCG,同时担任多个国际顶级会议和期刊的审稿人,包括ICML/ICLR/NeurIPS/CVPR/TIP/TVCG等。
分享内容
前沿开源工具箱MMagic及图像与视频生成、编辑和增强领域的先进研究成果。
第一部分:介绍图像和视频生成、编辑和增强任务。分享该领域中经典和主流任务、挑战以及最新研究成果。
第二部分:将从整体设计和实现的角度介绍MMagic开源工具箱。MMagic支持图像及视频生成、编辑和增强领域的各种任务(如图像超分辨率、文本到图像等)和模型(如GAN、扩散模型等),为相关任务提供了统一灵活的解决方案。
第三部分:将介绍如何使用MMagic快速运行预训练模型,以及如何为不同任务设计全新模型。
Talk 5: OpenDataLab —— 一个面向人工智能的开放数据平台
Bin Wang
上海AI实验室
青年研究员
带领算法团队进行多模态大模型数据相关的算法研究,曾于ICCV、MICCAI和IJCAI等学术顶会上发表系列论文并在多个国际赛事中获得奖项。代表工作有 《V3Det: Vast Vocabulary Visual Detection Dataset》 (ICCV 2023)、《Boundary perception guidance: A scribble-supervised semantic segmentation approach》(IJCAI 2019)。
分享内容
第一部分:OpenDataLab整体介绍,包括开放数据集平台、开源数据处理工具箱和数据集描述语言(DSDL)。
第二部分:OpenDataLab支持的开源数据工具包相关研究工作。
第三部分:探索定义数据集描述语言以及如何使用它来规范不同任务、格式和模态的数据集。
诚邀相关领域研究者参与研讨会,填写下方的问卷获取更多参会信息。
上海市徐汇区龙文路129号
国际传媒港L1楼
联系我们
comm@pjlab.org.cn
Copyright © 2025 Shanghai Artificial Intelligence Laboratory
沪ICP备2021009351号-1