首个多层级、全方位、百万级的室内多模态三维感知数据集 MMScan
2024 年 6 月,团队提出了 MMScan 多层级、全方位的多模态三维感知基准。该数据集在 EmbodiedScan 基础上进一步系统地标注了目前最多的近 7M 条语言标注,针对物体、区域等不同感知范围和粒度,标注了包括属性和空间理解各个方面的语料数据,并具备与三维空间标注的对应关系,为训练和测试多模态三维感知模型提供了重要的数据支持,基于这一数据集的基准构建不仅为当前该领域进展提出了新的见解和挑战,也大幅提升了目前领域内最好模型的性能,为此领域扩展数据和训练规模进而迈向下一阶段提供了重要思路。
上海市徐汇区龙文路129号
国际传媒港L1楼
联系我们
comm@pjlab.org.cn
Copyright © 2025 Shanghai Artificial Intelligence Laboratory
沪ICP备2021009351号-1