新闻

Dynamics

首页 >  科研动态 > 新闻  >  详情

CVPR 2024 Accepted Papers 系列解读

638542258022710000.jpg

 

CVPR官方数据显示,本年度论文投稿量达11532篇,创下历史新高。2719篇论文被接收,录用率为23.6%,与去年相比,录用率降低2.2%。其中,“Oral”论文共计90篇(入选率3.3%),Hightlight共有324篇(入选率11.9%)。

 

本届CVPR,上海人工智能实验室(上海AI实验室3篇论文获评“Oral”,14篇论文入选入围“Highlight”名单,覆盖视觉基础模型、视觉模型评测、自动驾驶、三维视觉、物体检测等相关领域的研究。

 

01. Highlight论文 - 视觉基础模型

Efficient Deformable ConvNets: Rethinking Dynamic and Sparse Operator for Vision Applications》论文中提出的创新算子Deformable Convolution v4 (DCNv4),推理及收敛速度显著提升,具备作为未来视觉模型基础构建块的巨大潜力。

 

核心创新DCNv4进行了两项关键改进

1.去除softmax归一化:在空间聚合中,去除了DCNv3中的softmax归一化,不仅增强了网络的动态特性,还提升了其表达能力。研究人员发现,在没有标准注意力机制“key”概念的情况下,softmax归一化并不必要,反而可能限制了操作符的表达能力。

2.优化内存访问:通过对现有实现的指令级内核分析,发现内存访问占据了大部分的计算成本。因此,优化了内存访问模式,减少了冗余操作,显著提高了运行速度。

显著提升DCNv4算子在实际运行速度上取得了最优三倍于DCNv3的效果,在多个视觉任务上展现了卓越的性能。

 

全文解析 请阅览:DCNv4:动态与稀疏操作高效融合的创新算子 | CVPR 2024


实验室团队本年度“Oral”“Highlight”入选论文解读将陆续发布,请持续关注。

 更多学术论文请点击【科学研究】