LLaVA-3D
276感知与导航智能-兼具二维多模态能力的三维多模态大模型
UniMERNet
365将数学表达式图像转换为 LaTeX 的解决方案
InternLM-Math
515开源数学模型,不仅会“解题”,更会“判题”
MathBlackBox
535结合MCTS与self-refine,平衡搜索效率与准确率,提高语言模型的推理能力。
生物大分子基础大模型及大分子设计相关算法
617包含蛋白质序列预训练模型
PointLLM
834感知与导航智能-点云多模态大模型
DocLayout-YOLO
1400提供多样性文档预训练及适配文档检测的模型结构优化
InternVideo
1943开源视频多模态大模型,AI视频理解既能“短平快”,亦可“长深细”。
InternLM-XComposer
2856开源多模态实时交互大模型
Seer
199视觉预测指导动作执行,端到端操作模型
DeepVerse
1284D交互式世界模型
风乌
95全球中期气象预报模型,预报时效首次超过10天
Hulk: A Universal Knowledge Translator for Human-Centric Tasks
88第一个多模态以人为中心的通用模型
PPI
53基于关键帧姿态与点云流的双臂协同操作算法
InterLM
6958自主可控的高水平开源语言大模型,通过精炼数据框架,实现思维密度的跃升
InternVL
8460开源多模态大模型,性能全球领先,关键指标比肩 Gemini、GPT-4V
MinerU
8000将PDF、word转化为机器可读格式的工具
Scaffold-GS
1023具有局部感知能力的结构化3DGS模型
LOKI
154面向大多模态模型的综合性合成数据检测评测基准





