InternVL

XTuner

MinerU

InternLM-XComposer

InternLM

LLaMA2-Accessory

LMDeploy

VLMEvalKit

OpenCompass

InternVideo

书生通用大模型体系

GitHub 星标总数超 15 万

MinerU

GitHub 星标总数超 4 万

OpenMMLab 浦视

GitHub 星标总数达 13 万

MMDetection

GitHub 星标总数接近 3 万

367,512

模型
工具
算法
数据集
评测集

LLaVA-3D

276

感知与导航智能-兼具二维多模态能力的三维多模态大模型

UniMERNet

365

将数学表达式图像转换为 LaTeX 的解决方案

InternLM-Math

515

开源数学模型,不仅会“解题”,更会“判题”

MathBlackBox

535

结合MCTS与self-refine,平衡搜索效率与准确率,提高语言模型的推理能力。

生物大分子基础大模型及大分子设计相关算法

617

包含蛋白质序列预训练模型

PointLLM

834

感知与导航智能-点云多模态大模型

DocLayout-YOLO

1400

提供多样性文档预训练及适配文档检测的模型结构优化

InternVideo

1943

开源视频多模态大模型,AI视频理解既能“短平快”,亦可“长深细”。

InternLM-XComposer

2856

开源多模态实时交互大模型

Seer

199

视觉预测指导动作执行,端到端操作模型

DeepVerse

128

4D交互式世界模型

风乌

95

全球中期气象预报模型,预报时效首次超过10天

Hulk: A Universal Knowledge Translator for Human-Centric Tasks

88

第一个多模态以人为中心的通用模型

PPI

53

基于关键帧姿态与点云流的双臂协同操作算法

InterLM

6958

自主可控的高水平开源语言大模型,通过精炼数据框架,实现思维密度的跃升

InternVL

8460

开源多模态大模型,性能全球领先,关键指标比肩 Gemini、GPT-4V

MinerU

8000

将PDF、word转化为机器可读格式的工具

Scaffold-GS

1023

具有局部感知能力的结构化3DGS模型

SafeVid

 

大规模视频多模态LLM偏好对齐数据集

GRScenes-100

 

高保真物理正确仿真场景数据集

LOKI

154

面向大多模态模型的综合性合成数据检测评测基准

上海市徐汇区龙文路129号
国际传媒港L1楼

联系我们
comm@pjlab.org.cn