通专融合AGI

虚实结合物理智能

安全可信AI

评测体系

面向大模型的开源方和使用者, 提供开源、高效、全面的大模型评测开放平台。 为大语言模型、多模态模型等各类模型提供一站式评测服务。全面量化模型在知识、语言、理解、推理和考试等五大能力维度的表现,客观中立地为大模型技术创新提供坚实的技术支撑。

大模型评测

面向大模型的开源方和使用者, 提供开源、高效、全面的大模型评测开放平台。 为大语言模型、多模态模型等各类模型提供一站式评测服务。全面量化模型在知识、语言、理解、推理和考试等五大能力维度的表现,客观中立地为大模型技术创新提供坚实的技术支撑。

CompassHub

评测集社区:提供高时效性,高质量评测集

CompassRank

性能榜单:发布权威榜单,洞悉行业趋势

CompassKit

评测工具:支撑高效评测,支持能力分析

医疗大模型应用检测验证中心

全国首个医疗大模型应用检测验证中心,打通 “训、评、用一体化”链路,为产业应用提供方向牵引与安全保障,促进生态发展。检测验证中心已完成上海12家医院的医疗大模型应用场景评测,规范产业和促进产业升级。

大模型评测

医疗大模型应用检测验证中心

全国首个医疗大模型应用检测验证中心,打通 “训、评、用一体化”链路,为产业应用提供方向牵引与安全保障,促进生态发展。检测验证中心已完成上海12家医院的医疗大模型应用场景评测,规范产业和促进产业升级。

覆盖国家《卫生健康行业人工智能应用场景参考指引》指导文件中32个场景辐射的10多个亚场景应用评测

基础平台

行业应用

加入我们

广募全球人才,开展战略性、原创性、前瞻性的科学研究与技术攻关,共同建设国际一流实验室。

上海市徐汇区龙文路129号
国际传媒港L1楼

联系我们
comm@pjlab.org.cn