本次活动由中国大模型语料数据联盟指导,上海数据交易所、星环信息科技(上海)股份有限公司主办,上海市数商协会协办,200余位大模型数据、人工智能技术企业及相关机构代表出席会议。上海市经信委信息化推进处负责人出席指导开放日活动。
活动现场,上海人工智能实验室(上海AI实验室)联合人民网,共同发起成立中国大模型语料数据联盟安全治理专委会,旨在推动大模型数据安全治理与隐私保护,为大模型技术快速发展提供数据安全保障。
上海AI实验室联合人民网发起成立大模型语料数据联盟安全治理专委会
中国大模型语料数据联盟的“朋友圈”也在本次活动中扩容。上海市新能源汽车公共数据采集与监测研究中心、华院计算技术(上海)股份有限公司、星环信息科技(上海)股份有限公司、上海市人工智能行业协会、上海稀宇科技有限公司、上海四维数邦数字科技有限公司、上海世纪出版(集团)有限公司、上海第二工业大学、上海市人民检察院、瑞因凡(上海)智能科技有限公司、北京晴数智慧科技有限公司、北京清博智能科技有限公司共12家新成员单位加入“中国大模型语料数据联盟”,将共同为大模型技术深度发展与高水平应用提供更多元的数据要素保障。
12家新成员单位加入“中国大模型语料数据联盟”
联盟成立以来,各成员单位充分发挥自身优势,不断提供高质量的数据供给。上海市统计和大数据研究院、上海图书馆(上海科学技术情报研究所)、上海仲裁委员会分别发布了《上海统计年鉴数据集》、《中国家谱总目数据集》及《国际仲裁法律、规则与实践数据集》,为大模型训练提供专业化的数据参考。
三部专业数据集发布
中国大模型语料数据联盟
由上海人工智能实验室联合中央广播电视总台、人民网、国家气象中心、中国科学技术信息研究所、上海报业集团、上海文广集团等10家单位联合发起。为应对大模型发展对高质量、大规模、安全可信语料数据资源的需求,保障大模型科研攻关及相关产业生态发展,大模型语料数据联盟于2023年7月6日世界人工智能大会开幕式上宣布成立,旨在通过链接模型训练、数据供给、学术研究、第三方服务等多方面机构,联合打造多知识、多模态、标准化的高质量语料数据,探索形成基于贡献、可持续运行的激励机制,打造国际化、开放型的大模型语料数据生态圈。
下载“书生·万卷”及更多开源语料,请登录中国大模型语料数据联盟开源数据服务指定平台
上海市徐汇区龙文路129号
国际传媒港L1楼
联系我们
comm@pjlab.org.cn
Copyright © 2025 Shanghai Artificial Intelligence Laboratory
沪ICP备2021009351号-1