上海人工智能实验室许劭华:评测对于AI大模型后续研发非常重要

2023-10-21 17:29:14 来源:上海证券报·中国证券网 作者:刘怡鹤

  上证报中国证券网讯(记者 刘怡鹤)在10月21日举行的第四届1024资管科技开发者大会(ITDC 2023)资产管理垂直领域大模型开发与应用论坛上,上海人工智能实验室书生大模型生态和产业合作负责人许劭华分享了大语言模型技术总览,即数据准备、预训练、指令微调、部署&推理、模型评测。

  许劭华表示,大规模构建高质量语料数据是大模型研发中非常具有挑战的环节,其中精细化数据处理是关键,而掌握领域数据是建设行业大模型的关键。算力方面,语言大模型的预训练计算量巨大,需要在大规模计算集群上进行,并且依赖高效的训练系统以充分发挥集群算力。在技术层面,实现大模型的高效且稳定的训练也是非常具有挑战性的。

  许韶华认为:“评测主要目的不是为了排名,而是指路,对于我们认识模型能力,安排后续研发非常重要。”

  在国家人工智能标准化总体组近期成立的大模型专题组中,上海人工智能实验室担任组长。在大模型安全对齐与评测方面,上海人工智能实验室是中国网络空间安全协会人工智能安全治理专业委员会副主任委员,围绕框架规范、评测数据、评测技术、对齐技术、评测平台等方面开展工作。

  此外,上海人工智能实验室与中国信息通信研究院联合成立大模型测试验证与协同创新中心;联合优势单位成立大模型语料数据联盟,该联盟将以模型能力测评验证为抓手,构建具有严谨性、科学性、引领性的测评验证指标及平台服务。

  据许劭华介绍,上海人工智能实验室,以原始创新引领技术进步,以开源开放赋能创新生态,构建了书生通用大模型体系。其中轻量级(InternLM-7)是社区低成本可用最佳模型规模;中量级(InternLM-20B)是商业场景可开发定制高精度较小模型规模;重量级(InternlM-123B)通用大语言模型能力全面覆盖千亿模型规模。