北京市三部门:谋划建设国家级数据训练基地

2023-05-19 19:39:54 来源:上海证券报·中国证券网 作者:

  上证报中国证券网讯 据北京市经济和信息化局5月19日消息,为抢抓通用人工智能产业发展新机遇,推动大模型技术创新应用,北京市经济和信息化局等三部门拟组织实施“北京市通用人工智能产业创新伙伴计划”。伙伴计划聚焦于汇聚产业链上下游合作伙伴,构建政产学研用深度融合的协同联动产业体系,推进大模型研发和应用,解放和发展数字经济时代新的生产力,赋能千行百业数智化转型,助力全球数字经济标杆城市建设。

  其中明确,到2025年,基本形成要素齐全、技术领先、生态完备、可有力支撑数字经济高质量发展的通用人工智能产业发展格局。上下游产业链布局持续优化,优质算力、高质量数据供给支撑能力大幅提升,大模型创新应用引领全国,每年落地10个以上重点场景商业化标杆应用并形成10个以上行业标杆解决方案,培育一批应用大模型技术实现突破性成长的标杆企业,建成具有国际影响力的通用人工智能产业发展高地。

  主要任务如下:

  (一)加快满足近期迫切算力需求。发挥北京市算力资源优势,通过与云厂商建立合作,加快归集现有算力,为市场主体提供多元化优质普惠算力,保障北京市大模型团队和AIGC企业产品研发和技术创新。采用用户单位与大模型团队结对方式,对形成场景应用模式或试点案例的北京市大模型团队训练、初创企业行业模型调优及行业应用推理算力,给予10%的财政补贴。探索支持各区重点布局的产业园区、基地按照入驻即享原则,对大模型企业给予算力支持。

  (二)提升中长期算力供给能力。加快建设海淀区北京人工智能公共算力、朝阳区北京数字经济算力中心等重点项目,尽快形成算力供给,完善北京市算力供给体系。建设北京市公共算力服务平台,汇聚云厂商和本地算力,形成统一服务窗口并实现算力任务调度,提升集约化、规模化、专业化算力能力,以商业化运营为主、政府适度补贴为辅,满足未来5-10年北京市人工智能企业对算力的规模化需求。提高环京地区算力一体化服务能力,形成全国算力网络调度枢纽节点。

  (三)推出一批高质量训练数据。梳理大模型训练数据需求清单和供给目录,建立数据供需对接机制。基于市大数据中心和北京国际大数据交易所探索建设可用于大模型训练的公共数据专栏和社会数据专区,推动公共数据和社会数据定向有条件开放。发挥在京国家机关、科研院所、企事业单位丰富的数据资源优势,用好北京国际大数据交易所社会数据专区成果及智源研究院中文语料库,形成训练数据的定向供给,对数据提供方给予一定比例的补贴支持。

  (四)谋划建设国家级数据训练基地。在数据基础制度先行示范区布局中谋划建设国家级数据训练基地,探索高价值数据共享的版权、安全和激励机制问题,推动形成基于贡献的商业化合作模式。发挥北京市从事人工智能训练数据的专业服务商优势,为大模型预训练的各个阶段所需的数据提供数据支撑和技术服务,开发涵盖文本、图像、视频等多模态的高质量数据集,助力国家级数据训练基地建设。支持发展基于AIGC技术的合成数据新产业。

  (五)实施大模型应用创新标杆试点工程。围绕首都之窗智能问答、在线导办等场景,依托私有化部署的算力集群资源,逐步开展政务服务行业专有模型训练、精调、剪枝、蒸馏等工作,赋能“12345接诉即办”辅助场景,总结专用模型实施部署经验,探索政务服务大模型服务模式。支持金融机构利用大模型技术打造“全能业务助理”,提升金融从业者的服务半径和服务质量。探索大模型助力智慧城市建设,推动城市大脑等城市管理公共平台开放数据接口引入大模型辅助治理。

  (六)推动大模型赋能千行百业。支持北京市企业在“模型即服务”人工智能产业链中布局,加强垂直领域攻关,实现重点场景应用突破,丰富行业应用生态。聚焦北京市虚拟数字人、数字医疗、电商零售等创新活跃的数据优势领域,加快推进大模型商业化落地应用,加速文字创造、人机交互、教育、影音等场景落地应用。加速信息交互领域的数字化转型,变革知识创造行业生产方式,激发持续的数字创新活力,深度赋能千行百业。

  (七)培育软件开发新范式。变革软件领域的开发应用模式,提升软件生产力工具效能,利用生成式AI重构企业软件。以开源聚合创新,构建大模型开源社区,吸引科研院所、代码托管平台、开发者及团队在京形成开放、包容、活跃的创新氛围。在基础软件领域引入大模型应用,提升国产操作系统、办公、设计、编程软件性能,丰富信创软件品类。加强工业软件与大模型融合,加快推进智能工业软件开发应用,提升软件质量、丰富应用功能。倡导模型即服务,提升云服务商、集成企业服务水平。鼓励互联网服务迭代升级,推动涌现大模型+互联网新软件新服务。

  (八)实施大模型底层支撑性技术筑基工程。支持企业加大研发投入,加强互联协议、网络传输、能耗优化等技术研发,提升片间互联速率,构建高速计算集群网络传输系统,提升芯片算力水平及集群表现。推进芯片制造工艺突破,加速工艺能力建设进程,以Chiplet技术进步弥补先进工艺技术代差,超前布局先进计算芯片新技术、新架构。开展面向不同芯片架构、不同应用场景的软硬件精准适配攻关,加快不同芯片架构的接口适配、共性算子开发,加速推出基于自主算力的软硬一体化解决方案。