阿里云通义千问140亿参数模型开源 共建大模型自由市场

2023-09-25 17:03:47 来源:上海证券报·中国证券网 作者:温婷

  上证报中国证券网讯(记者 温婷)9月25日,阿里云开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,可免费商用。

  据介绍,大规模预训练模型参数量大、训练成本高,开源大模型可以帮助用户简化模型训练和部署过程,使得用户不必从头训练模型,只需下载预训练好的模型并进行微调,就可快速构建高质量的模型或进行相应的应用开发。目前,7B(70亿)参数是开源大模型中最常见的规模,此外比较常见的开源模型尺寸还有13B(130亿)、20B(200亿)、70B(700亿)等。

  此前8月,阿里云开源通义千问70亿参数基座模型Qwen-7B,一个多月下载量破100万。浙江大学联合高等教育出版社基于Qwen-7B开发了智海-三乐教育垂直大模型,已在全国12所高校应用,可提供智能问答、试题生成、学习导航、教学评估等能力。模型已在阿里云灵积平台对外提供服务,一行代码即可调用。

  此次最新开源的Qwen-14B是一款支持多种语言的高性能开源模型,相比同类模型使用了更多的高质量数据,整体训练数据超过3万亿Token,使得模型具备更强大的推理、认知、规划和记忆能力。用户可从魔搭社区直接下载模型、体验模型,也可通过阿里云灵积平台访问和调用Qwen-14B和Qwen-14B-Chat。

  “一花独放不是春,百花齐放春满园。不管是闭源大模型还是开源大模型,自研大模型还是第三方大模型,大规模参数模型还是小规模参数模型,通用大模型还是行业、企业专属大模型,阿里云全部欢迎和支持,共同建设一个最大的大模型自由市场,”阿里云副总裁、公众与客户沟通部总经理张启表示,“我们希望所有大模型都能跑在阿里云上,跑得更快、更便宜、更安全。也因为此,阿里云率先开源7B、14B模型,并将持续开源开放,为开源社区贡献力量。”