上海市数据科学重点实验室主任肖仰华:用好大模型的征程刚刚开始 我国企业需构建差异化竞争优势

2024-04-25 20:58:29 来源:上海证券报·中国证券网 作者:刘怡鹤

  上证报中国证券网讯(记者 刘怡鹤)近日,Meta发布性能直逼GPT-4的开源大模型Llama 3,被视为开源模型发展的又一里程碑,也对闭源大模型阵营形成了新的竞争压力。Llama 3的出现将如何助推AI大模型产业发展?面对海外巨头的开源战略,我国大模型企业如何应对竞争?围绕这些问题,上证报记者专访了上海市数据科学重点实验室主任肖仰华。

  肖仰华认为,Llama 3开源对于完善大模型产业生态,加速大模型和千行百业深度融合,以及大模型应用的创新与普及都具有积极意义。

  Llama 3发布之前,OpenAI的闭源大模型GPT-4在整个大模型生态圈遥遥领先,是大模型应用方构建智能基座的优先选择。在肖仰华看来,Llama 3的性能直逼GPT-4,为广大大模型应用方带来了巨大利好。更多选择和良性竞争,有利于整个行业加速发展。

  肖仰华常把智能比作电能。某种意义上Llama 3的出现,意味着大模型基本达成了“发电”的里程碑,而且很多“发电厂”(基座大模型提供方)甚至还是免费(开源)。但有了电,不代表就能安全有效地用好电。

  用电涉及更庞大的产业,大模型的下游,也将围绕“用智”形成更庞大的产业生态。如果说电器是用电的关键,那么“智器”(也就是基于大模型能力的各种解决方案与产品),将是用好大模型的关键。

  他认为,随着Llama 3等基座大模型基本就位,大模型产业的发展焦点可能将逐步从基座模型的训练和能力提升,过渡到打造智能化产品与解决方案上。用好大模型至关重要,绝不比训练大模型容易。

  用好大模型不仅要对大模型能力有全面、客观的理解,还要将大模型与小模型、知识图谱协同好,要将大模型能力有效融入现有生产与研发流程中,要基于大模型的能力对数字化、智能化架构进行解耦与重塑等。“基于大模型的能力将重塑千行百业的数字化、智能化形态,这一征程才刚刚开始。”肖仰华说。

  对于国内众多大模型生态中的公司来说,Llama 3的出现倒逼企业重新思考其在生态中的定位,以及如何形成差异化竞争路线,打造竞争优势,避免科技巨头战略性开源对自身商业战略造成较大冲击。

  数据是大模型能力的源头,肖仰华建议国内大模型企业要充分抓住我国大力发展数据要素市场的契机,在大规模高质量训练数据、优质指令、价值观语料等方面加大力度,构筑特色鲜明、坚实牢固的数据护城河。

  他还建议,我国大模型产业应在大模型评测方面加大研发力度,形成领先的大模型评鉴能力。随着开源模型越来越多,智能应用与产品的研发者需要对模型能力具有较强的判断和评价能力,进而形成面对众多大模型的选型能力。

  “大模型的智能是一种综合能力,某种意义上对其考察评价的难度不亚于对人类智能的评价。大模型的评鉴能力足以成为大模型企业发展的核心竞争力之一。”肖仰华说。