董事长专访 | 文因互联董事长鲍捷:迎接“提示工程师”时代

2023-10-24 16:59:39 来源:上海证券报·中国证券网 作者:刘雪

  上证报中国证券网讯(记者 刘雪)今年是文因互联董事长鲍捷回国创业的第八个年头。2013年,创立于美国硅谷,2015年团队回国,正式注册品牌。十年时间,文因互联(全称:北京文因互联科技有限公司)已成为中国证监会首批科技服务商备案的国家高新技术企业,团队从最初的五六个人,扩大到一百多人。

  “人机协同将成为未来社会的主要工作模式。”近日,鲍捷在上海接受了上海证券报记者专访表示,人工智能作为人们的助手将协助我们完成大量简单、重复的任务。人们只需要完成其中创造性、思维性较强的工作环节,这将大大提高我们的工作效率甚至改造工作模式。未来是一个人人都是提示工程师的时代。

  拥抱大模型

  归国前,鲍捷曾担任美国麻省理工学院访问研究员、三星美国研发中心研究员,曾是三星问答系统S-voice第二代系统核心设计师。2015年鲍捷和创业团队一起从美国回来,最早在清华经管学院孵化器创业。目前公司在北京、上海、深圳、合肥、成都都设有办公室。

  “文因互联对上海有着特殊的感情。”鲍捷说,2017年,我们承接了上海证券交易所公告自动化处理的业务。这成为文因互联事业发展的重要转折点。此后,公司相继承接了科创板、北交所、银行间ABS自动化处理业务。如今,金融领域已成为公司重点拓展的业务领域。

  鲍捷表示,以信披核查为例,人工智能的应用可以进行一致性审核、完整性审核、规范性审核、可信性审核。经过程序的初筛之后,再进行人工审核,可以大幅提高审核效率,提升监管机构数字治理能力;同时也倒逼发行主体更加规范、透明。

  大模型的应用正在潜移默化地影响着各行各业,这给文因互联创造了更广阔的发展空间。自2022年年底以来,文因互联布局垂直领域大模型研发,坚持以国产化为导向,积极适配信创生态,为自主可控提供有力的支持。

  鲍捷把大模型的能力总结为三大类:生成数据、生成知识、生成洞察。

  在生成数据方面,鲍捷说,大模型可以更高效地处理数据,而且成本大幅降低。这也就使得我们可以支持以前根本不能去服务的很多腰部的或者尾部的场景,之前因为成本问题无法实现的部分现在也可以去尝试、去实现。

  在生成知识方面,鲍捷认为,大模型真正的威力其实在于帮助系统理解知识建模。我们第一次拥有在无标注的语料之上进行无监督学习的程序,在语料当中去挖掘隐含的约束知识,在很多金融场景上都需要这样的知识。

  大模型降低了建模成本。领域知识建模成本、数据标注成本、语言建模成本、跨应用适配成本、人机交互成本等都大幅降低。以文因的产品为例,第一代在2017-2020年,全国首个为交易所打造公告摘要系统,完成204类公告的金融文本提取,平均单类公告建模成本在万元左右;第二代在2022年,单类建模成本在千元左右;第三代,2023年以后,在基础大模型底座之上进行开发,单类公告的建模成本会下降至百元左右,开发效率提高十倍。

  目前,文因互联服务的金融领域客户包括监管部门、银行、券商、基金及资管、审计会计等,在产业界的客户覆盖了航空、通信、工程、医疗等领域。

  星火燎原

  “工程师用代码改变世界。”鲍捷常对团队说:“一件事如果其他人能做,就不会给我们做。一定是最困难的事,才会让我们做。”

  当被问起“文因”这一名字的来源,鲍捷说,取自理查德•道金斯《自私的基因》。书中说,生物进化是基因驱动的。我们认为,社会的进化是文化基因驱动的。我们希望让知识更加高速流动起来,相互碰撞可以产生新的“物种”。

  “大模型就像早恋。”今年7月底,鲍捷在文因金融大模型领域落地汇报会上打了这样一个比喻。“每个人都在讨论它(大模型),每个人都觉得别人已经做过了,所以每个人假装自己都在做。而实际上,大模型的落地过程其实是非常困难的。”

  在过去半年多的时间里,国内出现了100多个大模型,但绝大多数无法对ToB客户提供公有云服务。

  鲍捷说,新技术出现时都是这样,大模型也是如此。从去年12月份大模型刚刚开始推出的时候,我们就决定所有的产品线必须基于大模型来开发,但在这过程中经历了许许多多的挫折尝试。

  大模型虽然看上去很神奇,但有可能很多小学生会做的事情,大模型却不会。金融行业是个严肃场景,对数据标准化的要求是99.99%以上。大模型落地会面临诸多问题,成本、数据、场景、安全等,还需要不断地实践和探索。

  鲍捷认为,大模型尚处于发展的初期阶段,就像有了电灯,还要再建电站、电网。但星星之火,必成燎原之势。从目前来看,在金融、航空、通信、工程、政务、医疗等领域均有广阔的应用空间和落地场景。

  近日,文因互联中标深圳航空飞行品质监控系统维护服务项目,用垂直领域大模型助力飞行安全管理建设。同时,也与南方航空全资子公司珠海翔翼航空合作,共同探索大模型技术在航空领域的应用。

  人人都是提示工程师

  在大模型时代,提问的技能非常关键。

  提示词(prompt)简称“提示”,就是给大模型的指令。提示可能是问题,可能是描述,也可能是带有参数的描述。提示工程就是设计、改进、完善提示的学问和技术。通过设计和优化输入提示,使模型能够更准确、可靠地回答问题、执行任务以及提供更有价值的信息。

  鲍捷表示,在计算机科学领域,有 GIGO(Garbage in, garbage out)的说法。如果输入的数据是错误或是低质量的,那么处理后输出的数据也将是错误或低质量的。简单来说,计算机程序或系统产生的结果质量是基于其输入数据质量的。在与大型语言模型交互时,问题的提法对输出的质量也至关重要。

  大模型是人类的助手,让人们拥有更强的工作能力,但并不会替代人的工作。

  “徽商曾有九层算盘,后来计算机的出现,这些工具并没有取代会计这个职业,因为会计可以进行结构性的思考。”鲍捷认为,大模型出现之后,人们会拥有更强的工作能力,更可能变成一位“提示工程师”。

  谈到文因互联的发展计划,鲍捷认为还是踏实稳健。“先做好金融领域的工作,我们希望给800多万金融从业者,每人提供一位得力的‘秘书’。”