马上消费副总经理蒋宁:大模型将有效提升金融领域营销、运营等价值链效率

2023-07-08 16:12:24 来源:上海证券报·中国证券网 作者:何奎

  上证报中国证券网讯(记者 何奎)7月6日至8日,以“智联世界 生成未来”为主题的第六届世界人工智能大会(简称WAIC)在上海举办。马上消费金融股份有限公司(下称“马上消费”)副总经理兼首席信息官蒋宁在现场接受记者采访时表示,金融行业是数据、技术密集型行业,具有数据规模大、数据类型多等特点,与大模型训练所需要的底层数据基础要求十分契合。

  “大模型在金融领域有广泛的应用前景,帮助推动构建用户个性化服务体验。在数字中国的建设背景下,大模型将有效提升金融领域营销、运营等价值链效率,进一步拓展数据决策在风控领域的创新应用效果,助力金融行业数字化转型产生实质性的飞跃。”蒋宁说。

  据蒋宁介绍,近期,马上消费将正式发布自主大模型,与社会各界共享、共创更多有价值的探索。目前,公司基于自主研发的金融大模型和动态自适应强化学习技术,在营销、服务运营、数据决策等领域已经实现落地。未来,公司将更加聚焦三项核心关键能力,一是自主动态强化学习能力的大模型(AIGC+RLHF),二是多种模型组合式的AI系统,三是多模态音视频实时人机结合的能力。

  三项技术应对四大挑战

  当前,人工智能大模型的发展在全球都还处在初期阶段,在金融领域的探索也才刚刚起步,面对的困难和挑战依旧不少。蒋宁表示,金融领域探索大模型的困难和挑战主要体现在关键性任务和动态适应性、个性化要求和隐私保护、安全可控需求提升、大数据和基础设施能力挑战四个方面。

  一是由于金融各项业务是动态且变化的,面对不可预期的外界环境和突发意外情况,当前的大模型并不能做到每一份决策都稳定、精确,这是金融机构在运用大模型等人工智能技术的一个非常大的挑战。

  二是金融行业希望利用人工智实现极致的用户体验,包括个性化、定制化的用户产品和服务,但这需要个人隐私数据和大模型相融合,涉及到合规和安全问题,需要行业不断探索。

  三是金融行业一直存在的“数据孤岛”问题,跨行业、跨组织、跨机构的数据共享没有打通,数据共享体系建设需要持续探索。大模型要不断发展成熟,就必须构建一个巨大的增强学习或者强化学习的网络平台,金融机构在这个平台上持续贡献数据并实时反馈,促进平台不断升级和进化。

  四是金融行业大模型应用对底层设备、基础架构等软硬件设施提出更高的要求。现在的网络、服务器、芯片等软硬件设施需要不断迭代升级,以满足后摩尔时代高速增长的数据和算力要求。

  如何解决上面四个挑战?蒋宁认为,大模型有三个关键技术值得关注:强化学习和持续学习技术、鲁棒性决策、组合式AI系统技术。

  蒋宁详细解释道,首先,大模型具备强化学习和持续学习技术。OpenAI的核心能力不仅是表面的ChatGPT巨量模型参数,更在于其幕后的强化学习机制和各种生态能力的建设,通过不断使用让系统越用越聪明、越用越“人性”。目前,国内的各种大模型还未完成自适的生态体系建设,强化学习能力仍需进一步发展。

  其次,鲁棒性决策(机器学习模型在非期望的输入或者变动的环境中,仍然能够提供非常可靠的输出结果)也是大模型在关键决策领域落地的核心能力,如何帮助排除噪音以及干扰性问题,在突发和不可预期情况,实现关键决策的持续稳定和合规可信尤其重要。

  最后,大模型另一个关键技术是组合式AI系统技术。组合式AI系统技术可以有效结合各种垂直领域的判别式模型的可用性和专业性,以及具备生成式大模型的迁移学习和泛化能力强的特点,可以在工业界真正发挥大模型的泛化能力优势。

  “三横三竖”发展战略

  从趋势来看,大模型持续强化学习解决了鲁棒性问题,同时能把判别式模型和生成式模型的优势进行组合,这是人工智能未来发展趋势。

  据蒋宁介绍,基于上述认知,在未来大模型的探索和研究方面,马上消费制定了“三横三竖”的发展战略。

  蒋宁表示,“三横”包括:通过持续学习技术、模型控制、组合式 AI 系统技术形成安全、合规、可信的鲁棒性决策能力。“三竖”包括:一是数据智能,在数据领域实现智能化;二是多模态等非结构性数据判别式模型的综合能力;三是实时人机协作。

  “得益于与客户广泛的交流和互动,我们已经为利用大模型技术训练人机协作、人机对话等模型建立了庞大的数据要素,为‘三横三竖’发展战略奠定了深厚的基础。”蒋宁说,目前该公司已经累计获取了约40PB的数据,包括文字、声音、图片等。

  作为前沿科技的探索者和践行者,谈及大模型的应用落地,蒋宁用三个词总结了马上消费在金融大模型的优势和特点,即安全可控、个性化决策和体验、持续学习。目前,该公司已经研发了实时人机决策模型、多模态大模型、数据智能模型等,并在内部正式上线测试。