拥抱新技术浪潮 大模型助力金融行业变革

2023-12-09 18:44:14 来源:上海证券报·中国证券网 作者:朱妍

  主持人:

  郑 明,CFA协会亚太金融研究平台(ARX)上海地区代表

  圆桌嘉宾:

  阿里云全球技术服务部数据智能团队负责人 黄高攀

  中欧基金执行董事、信息技术总监 贾建国

  鹏城实验室研究员(正高)/博导、港中文深高金客座教授、原平安基金量化投资总监 孙东宁

  上海恒生聚源数据服务有限公司首席数据专家 张洋洋

  上证报中国证券网讯(记者 朱妍)自ChatGPT发布以来,大模型在金融领域能发挥多大的能效,引发了行业内的高度关注,技术带来的革新浪潮正席卷而来。

  在金融行业内,大模型发展到了怎样的程度,面临着怎样的挑战?又具有怎样的远大前景?12月8日,在2023滴水湖新兴金融年度大会“数字金融打造全球核心竞争力”分论坛上,来自各大机构的行业大咖就“金融大模型的构建与挑战”话题展开了热烈讨论。

  大模型助力金融行业变革

  对于当下大模型在金融领域的应用,多位人士表示,大模型在投资端、客户端等方面已经有落地应用,在提高数据、投资效率的同时,也提供了更好的金融服务。

  孙东宁表示,大模型、人工智能在量化领域有着非常大的应用,包括数据收集与管理、信号挖掘、组合构建,交易实现与风险管理。以数据收集为例,过去在量化投资中,用的主要是结构化数据,比如财务数据、量价数据;而文本数据、舆情数据、研报数据这些非结构化数据,若要进行量化处理、纳入模型,其人力、时间和资金成本较高。但大模型出现后,这些数据收集与处理的效率显著提升,另类数据变得“不另类”了。

  贾建国认为,从投资角度来说,研究、投资、风险、控制、交易、运营这5个涉及到自然语言处理的环节,大模型都可以发挥作用。另外,大模型还是很好的“投资顾问助手”,能适配客户的风险接受程度、投资喜好,选出适合投资者的产品。不过,“最后一公里”的事还是需要投资顾问来做,大语言模型还不能直接面客。

  提及金融大模型的构建离不开高质量语料库的采集,张洋洋表示,基于聚源多年的数据经验,金融场景大模型有其独有的特性。要构建高质量语料库,先要从应用端的具体场景出发,进行数据规划,对语料数据进行合理的归集并管理,这需要考虑到语料背后的权属、可被应用的场景、安全等级等因素。语料数据的合理归集和管理,是大模型高质量语料库建设的前提,而对归集后的语料进行基于具体场景的数据治理,是被高效应用的基础。对不同的语料数据品类,构建其适用的质量控制手段,是大模型能够被达成有效利用的关键。

  黄高攀也表示,要得到高质量的语料,首先是收集过程需要有统一的语料收集平台来管控文本、语音视频、结构化数据;其次是语料的高质量提取,包括文档解析和清洗、数据去重、低质量数据的过滤,最后根据场景需求构建高质量数据集。他认为,整个过程中,有两点很关键,有没有高效的AI服务平台,以及是不是和场景需求相匹配。

  大模型迎接风险和挑战

  作为一种新兴事物,在大模型为金融行业带来向好变化的同时,未来在应用过程中,又存在怎样的风险和挑战?

  张洋洋认为,金融是服务大众的,大模型在金融领域的应用过程当中,具有基于其自身特性的要求,其中数据安全问题需被重点关注。如今金融机构积极投入大模型的应用研发,并取得了一定的成果,但在对公众服务时,面临着更强的监管合规要求。比如大模型当下还没法完全保证回答的“安全性”,且存在一些数据版权的问题。

  黄高攀也表示,当前大模型存在一定的“幻觉现象”,需要借助一些知识检索等技术来减少这类现象,否则会给大模型的使用带来很大的困扰,这在金融行业也一样。

  贾建国认为,目前大模型在算力、产品解决方案、人才上都面临着一些挑战。以产品解决方案为例,如今大语言模型的数量之多带来了很大的选择困难,但又不可能每个都去尝试一遍,这造成了很大的资本浪费。

  尽管面对诸多风险和挑战,多位人士仍表示了对金融大模型应用前景的期待。孙东宁表示,大语言模型叠加时间序列大模型,未来一定会在量化投资各个环节上起到非常大的助力,金融机构应大力拥抱这些大模型。

  贾建国也表示,大模型可能会引领“新范式”的产生,所有人或将从中受益,它确实能够帮助金融行业扩大产能、提高工作效率,在一定程度上成为公司“助手”。