ChatGPT为代表的“生成式AI”(Generative AI)掀起了新一轮AI浪潮,在中国更是引发多家科技公司的追逐,并已推出近百款大模型

以ChatGPT为代表的“生成式AI”(Generative AI)掀起了新一轮AI浪潮

“‘千模大战’是大家对国内外当前形势的描述,各种模型在各个行业不同领域的应用也是方兴未艾。”恒生电子董事长刘曙峰称。

生成式AI“在提高企业生产力、破除技术限制的同时,也将带来商业模式和产品创新的革命,甚至对所有行业产生颠覆性影响。”波士顿咨询预计未来两到三年内,行业应用场景将迎来井喷式发展。

就金融领域而言,恒生电子AI技术专家林金曙认为,大模型正在对金融行业的智能化水平和数字化水平产生深刻的影响,为金融行业智能化转型升级打开新的大门。

争相挤进大模型赛道

生成式大模型时代,“数据+算法+算力”构成了新范式的基本要素。

作为全国范围内率先对大模型产业落地出台针对性支持政策的地区,今年5月19日,北京市经信局联合市科委中关村管委会、市发改委共同启动“北京市通用人工智能产业创新伙伴计划”,同时发布了首批39家成员名单,并启动第二批伙伴征集。

在第一批成员中,阿里云、百度、第四范式、昆仑万维、奇虎科技等公司已推出各自的大模型。

“随着ChatGPT掀起大模型发展热潮,人工智能产业风头正劲,(国内)迄今已有八十余个大模型公开发布,其中北京约占一半。”7月2日,北京市经济和信息化局局长姜广智在“2023全球数字经济大会人工智能高峰论坛”上称。

据了解,截至6月30日,共有416家京内外大模型研发和应用企业申请加入第二批“伙伴计划”,北京百度网讯科技有限公司、中电数据服务有限公司、北京集智未来人工智能产业创新基地有限公司、京东科技信息技术有限公司、北京神州数码云科信息技术有限公司、北京金山云网络技术有限公司等63家企业入选。

“中国目前还没有像OpenAI那样在大模型上绝对领先的公司,也会有更多的大模型。大模型是新的生产力,大家都得有大模型作为底座,所以入局的门槛确实是变高了,在达到这个门槛之后,重点在于如何选择方向。”第四范式创始人兼CEO戴文渊表示,大模型能够带来用户体验的提升,开发效率的提升,所以一定会形成软件行业的飞跃,就是谁率先能做出来的问题。这是一个巨大的市场。大模型是新的生产力,以大模型基础设施为先导项目,改造整个软件产业,整个行业的业务价值、商业模式都会得到飞跃。

360公司创始人周鸿祎认为,如果模仿OpenAI,将来中国和全世界可能就只有一两个大模型,因此有人把大模型比喻为操作系统,大部分公司可能没有机会。但未来大模型的趋势不会只有一个,而是会像数据库一样,变成每个数字化系统的标配,小到手机上的部署、中等规模的汽车上的部署,当然也包括在企业和政府内部的部署。

当前,国内大部分已推出的生成式大模型中,大都以服务B端为主。“目前国内发展前景是To B和To C战略并重,大模型在B端发力必须有非常高的搭配行业质量。”昆仑万维CEO方汉表示,大模型的发展将呈B端碎片化,C端免费化,由于大模型对行业数据的需求,加之数据已经被分割在B端的不同碎片,很难有一家企业能够拿到全部行业的数据,导致B端碎片化;同时,中国用户的免费习惯是非常明显的,所以为C端用户提供服务的企业必然是以免费模式为主、VIP模式为辅。

方汉认为,目前国内定制大模型企业将快速向头部汇聚。C端需要抢占的是大模型的服务入口,目前看来,办公软件、即时通讯、浏览器会成为主要的C端大模型服务入口。

这将意味着生成式AI将面临着更高的技术门槛和更高的规模门槛。

重新定义金融科技

虽然生成式大模型赛道上已挤入一众科技公司,但针对金融行业的大模型并不多。

“当我们目光转向垂直领域,尤其是像金融这样强监管垂直领域的时候,会发现技术进步的浪潮带来的颠覆性可能并没有那么强,但是,每一次科技进步也同样会催生卓越的企业。信息化时代的招商银行以科技立行,在零售业务乃至整个银行业务上成为大中型银行中成长最快的一家,正是得益于科技特征,它抓住了信息化、科技带来的力量。”恒生电子董事长刘曙峰称。

大模型在制造业、医疗保健、教育、娱乐等行业产生的效果已开始显现,例如,它们可以用于自动化客户服务,提供个性化的教育资源,协助医疗诊断,甚至参与创作音乐、文学和艺术作品。它们能否在金融科技领域开创新的可能性?

恒生电子AI技术专家林金曙表示,金融行业作为数字化和智能化的先驱,大模型在该领域具有极大的应用潜力和重要性,大模型有望在金融科技领域开创新的可能性,对业务场景智能化和软件生产力的提升产生深远影响。

林金曙认为大语言模型可用于辅助投资顾问工作,为投资者提供个性化的投资建议,大大提升投顾的工作效率。金融机构可以利用大语言模型搭建智能客服系统,提供24小时不间断的在线服务和解决方案,快速响应客户咨询。智能客服可以处理各种类型的问题,包括账户查询、交易操作、产品推荐等,大大降低人工客服的工作量。另外,大模型有望帮助金融机构在舆情风控、运营投研以及监管合规等方面提供数据参考,降低金融风险。

为了实现这些功能,恒生电子从3月底开始筹划、设计金融大模型产品。6月28日,恒生电子和旗下子公司恒生聚源发布基于大语言模型技术打造的数智金融新品,金融智能助手光子和全新升级的智能投研平台WarrenQ,恒生电子金融行业大模型LightGPT也首次对外亮相。

“LightGPT将于9月底完成新一轮的金融能力升级,并正式开放试用接口。”恒生研究院院长、恒生电子首席科学家白硕表示,现有大模型之所以没有达到金融特定领域落地需求,主要有三个方面:

第一,模型本身的质量。金融机构使用大模型时,对它回答的内容和服务质量要求非常高,有一点错误会被放大,产生的后果会比较严重。投顾、合规、运营等场景都有很严肃的要求,这些要求不是通用大模型,通过公开数据的训练可以自动达到的。

第二,合规监管严格。金融行业的法规和监管要求较为严格,这会在一定程度上限制大模型的应用范围。金融机构需要在模型开发和应用过程中遵循相关的规定,并且对模型生成内容和数据的流动和安全性要求严格。

第三,算力要求高。在相关要求下,金融机构只能用准确的数据得出的高质量结论,这就要求金融机构做私有化部署,或者在很细的范围内进行私有化部署。而大体量的大模型数据参数,对推理硬件成本要求高。

实际上,在恒生电子发布金融行业大模型之前,国内已有金融行业大模型面世。

今年4月,第四范式首次向公众展示了大模型产品“式说3.0”。6月27日,北京市首批10个人工智能行业大模型应用案例发布,其中由第四范式和北京中关村银行共同开发的多模态智慧金融大模型示范应用被纳入其中。5月,度小满宣布正式开源国内首个千亿级中文金融大模型“轩辕”。

据第四范式联合创始人、首席科学家陈雨强介绍,第四范式与中关村银行携手,以“式说”大模型为基础,联合开展金融多模态智慧金融平台研发及私有化部署。企业可在私有化部署的情况下保证数据不出本地从而保障数据安全,在行内规章制度及人员信息查询、行业术语通俗化解释、客户经理信贷管理、人工客服问答推荐、理财业务办理、AI应用快速研发等多个环节形成大模型能力,大幅降低客服管理成本,提升客服人员效率及客户满意度。

度小满首席技术官许冬亮认为,金融行业非常需要垂直的行业大模型,通用大模型能力上会存在一些不足。金融行业数据层面不可以出机构,所以通用大模型缺少知识基础。金融行业对风险控制要求比较高,对精度要求也比较高,系统又比较复杂,加上金融相关数据实时性要求很高。通用大模型目前还没有达到金融机构使用的最低门槛,所以需要针对金融行业定制的行业大模型发挥效应。

“金融业数字化转型的起点是做好数据治理,需要真正完善数据治理体系、增强数据管理能力、加强数据质量控制、提高数据应用能力。人工智能应用同样离不开高质量的海量数据,但金融机构的数据治理普遍处于起步阶段,数据低质量、数据孤岛、数据散乱等普遍存在,难以为人工智能提供充足的数据要素支撑。”中国社会科学院金融研究所研究员、支付清算研究中心主任杨涛认为,但对于金融业来说,生成式大模型目前仍面临数据治理、场景的标准化、技术与方案的高成本门槛以及透明度与不可解释性等诸多挑战。