- 快捷搜索
- 全站搜索
生成式大型语言模型的崛起掀起了新一代人工智能浪潮,引发了社会各界的强烈关注。未来银行业如何搭乘生成式大模型的快车,实现从数字化到数智化的飞跃是亟需研究的课题。本文从为什么要研究生成式大模型、怎么应用生成式大模型和未来展望三个角度展开讨论,探究生成式大模型的日渐成熟对银行业产生的影响。首先介绍生成式大模型的原理和现实意义,接着从内外部动力剖析生成式大模型的迫切性,最后立足银行实际业务和管理流程提供应用生成式大模型的新思路。未来银行拥抱生成式大模型刻不容缓,需要找准自身定位,坚持守正创新,提供更优质的金融服务。
早在2022年10月,监管在调研材料中提醒各商业银行关注自然语言生成(NLG)技术的应用。当时的NLG还只是作为一种可以吟诗作对的人工智能技术见诸于网络大众。二个月不到的时间,11月底ChatGPT横空出世。又在2个月不到的时间,由于月活跃用户快速破亿,成为增长最快的消费应用之一,引爆全球的关注度,掀起人工智能应用的全新浪潮。
作为NLG领域的最新成果,以ChatGPT为典型的生成式大模型为商业银行数字化转型带来全新机遇,其内容创作和交互能力所“涌现”出来的“智力”让走在数字化转型过程中的银行业看到了前行的方向和曙光,为更智能、更具个性化的金融服务方式和产品提供了支撑。
目前所有生成式大模型的基础都是采用Transformer架构及其中的self-attention机制[1]。与传统深度学习模型受限于结构无法不断扩大模型参数不同,Transformer架构得益于self-attention机制高效的并行和传导能力,可以将参数量扩大到十亿、百亿乃至千亿、万亿级别。参数量的增长类比于人类神经元的增长,神经元越多,智力越高,能力越强。因此Transformer的提出为后续大模型的诞生奠定了重要基础。
Transformer架构分为编码和解码两个模块。编码模块负责理解文字输入,解码模块负责根据输入输出对应的文字,这两个模块最终演变成了Bert和GPT模型。Bert是判别大模型,由编码部分演变而来,具有强大的语义理解能力,但对于文本生成任务难以胜任。GPT是生成式大模型,由解码部分演变而来,其强项在于文本的生成撰写。由于生成式大模型的训练过程可以更好地利用无标注文本,大大降低过程中的人力投入成本、显著提升训练集数量,因此以GPT为代表的生成式大模型效果逐渐超越以Bert为代表的判别式大模型,成为了当前深度学习的前沿和主流[2]。
表1 GPT模型发展历程
|
年份 |
版本 |
特征 |
|
2018 |
GPT-1 |
模型规模较小,展现出较优秀的文本生成和自然语言处理能力,但语言不够连贯和流畅,答案也不总是合理的 |
|
2019 |
GPT-2 |
规模更大,并在预训练中使用了更多的数据,生成的语言流畅度和连贯性得到很大提升 |
|
2020 |
GPT-3 |
数据集随机抽取自互联网上的文本数据语言流畅度、连贯性和创造性都有很大提升。可以处理多种任务,如语言翻译、摘要生成、问答系统等 |
|
2022 |
GPT-3.5 |
强化学习的引入赋予GPT-3.5前所未有的拟人性和流畅性,引爆大众对生成式大模型的关注,无论是语义理解,文本创作,知识储备等能力都有长足的进步 |
|
2023 |
GPT-4 |
文本输入限制增加到上万字;回答准确率显著提高;生成创意文本,实现风格变化 |
GPT的发展流程如表1所示[3],作为最具代表性的生成式大模型,也是当今生成式大模型领域当之无愧的王者,其诞生和发展也代表着生成式大模型的发展路径。不过随着ChatGPT和GPT-4模型的爆火,海内外也涌现出一大批颇具竞争力的生成式大模型。表2例举了部分具有代表性的生成式大模型,不难看出大模型的发展正方兴未艾,并且一直在不断升级迭代,持续提升性能和智能。
表2 代表性生成式大模型
|
发布时间 |
模型名称 |
国别 |
|
2023.3 |
LLaMA |
美国 |
|
2023.3 |
Bard |
美国 |
|
2023.3 |
文心一言 |
中国 |
|
2023.3 |
ChatGLM |
中国 |
|
2023.4 |
日日新 |
中国 |
|
2023.4 |
通义千问 |
中国 |
|
2023.5 |
星火 |
中国 |
|
2023.5 |
PaLM2 |
美国 |
|
2023.6 |
百川大模型 |
中国 |
|
2023.7 |
Claude2 |
美国 |
生成式大模型的出现标志着人工智能在语言理解和生成方面取得巨大突破,为自然语言处理、机器翻译、智能助理等领域带来革命性的影响;作为人工智能领域划时代的最新成果,它的出现代表着一个全新生产力时代的到来,就好比第一次工业革命中的蒸汽机和第二次工业革命中的电气,其技术将深刻影响未来世界的产业生态格局,在无数行业中掀起产业革命。对于银行业来说,生成式大模型有可能成为数字化转型的全新方向,将成为高同质化竞争中的胜负手。
从生成式大模型在各银行落地的现状来看,它代表了更有趣、更智能的金融服务。目前各大银行对于生成式大模型的研究如火如荼,例如建设银行尝试将大模型能力应用于RPA流程自动化,希望提高银行的服务效率;招商银行准备在智能对话机器人引入生成式大模型,融合小招客服来提供全托管、辅助应答功能,还尝试利用类似生成文案推介信用卡;同时,包括百信银行、邮储银行在内的多家银行,宣布成为百度类大模型项目“文心一言”首批生态合作伙伴。得益于生成式大模型为银行提供了更令人满意的服务,各行对于生成式大模型的研究热情与日俱增。
从对银行业管理赋能的角度来看,生成式大模型代表着更高效的管理和更便捷的工作模式。通过生成式大模型技术,银行可以更高效地实现自动化处理和智能决策,大大提升管理效率。例如在客户服务中,生成式大模型可以结合银行具体业务知识来应答提问,对外可降低人工客服成本,对内可降低培训成本;在风险合规控制中,大模型可以进行外规内化、内部规章制度等文档的撰写,甚至可以通过分析大量已有数据,识别潜在的风险和欺诈行为,帮助银行更加准确地评估客户信用风险等。总之,生成式大模型在降低管理成本、提升管理效率方面有着巨大的潜力,对于银行降本增效将起到极大的促进作用。
近年来国家不断鼓励信息科技和传统行业结合,赋能传统行业发展,银行业作为除了信息行业本身,信息化、技术化水平高的行业之一,早在多年前已经开始了数字化转型。转型过程涉及了广泛的技术创新,特别是人工智能(AI)技术的应用集成。
表3 数字化转型政策
|
主题 |
主要内容 |
|
|
2015 |
"互联网+"行动计划 |
鼓励传统行业与互联网相结合,促进数字经济的快速发展,银行业也成为其中的重要领域 |
|
2019 |
"金融科技"发展规划 |
明确将金融科技创新和数字化转型作为金融业发展的重要驱动力。提出推进金融科技与实体经济深度融合、加强金融科技监管、促进金融科技国际合作等目标。 |
|
2022 |
加快场景创新以人工智能高水平应用促进经济高质量发展 |
鼓励重点行业深入挖掘AI技术。在金融领域,着重强调优先探索金融风控、企业智能征信、智能反欺诈等智能场景 |
本文在表3中罗列了近几年来国家对于数字化转型的支持。从中可以看到随着时代的变迁,国家政策的支持和人工智能技术应用的与时俱进,银行业因为数字化转型遇到了新的机遇和挑战。时至2023年,在生成式大模型的应用领域,国家互联网信息办公室于4月11日发布《生成式人工智能服务管理办法(征求意见稿)》,并于7月13日审议通过作为暂行办法。全国信息安全标准化技术委员会发布也于10月12日发布《生成式人工智能服务安全基本要求》。作者相信,在国家政策的指导和规范下,生成式人工智能的发展一定会更加规范,更加健康。
目前对于AI在银行业应用中相关风险的理解和解决研究,还处于起步阶段。这可能会为银行业带来不可预知的危机,同时引发许多问题和隐患,包括技术透明度、数据安全和隐私、责任感以及人为偏见等问题。因此,为确保负责任的利用人工智能技术带来的优势,银行需要进行更多的工作。其中,透明度应是保护客户和保持客户信任的关键,银行必须加以重视。
国家金融监督管理总局作为银行业的监管部门,面对生成式大模型可能带来的危机与挑战,表现出理性和审慎的态度。尽管意识到生成式大模型的应用涉及到隐私和数据安全风险,以及算法不透明性等问题,但其仍不断尝试对大模型技术的应用展开探索。这种尝试的态度不仅体现出监管对新技术的积极态度和对创新的勇敢尝试,更是揭示出大模型对于商业银行数字化转型的潜在价值和重要性。
各商业银行则应该秉承贯彻这种思路,在保证数据安全、业务连续性的前提下守正创新,不断探索生成式大模型在银行业应用的方向和场景,不断尝试在新一波的技术浪潮中勇立潮头,将新技术和业务实践相结合,尽快让大模型产生实际生产力。
随着数字化时代的到来,银行业正面临着日益复杂的市场环境、巨大的数据量以及多样化的客户需求。在生成式大模型诞生之前,银行业运用人工智能技术解决业务问题时,由于缺少高精度、高智能算法模型的支持,现有的AI能力在银行发展中还存在着不少瓶颈[4]。
传统的数据处理和分析手段效率较低且准确率不高。银行业每天产生大量的数据,包括客户交易记录、市场数据、社交媒体内容等。传统手段主要是技术人员利用sql、java、python等编程语言“硬编码”来编写规则;在面向大规模数据时,存在效率较低,重复性工作较多且主观性较强的问题。另外,在大模型诞生之前,数据分析算法主要是利用传统的机器学习算法,如回归分析、聚类分析、关联规则分析和时间序列分析等,算法的精度存在瓶颈,且对于技术人员的算法要求也较高。而生成式大模型由于参数量庞大,训练效果显著,可以更高效地开展数据分析工作,通过输入数据和用户指令,即可快速生成数据分析报告,自动化程度更强。
传统模式下的客户体验智能化和个性化水平较弱。传统银行业务通常需要客户亲自到银行办理业务,这对于客户来说可能是繁琐和耗时的。但是,随着生成式大模型技术的应用,银行可以提供智能客户交互和自助服务,使客户可以通过语音或文字与机器人助手进行交互,完成各种银行业务。与此同时,现代消费者对于个性化的服务和体验有着越来越高的期望,此前的智能客服一般属于通用化的产品,对于所有客户都是统一的模式,需要付出很大成本才能做到千人千面,因时因势做出合适的响应。而生成式大模型技术可以通过对客户的大量数据进行分析,构建出高精度的用户画像,生成每个客户私人管家型机器人,提高客户满意度和忠诚度。
传统的风险甄别和市场预测的精度和效率有待进一步提升。银行业需要在快速变化的市场环境中做出复杂的决策,如贷款审批、投资决策和产品定价等。传统的方法一方面由于准确率的问题,可能产生“假阳性”误报和“假阴性”漏报的情况,给客户带来不便,也增加银行的损失;另一方面,随着数据量的爆炸性增长,传统的数据处理和分析方法无法高效地处理如此庞大的数据,因此需要更强大的数据处理技术来应对挑战。生成式大模型技术为很好地解决这样的问题提供了可能性,其通过对大量历史数据和实时交易数据的分析,可以极大地提高市场预测的准确率,同时可以及时进行异常风险识别。这种智能化的能力可以帮助银行降低损失,并为银行业务决策提供重要的参考。
传统的人工智能技术在银行业中的运用主要体现在面向客户的产品中,如何赋能银行的员工管理,提高工作效率也是亟需考虑的方向。在生成式大模型之前,由于缺乏强大的AI模型支撑,阅读材料、撰写文本、编辑表单、编写代码等工作均需要员工具备相应的背景知识,时间和人力成本较高。生成式大模型由于强大的文本理解和生成能力,在给定输入数据和用户指令的情况下,即可辅助员工完成大量的日常工作,极大地提高工作效率,节省人力成本。
除了在数据分析以及自然语言领域的需求,银行内部对于图像和音频制作修改的需求也不断增加。当前银行产品种类纷繁复杂,这些产品都需要对应的宣传和推广,在推广的过程中往往需要对应的图片形象、声音形象用于宣传。银行往往会选择将这部分工作委外处理,这就带来了很多额外的运营成本。运用大模型的多模态能力可以在宣传物料的设计、修改、推广等多个阶段帮助银行降本增效。
因此,大模型的出现对于解决当下银行业应用AI的瓶颈问题具有十分重要的意义。生成式大模型技术在银行业的落地应用已经展现出巨大的潜力。随着技术的不断发展和应用的深入,相信大模型技术将继续推动银行业在智能化和数字化方向上的探索,为客户和银行带来更多的价值和便利。
金融科技的快速发展正深刻改变着金融市场的运作方式。AI作为其中的关键驱动力之一,对金融行业的创新和升级起到了重要作用,服务领域涵盖市场预测、交易执行、风险管理和客户服务等方面,为各金融机构带来前所未有的机遇。
表4 银行业GPT探索现状
|
银行 |
类型 |
进展 |
|
建设银行 |
国有大行 |
将生成式大模型应用于RPA流程自动化机器人场景 |
|
农业银行 |
国有大行 |
率先推出自主研发AI大模型ChatABC,应用于平台的问答助手、工单自动化回复助手等场景 |
|
工商银行 |
国有大行 |
发布人工智能金融行业通用模型,应用于客户服务、风险防控、运营管理等多个领域 |
|
招商银行 |
股份制银行 |
在数字化运营推广方面,应用生成式大模型生成文案推介信用卡。 |
|
江苏银行 |
城商行 |
联合应用大模型与Codex技术分析行内信息系统的运行情况,并实现自动化分析和提供建议。 |
表5 非银金融GPT探索现状
|
名称 |
行业 |
进展 |
|
华盛证券 |
证券业 |
发布“华盛GPT-天玑”,通过分析市场数据和资讯为交易员提供快速准确的交易决策支持,提升效率和准确性。 |
|
瑞士保险Helvetia |
保险业 |
Helvetia正在测试利用ChatGPT推进客户服务,通过其聊天机器人Clara进行现场实验,用户可以通过它获得有关保险、养老金和房屋所有权的答案。 |
|
苏黎世保险 |
保险业 |
用ChatGPT进行理赔和数据挖掘,利用人工智能提升理赔效率,将解决财产险理赔所需的时间缩短至24小时以下 |
表4和表5展示了银行业和非银金融业在GPT探索领域的进展情况,可以看到金融业正不断探索GPT和金融业务的结合方式,其中以银行业更为突出。中国各大商业银行正在进行新一轮的AI '军备竞赛'。根据互联网数据中心(IDC)的报告,探索大模型应用已经在中国银行业蔚然成风。尽管目前尚未公开国内各大银行和同业在大模型方面的投入成本,但从主流大模型的训练参数量来看,训练一款专属于金融机构自身的生成式大模型能力,至少需要数百万甚至上千万元的软、硬件投入。这种投入对于中小银行来说都需要仔细斟酌,慎重再慎重。为了构建未来银行的核心竞争力,中小银行更应该积极探索符合自身现状的建设、应用方式。
生成式大模型代表了自然语言处理和人工智能领域的最新成果,为银行提供了前所未有的机会,对于提升客户体验、优化业务流程、强化风险管理,并开拓新的市场具有重大意义[5]。银行业在如今数字化潮流不断崛起的背景下,迫切需要采取一系列创新举措,以推进生成式大模型在业务中的实际落地。然而,要成功将其引入银行业,需要综合考虑技术、数据、合规性和人才等多个方面的因素。因此,未来实现生成式大模型真正的落地并发挥价值,本文拟出了三个阶段,如表6所示。
表6 生成式大模型未来探索畅想
|
|
阶段主题 |
具体举措 |
|
第一阶段 |
跟踪前沿,开放尝鲜 |
时刻保持对技术前沿、行业前沿的跟踪,留意头部科技企业在大模型应用领域的进展。 |
|
第二阶段 |
深入场景,赋能业务 |
待大模型能力及应用逐渐成熟、业务耦合点越发明确,开始将大模型能力嵌入业务流程,赋能业务发展。 |
|
第三阶段 |
私有化专属大模型 |
大模型能力势必会发展成一种智能中枢,会成为银行间效率竞争、质量竞争的决定性因素,建设理解金融机构精神内涵,通晓金融机构内部知识的大模型就势在必行化。 |
在当今数字化风潮中,银行业需要及时做出调整和应对,通过以上三个阶段的实施,将大模型和银行业务深度融合,可以有效的实现大模型在银行各业务的落地,从而提高运营和管理效率、增强客户体验,在数字化竞争激烈的金融领域中取得领先地位。
在金融服务过程中,对客户场景的应答需要综合考虑不仅仅是“聪明”地完成服务,还需符合“合规”的基本要求。尽管“智能涌现”带来的技术神奇令人叹为观止,但由于无法预测模型生成的具体内容,即AIGC对于内容的不确定性和不可控性,银行必须审慎对待这项智能应答服务的应用[6]。在借助其卓越智慧之前,坚守合规底线是每家商业银行为维护金融市场稳定所必须秉承的行为规范。守正即是坚守金融行业的核心价值观和法律法规。金融作为社会稳定的支柱,其最根本的使命是为客户提供安全、高效、诚信的服务。生成式大模型技术的应用必须严格遵守相关法律法规,并尊重客户的隐私权。因此,在应用生成式大模型技术的过程中,要始终坚持守正创新的原则,才能实现可持续的发展,服务于金融行业的繁荣与稳健。
在很多时候,创新以帮助商业银行更好地合规。创新意味着不断探索新的应用场景和提升服务质量。生成式大模型技术可以用于优化客户服务、风险评估等多个方面。例如,尝试引进大模型通过对大量历史数据的学习,实现更准确的风险预测,帮助银行更好地管理不良资产,提高资产质量,对风险防患于未然。在客户服务中,大模型可以对沟通内容进行质检,及时纠正不当言论。此外,大模型还有机会方便地识别出银行在日常经营、资金交易等流程中可能存在的风险事项。
“合规”让“创新”行稳致远,“创新”让“合规”全面高效,两者相辅相成一起助力商业银行高质量发展。
生成式大模型的强大能力如何和商业银行业务有机结合,是当前国内外银行积极探索,积极思考的问题。
立足于客户角度,打造客户旅程服务的小智囊以提升场景金融的服务质效[7],已成为许多商业银行探索和实践的重点课题。一方面在智能客服领域,生成式大模型作为专业的语言模型,通过与银行内部的客户数据和历史客服聊天记录相结合,进行领域微调,可以得到带有银行自身特色的客服机器人,从而提高客户满意度,减轻人工客服的压力。另一方面在个性化服务领域,大模型可以基于客户的历史交易记录、偏好和行为模式,精准地预测出客户的需求,为每位客户推荐最符合其兴趣和需求的产品和服务,提升客户满意度的同时,促进了交易量和客户忠诚度的增长。
立足于产品角度,基于客户全周期性需求和银行自身发展利益,打造客户与银行双赢的爆款产品是接入大模型之后值得考虑的方向。一方面,可以利用大模型强大的数据分析和决策支持能力,通过将历史数据、市场信息和行业洞察等输入至大模型中进行微调,训练出高精度的市场预测模型,同时输出多视角下的数据分析报告,以此帮助银行优化产品组合和资源分配。另一方面,从风控角度,大模型可以辅助进行客户信用评分和银行贷款决策。使用历史贷款数据和客户信息进行模型训练,建立基于生成式大模型的预测模型,根据客户的特征和财务状况预测其还款能力。同时,大模型可以辅助银行改进欺诈检测系统。通过分析大量交易和客户数据,大模型可以识别异常模式和不寻常行为,从而提高欺诈检测的准确性和效率。
总的来说,应用大模型可以帮助银行在客户和产品等多种业务场景中提高效率、降低风险、增强客户体验,并为未来的业务创新提供技术支撑。
不局限于商业银行具体业务,要实现银行的数字化转型,在自身管理能力方面同样需要积极拥抱大模型,让大模型赋能银行管理,提高员工工作效率,提升银行管理效能。
在流程自动化管理中,大模型可以与机器人流程自动化(RPA)技术相结合[8],实现银行管理流程的自动化。例如,自动生成合规报告、风险评估和内部审计报告,减少人工编写和审查的工作量。同时,大模型也可以对政策法规进行解读,并给出具体操作指引,银行内部的大模型也可以基于指引,结合内部的职责分工与现有规章体系,自动化地给出执行细则。
在数据分析管理方面,大模型可以基于企业对外披露的年报、季报进行文档分析,利用大模型快速解读各企业的财报,提取重要信息要素,快速形成行业、区域的对比分析,提供一定程度上的决策支持,辅助分析与管理人员聚焦更深度的剖析研判。与此同时,大模型强大的生成能力,可以辅助技术人员进行数据报表的分析,通过自然语言描述需求,大模型即可完成相关的数据统计和展示,可以极大地提高技术人员的工作效率。
在员工工作管理中,一方面,大模型可以用于员工培训和知识管理,大模型可以使用银行内部培训材料和知识库进行模型训练,从而得到一个银行领域性较强的知识机器人。利用基于生成式大模型的知识机器人可以回答员工的问题、提供培训资料,并提供个性化的学习路径和建议。另一方面,在银行低层研发中,大模型可以快速生成各场景应用中的源代码,或辅助进行编码过程中bug的寻找和解决。如此,即可帮助工程师从基础代码的编写中解脱出来,更聚焦于业务场景到代码的设计与优化,进而提升金融科技的管理效能。
在风险管理领域中,大模型通过分析大量的金融数据,包括交易记录、市场数据和客户信息等,可以训练出高精度风险预测模型,以预测潜在的风险事件。这有助于银行更好地监测和管理风险,并及时采取措施来减少潜在的损失。
由此,大模型在银行管理领域应用广泛,其智能化的自然语言处理和数据分析能力可以极大程度的为银行管理赋能,优化银行管理效率。因此,越来越多的银行积极探索使用大模型技术,提高银行业务和管理的数智化能力,加快自身的数字化转型,为客户提供更优质的金融服务体验。
在有限投入的前提下,有效地利用云端资源和本地GPU,有效把握住大模型智能的“涌现”的同时,尽可能地克服“幻觉”,是每一家商业银行、特别是中小银行在尝试应用生成式大模型的基本原则。希望在良性竞争的同时,各商业银行可以谋求联合创新的路径,在AI前沿领域合作共赢,找准生成式大模型的业务增效切入点,打造我国银行业的“爆款”智能服务。