目录
摘要
关键词
大模型解决领域应用问题的本质及要求
(一)领域应用的本质是复杂决策
(二)领域应用的专业性要求较高
(三)金融领域应用对大模型有更高要求
金融行业如何选择AIGC的适用场景
(一)使用AIGC需解决的三大问题
(二)如何突破AIGC在当前行业的应用难点
(三)AIGC在金融行业的应用实例
AIGC落地的策略和实施路径建议
(一)AIGC融合企业知识的实施策略
(二)企业AIGC应用的实施路径建议
摘要
如何将大模型的技术能力应用到金融等垂直领域,是当前人工智能领域关注的热点问题。本文从AIGC落地方法论的角度出发,通过领域应用难点分析、场景选择方法论研究、落地方法和策略研究三大模块,为金融同业推动AIGC场景落地提供若干思路和参考。
关键词
ChatGPT 大语言模型 AIGC 领域应用 安全合规
以ChatGPT为代表的生成式自然语言大模型1快速发展,开启了人工智能的新一轮发展浪潮。大模型将深刻影响人类社会的生产生活方式。金融领域有高度规范的数据积累,扎实领先的数字化基础,并且拥有丰富的理解、感知、认知、决策需求场景,行业专家普遍判断大模型的优势能力在金融领域的应用前景可期。然而,推进大模型在金融领域的落地仍需克服一些困难。如何判断某场景是否适合应用大模型,如何具体应用大模型,如何保证安全合规等问题,均有待解决。
大模型解决领域应用问题的本质及要求
大模型是指具有大量参数的机器学习模型。这些模型可以在训练过程中处理大规模的数据集,预测能力更强、预测准确性更高。在自然语言、音频、视频、图像领域,均涌现出一些大模型。AIGC2即人工智能生成内容,是利用人工智能多种模态的大模型,根据给定的主题、关键词、格式、风格等条件,自动生成的各种文本、图像、音频、视频等内容。
在本轮人工智能革命中,技术是原动力,应用是牵引力,安全是信任力。如何将大模型的技术能力应用到垂直领域,是当前人工智能领域关注的热点问题,也是众多企业探索和研究的方向。大模型在解决领域应用问题时具有非常强大的潜力,但也面临着一些挑战。解决这些难点和挑战需要在多个方面不断努力、开展合作,譬如数据隐私和安全、数据不平衡、模型的可解释性、模型的部署和扩展、模型的可获得性等。
(一)领域应用的本质是复杂决策
目前ChatGPT较好地实现了机器与人类的开放式对话。然而,大模型的实际应用场景依赖机器的复杂决策能力,复杂决策是领域应用的根本特点。复杂决策意味着需要考虑诸多因素,包括但不限于数据的质量、规模、类别、分布等。此外,决策的准确度还依赖对综合任务的拆解能力、精细严密的规划能力、对宏观态势的研判能力等。这些能力之间相互交织、相互影响,决策的难度也随之增加。
因此,在实际应用场景中,AIGC需要结合人类专家的知识和经验,以更好地应对复杂决策(见图1)。例如,在金融领域中,可以使用AIGC来分析海量数据,以识别潜在的风险和机会,但是最终决策需要由人类专家来作出。同时,为了提高AIGC的决策能力,可以使用强化学习技术,令其不断进行学习和优化。对AIGC的决策结果进行评估和反馈,可以不断改进其决策能力。此外,还需要注意AIGC的透明度和可解释性,以更好地监督和管理其决策过程。
(二)领域应用的专业性要求较高
完成各种领域的特定任务依赖相对独立的密集知识,且推理链条复杂,需要对不同领域进行深入研究,才能确定最适合该领域的解决方案。专业领域可能缺乏足够的公开数据,导致在训练模型时存在数据不足的问题。另外,专业知识可能非常复杂,在模型训练过程中可能需要大量人工操作,帮助模型理解领域内的专业术语和概念、实体之间的关系等(见图2)。在应用到实际问题时,需要理解问题的上下文,对于专业问题,上下文可能非常抽象,这使得模型在处理问题时存在理解困难并导致过拟合或欠拟合情况。模型输出的可解释性也非常重要,在某些情况下模型输出的内容可能难以理解,既可能是七拼八凑的结果,也可能是暂未被人类认识到的潜藏逻辑推论,需要领域专家对预测结果进行判断、论证。
(三)金融领域应用对大模型有更高要求
金融领域拥有大量规范化程度较高的数据和良好的数字化技术基础,因此被认为是率先拥抱人工智能的行业之一。然而,要实现AIGC的大范围落地,还需要克服许多困难。首先,金融领域的各个场景都需要严谨的答案,对错误的容忍度较低,因此迫切需要缓解大模型的幻觉3现象。其次,如果深入分析金融领域的需求场景并将需求细粒度拆解为细分任务,会发现大多数金融场景都需要进行高精度计算,例如理财产品推荐的问答场景。目前,大模型的计算能力尚不足以支撑问答计算,因此需要探索如何解决这一问题。最后,金融领域需要考虑安全合规问题。大模型的输出不受控,因此需要评价大模型的合规表现,增强大模型的合规能力,以及解决数据安全问题。这些问题的解决需要金融领域从业者不断探索和思考。
金融行业如何选择AIGC的适用场景
技术高速发展,但其应用潜力尚未兑现。对于金融企业,什么样的业务场景适合落地AIGC是其一直在探索的问题。下文将深入探讨在AIGC应用落地时所需面对的三大关键问题,剖析当前金融企业如何突破AIGC的应用困境,并以实例总结AIGC在金融行业的应用现状。通过这些研究,希望能为AIGC在金融行业的实际落地提供有力的方法论支持。
(一)使用AIGC需解决的三大问题
1.AIGC能否带来业务增值
AIGC是否能够带来业务的增量价值是评估其在特定场景中是否适合落地的首要考量因素。AIGC的应用不是为了验证其可用性或可行性,而是着重于业务处理的改进、成本节约以及解决问题效率的提高。
AIGC的应用价值主要体现在两方面。一是在业务增量价值方面,AIGC的应用使得以前无法做到的事情得以实现。同时,经过训练,AIGC在某些领域可以超越人工处理的水平,达到高于70分位的表现。这种改进使得业务处理过程质量更优、效率更高,从而促进业务的增值。二是在成本效益方面,AIGC提供了出色的人机交互形式,降低了解决问题的成本,提升了性价比。以智能客服为例,AIGC的回复可能更加人性化,甚至可赋予个性化风格,从而大幅提升用户的满意度。传统客服机器人需要大量语料和问题——答案配置工作,使用AIGC可简化知识库的配置,大幅缩短工作时间。此举对于业务处理效能的提升具有显著作用。
2.AIGC的风险是否可控
评估某一特定场景是否适合引入AIGC技术,必须对AIGC的风险可控性进行判断,并考虑企业的接受程度。以智能客服为例,需要审视是否可以对应用AIGC可能带来的风险进行有效控制,以及企业是否能够接受这些风险。尽管已经在模型中增加了大量限制和质检规则,但AIGC仍然存在偶发的不当言论。这可能包括对金融企业责任的夸大、对金融相关产品的理解过于通用,以及回答与企业业务无关的问题。需要认真考虑企业对这些风险是否能够接受,以及如何解决这些问题。
同时,需要关注用户体验。在引入生成式预训练(GPT)模型后,为保障回答的质量,需要对大模型的回答进行质检和审查,而这将导致响应时间从毫秒级别延长至秒级或更长级别。对于这样的响应速度是否符合用户的接受程度,是需要认真考虑的。
因此,在考虑引入AIGC技术时,必须综合权衡风险可控性和企业接受程度。对于可能出现的风险,需要寻找解决方案,确保AIGC应用的稳健性和安全性。例如,强化质检机制和风险监控体系。同时,对于响应时间的延长,需要寻找优化策略,以平衡质量和用户体验。在整个过程中,务必与企业相关部门进行充分沟通,确保AIGC技术的落地能够得到全面认可和支持。细致的风险评估和用户体验优化,可以确保AIGC技术在特定场景中的成功应用,促进企业业务的提升和发展。
3.AIGC如何与现有流程整合
在AIGC技术落地过程中,无缝嵌入现有业务流程显得尤为重要。金融机构在引入AIGC时,需要根据任务性质、业务需求和AIGC的实际能力,深入思考如何对现有业务流程进行改造,并选择最适合的模式,如Agent(直接替换)模式或Copilot(副驾驶)模式4。在选择合适的模式时,不仅需要考虑AIGC的技术成熟度,还要全面评估其对工作质效的提升情况。
目前,在金融行业,大多数机构采用Copilot模式。Agent模式直接由AIGC回答问题,虽然具备高度自动化的特点,但仍然存在一定的风险。相对而言,在采用Copilot模式时,客服人员与AIGC协作,通常需要等待约5秒钟才能得到AIGC的答案。客服人员在查看AIGC回答后可进行适度的调整和润色,然后再将答案传递给客户。因此,这种模式会在效率和效能上有一定的折损。
在实践中,成功将AIGC与业务流程相结合需要一定的策略和方法。在应用Agent模式时,金融机构需要不断优化和提升AIGC的准确性和稳定性,以降低风险。在应用Copilot模式时,应该注重优化流程、缩短客服人员等待时间,确保整个服务过程高效顺畅。此外,在AIGC回答内容的调整环节,可以考虑引入智能辅助工具,帮助客服人员快速检查和修改答案,提高效率。
总体来看,只有通过精心规划和优化,AIGC才能真正成为金融机构的得力助手,为业务提供可持续的增值。
(二)如何突破AIGC在当前行业的应用难点
当前的技术水平表明,在行业应用中,AIGC需要扬长避短,才能最大程度发挥其优势、有效应对其局限。
AIGC以其卓越的理解力和表达力而著称,能够快速将自然语言映射到多种模态数据上,并高效生成符合需求的新内容。从整体来看,可以将AIGC视为一种高效的“对话式人机交互界面”或“内容创作者”。
然而,必须认识到,AIGC在逻辑处理和精确可控性方面还有待提高。其无法完全取代行业专家进行专业决策,并且对精确指令的遵循也存在一定的不稳定性。因此,AIGC并不适合作为决策性任务的“终极执行者”角色。总的来说,需要科学利用AIGC,发挥其优势,注意规避其局限,才能充分挖掘其在行业应用中的潜力。
(三)AIGC在金融行业的应用实例
AIGC在金融领域的场景较为丰富,笔者根据应用实例,归纳出如下典型场景。
一是客户服务。利用AIGC可以实现虚拟助手和聊天机器人,可以自动回复电子邮件和信息,或处理复杂的金融查询,并根据客户特征提供个性化建议。流畅的对话体验可提升客户的满意度,从而提升服务的质量和效率。
二是产品创新。通过对客户数据进行分析,AIGC可以生成个性化的产品推荐和定制化方案,从而提高客户满意度和产品竞争力。
三是智慧办公。AIGC可以实现自动化数据处理和报表生成、文本归纳,减少人工处理的工作量,提高工作效率和决策质量。
四是研发管理。AIGC可以生成模拟数据、进行预测分析,帮助研发团队评估产品性能、优化算法和制定决策。
五是监管合规知识库建设。AIGC可以对金融监管信息进行解析,构建知识库问答系统,快速对问题给出答案。这有助于提升监管和被监管对象合规管理工作的效能。
六是代码开发。通过提示、辅助、补充等方法自动生成代码,节省基础代码或通用代码的编写时间,其结果经程序员简单调试即可使用,有效提升开发效率。
AIGC落地的策略和实施路径建议
(一)AIGC融合企业知识的实施策略
企业在使用大模型时,需要融入企业自身数据,以便使大型模型更加贴近实际业务需求,提高其在特定领域的适应性和效果,增强模型的实用性。不同企业或不同的应用场景可采用不同策略,如企业自建大模型、微调基础大模型、知识外挂等,每种策略都有其优缺点。
一是企业自建大模型:企业从头开始构建自身的模型,亲自进行模型的设计、训练、优化和维护。这种方法通常需要大量的时间、资源和专业知识,但可以完全满足企业的需求。考虑到技术难度、资源要求和成本因素,中小型金融机构一般不适合自建大模型。
二是微调基础大模型:企业基于现有基础大模型,通过微调来适应自身的特定需求。在微调过程中,企业可以引入自身的数据和知识,以提高模型在特定任务上的性能。这种方法通常比自建模型更快速和经济,并保持了一定的灵活性。
三是知识外挂:即将外部知识与大模型结合使用而不直接改变模型本身,可以通过知识分片、词向量搜索、提示工程等技术来实现。这种方法在不修改模型结构的情况下为模型提供额外的信息和上下文,有助于改善模型的性能。
企业可以根据自身具体需求和可用资源来选择这些技术路径。不同的项目和应用可能需要不同的方法,具体选择取决于数据、时间、预算和技术能力等因素。
(二)企业AIGC应用的实施路径建议
不同于其他新技术的引入路径,大模型产业侧目前处于百模混战、快速发展阶段,引入成本高、实施依赖多,存在技术难度大、配套产品要求多、大模型选型难、合规使用难、数据处理和算力成本高等诸多挑战,建议在实践中采取四步走策略。
一是试点场景预研探索。在实际应用中,大模型面临着多项实施挑战。这些挑战包括需要进行精细的提示工程和性能调优,必须与业务流程有机结合,以及需要融合企业自身的数据,需要通过实践进行深入研究和探索等。因此,建议结合企业的痛点场景、数据积累情况和可用计算资源,充分考虑大模型的优势能力,遴选最具代表性的应用场景,进行业务需求的实验和技术预研,增加落地实战经验,积累大模型评估数据,引导业务学习提示工程,与业务磨合大模型项目的合作机制,重点积累提示工程和模型微调实战能力,思考产品化和工程化的优化方向。
二是公共平台能力建设。规划设计AIGC的公共能力平台,即MaaS中台,包括大模型前端公共组件、大模型服务网关、大模型基础服务。模型服务统一封装,核心难点集中攻关,为各个大模型应用提供覆盖前端、后端、模型、工具、算力的基础技术支撑,降低大模型的开发门槛,缩短开发流程,统一技术栈,集中管理数据,建立公共的合规使用机制。
三是基础模型的评估选型。这包括研究大模型效果评估的方法论,收集内外部评估数据,积累公司内部真实应用场景的数据等,最终推动大模型的选型引入。对大模型需从效果能力、非功能表现、合规表现等方面综合评估。效果能力评估可从多个方面开展,包括阅读理解、文本生成等通用能力评估,金融情绪识别、金融事件解读等领域能力评估,保险术语解释、债券文章摘要等任务能力评估等。评估非功能表现包括性能容量、算力要求、模型大小等维度。评估合规表现要从恶意用法、信息泄露、偏见歧视、错误知识信息等方面进行监测。
四是规模化应用及迭代优化。挖掘更多的AIGC场景,突破数据和算力两大瓶颈,推动规模化应用,充分发挥技术价值,以降本增效。具体而言,应深入调研企业AIGC任务的标注数据市场供应情况,着手规划自身场景标注数据生成和处理工作,并在过程中解决数据知识产权合规性问题,产学研结合解决数据获取难题;适量补充算力资源,优先在大模型推理场景中试用国产算力,持续跟踪国产算力发展情况,完善企业异构算力调度功能。同时,实时跟踪业界先进工具,结合实际项目开发情况持续提高公共平台能力,迭代优化企业模型效果,在实施过程中形成AIGC场景开发的相关规范和标准,推动AIGC项目高标准、高效实施和合规应用。
总结
解决大模型的领域应用问题是一个相当复杂的过程,需要集成人工智能和多学科的知识和技能,结合领域专业知识进行分析和决策。大模型不能停留在类ChatGPT式的“开放聊天”,不断尝试解决生产过程中的多种难题,尽快提升其解决实际问题的能力,切实推动大模型成为各领域先进生产力。现阶段,AIGC应用落地不能是简单地依赖模型能力“套壳”,而是首先对现有业务、系统、流程有更深刻的理解,然后扬长避短地发挥AIGC的能力,利用AIGC实现人机交互及内容生产等方面的价值提升。
债券作为金融行业的一个子领域,AIGC的应用能为债券业务拓展更多的可能性,适用场景同样丰富和复杂,应深入理解AIGC技术,并积极探索更具创新性的应用场景。相信AI大模型将为金融行业、债券市场带来更多机遇和发展空间,成为金融行业智能化和高效化进程中的有力助推器。
注:
1.大语言模型是一种人工智能模型,旨在理解和生成人类语言。该模型基于大量的文本数据进行训练,可以执行多种任务,包括文本理解、翻译、情感分析等。
2.AIGC可以广泛应用于媒体、教育、娱乐、营销、科研等领域,为用户提供高质量、高效率、高个性化的内容服务。
3.模型幻觉:当模型生成的文本不遵循原文(Faithfulness)或者不符合事实(Factualness)时,就可以认为模型出现了幻觉问题。
4.Copilot(副驾驶)是一项嵌入各种不同软件服务的AI 组件。不同于Agent的直接替代,Copilot是基于AI和大语言模型构建的推理能力,以辅助流程帮助用户完成认知工作,从编写邮件、代码、宣传稿到生成图像、视频,制定工作计划或者获取工作和生活建议。
参考文献
[1]范文仲. 数字金融的创新与趋势[J]. 中国金融,2023(8).
[2]李紫菡,周双双. ChatGPT概述及应用研究[J]. 债券,2023(6). DOI: 10.3969/j.issn.2095-3585.2023.06.015.
[3]杨涛. 新技术在金融领域应用的共性问题与挑战[R/OL]. (2023-04-17)[2023-09-28]. http://news.sohu.com/a/667804744_674079.