【云驻共创】基于混合云的金融大模型体系建设及应用实践

举报
菜鸟级攻城狮 发表于 2024/08/01 20:59:34 2024/08/01
【摘要】 华为云持续深入行业场景,理解业务痛点,采用系统化思维,联合客户、开发者、同行、合作伙伴等上下游,持续构筑大模型的商业成功。目前,华为云Stack大模型混合云已应用于政府、金融、煤矿、交通、电力等10多个行业。在金融,华为云携手头部金融机构探索大模型在研发、客服、授信等领域的应用场景,并已经取得初步成效。中国工商银行大数据与人工智能实验室夏知渊在会上分享工行基于混合云的金融大模型体系建设及应用实践。

前言

华为云持续深入行业场景,理解业务痛点,采用系统化思维,联合客户、开发者、同行、合作伙伴等上下游,持续构筑大模型的商业成功。目前,华为云Stack大模型混合云已应用于政府、金融、煤矿、交通、电力等10多个行业。在金融,华为云携手头部金融机构探索大模型在研发、客服、授信等领域的应用场景,并已经取得初步成效。中国工商银行大数据与人工智能实验室夏知渊在会上分享工行基于混合云的金融大模型体系建设及应用实践。

一、中国工商银行在金融科技领域的创新实践:大模型体系建设

首先,让我们来了解一下工行对于大模型技术的变化和未来发展趋势的理解。从我们人类历史的发展历程来看,每一次技术迭代和更新都会推动我们生产力,尤其是我们的社会生产生活有很大的一个影响。当前以自然语言类的这种大模型为基础的新的这样的一个技术,已经成为我们新的生产力的一个重要引擎,并且正在加速千行百业的深入应用。在国外的一些调研公司,比如像麦肯锡公司测算,大模型未来每年会给我们全球经济贡献2.6万亿到4.4万亿美元。可以说人工智能又进入到了新的发展阶段。


从22年四季度到现在,ChatGPT的出现引发了大模型应用的巨大变化。从早期使用提示词的方式到现在的各种工具协同自身记忆和专家知识形成综合智能体,大模型的使用形态越来越丰富、有效,进入了AI应用的新阶段。


由于金融行业具有自身的特点,因此与新技术的应用密切相关。作为数字化程度相对较高的行业,金融行业拥有从数字化迈向智能化的天然优势,能够很好地遵循商业和人工智能技术发展的规律。目前,金融行业的智能化转型正在从业务场景级向业务领域级和企业级的智能化转型。这不仅会在局部业务点上带来变化和突破,而且在整个行业中和业务领域上也会有所突破。在第三部分的案例介绍中,将进一步展开讨论。目前看来,我们已经进入了AI2.0时代的智慧金融新时代。


二、工行在大模型领域的探索与实践

第一部分, 我们介绍了人工智能技术的发展情况及其对金融行业的影响。第二部分将详细介绍工行在大模型领域的探索实践经验。近年来,特别是自2022年以来,我们一直关注人工智能的发展和变化。从2022年初开始,我们构建了大模型的试点集群,并在接下来的几年中取得了许多经验和教训。现在将简单介绍一下这些经验。


在整个大模型建设过程中,这是一个非常体系化的工程,体现了从基础设施到数据采集再到上层应用的全过程。在这个系统性工程中,如果没有全局的谋划和思考,很难推动工作。因此,我们需要遵循中国的一句古语:“谋定而后动”。

在大模型开展前期,工行进行了大量实验、深入思考和规划,以指导整体工作的开展。首先,我们明确了大模型与企业内部其他平台和业务系统的关联性。我们认为大模型是支持业务发展的加速器,与原有数据中台和传统AI能力相辅相成。数据中台可以为大模型注入金融专业知识和专家经验,而传统AI技术如OCR和预测模型等则可以综合提高大模型的效果。例如,大模型可能不擅长处理数学或理工科问题,但我们可以利用传统模型技术来调度大模型,从而获得更好的效果。


从服务形态来看,我们的大模型在整个体系架构中扮演着金融行业智能化的核心角色。通过与AI进行对话,我们可以实现各种业务的办理和服务的生成,这是我们的整体定位。其次,在新一代企业中台的具体建设思路上,工商银行采用了逐层向上依次迭代建设的思路。

这里提到了三大支柱、两个平台以及1+X办事和全域生态等几个部分。三大支柱是指人工智能依赖于数据、算法和算力三个支撑体系。围绕这三个支撑体系,建设了一些工行自己的平台和基础设施。这两个平台是为了提高模型研发和业务服务的效率而构建的。一加X范式是将AI技术或大模型技术快速融入业务系统的解决方案。全域生态是指我们构建的AI原生应用市场,旨在激发集团内部不同业务部门对AI的理解和结合AI开展业务创新的能力。具体来说,它包括三个支柱。


在算力方面,工行与华为合作,从2022年开始构建高性能网络基础设施、存储能力和算力技术,以满足千亿级参数的模型训练需求,并实现上千QPS的推理能力。这为我行整个集团的各类业务提供了相应的服务。在数据部分,我们构建了一站式的数据采集、清洗、评估和管理的数据研发流水线Data S,并利用大模型的数据生成技术和模型对数据进行质检配比等工程化方法,提高了模型训练数据的采集和提质效率,让我们的模型更好地学习金融专有知识,为金融提供更好的服务。


三大支柱的第三部分是算法部分。工行秉承开放融合的理念,形成了一个多参数规格、多模态的千亿级金融大模型。我们与华为等领先商用大模型开展了合作,并将开源通用模型进行了整合。通过这种方式构建的模型矩阵可以为不同场景提供支持和服务。此外,我们还构造了一个智能体,能够通过智能体的形式将传统模型和其他大模型协同起来,将业务问题交给大模型理解和调度小模型,形成大小模型的协同工作模式。


三、构建高效与安全的AI模型与平台

目前,工行的大模型已经从百亿级发展到了千亿级,无论是微调还是二次训练,都需要较高的门槛和效率要求。针对不同的业务场景,我们需要进行一些调整和适配工作。在这个过程中,我们构建了一个平台,将训练效率、断点续训等能力整合在一起,有效地发挥了整个训练的效果。此外,模型安全也非常重要,因为金融行业提供的服务对安全性要求非常高。因此,专门构建了一个模型安全平台,在该平台上可以进行大量工作,如训练数据检查、模型上线前的安全测试等,以提高每个版本的模型质量。

有了三大基础和模型研发以及安全平台的支持,我们需要考虑如何将这项技术快速融入到我们的业务体系中。为此总结了一种名为“1+X”的工程化解决方案。其中,“1”强调的是智能体,它将融合并注入我们的后端能力。同时,它还将与我们的业务专家的想法、问题和思考进行对接。通过这种方式,模型才能真正地运行起来。

X种解决方案是我们工行根据应用经验归纳出来的,旨在提供一套快速、完整的解决方案,使我们的业务系统能够轻松安装和使用,避免重复开发和配套工作。该方案包括多模态知识检索、对话式数据分析、智能化文档编写以及交互式智能搜索等多种能力。通过这些方案,我们可以快速为各个业务条线赋能整个AI的能力。


四、构建智能服务体系:大模型在工商银行的应用

首先,介绍的是工行知识检索的模式。知识检索是目前大模型最典型的应用形态之一。它可以帮助我们的业务人员在大量业务办理、知识规章制度等中快速找到难点或冷门的关键点,从而快速办理业务。同时,它还可以为客户提供各种咨询服务。通过将大模型、搜索引擎和知识库的能力整合起来,我们开发了一个解决方案业务人员只需在界面上上传相关知识文档,就可以构建自己的咨询类数据分身,即智能分身。这可以帮助他们回答各种问题,包括为客户解答各种问题。该解决方案已在信贷、网点业务办理和远程银行等场景中得到广泛应用。

第二个是开发的智能搜索系统。它基于我们的搜索引擎和大数据模型,可以整合内外部各种信息,为我们的业务信息服务和舆情监控等提供支持。通过这种方式,我们可以将企业内部和外部的信息平台知识融合在一起,快速响应和分析需求。


第三个是数据分析的范式或解决方案。在数字化经营过程中,我们需要查看报表、查询数据以了解经营情况。以前这需要编写SQL代码,但现在我们可以使用大模型来理解想法并生成代码执行任务,包括查询数据、将数据转换为图表以及进一步解读图表内容。这些方法可以大大降低用户门槛,在不同业务部门如信用卡和信贷等中得到广泛应用。


第四个是文档编写的范式。在企业内部,我们需要编写大量的资料,包括信贷类和个人金融类业务。我们需要对客户进行评价和跟踪等。这些都需要大量的文档编写工作。我们的大模型在这方面也有它的长处。我们结合了大模型和相关智能体的方案,让它能够编写非常复杂的报告和资料,提高业务办理效率,缩短客户等待时间。这在研报生成、工单摘要和财报分析等场景中都有应用。


最后一个是智能体,它是整个大模型应用的最新形态,也是未来能充分发挥这项技术的核心形态。在这个形态中,我们将大模型与业务系统API和工具平台进行对接,使其能够完成复杂的任务和工作,并为我们提供数字员工的多项技能调度能力。通过这些能力的建设,我们已经打造了工行的智能体对话式服务能力,并在包括信贷远程银行在内的二十多个重点业务领域中得到广泛应用,为全行员工提供了赋能。


五、利用大模型技术优化金融服务与推动工业互联网平台发展

远程银行作为全行客户服务运营的主要阵地,它在解决客户难题方面发挥了重要作用。工行的一线员工每天都要接听和拨打大量的电话,这是一项非常繁重的工作。因此,工行使用大模型构建了一个赋能的全链路条件。从知识准备到客户通话过程中的辅助,再到客户通话后的工作单编写,工行都使用大模型重塑了整个业务模式。这为我们工行的5000多名坐席员工提供了很好的支持。在重点场景上,我们的通话时间可以降低10%,员工坐席效率可以提高18%,知识运营效率可以提升到20%。

其次,我们的网点业务非常重要,尽管现在大部分业务都可以在线上完成,但仍有一些业务需要在网点处理。因此,我们的网点员工在日常工作中会遇到各种各样的难点和问题,这些问题会影响他们的客户服务效率等。为了解决这些问题,我们利用大模型的能力将业务办理知识导入其中,并让模型回答各种复杂的业务问题,以帮助我们加快客户服务过程。这种方法也为我们的20万名网点员工提供了相应的支持和辅助。

目前看来,人工智能已经成为新一轮发展浪潮的一部分,我们应该拥抱大模型技术,加快通用人工智能技术的发展。这必将为我们的社会带来更大的前进动力。希望我们不仅能在不久的将来见证这个新技术跨越发展的历史时刻,也希望每个人都能成为创造这历史时刻的一员。


总结

工商银行致力于推进金融科技领域的智能升级,特别是通过构建大模型等智能应用来提升信贷业务的专业知识检索效率、风险管理能力和决策支持水平。自2022年起,工商银行专注于人工智能技术的发展,并在大模型领域进行了深入的探索和实践。通过构建试点集群并逐步积累经验,工商银行认为大模型是业务发展的加速器,能够与企业内部其他平台和业务系统相互配合,共同促进金融服务的智能化。在大模型的建设过程中,工商银行强调了基础设施的重要性,包括强大的机房设备和高效的数据处理能力。此外,还特别关注数据、算法和算力三大支柱的建设,致力于打造千亿级参数的模型训练环境和高QPS的推理能力。通过数据研发流水线和模型生成技术提升数据质量和训练效率,同时开放融合,引入多参数规格和多模态的大模型,以适应不同业务场景的需求。工商银行构建了一个全面的智能化中枢,通过AI对话等方式,实现业务办理和服务的自动化,推动业务创新和效率提升。


本文参与华为云社区【内容共创】活动第26期

任务7大模型混合云,十大创新技术引领政企智能升级



【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。