大模型技术的深入应用,正让金融业务发生翻天覆地的变化。例如,“投顾助手”能够为用户提供投资建议,帮助客户在瞬息万变的投资市场中把握市场规律,获得更高的收益;“智能客服”能够高效响应用户的服务需求,并给出精准的回复……大模型高效利用海量金融数据,并切实地提升金融业务与服务的智能化水平,在实际金融场景中发挥出重要的价值。
借助浪潮信息AI服务器、AIStation智能业务生产创新平台等领先的智算基础设施,国内领先的金融科技企业恒生电子实现算力高效分发、算力资源高效管理,加速了金融行业大模型LightGPT的开发和落地,模型训练和精调时间周期由数周缩短至数天,应用于客服、运营、投顾、投研等金融业务场景,助力金融行业智能化转型。
“量身定制”金融大模型,高效训练是关键
恒生电子是一家以“让金融变简单”为使命的金融科技公司,致力于为证券、期货、基金、信托、保险、银行、交易所、私募等机构提供整体解决方案和服务,连续16年入选FinTech100全球金融科技百强榜单,2023年排名第22位,位列亚洲上榜企业第一。
恒生电子高度重视大模型技术的创新与应用,率先发布了领先的金融行业大模型LightGPT。LightGPT基于海量高质量金融数据训练,使用超2000亿中文tokens和80多项中文金融任务指令微调,涵盖投研、投顾、智能客服、合规风控等多领域金融应用场景,实现金融相关任务高效、准确理解,显著超越通用大模型。在测试中,LightGPT的逻辑推理、超长文本处理、多模态交互、代码、金融专业问答等多项能力都表现突出,表现出极高的准确性和专业水准。同时,LightGPT学习中国的金融法律法规,更符合中国金融市场的监管要求。
就像一个“多面手”,LightGPT综合能力突出,单个模型即可满足金融机构众多应用场景的需求,为投顾、客服、运营、合规、投研、交易等业务系统注入AI能力,加速行业升级和智能化转型。如在信批材料审计场景,LightGPT可帮助审计员将文档的审计时间从2小时缩短到5分钟;在投顾场景,可帮助投资顾问将客户咨询问题的平均回答时间由十几分钟缩短至几秒,大幅提升工作效率,提升客户体验。
面向不同金融机构的个性化需求,恒生电子需要针对具体业务“量身定制”,对LightGPT进行强化训练和精调,以提升模型的精度,或输出符合要求的内容。为了更好地推动大模型的开发和应用,恒生电子希望在AI基础设施方面进行深度改造。一方面,大模型预训练与微调需要性能强大、高效易用的算力平台,租用算力资源虽然可解燃眉之急,但在算力稳定性、安全保障方面存在着隐患。另一方面,大模型的开发运营涉及多团队、多业务与大量数据,需要有效的任务排队和调度机制来确保资源的合理分配和高效使用。否则,将导致各团队抢占算力资源,计算任务下发后需要长时间等待才能得到结果,不仅会影响开发进度,而且会提升成本。
创新智算平台,提速大模型开发
恒生电子携手浪潮信息,部署了大模型智算平台,涵盖AI服务器、AIStation智能业务生产创新平台,大幅提升了LightGPT大模型开发和应用效率。
在算力方面,浪潮信息为恒生电子提供了AI服务器,并通过软硬件一体化的平台建设模式,实现了上线即使用的应用目标。同时支持灵活扩展,满足恒生电子业务快速增长对算力资源的灵活需求。
浪潮信息AIStation平台为恒生电子提供敏捷可靠的大模型开发支持和可扩展的人工智能基础设施管理能力。AIStation统一管理和调度算力资源,为恒生电子算法工程师提供统一的算法开发环境,实现大模型预训练、精调和推理测试的完整业务流程。对于千亿、百亿参数的模型精调,AIStation自动创建分布式训练环境,为大模型训练提供高效、稳定的计算环境。AIStation推理服务与恒生的模型测试平台实现对接,有效提升了模型部署和测试效率。借助AIStation平台,恒生电子加速了面向投顾咨询、投资合规、运营管理、客户服务等金融业务场景的大模型应用的开发和交付。
此外,浪潮信息分享了源大模型项目的开发经验,以及开源大模型的微调方案和实践经验,为恒生电子金融大模型LightGPT的预训练、微调提供了有力的帮助。
借助大模型智算平台,恒生电子加速了金融行业大模型LightGPT的开发与上线,模型训练和精调时间周期由数周缩短至数天。目前,LightGPT已完成国家网信办大模型算法备案,在客服、运营、投顾、投研等多个金融业务场景落地应用,助力多家头部金融机构实现了数智能力的进化。此外,恒生电子已联合20多家金融机构,共建LightGPT金融大模型以及光子系列大模型应用,并不断提升大模型的技术能力与积淀,助力金融领域业务形态和逻辑范式的革新。