本文来源于:鑫智奖·2025第六届金融机构数智化转型优秀案例评选,作者:哈尔滨银行
哈尔滨银行:基于大模型金融机构数智化知识管理系统创新实践
2025-05-30 关键词:数字化转型,金融服务,大模型创新
5161
一、项目背景及目标
随着金融行业数字化转型加速,各机构面临海量非结构化文档治理难题。据行业调研显示,头部金融机构年均产生技术文档超50万份,但知识利用率不足35%。传统基于关键词检索方式的知识管理系统存在如下痛点,语义理解能力薄弱导致召回率低下,知识更新滞后造成维护成本高企,敏感数据外泄风险制约智能化进程。本项目创新性地提出“分布式大模型+智能知识管理”双轮驱动方案,通过本地化部署满足金融级安全要求,采用RAG技术实现动态知识更新,结合深度语义理解突破复杂场景应用瓶颈。技术架构设计重点攻克多源异构文档处理、检索性能优化、基础环境性能及稳定性等核心问题,为行业知识管理范式转型提供可复用的解决方案。
二、创新点
1.技术创新维度
1)采用“大模型分布式推理+知识管理流水线”融合架构,通过vLLM框架实现百亿参数模型在国产化硬件环境的高效集群部署,推理资源利用率达78%。
2)研发面向金融文档的动态分块算法,通过对RagFlow二次开发改造,使之深度融合MinerU智能解析引擎与动态分块策略,构建了面向复杂文档的智能分块体系。针对非常规复杂格式文档的特点,引入LlamaIndex框架实现定制化的文档分析和分块,提升分块的合理性及效率。
3)构建基于多阶段重排序的混合检索体系,通过混合检索双路召回与深度精排模型组合,实现金融领域查询MRR指标行业领先。
4)构建幻觉抑制体系。一方面,为控制生成答案的质量,配置拒绝回答阈值。当生成答案的可信度低于设定阈值时,系统拒绝输出答案,避免生成低质量或不准确的内容。另一方面,采用检索置信度评分、LLM事实核查双重验证、提词器控制等机制,相较于传统RAG方案,幻觉率降低了42%,有效提升了生成内容的质量。
2.应用创新维度
1)打造"知识即服务"新模式,通过API网关将各类知识库能力注入OA、ITIL等多个业务系统,统一接入与标准化接口,降低平台集成复杂度。

2)建设智能监控告警系统,基于故障事件智能关联处理方案,提升ECC故障排查处置效率。
3)构建批量作业调度事件智能化发现与处置能力,提升批量作业调度任务故障排查处置效率。
4)实现了文档数据的统一管理,该平台对文档的整个生命周期进行了系统化管理,不仅提升了文档的组织性和可访问性,还确保了信息的时效性和准确性,提升各类文档在存储、检索方面的便利性。
三、项目技术方案
1.系统架构设计
系统采用分层解耦的微服务架构,构建"数据层-算法层-服务层"三级技术栈。底层基于国产华为昇腾910B的模型推理服务集群,依托vLLM框架实现Qwen2.5-32B大模型的分布式部署,通过张量并行与流水线并行技术,将模型推理延迟控制在800ms以内。中台层集成经过二次开发后的RagFlow知识库引擎,强化了文档解析能力,可支持超过20种格式的文件,涵盖PDF、Word、Excel、PPT、图片以及影印件等金融文档的自动化处理,日均处理量达2000+文档。服务层通过Dify平台实现业务流程可视化编排,构建查询理解-向量检索-重排序-结果生成的完整服务链路。


2.文档解析技术
经实际测试表明,RagFlow自带的原生DeepDoc智能解析引擎在处理多层级嵌套的图文排版及复杂表格结构的PDF文档时,存在解析精度不足的问题,难以满足金融行业对非结构化数据的深度语义识别需求,基于此,亟需一种更优质的文档解析算法进行替代。经过对市面上常见开源文档解析引擎调研、分析、论证,最终确定了RagFlow集成MinerU的文档解析管理方案。RagFlow通过深度融合MinerU智能解析引擎与动态分块策略,构建了面向复杂文档的智能分块体系,在提升知识处理效率的同时保障了语义完整性。系统依托MinerU组件的多模态解析能力,结合OCR光学识别与版面分析技术,精准解构PDF、扫描件等非结构化文档的图文布局,实现对表格、公式、多栏排版等复杂元素的上下文感知。在此基础上的动态分块机制采用双层驱动架构,预设模板库内置学术论文、法律合同、财务报表等20余种垂直领域的分块规则,通过语义边界检测自动匹配文档类型。用户自定义模块则支持块大小、重叠比例、特殊标记保留等参数灵活配置,辅以基于Transformer的语义完整性评估模型,动态优化分块颗粒度。
3.检索优化体系
检索通过运用多路召回技术,结合关键词、语义以及知识图谱检索,实现全方位检索优化。同时,引入Raptor分层摘要技术,采用树状分层摘要架构,从块级总结逐步构建到全局索引,显著提升检索效率与准确性。此外,通过调整Rerank模型权重,对检索结果的排序进行优化,从而提高检索结果的准确性和相关性。最终由Qwen2.5大模型进行生成式结果优化,采用指令微调模板确保输出符合金融文本规范。
4.支持批量知识加载与知识库灵活挂载
在知识批量加载能力方面,RagFlow通过RESTful API体系提供了工业级数据管道支持。其核心知识摄取接口采用分布式任务队列架构,支持JSON/XML标准格式的多模态数据流式上传,单次API调用可承载百万级文档片段的批量注入。在知识库动态挂载层面,RagFlow基于API Token的弹性知识路由体系。每个知识库在创建时自动生成具有细粒度权限控制的访问令牌,支持通过HTTP Header进行动态绑定。这种设计使得单个推理接口可以实时切换多个知识源,为多租户和各类切换测试场景提供了原生支持。
四、项目过程管理
本项目采用全生命周期管理方法,围绕数智化知识管理构建的业务目标和技术特性,系统性推进各阶段工作。
需求分析阶段:通过深度访谈与场景建模明确业务痛点与功能边界,对用户需求进行了优先级排序,并组织了跨部门的需求讨论会,达成共识后形成了可衡量的验收标准以及明确的技术约束条件。
详细设计阶段:团队基于RAG架构特性开展技术选型论证,同步完成用户界面原型设计与交互逻辑验证,确保知识检索增强生成的响应效率与准确性达到要求。
开发测试阶段:采用敏捷迭代模式,搭建微服务架构下的知识管理核心引擎,通过单元测试、集成测试与压力测试三级验证体系,重点保障了向量数据库在高并发场景下的稳定性以及语义理解具备良好的容错能力。
生产上线阶段:上线过程中,建立自动化监控及健康检查机制,持续跟踪QPS、召回率等关键性能指标,确保系统稳定运行。
运维服务阶段:构建了智能运维看板,通过ELK日志分析系统实时追踪用户行为路径,持续优化知识抽取算法,同时建立用户反馈闭环机制,每季度进行知识内容质量评估,确保系统在符合金融监管要求的前提下,持续释放知识资产的价值。
五、运营情况
数智化知识管理系统严格遵循业务场景需求导向原则,在需求调研、方案设计、系统开发及测试验证等全生命周期阶段与业务部门保持深度协同,通过精准对接业务流程痛点与知识应用场景实现技术方案的精准落地。自今年4月正式上线以来,系统运行稳定,日均知识检索及调用量约1200笔次,业务连续性保障有效,获得了行内用户对知识获取效率提升的积极评价,同时通过建立常态化需求反馈机制持续收集具有建设性的功能优化建议,为后续敏捷迭代及服务能力升级提供了重要支撑。
六、项目成效
项目实施后,行内知识管理效能实现质的飞跃。在运营层面,技术文档处理效率提升4倍,知识库更新周期从周级压缩至小时级。ECC故障及批量作业调度任务故障排查处置效率显著提升,处置准确率从85%提升至95%,人为操作失误导致的事故减少80%。业务端数据显示,通过集中管理和快速检索各类知识文档,员工可以快速获取所需信息,减少了资料收集时间;通过对内部经验和知识的有效管理,避免信息孤岛,提升行内的知识管理能力,促进知识共享,推动了全行业务效率的显著提升和管理水平的全面升级。此外,系统建设过程中培养多名复合型AI人才,也为金融行业智能化转型树立标杆。
七、经验总结
项目的成功实施,使每个员工,都能生产知识,获取经验;每个管理者,都能统计知识水平,掌握组织成长;每个组织,都能沉淀知识资产,提升协作效率。本项目成功验证了“大模型+RAG”技术在金融领域的落地可行性,尽管大模型参数规模不断增长,但RAG在成本、速度和准确性上仍具优势,尤其适用于海量数据和垂直领域,具有不可替代性。三个核心经验值得借鉴:第一,知识管理体系建设需遵循“数据治理先行,智能应用渐进”原则,建立完善的文档质量管理体系;第二,检索效果优化需要构建"召回-排序-生成"的全链路评测机制,特别是在金融专业术语处理上需设计领域适配方案;第三,大模型落地需与实际业务场景结合,确保技术能更好的为业务服务。
未来规划沿着三个方向深化,首先扩展多模态处理能力,实现图表、录音、视频等非文本知识的统一管理;其次探索小样本持续学习机制,构建自演进的知识服务体系;最后在推动国产化生态建设方面,完成从芯片层到应用层的全栈技术验证。
本网站案例,除特殊标明来源的,版权归金科创新社所有,未经许可不得转载,否则将视为侵权,对于不遵守此声明或者其他违法使用本文内容者,本网站依法保留追究权。另,本网站部分案例、观点文章来源于网络素材,如有侵权,请邮件联系 fenglei@fintechinchina.com 处理!
特别提示: 本网站免费为广大金融企业提供IT选型咨询服务,详情点击 【 需求提交 】。
推荐阅读
更多
胡震:构建数字金融服务生态,探索数字化转型新路径
为贯彻落实《国务院关于全面推进乡村振兴加快农业农村现代化的意见》总体部署,全面推进乡村振兴,进一步加大支农惠农力度,有效支持当地畜牧业发展,切实解决畜牧经营主体融资难、融资贵及担保难问题。
金融电子化
胡震
2025-05-30
中信建投证券:基于AI大模型的多智能体技术在投顾领域的应用案例
该案例以大语言模型为核心,融合 RAG、Agent技术,构建“主 Agent+子Agent”架构,覆盖投顾全场景,包含个股分析助手、策略分析助手、产品分析助手。亮点包括:技术上实现知识可溯源与复杂任务规划;业务上赋能B端投顾效率、C端个性化服务;实施上分阶段落地,配套三级评测与合规体系;商业模式探索C端增值服务与B端技术输出。重点打造可信可控的智能投顾平台,推动证券投顾AI智能化转型,该平台服务于总部投资顾问,为行业首批实现案例。
鑫智奖·2025第六届金融机构数智化转型优秀案例评选
中信建投证券
2025-05-30
贵阳银行:写好“数字金融”大文章,赋能高质量发展新活力——“超级APP”体系打造
在全国大力发展数字经济,中央对数字金融高质量发展提出新要求,银行业全力推动数字化转型的背景下,贵阳银行聚焦零售线上渠道服务能力的全面升级,围绕“方便、快捷、吸引、依赖、获得”五大核心要求,整合零售条线流量,构建统一获客、统一营销工具,着手打造“线上场景+客户权益+金融服务”的“超级APP”体系,为客户提供触手可及的智能化、一站式综合金融服务。 “超级APP”作为贵州省内首批实现鸿蒙原生应用上架的城市商业银行应用,用户无论在安卓、iOS还是鸿蒙版手机银行上,都能享受到规则一致、体验一致的金融服务。
2024年度城市金融服务优秀案例征集活动
贵阳银行
2025-05-30
北银金科:金融操作系统智能化软件测试体系建设
智能化软件测试基于金融操作系统"五个统一"原则的系统设计,深度整合测试资源,构建全链路测试流程与资产复用体系,在保障系统稳定性的同时显著降低测试成本,形成可插拔的智能测试组件生态。
鑫智奖·2025第七届金融数据智能优秀解决方案评选
北银金科
2025-05-30
南京银行:AI应用探索与创新实践
近年来,伴随AI技术的快速发展,智能化为推动银行业务变革与数字化转型提供了全新动力,尤其在优化业务流程、提高运营效率、提升客户体验、强化风险防控等方面发挥着重要作用。例如,基于智能化的算法设计、AI技术广泛应用于电话银行、网上银行、手机银行等渠道,甚至在某些特定场景中,智能客服机器人已基本可实现对答如流。顺应这一趋势,南京银行在全方位强化AI布局的基础上,深入开展了数字员工营业厅建设实践,并终取得了良好成效。
中国金融电脑+
张银川 王桂庆
2025-05-30
国元证券:企业综合金融服务协同系统建设项目
国元证券通过建设企业综合金融服务协同系统,构建“场景+数据”营销服务体系,实现数据驱动->场景应用->业务一线的数字化支撑。实现对销售人员从拓客、展业到业务协同一站式支持,助力管理层进行有效的经营决策。 本项目在信创化、数字化、智能化等几大维度创新实践。在业务上,实现智能化的企业全生命周期管理与多端协作模式实现业务场景化适配。在技术上,融合低代码技术快速开发与微服务技术深度治理,并顺应国产化的创新实践。
鑫智奖·2025第六届金融机构数智化转型优秀案例评选
国元证券
2025-05-30
微信
咨询
微信咨询
扫码添加金科小助手微信号
咨询案例和解决方案相关信息
或联系对应机构