首例大行核心数仓全面重构!某十万亿级银行携手长亮科技勇闯“无人区”
长亮动态
2025.02.20

银行业绩增长的元点究竟在哪里?


如果用“第一性原理”去解锁这个谜题,会在数字化转型这一“标准答案”下挖掘到更核心的要素——数据。从这一突破口一层层向上推演,会发现优质的数据仓库是银行释放数据潜能、驱动业务发展、精益经营管理的重要基石,而这也成为长亮科技找到的解题之钥。


然而,大行数据仓库由于涉及海量数据、架构复杂、数据链路长且影响范围广,其全面重构一直是棘手难题,被视为数据领域的“无人区”。不过对于银行与数字化转型服务商而言,突破“无人区”意味着能够开辟新赛道,抢占业内领先制高点。


某股份制银行与长亮科技,正在这样做。



2024年12月,由某股份制银行与长亮科技共建的“国内首例大行核心数仓全面重构项目”成功上线,各项技术指标圆满达到预期,为该行业绩增长叠上了“全场buff”。新核心数仓较旧版实现了四大飞跃:一是精简数据资产,精简幅度近二分之一;二是缩短数据链路,批处理作业加工链路层级缩短了一半;三是加速数据应用,绝大部分数据应用批处理作业提前完成;四是节省资源成本,核心数仓服务器CPU使用量和存储使用量都减少了四成左右。


回顾这一首例大行核心数仓全面重构的成功实践,不仅验证了该方案的切实可行性,更将作为行业标杆引领数字化转型,并加速这一升级趋势。


打破刻板印象,全面重构的举“重”若“轻”


世纪之交以来,国内银行业拉开了数据大集中的序幕,而数据仓库也在十余载后成为银行业的标配。至2022年,随着金融信创的全面推广,以及大数据、云计算、AI等新技术的大势所趋,数据仓库迎来了转型升级的关键节点。


与此同时,某股份制银行决定革新服役逾十年的核心数仓,以解决数据模型陈旧、数据资产冗余、数据加工链路过长等制约业务发展与数字化转型的瓶颈。对于该行而言,数字化转型是全行“一把手”工程,而数据仓库则是数字化转型的数字基建。该行首席信息官在动员会上特别指出,“核心数仓改造已势在必行,我们要做的,不仅仅是核心数仓的革新,更是要重塑本行数字化基建。


为了更彻底、长远的根治核心数仓淤积的问题,该行没有选择看似简单易行,但治标不治本的局部优化方案,而是决定采取短期成本高、业内并无先例的全面重构方案。


但核心数仓全面重构之所以未有先例,是因为这项数据基建工程“重”在三点:一是首创不仅无经验可循,还需要摆脱旧有系统的枷锁;二是复杂,需要自顶向下、由内而外进行全面革新,建设全新的数字底座、规划全新的数据架构、打造全新的数据模型以及构建全新的数据管理机制;三是艰巨,需要面对涉及面广、改造工作量大、数据关系复杂以及并行开展工作难度高等挑战。


 “重”任之下,该行以超常规的决策力度,高位推动项目落地。行方领导不仅牵头推进项目重点任务,更是全程参与资源保障、重大变更、长效机制建设等关键事项决策,保障项目有序推进。这种自上而下的组织决策机制,有效实现了跨条线的集约化管理和敏捷化组织协同,确保了这一重大工程在顶层设计、资源配给与实施节奏上的战略一致性。


在强有力的组织保障下,项目组探索出一条“化繁为简”的破解之道。在数仓实施过程中,项目组摒弃了传统的纯手工进度填报和管理方式,通过全范围、全过程、全工具化的线上研发管理,有效应对了改造范围广、人员多、流程长等挑战,使数仓全面重构从“迷宫探险”变成了“拼图游戏”,实现了复杂项目管理的举“重”若“轻”。


• 全范围:所有相关人员、所有改造数据对象全部由项目管理工具纳管;

• 全过程:项目实施过程中所有流程节点由TMO梳理项目实施标准流程,并制定每个环节的技术标准和具体规则;

• 全工具化:通过项目管理工具,打通与数据开发平台、元数据系统通路,最大程度融合重构流程与制度,落地技术标准与规范,减少人工操作。


其中,工具是项目最为关键的“加速器”。项目组研发了一整套支持重构辅助管理与迁移的工具,重构范围100%纳管,脚本自动化迁移成功率达90%以上,数据自动化比对验证覆盖率达100%,让应用迁移如同坐滑梯一样顺滑。


得益于行内高效的推动机制与创新的项目管理,这一首大行核心数仓全面重构项目比预期提前3个月完成打破了数仓全面重构又重又久的刻板印象,并在近两年的实施期间实现了零生产事件,成功在“无人区”点亮了绿灯。


坚持用户导向,精准发力的体验跃升


对于核心数仓的全面升级,项目组认为与其广撒网地点亮技能树,不如回归“第一性原理”,聚焦用户的核心需求。因此,新数仓的建设以满足“好用、高效、准确、持久”的关键需求为发力点,确保每一步都精准命中业务用户的实际痛点。


第一,让数据更好用、好找,是业务部门对数据仓库最直接的要求。


得益于项目组对数据架构与数据模型的有效重构,以及对创新技术的应用,新数仓实现了用数的全面体验升级。在数据架构上,核心数仓被划分为贴源数据区、全局共享区、应用专属区三大层,其中,全局共享区分为主数据、业务基础、业务管理三大板块,每个板块中的二级主题明确归属对应业务部门与IT团队,进一步加强业技融合。在模型构建上,项目组则采用了粒度建模、维度建模、范式建模相结合的建模方法,使数据模型既易懂又灵活,能便捷适配业务需求的迭代变化。


新数仓引入了先进的AI大模型技术,该技术以数据血缘关系为基础,通过直观的人机对话界面,能够快速为业务人员推荐最优数据模型并圈定数据范围,同时清晰展示数据加工逻辑,从而实现数据查找速度和数据使用效率的双重提升。


第二,新数仓做到了响应更快、更敏捷。这一升级体验是基于数据应用时效提升与需求交付周期缩短的双管齐下。


项目组通过全局共享区重构与应用集市迁移改造,将应用作业平均链路层级缩短了一半,并显著提升了80%以上的仓内集市数据应用作业时效,确保总分行能在每日早间营业前及时获取风险管理、零售业务等关键数据,为管理决策提供强有力支持。


此外,项目组还搭建了一套数据敏捷交付体系,实现共性数据的互联互通和共享复用,降低了应用开发难度,并通过自动化工具大幅缩短需求交付周期。例如,批发金融的数据类需求交付时长缩短了30%以上,能更敏捷地响应业务发展。


第三,新数仓将提供更准确、完整、一致的数据,有力赋能业务经营与管理决策。


面对数据重复、不一致等频发问题,如果只是像打鼹鼠游戏一样,发现一个解决一个,而不深究其根源,将无法实质性地提升数据质量。因此,本项目着重从源头来提升数据质量,通过发布主数据管理规范,回检并优化存量主数据,解决源系统与核心数仓间的主数据不一致问题,并建立常态化的质量提升机制。同时,项目组通过整合核心数仓数据资产,统一业务重点关注指标与标签,有效攻克了总分行间长期存在的“数据不一致”难题。


新数仓的应用让手工维护数据量大幅下降,数据准确性显著提升。以反洗钱为例,手工维护次数极大减少,交易对手机构数据信息项的空置率降低了一半以上。此前仅精确到省市的地址信息,如今已提升至更为精准的省市区级别。


第四,如果说好用、高效、准确是新数仓的突出亮点,那么长效的管理机制则为这一切提供了更持久的保障。


为了规范核心数仓的各项数据研发管理活动,项目组推出了一套长效管理机制,围绕“数据需求、数据架构、数据模型、数据开发、数据测试、运行监控”的六大核心管理领域,从“制度、组织、工具、管理”四大维度提供保障,确保数据架构和数据模型健康、长久。


打造业技融合,经验能力的沉淀内化


通过科技能力与业务需求的同频共振,该行在国内大中型银行中率先完成了核心数仓的全面重构,再一次成为行业领跑者。实际上,这一突破性成果的取得,不仅源于行内自上而下的有力推动,更离不开其对科技合作伙伴的审慎考量与精准选择。


彼时,长亮科技已成为金融数据领域的领头羊,其大数据业务已覆盖全球200余家金融客户,包括所有的政策性银行、八成以上国有银行及九成股份制银行。凭借在银行数仓领域积累的实施方法论、大型项目的丰富实战经验,以及在大行项目中被屡次验证的技术实力,长亮科技在众多金融科技厂商中脱颖而出,成为该行实现这一创举的最佳拍档。


在项目实施过程中,双方组建的项目组通过敏捷协作机制,将长亮科技沉淀的项目经验与该行深度业务洞察有机融合,最终实现了方法论创新与工程实践的双向赋能。而这场行业级攻坚战役,也让长亮科技数据团队在技术交付之外实现了能力升维,确保每个技术决策都能精准锚定业务价值。这些成熟的经验和能力,不仅将赋能国内银行业的数据资产管理,更将成为长亮科技大数据产品“出海”的底气来源。


依托国内市场的深厚积淀和技术优势,长亮科技面向海外市场推出了综合化+智能化产品——DataMind。该产品将数据研运、数据中台组件、数据应用场景、AI能力等有效融合,嵌入到数据体系的标准化实施工艺流程中,并预置数据湖模型,打造湖仓一体自动化流水线。在长亮科技成熟方法论、产品以及工具的加持下,将会有越来越多海外银行成为数据管理的创新典范,构建起前瞻、敏捷、智能化的大数据体系。


结语


在瞬息万变的大环境中,数据管理领域正经历复杂的变化与挑战,但秉持“创新求索”这一不竭追求,终究会获得持续领跑行业的“硕果”。这正是该股份制银行和长亮科技能够铸就行业标杆之作,不断引领银行业创新发展的内生力量所在。


让中国金融科技 具有世界影响力
长亮科技更懂如何为您的数字化转型赋能