3月25日,在2023年首期 Techo Day 腾讯技术开放日上,腾讯云以“信息系统迁移的难点及突破”为主题,聚焦金融核心系统的迁移,首次公开其在银行、证券、基金等多个行业客户核心系统迁移过程中的具体实践和诸多细节,通过对具体案例的深度拆解和复盘,为金融领域开发者带来极具参考价值的干货分享。
马鹏玮:数据库及应用系统迁移的的难点及工具选择
由于金融机构对业务连续性和数据准确性的严苛要求,金融核心系统一直是业内公认的最复杂、数据最庞大、迁移难度最高的系统之一。活动伊始,中国信通院云大所大数据与区块链部副主任马鹏玮作为特邀嘉宾,就金融行业数据库及应用系统的平稳高效迁移分享了观点。他认为,从数据库迁移的实施工具来看,需要包含在线迁移、旁路迁移、增量迁移等多项功能,也包含一体化、高性能、特殊场景迁移、系统画像能力等能力和特性。但是,考察迁移工具最核心的价值点,主要是减少人工干预的易用性和适配大多数现有技术路线的开放性。他预计预计随着迁移工具的易用性和开放性竞争,会让迁移工具逐步收敛,变成只有三到四种方案,而迁移工具也会更加通用化。
在技术架构与原理分享环节,腾讯云技术团队的几位专家成员现身说法,就腾讯云在银行、证券、基金等行业的多个实践案例,与广大开发者们分享了金融核心系统迁移的具体解决方案。
田清波:金融核心系统基于TDSQL的分布式改造
由于传统技术架构存在着诸多瓶颈,加之新技术带来的持续业务创新,金融行业向数字化、分布式转型已成为必然趋势。对此,腾讯云资深数据库专家田清波详细解析了某商业银行核心系统分布式改造的案例。
该核心系统以关系型数据库Oracle等传统集中式数据库为主,MySQL、PostgreSQL等为辅。这一架构软件层存在较大的依赖性,且维护成本高,创新能力受到底层服务框架的极大制约。而且由于核心系统的建设与迁移涉及到许多历史系统和核心会计账簿,加之银行业务每天同时还在高速发展所以迁移过程必须实现客户零感知、体验零受损且灵活且富有弹性。
他介绍,大型银行因为多IDC部署,需要做多地多活、风险容灾,单元化可以实现“故障域可控”、“流量自包含”的可隔离;突破基础设施限制的易扩展;支持灰度发布、流量灵活调控的促敏捷以及多地多活的高可控。中小银行如果只是单个IDC数据存储,账户数较少,采用微服务架构性价比更高,架构管理也更为简单。
在本项目中,通过单元化迁移模式,实现了信用卡系统支持10亿级交易账户和 10亿级日交易量的目标,基于全球首创的交易不中断切换模式,保障了快捷、顺畅的支付体验。同时在成本方面,根据实际的测算,以5年为周期,新核心系统相比老系统成本节约近70%,节省费用超10亿。
张晓宇:使用3AZ部署架构实现的同城多活全栈私有云平台
针对专有云的应用,腾讯专有云领域专家张晓宇以某银行为例,介绍了使用3AZ部署架构实现的同城多活全栈私有云平台的实践。张晓宇认为,银行客户在建设信创基础设施时,最关注的需求包括一云多芯,即提供混合部署与调度能力,按需在同一个云内投放CPU、操作系统、数据库等多种类型架构的云资源池,包括海光、鲲鹏、飞腾、X86资源等;其次需要关注的是一体化管理,即通过一体化的云管理平台来整合银行正在使用的不同类型云平台及产品,让IaaS及PaaS产品之间深度融合及配置联动,避免传统私有云的多个产品之间的管理、维护的割裂;再次是统一调度和运维,实现计算资源池、存储资源池、数据库资源池超大池化,用以快速、动态地整合与调度分配资源,同时内置各云产品的日常监控、故障处理、扩缩容、版本升级等产品化能力;最后是高可用。对RPO、RTO要求极高,需要容灾能力强、未来能够支持扩展为多地域的架构,目前,通过3AZ架构,腾讯专有云TCE可以做到RPO=0,RTO分钟级。
借助腾讯云全栈云平台TCE以及云原生敏捷PaaS平台TCS,该银行客户可以实现用户态的多AZ集群,能够解决双AZ下的自动切换问题,同时,存储/数据库在采取1+1+1副本部署之后,能力更优而且成本更低,平台基本可实现AZ级故障时的免切能力,仅少数产品场景下需要人工介入。
陈俊:TCE 支撑银行系统横向扩容及统一池化服务
腾讯专有云云原生基础设施负责人陈俊带来了TCE 支撑银行系统横向扩容及统一池化服务的分享。基于金融科技输出的战略背景,某银行启动了行业领先的生态云平台建设工作,希望建立和完善大数据云技术能力和服务体系,更好地服务银行业务发展和金融科技转型。因此需要云平台架构支持云原生多租户,统一弹性资源池,完全面向用户的自服务能力;在技术能力上,要求以云平台为核心,结合云大数据处理能力,让数据通过云无缝流动引领新的业务方向。
腾讯云通过全栈云平台TCE同城高可用容灾管理组件以及云原生技术栈,包括建立与完善大数据云技术能力与服务体系,这其中包括多租户、弹性资源等四项对外服务能力和数据获取、处理等四个重点技术方向等。还针对行内采购的多朵 TCE 云,可能对行内内部多个业务部门使用不便利的隐忧,开发多云管理平台,统一对接 TCE 标准化外部登录与权限系统,使对外体验一致。
该项目上线后在效果上实现了规模上量和降本增效,当前规模已达到 10+朵云,15+个数据中心,50K+ 设备规模上量,同时涵盖各类异构硬件;向上赋能各子行业,每年数亿成本节省以及营收。
杨文龙:通过云原生大数据工具实现存量平台快速迁移及升级
腾讯云高级大数据架构师杨文龙以某股份制银行与腾讯云达成的大数据联合创新项目为例,详细介绍了云原生大数据工具实现存量平台快速迁移及升级实践。该项目目标是验证在国产化软硬件条件下,存算分离的云原生数据湖架构是否可以支撑银行未来3-5年的数字化发展,是否比原来的架构更具弹性、性能更好、总体拥有成本更低。
在本项目中,针对大数据组件多、国产化适配困难,Hadoop体系与MPP体系无法打通融合计算,搬迁成本高等难题,腾讯云携手对方技术团队,基于腾讯云TBDS大数据平台及其相关工具组件,创新性地运用Alluxio、Iceberg、Presto、Spark、Flink、SuperSQL等新兴大数据能力组件构建起物理存储、容器计算的新一代国产化存算分离数据湖架构,并且借助Alluxio加速层对Presto的查询过程进一步优化实现数倍性能提升。
以某基金项目为例,该客户原有CDH大数据平台架构老旧,存算组件功能及性能难以满足业务需求,同时内部多源异构数据未形成统一归集库,急需实现大数据基础设施全信创化,替换现有平台。借助腾讯云TBDS大数据平台及WeData一站式数据开发平台等组件打造的新平台,通过WeData敏捷数据集成开发能力,有效打破内部数据孤岛,汇聚全域数据,提升开发效率。融合TBDS互联网基因开源组件增强能力,提升存算性能,跑批时间由7个小时缩减到3个小时内,3个月实现了CDH数据平滑迁移,满足自主可控需求,同时支持营销中台及TA系统大批量核算,快速变现数据价值。
杜震:如何在CentOS停服后快速迁移到TencentOS Server
针对备受行业关注的CentOS停服事件,腾讯TencentOS产品架构师杜震给出了基于TencentOS的应对方法和具体实操详解。在停服后,客户面临生产环境安全风险激增,系统运维难度增加,最主要的是业务软件对OS的一些特殊需求更加难以满足。对此,腾讯云的应对方式是建议客户将业务从CentOS迁移到TencentOS Server上面来。TencentOS Server的内核基于社区 LTS独立演进全面优化,同时TencentOS Server用户态与CentOS同源兼容。从兼容性、稳定性和性能三个方面实现完美替代:宕机率低70%+,典型场景性能高50%+。
该国有大行携手腾讯云,基于TencentOS,逐步把核心系统迁移到新系统上,涉及基础硬件、操作系统、中间件、数据库、云平台5个核心模块,日均交易量超过1 亿笔。
动手实验室 让开发者在实践中检验实效
值得一提的是,随后的“动手实验室”活动环节还进行了国产化系统的现场实操实验。腾讯TencentOS 产品架构师杜震作为该环节主持人,基于“离线任务绝对抢占”“离线压制水位线”“网络带宽优先级抢占”等三个在/离线混部高性能功能实验case,展示了TencentOS RUE 内核的优异特性,带领现场的开发者们进行了一堂极具实操价值的公开实践课。
未来,腾讯云将继续通过Techo Day平台与广大开发者携手,以真实行业数字化转型升级的核心痛点为抓手,全面分享腾讯云在助力客户打造国产化信息系统过程中的实践和经验,为相关从业者提供更多有价值的案例和参考。
本文来源:财经报道网