这个交流问题目的是需要考察到以下几个方面,希望大家可以从这几个方面来进行交流探讨,谢谢哈。
(1)容灾和高可用应该如何设计以满足业务双活/容灾
(2)业务系统是否已经实现了应用无状态改造
(3)容灾需要在多大层度上需要依赖底层云平台的能力?(考虑现网的负载均衡方案,业务流量模型等如何设计)
信创云平台的技术选型,应评估其须支持同城多AZ(参考公有云的Region-AZ架构),这样可为业务的双活高可用设计提供支撑。
异地容灾需要信创云平台在异地城市单独部署一套。
业务应用系统的有状态数据宜规范用数据库、对象存储、统一日志平台等存储。在应用服务器侧,业务应用系统进行容器化改造为无状态应用,有利于降低运维成本,有利于实现高可用、容灾等业务连续性保障。
业务应用系统的容灾设计可细化为应用服务侧、数据库侧、网络流量侧。对南北流量的容灾切换,可用现网的L4负载均衡方案。云上的南北流量和东西流量,可用信创云平台L7层负载均衡服务。
收起1、银行最常见的容灾架构就是两地三中心架构,当然随着规模扩张,也有多地多中心的容灾建设。对于大部分中小银行来说,完成两地三中心建设可以满足大部分业务连续性要求。对于云平台来说,更多是云上应用自身需考虑借助F5或软负载等能力实现双活或主备机制,根据应用系统的双活\主备容灾方案,建设对应资源池提供资源支撑,不能不考虑应用双活\主备机制,把容灾完全交给基础设施去实现;
2、目前我行大多系统还是有数据存储或共享需求,这和银行系统特性有关;
3、目前我行容灾更多依赖应用系统自身双活\主备机制实现,现网负载均衡从稳定性考虑,以专业硬件厂商设备为主,云平台主要提供资源支撑以及虚拟机备份恢复等能力。
1、容灾和高可用设计以满足业务双活/容灾?
容灾和高可用设计是确保银行业务连续性的关键因素。为了实现业务双活/容灾,可以采用跨地域部署的方式,在不同地理位置建立多个数据中心,并保持数据的同步和一致性。可以使用数据复制和同步技术,以确保数据在多个数据中心之间的一致性。同时,需要设计并实施自动故障切换和容灾策略,以确保在一个数据中心发生故障或不可用时,业务能够无缝切换到另一个可用的数据中心。
2、业务系统是否已经实现了应用无状态改造?
应用无状态改造是指将业务系统设计为无状态的架构,其中业务数据和状态被存储在外部的持久化存储中。这种设计可以使应用系统更具弹性和可伸缩性,并支持负载均衡和容灾。如果业务系统已经实现了应用无状态改造,可以更容易地进行水平扩展、容灾切换和负载均衡。如果业务系统仍有状态或依赖本地存储,需要进行适当的改造和调整,以适应云平台的要求。
3、容灾需要在多大程度上依赖底层云平台的能力?
容灾的程度取决于具体的业务需求和云平台能力。云平台通常提供一些容灾相关的能力,如跨区域或跨可用区的部署、自动故障切换、负载均衡等。在设计容灾方案时,需要评估云平台提供的容灾能力是否满足业务需求,以及是否需要额外的容灾措施。这可能涉及到选择合适的负载均衡方案、网络架构设计、数据备份和恢复策略等。同时,业务流量模型也需要考虑容灾方案,以确保在故障切换时能够正确地引导和处理业务流量。
银行业信创云的整体架构设计应该考虑容灾和高可用、应用无状态改造以及与底层云平台的协同设计。根据具体的业务需求和云平台能力,可以制定相应的容灾方案,并确保业务在故障发生时能够快速切换和恢复。
收起(1)容灾和高可用应该如何设计以满足业务双活/容灾
业务双活包括数据库层、应用层、网路层以及基础架构层等多方面。信创云平台中本身具备网络层和基础架构层的双活功能,所以在云平台中业务的双活主要考虑数据库层和应用层两方面。
业务的容灾:可以通过云平台本身的复制技术,将生产集群的虚拟机复制到容灾集群中,当生产集群故障时虚拟机可以快速的在容灾集群启动;另外可以利用数据库本身的功能把数据实时备份容灾节点,一旦生产节点故障容灾节点可以快速启动数据库跟应用对接;最后还可以利用第三方的备份及CDP技术实现业务的容灾。
(2)业务系统是否已经实现了应用无状态改造
是否实现了应用无状态改造,这个跟每个行的应用特点有关,特别是一些核心应用很难做到完全的无状态化。
在云平台中如果应用所在的虚拟机出现问题或流量增多时,平台能够自动对应用进行迁移或进行水平扩展,保证应用的可用性,如果应用本身是无状态的,只要通过管理器将可用应用注册到网关,网关根据服务状态进行流量分流即可。
将有状态应用改造为无状态应用,可以采用将应用状态转移到其他专门负责状态的应用中。如Redis分布式缓存、外部持久化存储、使用管理中心来管理应用的配置、文件存储存储应用中的文件,使应用间能够共享等。
(3)容灾需要在多大层度上需要依赖底层云平台的能力?(考虑现网的负载均衡方案,业务流量模型等如何设计)
容灾在很大程度上还是依赖底层云平台的能力。底层云平台可以提供许多关键的功能和服务,可以帮助实现容灾策略的实现。以下是一些容灾中依赖云平台能力的方面:
监控和警报:云平台通常提供监控和警报功能,可以帮助您实时监控应用程序和基础设施的状态。这样可以及时发现潜在的容灾风险并采取相应的措施。
底层云平台提供了许多关键的能力,这是应用稳定运行的基础,在此基础上可以结合现有的负载均衡方案和业务流量模式来巩固整个架构的可靠性,但实施容灾策略还需要结合应用程序的需求和业务场景进行定制化的开发和配置。因此,容灾策略的实施通常是云平台能力和应用程序需求的结合。