本文分享自天翼云开发者社区《云灾备场景》,作者:l*n *1、公有云灾备场景 公有云云上灾备能力建设: 1、容灾场景 -- 同城容灾演练(跨可用区) a.公共云形态:企业应用使用天翼云同地域的不同可用区搭建的同城容灾架构,保障容灾能力
b.应用级:企业希望对整体的应用做容灾备份演练,而非单独的数据库或存储
c.云上同城灾备:应对公共云上某地域可用区故障场景。例如:
1) 企业正使用的云产品实例不可用 2) 可用区的某产品的集群级别的性能衰减或不可用 3) 基础设置故障导致的整个可用区故障
d.容灾演练场景
1) 单产品级:LB,ECS,redis,中间件,数据库,对象存储等 -- 通过单产品故障注入来模拟 2) 应用级:整个应用链路的多组件出现问题 – 产品组合故障模拟 3) 机房级:机房级出现问题–入口流量模拟,VPC ACL模拟等
2、容灾场景 -- 异地容灾演练(跨地域) a.公共云形态:企业应用使用天翼云在不同地域部署两套应用系统(冷/温/热应用+数据),数据层面需要实现跨地域的复制,保障跨地域容灾能力。
b.应用级:跨地域的容灾更多的是应对地域级的灾备,因此容灾实现上更多是实现应用整体的切换,从网络接入层到数据持久层。
c.云上跨地域灾备:应对公共云上某地域故障场景。例如: 1)地域级故障,比如地震,海啸等
d.容灾演练场景 1)机房级切换:通过智能DNS或者GSLB来实现流量入口的切换
2、私有云灾备场景 私有云灾备能力建设: 1、容灾场景 -- 同城容灾 a.私有云/混合云:天翼云私有云部署同城双/三可用区形态
b.应用级:企业希望对制定的单体应用做容灾备份演练,而非单独的数据库或存储
c.产品、集群级:针对单产品,单集群实现容灾
d.机房级:针对机房级实现容灾,包括机房间断网,脑裂,孤岛,机房断电等场景
e.容灾演练实现方式: 1)单产品级:LB,ECS,redis,中间件,数据库,对象存储等 -- 通过单产品故障注入来模拟 2)机房级:通过对物理交换机操作实现机房级的故障模拟,比如通过AGW实现机房出口流量断开,通过DCI交换机实现可用区之间,或者跟仲裁节点之间的断网等场景 3)应用级:可以通过保护组(PG)的能力,来实现小范围指定应用的容灾演练
2、容灾场景—异地容灾 a.私有云/混合云:跨异地region形态,来实现两个region间的容灾能力
b.应用级:针对制定的单体全链路应用做容灾备份演练。
c.地域级:针对地域内的机房断电,断网等场景
d.容灾演练实现方式: 1)应用级:通过GSLB、智能DNS来实现应用的跨机房切流操作 2)机房级:通过对物理交换机操作实现机房级的故障模拟,比如通过双TC区的AGW实现机房出口流量断开模拟region级故障