新闻中心

Resource Center

云时代下的企业灾备建设思路

/ 2018-05-24

 越来越多的行业用户选择利用云计算技术构建自己的数据中心,但业务集中、数据集中的同时,也意味着风险的集中。


    一旦发生数据中心人为误操作、网络故障甚至灾难时,企业及分支机构将无法对外提供服务,甚至关键数据也会丢失。

从GitLab事件看企业灾备现状


    去年,全球知名的开源托管服务平台GitLab数据丢失事件可能大多数人还印象深刻,因为缺乏完善的灾备方案,人为误删数据库致使系统宕机,并且长时间无法恢复。庆幸的是,运维工程师利用一次偶然产出的LVM快照,使数据得以恢复到6个小时之前的状态,但中间丢失的那部分数据对用户的潜在影响是无法用数字衡量的。


    事实上,缺失灾备方案的并不只有GitLab,诸多企业均存在类似的情况。由于成本和技术等原因,企业只应用传统的本地备份方案,并且通常只针对企业重要的业务数据(数据库、电子邮件等)进行备份,而不对操作系统及应用程序进行备份。故障发生后,需要耗费大量的时间在备份文件的导入恢复和配置上。业务恢复周期长、操作复杂,很多企业在做了灾备方案后,却束之高阁,无法应用。


    因此,如何以更高的性价比实现企业业务连续性,平衡风险、效率与成本,是当前企业用户的迫切期望。


企业灾备建设需要“因地制宜”

    不同类型的风险其影响程度、发生概率和造成的损失大小是不同的, 在讨论企业灾备建设方案之前,可以将企业各信息系统所面临的风险因素、概率、影响和应对手段进行分析,以便于企业根据风险的抵御能力以及应用系统的重要程度,评估如何采取相应的灾备措施来减低各种风险和威胁可能带来的影响和损失。



企业信息化风险评估与应对措施

    根据上面的分析,基于不同的风险抵御能力,灾备的建设分为两个维度、四个层次:

- 数据维度(本地、异地)

- 业务维度(同城连续性、异地连续性)


    企业应用云计算技术之前,灾备的建设更多还是解决数据层面的问题,主要是利用传统存储设备的数据复制特性,由存储设备统一完成上层业务(包括数据库系统)的跨地域数据复制。但因为技术绑定和所有业务系统共吃一个”大锅饭”的原因,建设成本高昂,灾备效率不高,兼容性和数据一致性也存在一定的风险,并且由于只是数据级的复制,依旧无法解决数据备份和业务恢复复杂度高的问题。


    那么,如何应用云计算技术解决这些问题,并且构建业务维度的灾备体系呢?


建设以云计算技术为核心的业务连续性灾备架构


    首先对云计算技术进行定义,参考目前大型互联网公司,例如Google、Facebook、阿里、腾讯的基础设施架构和应用架构,我们认为下一代IT架构应该具备基础设施超融合、应用系统集群化两大特征。云计算技术就是支撑这两大关键特征的平台技术,例如分布式、虚拟化、应用编排、流量分发等。具备这样技术能力的数据中心可以称之为云数据中心。


其次,在数据中心领域,通常会从两个方面去考虑业务可用性的实现:


    1)重新定义数据中心架构,尤其针对传统集中式架构的业务系统,例如传统ERP系统。此类系统非常关键,架构无法轻易变动,需要在基础架构层面去实现高可靠和高可用。


由于云数据中心的超融合基础架构本身就具备高度容错能力,以我们企业级云的超融合基础架构为例,基础架构支持数据多副本、数据持续保护、虚拟机HA、支持数据库集群化部署等多种高可靠机制。因此,对于此类传统业务的业务连续性,重点考虑的是业务跨站点数据复制和业务切换的设计。


    2)重新定义应用架构,使之具备分布式能力,通过应用层集群和流量分发技术构建业务双活,甚至多活能力,同时基于云计算资源池化、统一编排等能力,资源调配可以非常灵活,扩展也会非常容易。


    因此,我们认为云数据中心灾备建设的核心在于如何构建一个弹性安全可靠的基础架构去支撑分布式的业务集群,如何基于业务要求选择合适的数据复制方式,如何对多个数据中心进行业务和流量感知,如何在出现故障时能够统一地进行灾备切换。


    由此,得出了以业务连续性为中心的云数据中心灾备参考架构:



    首先,云数据中心通过超融合基础架构以软件定义的方式进行构建,超融合实现了物理拓扑的架构极简,硬件上只有x86服务器和交换机,所有的资源承载节点都是x86服务器,所有的网络通道都是以太网络,包括其中的存储网。超融合基础架构本身就具备高度的容错能力,例如虚拟存储的多副本机制、虚拟机HA、虚拟负载均衡等。


    其次,在参考架构中设计全局负载均衡和服务器负载均衡,对多个数据中心进行业务感知与流量分发,可以根据不同的性能需求选择用物理方式或者虚拟网元方式进行部署。基于负载均衡实现数据中心流量切换智能化,出现故障时能够统一进行灾备切换。


    数据中心数据复制路径基于IP网络,很容易实现通道冗余,降低成本,基于虚拟化环境的副本同步机制,从基础架构层面保证数据可靠。针对结构化和非结构化数据特点,采用独立的数据复制方式,并进行统一管理,高效低成本,也避免了单一基于底层存储复制技术的技术风险。通过评估业务对连续性的要求、分析数据中心间的网络状况等因素,合理选择同步或异步方式实现主备或双活。


    这样的参考架构,更容易实现应用高性能、高可用的目标,降低IT投入成本,同时也可以平滑支撑应用架构的演进。


写在最后

    灾备建设是一个复杂的系统工程,我们云IT秉承简单、稳定、安全、易用的产品宗旨,以业务为中心,融合多种灾备技术到企业云管理平台内,提供了面向海量虚拟机备份的数据备份、面向关键业务的持续数据保护、异地灾备、VMware灾备、公有云灾备等多个解决方案,用户可根据自己的业务特点,灵活地选择合适的灾备方式。


    在不远的将来,我们企业级云平台将内置灾备云服务,已经使用我们企业级云的用户可以像使用苹果手机iCloud服务一样轻松享受灾备服务,将关键业务的关键数据一键式备份到云端。


    我们除了提供自身产品的完善灾备解决方案外,还与业界优秀的厂商进行生态合作,对Veritas、爱数、火星高科等厂商的灾备产品都进行了兼容性测试或认证,消除用户的后顾之忧。


关注我们

2018-2020 德州网安信息技术有限公司 版权所有 备案号:鲁ICP备17032094号-1

鲁公网安备 37149202000538号