分析和交流ICT行业最前沿技术,分享更多存储、服务器、数据中心、网络、软件定义和虚拟化等相关知识,旨在知识交流、开放共享和共同进步。
备份软件是为了增强企业关键数据可靠性和数据冗余性,那么备份软件自身的可靠性和可用性也直接影响着企业数据的可靠性。今天我们来探讨下备份软件的的系统可靠性和可用性。
备份介质可靠性
针对备份介质,一般备份介质都提供了路径冗余(SAN存储采用多路径)、卷镜像、快照和远程复制等技术,可以保证存储介质系统可靠性。但是对于备份介质来说,本身存储的数据就是冗余数据,在磁盘故障的情况,只需要保证有可用副本恢复以备份的数据就可以,采用远程复制等技术一般用在整个存储介质故障的场景,另外需要额外存储空间和容量,对客户而言成本过高。
备份介质(NAS或SAN设备)可以被多个MA备份介质使用,提供了资源利用率,然而,备份介质无法避免物理故障或硬件导致的错误,网络和存储设备都会出错,当存储介质设备发生错误,在没有进一步对备份数据进行保护时,就会导致了数据丢失。Simpana在提供了GridStor技术加强备份介质冗余可靠性。
介质服务器可靠性
针对介质服务器,Simpana在介质服务器层提供了GridStor技术,支持MA集群内的故障切换(Failover)和负载均衡功能(Load Balancing),增加了数据存取的高可用性。
当集群内MA故障或存储介质发生故障,备份业务将会切换到可用的MA和备份介质上,并且GridStor还支持跨越操作系统的环境和存储类型切换,如对Windows文件系统的备份作业,能从Windows的MA切换到Linux的MA上,用户并不需要知道数据到底在哪个设备上,数据在恢复时,系统会自动给找到需要恢复的数据。
另外,MA的并行并行去重能实现负载均衡和故障切换,确保性能的同时,增加了系统的高可用性。目前支持把2台MA组合起来进行去重,具体工作流程如下:
首先客户端选择MA(DataMover)发送数据到MA上生产指纹,并使用内部算法来选择哪个分区来执行指纹查找。如果所选的分区在另一个MA上,就通过网络在对应MA上进行查找。
如果查找发现数据已经存在,就只需要在所选择的分区中更新引用,在MA访问的装载路径上更新元数据指针,如果查找发现是新数据,就需要在所选择的分区中插入指纹,并通过客户端所选的MA备份数据到对应的存储介质中。但整个过程,在保证MA可靠性的同时,也做到MA间还是共享重删指纹库。
备份管理服务器可靠性
在整个备份软件系统中,备份管理服务器CommServe是Simpana平台中最核心的服务器,CommServe中含有重要的配置信息、安全设置、用户信息、许可证以及Tier1层索引,一旦这些重要的数据丢失,重建系统相当困难。
冷备份方案
针对备份管理服务器Comm Serve,Simpana自身也支持CommServe DR选项,当主CommServe故障时,可以通过CommServe DR服务器来启动备份任务管理,但是DR服务器是一种冷备份方式,数据不会自动同步,需要手动把对CommServe的备份数据恢复到DR CommServe服务器中。
首先在主备站点各部署一台CommServe (IP地址和机器名保持一致),通常情况下,备站点CommServe是关机状态。备站点提供一个文件共享空间,主站点的CommServe的Catalog库定期备份到备站点的文件共享空间中。
当主站点CommServe异常时,启动备站点的CommServe服务器。选择最近的一个catalog备份集,在备份站点的CommServe服务器上导入catalog备份集,导入完成后,备站点对外提供被任务管理服务。
高可用方案
CommServe DR方案是一个冷备份方案,恢复操作漫长,而且整个恢复过程都需要人为干预。为了提供Simpana自动化和高可靠能力,CommServe也具备安装在集群环境中的能力,如:微软MSCS集群上。MSCS集群在Widows 2012中就支持,而且在Simpana备份软件中就自带SQL server数据库保存索引和指纹数据。
针对CommServe集群MSCS/ MSFC部署,CommServe数据库(索引和指纹数据)的部署方式也分为2种方式:双阵列双活部署和单阵列部署。基于双阵列的集群部署,采用阵列的双活特性,在阵列层实时同步创建在SAN阵列双活卷之上CommServe数据数据(图中Master Server实际上就是CommServe服务器)。
基于单阵列部署方式,基于集群MSCS/MSFC软件特性保证数据互斥访问、数据一致性,在SAN阵列上创建卷分别映射给主备CommServe服务器,主站点CommServe服务器故障,业务将通过集群切换到备站点CommServe上运行。
双阵列双活部署可以防止CommServe服务器和CommServe数据库(SAN阵列)故障,单阵列部署只能防止CommServe服务器故障。在集群环境中,如果主备CommServe服务器要要跨站点部署,CommServed上的MS SQL集群日志文件对时延是有要求的(数据来自SQL server 2008微软官网)。
按照微软官方推荐,如果要性能最优,日志文件时间要<1ms,这个要求在跨站点部署的情况下不可能达到,一般在实践应用中选用<5ms,采用裸光纤SAN网络链路,当光纤距离>30公理,要加DWDM波分设备。
温馨提示:
请搜索“ICT_Architect”或“扫一扫”下面二维码关注公众号,获取更多精彩内容。