双机热备
1. 概述
随着网络规模的迅速扩充,数据容量的大量增长,系统要求有更为完备的手段保障系统运行的高可靠性和系统交易的不间断性,用以对付类似系统崩溃,硬件损坏等意外情况的发生。系统需要一个支持各种应用、可以实时镜像、自动检测和切换的服务器容错镜像热备份工具。
双机热备是容错的一种表现形式,是一组被称为节点的计算机,对于网络的其他部分来说,集群内的服务器就像一个单一的实体,一个高可用的“虚拟”服务器,集群在检测到软件和硬件故障时,自动将数据和处理的服务转到无故障的节点,借此提高系统和应用程序的可持续运行。
当一个节点发生故障时,使用该双机系统的客户机可能发生两种情况:其工作活动没有受到任何影响或需要重新连接,具体取决与他们正在使用的资源情况。
当有故障的节点被替换恢复到正常工作状态后,这些资源通过人工干预或自动方式,将资源移交至原来的控制节点主机。
在双机容错系统中,应用系统的数据存放在一个被实时镜像复制的目录中。该目录被实时同步,类似于服务器内部的硬盘镜像一样。
服务器检测到主服务器的故障时(包括硬件故障、操作系统死机、关键进程停止等原因造成),开始切换过程,关闭主服务器的应用,并在从服务器上启动被保护的应用,切换过程自动完成,时间大约是15秒到180秒之间,具体需要看应用和数据库关闭/启动的时间。
由此可见,选择一种性能可靠的服务器和先进的双机软件,对保障整个系统的安全是至关重要的。如何在工作主机发生故障时,保障备份机在极短时间内接管工作机的工作,并且同时保证数据的完整性和一致性,是双机容错技术的两个主要的特点。
2. 方案建议
2.1方案综述
根据用户的实际需求以及应用环境等需求,我们建议采用RoseMirrorHA双机软件来组建高可用系统,方案结构如图:
|
|
|
|
双机容错软件采用RoseMirrorHA双机软件。该软件支持主从热备(Active/Standby)和对等双工(Active/Active)两种工作模式。在本方案中根据实际环境,我们建议采用主从热备(Active/Standby)工作模式。
在本方案中,采用两台DELL R720 PC服务器作为业务系统的服务器。每台服务器配置有2个千兆网络端口,连接到主干网络交换机。软件方面通过RoseMirrorHA for Windows 来保障业务系统的正常运行。
2.2方案描述
在本方案中,采用的软硬件设备如下:
n DELL R720服务器
DELL服务器配置为: 四核2.5GHz CPU,8GB内存,2块146GB高速硬盘组成RAID1磁盘阵列,3块1TB硬盘组成RAID5磁盘阵列。
对于依赖 24x7 可用性和关键业务应用程序的成长型企业或分支机构而言,DELL PowerEdge R720无疑是一个卓越的低成本解决方案。借助可选的功能,可以根据自己的需求来定制服务器(从基本的文件/打印服务器到功能强大的数据库应用程序服务器),从而节省时间和金钱。
DELL服务器具有速度快、稳定、可靠等优点,由于此方案中的DELL服务器均采用了四核CPU,可以极大地提高应用数据库处理速度,从而工作效率。
n 双机容错软件RoseMirroHA
双机容错软件采用了RoseMirroHA软件实现整个业务系统的高可用性。在正常情况下,主机运行业务数据库,备机作为备份服务器。在系统正常运行的过程中,主机和备机相互监控自身的状态,通过状态检查来判断整个双机系统的网络状态、存储状态、数据库状态和系统状态。主机将数据库的变化数据(包括删除、修改、增加),通过千兆专用镜像网络,实时复制到备机上。
当系统中的主机出现故障时(包括硬件故障、操作系统死机、关键进程停止等原因造成),备机通过心跳检测到主机发生故障,立刻接管主机的业务,从而实现了业务系统不间断运行。
宕机后的主机修复后,进入到双机容错系统中,作为当前双机容错系统中的备份服务器,主机会自动将变化的数据同步镜像到修复后的主机,保持两台服务器的数据一致,并监控所有生产服务器的运行状态。系统管理员可以在适当的时候通过人工干预方式,将属于原故障机的任务转移到恢复好的节点主机上。
RoseMirrorHA拥有多年运行成熟、稳定可靠的RoseHA的可用技术,以高性价比的实时镜像技术,为用户提供一个近乎不停顿的高可靠性系统。它以优越的性能将为您的关键业务数据和应用提供安全可靠的访问。防止主机因意外宕机造成长时间停机,以最低之成本提供用户零故障操作环境(nosingle point of failure)。
2.3系统特点
双机容错系统建立后,本容错系统具有以下特点:
1. 避免了单点故障;
对于采用共享磁盘阵列柜方式的双机容错系统,如果共享盘柜损坏,即使服务器不发生故障,仍然会导致停车场业务系统的中断。
本双机容错系统中,无需共享设备,将系统风险平均分散到两台服务器上,有效地避免了单点故障,从而真正提高整个系统的可靠性。
2. 支持业务系统达到24*7的运行模式;
由于双机容错系统的实现,可以保证集群中的业务不间断的运行。
3. 节省硬件投资、不用增加额外的共享盘柜;
由于共享盘柜式的双机容错系统,需要单独的磁盘阵列柜。RoseMirrorHA是纯软件方式的双机容错软件,不需要磁盘阵列柜,从而节省了硬件投资。
4. 系统扩展性好,增加新业务系统方便;
本方案目前采用主从热备方式,在未来可以新的业务系统,只需要做的就是修改RoseMirrorHA工作方式。
5. 易于维护管理;
基于Java的管理界面,直观、实时显示应用服务和系统相关环境的运作状态,功能表现清晰,对整个系统状态一目了然。还可以远程管理,方便快捷的配置向导。