一、引言
随着计算机技术的飞速发展,服务器技术也在不断地走向成熟,可以说服务器正在一步步担负起以前需要小型机甚至大中型机才可以实现的任务。目前服务器的技术热点主要有:IRISC与CISC技术、处理器技术、多处理器技术(AMP技术、SMP技术、MPP技术、COMA技术、集群技术和NUMA技术)、SCSI接口技术、智能I/O技术、容错技术、磁盘阵列技术、热插拔技术、双机热备份。
所谓双机热备份是指系统对主机及硬盘、通讯线路等核心设备,采用双机备份,当系统正常时主机进行工作,并且每隔设定时间系统自动检测,若发现问题,系统能够自动切换到备份机继续工作,保证不影响系统的正常运行。
由于计算机软件和硬件都会不可避免地发生故障,而这些故障都可能给企业带来极大的损失,所以对于现代企业来说,利用双机热备份系统来提供及时可靠的信息和服务已经成为保证企业数据安全的一种必要措施。
我们在新华制药集团INTRANET网络建设的过程中,考虑到企业数据的安全性以及企业生产的连续性等因素,针对其网络的拓扑结构,通过对市场上同类产品的反复比较论证,最终利用WINDOWS NT 4.0(PACK6)、ROSE HA、SQL SERVER7.0实现了ERP数据库服务器的双机热备份系统。
二、系统方案设计
1方案背景
新华制药集团INTRANET网络是基于千兆以太技术实现的一个大型企业内部网络。其主干网络采用千兆以太技术,低端采用百兆以太技术延伸到桌面工作站。整个网络大约连接500台以上的工作站和12台服务器,设计目标是保证ERP项目的实施以及实现对INTERNET的接入。其ERP项目由深圳金蝶软件公司负责实现,数据库采用SQL SERVER 7.0,操作系统采用WINDOWS NT 4.0(PCAK6)。而需要实现双机热备份功能的就是ERP项目中的核心设备——数据库服务器。
2系统结构分析
(1)系统模式
当前双机热备份系统在数据库服务方面主要有以下两种模式可供选择:
● 主机与从机所有设备完全独立,主机从机都有完全独立的数据库系统,从机的数据库系统提供对主机的时时备份,工作站在提交任务时,同时提交给主机和从机。主机与从机之间有心跳监测,一旦从机发现主机心跳停止,立即宣布接管主机。在接管过程中会有1分钟左右的宕机时间。
● 主机与从机有独立的操作系统与独立的数据服务,但是数据存放在同一个外部磁盘整列设备上。主机与从机的数据服务同步,主机与从机之间有心跳监测,一旦从机发现主机心跳停止,立即宣布接管主机。接管过程没有宕机时间。
我们考虑到新华制药集团生产过程的连续性最终决定采用第二种方案。共享外部磁盘设备采用ESCORT DA6000磁盘阵列。
(2)系统软件构成
● 操作系统:WINDOWS NT 4.0(PCAK 6.0)
● 数据库:SQL SERVER 7.0
● 双机容错软件:ROSE HA
(3)系统硬件构成
● 服务器:HP LH4服务器
CPU :奔腾智强(INTEL服务器专用CPU),双CPU
内存:512M ECC服务器内存
硬盘:RAID1/18G*2
● 共享磁盘设备:ESCORT DA6000磁盘阵列
ULTRA WIDE/ULTRA 2/FIBRE通道
支持并行I/O及命令排队
RAID5+全局备援/80G*5
(4)系统拓扑结构
如下图所示:
三、系统实现步骤
1.磁盘阵列柜的设置:
共采用5块SEAGATE 80G SCSI硬盘,其中3块用来做RAID 5,一块用来做RAID5的热备援,另外一块用来作为全局备援,这样就最大限度地保证了数据的安全。将磁盘阵列柜与两台HP服务器通过SCSI线连接起来。
2.操作系统的安装:
分别在两台HP服务器上安装两套独立的WINDOWS NT 4.0操作系统,然后安装PCAK6.0以及WINDOWS DATA ACCESS补丁。将本地硬盘划分为两个逻辑盘:C盘和D盘,将磁盘阵列柜上的共享磁盘作为E盘用来存放SQL SERVER数据。
注意:E盘上不允许安装SQL SERVER数据以外的任何资料,并且不允许文件回收站的存在,因为这会影响数据的共享。
分配其中任意一台为主机,主机名XHHOTSP1,另外一台作为从机,从机名XHHOTSP2.
在主机上安装两块网卡,其中一块作为私有网络直接连接到对方机器相应的网卡,用来监测对方心跳。该网卡加载TCP/IP协议,地址定义为10.10.10.1。另外一块连接到公共网络对外提供服务,其IP地址定义为192.168.0.10;从机上同样安装两块网卡,其IP地址分别定义为:10.10.10.2和192.168.0.11。
在两台服务器的COM1之间通过串口线建立连接(速率为9600bps)。
3.数据库的安装:
首先在主机上安装SQL SERVER数据库,在选择系统路径时选择将数据库系统文件安装在D:\SQL7.0路径下,将数据部分安装在磁盘阵列柜提供的共享盘E:\SQLDATA路径下;然后在从机上安装SQL SERVER数据库,同样将数据库系统文件安装在从机的自有磁盘D:\SQL7.0路径下,将数据部分安装在磁盘阵列柜提供的共享盘E:\SQLDATA路径下,将原来主机安装数据库时写入的数据覆盖掉。
注意,要将数据库服务的自动启动功能屏蔽掉。
4.ROSE HA的安装:
首先在主机和从机上安装ROSE HA程序,然后进入主机的ROSE HA监控程序,进行双机匹配设置:
● 通过串口监听对方心跳。
● 通过对方私有网络网卡IP地址10.10.10.2监听对方心跳。
● 双机间建立ALIAS共享服务,赋予XHHOTSP1和XHHOTSP2一个漂移的主机名XHHOTSP。
● 双机间建立VOLUME共享服务,赋予XHHOTSP1和XHHOTSP2一个共享的磁盘空间E,该磁盘空间由磁盘阵列柜提供。
● 双机间建立IP共享服务,将两台机器公共网络网卡192.168.0.10和192.168.0.11的IP地址对外屏蔽,用一个漂移地址192.168.0.50取代。
● 在上述共享服务的基础上建立SQL SERVER、SQL SERVER AGENCY、DISTRIBUTE TRANSANCTION共享服务,由ROSE HA来接管SQL SERVER的自动启动功能。
5.将主机、从机重新启动。
至此,双机热备系统配置完毕。该系统平时由主机对外提供数据库服务,从机处于休眠状态。从机通过COM1和内部私有网络随时监听主机的心跳,当监测不到主机心跳时宣布接管主机所有任务,并报警。
四、结束语
该系统可容忍磁盘阵列柜同时两块硬盘出现错误,在主机出现故障时从机可实现无时间缝接管,没有宕机现象的出现;在速度方面,磁盘阵列柜提供的ULTRA 2标准保证了对SQL SERVER数据的快速存取。通过容错测试和一年多的实际运行,证明我们为新华医药集团设计的ERP数据库服务器双机热备系统在安全、速度等方面完全达到设计要求。