未来的社会,是建立在信息上的帝国,然而信息在充满蓬勃活力的同时,也是敏感而脆弱的,这就使得“未雨绸缪、居安思危”成为现代成熟企业的重要准则,而这一点对于“社保”这类系统而言,更显得尤为重要。对于青岛市劳动和社会保障信息系统的副处长张帅来说,如何万无一失地保证业务系统的不间断运行让他一直颇为挂心,而赛门铁克的VERITAS远程容灾解决方案适时为他解决了这一问题。     
        据张帅介绍,关于社保系统安全与持续运行的问题,很早就列入了他们重点工作的日程表。青岛市劳动和社会保障信息系统采用了全市大集中模式,包括多个业务系统;同时,业务系统的数据流量、数据处理量和数据存储量也越来越大。因此,业务系统的稳定和数据的保护是否健全,已成为青岛市社会保障业务系统正常运行的关键。
        在考察了多家企业后,青岛社保的故障恢复和灾难备份系统等项目,最终花落赛门铁克公司。赛门铁克的工程师在最初接触项目时建议用户:备份容灾是涉及到众多技术以及众多产品的解决方案。因此性能、灵活性以及价格都是必须考虑的因素,需要根据用户的实际需求量身打造,而不是盲目选用最贵的产品。同时,应尽量采用先进而不是将要被淘汰的技术,毕竟冗余站点与生产站点一样会长期使用。
        从具体的项目需求来看,青岛市社会保障信息系统的故障恢复和灾难备份系统的建设要求采用应用级别的容灾方案,在系统建设过程中,不仅要考虑数据中心端的容错,还应该考虑对重要关键业务的系统进行异地容灾备份和对重要数据定时、实时备份。这样不但保证了用户的关键业务数据的不丢失性和高安全性,而且当面对生产中心发生意外灾难(如生产中心停电时间超过UPS保障时间1个小时)而导致业务中断时间过长等问题时,能将损失降到最低,同时保障业务运行的持续性。
       经过一系列的讨论和演练,最终确定青岛社保容灾系统主节点为青岛市劳动局的中心机房,目的是为了能够在灾难发生后,业务系统依然可以不间断地被访问,青岛市社保机关大楼还建立了一个备用系统,以便适时接管业务。青岛市社会保障信息系统数据中心与灾备中心之间采用专线连接方式,通过主机逻辑卷远程复制功能,实现数据的同步复制。
      数据中心数据库服务器采用双机集群配置,磁盘采用RAID技术提供磁盘镜像,并配备磁带库数据备份系统。当某一通信线路、路由器、防火墙、交换机、服务器出现故障时,相应的备份通信线路,以及冗余的路由器、防火墙、交换机、服务器便接管工作。而当数据磁盘出现故障时,可以采用RAID磁盘镜像以及数据备份系统进行数据恢复。
        灾备中心的业务数据库和应用服务器采用与生产中心性能一致的主机系统,进行单主机配置,磁盘采用RAID磁盘镜像。当由于生产中心的灾难造成数据丢失时,灾备中心则可以快速恢复生产中心的数据。
      为了能够监测应用系统的运行情况,并能够在灾难发生时实现应用系统从青岛市劳动局中心机房到备份中心的切换,青岛社保选用专门的VERITAS Global Cluster Manager广域网集群管理软件来实现多集群的管理和应用系统的容灾。GCM主要管理由青岛市劳动局和青岛市社保机关大楼两个节点组成的广域集群,集中管理广域范围的网管应用,并结合VVR做应用级的容灾,在青岛市劳动局和青岛市社保机关大楼之间做自动的或管理员确认的或计划内人工发起的网管应用切换。
      VERITAS的GCM还可以在青岛市劳动局和青岛市社保机关大楼之间建立心跳线以检测两地系统故障。一方面,一旦青岛市劳动局系统发生故障,GCM将自动或由系统管理员确认后手工将网管应用在青岛市社保机关大楼接管运行。由此保证网管系统的不间断运行。另一方面,对于计划内的停机情况,如青岛市劳动局机房的地点整体搬迁,也可以手工将网管系统切换到青岛市社保机关大楼运行,直到青岛市劳动局的新机房建立好后再将网管系统切换回青岛市劳动局。
      该系统投入运行以来, 运行正常, 性能良好。最终为青岛市劳动和社会保障核心应用系统提供了7×24小时全面的数据应用和安全保障。  

 

责任编辑:admin