|
客户简介
中华人民共和国国家统计局是国务院直属机构,主管全国统计和国民经济核算工作。
目前国家统计局已经建立了以国家为中心,覆盖各个省、直辖市、自治区、县的网络系统。其中骨干网络包括31个省、33个重点城市的64个节点,骨干网络带宽提高到了384K,并在网上开展了一些重要的应用。如电子邮件系统、办公自动化OA系统、WEB服务、统计数据处理及传输、VOIP等。另外还有两个非常重要的系统,全国5000家工业直报系统和3000家房地产指数直报系统。全国5000家工业直报系统中的5000家工业企业的产值占全国年GDP的80%以上,他们每月通过计算机网络将数据进行报送,专业的部门进行数据分析和处理。全国房地产指数直报系统,每个月对国内3000家会员单位的房地产景气指数进行调查,他们每个月通过网络上报数据,国家统计局通过专业分析定期发布每个月的国房指数。
客户面临的问题和挑战
信息中心网络部负责维护统计局的网络和系统环境,需要向包括经济普查业务在内的统计系统业务和支撑业务提供安全、稳定、可靠的运行环境。其维护工作涵盖了网络设备、主机、线路、数据库、安全系统等种类繁多、数量庞大软硬件基础设施。对于监控系统和服务管理系统也已经有了基础建设和操作使用经验。
这些基础设施的建设来自于多年来大大小小的许多项目,资源信息分散和记录的不完整给运行维护工作带来了很大的困难。
除了对提供高可用性和高性能要求的挑战外,应对人员管理的挑战也是一个重要的课题。网络部目前的维护人员和管理人员目前只有10余人,多数人员都是身兼数职,如何在有限的资源配置情况下提高工作效率,完成工作目标是长期管理中需要考虑的实际问题。另外,解决人员流动所带来的影响也越来越迫切。
解决方案
方案设计
为了帮助网络部解决上面提到的这些问题,基于对国家统计局IT环境现状及管理需求的分析理解,借鉴ITIL理论及最佳实践,结合神州泰岳的IT服务管理模型,我们设计了如下的解决方案。
国家统计局运维管理系统框架
运维管理和资源分析系统不是简单的管理工具的堆砌,它是一个有机的整体,紧密结合管理流程、人员和管理工具,通过规范的管理流程、先进的管理手段,实现集中的、全面的管理功能,提升管理水平。
国家统计局运维管理和资源分析系统采用的三层管理模式,而面向业务/服务的应用系统监控管理是这四层的核心,将作为主线贯串其中。
项目分成三个子系统:监控系统、服务系统和报表系统进行规划实施,在项目执行过程中,按先后次序,依次启动。这样使得监控系统尽快到位,并发挥作用,使得运维人员能从日常的工作中抽出时间,参加服务流程系统的规划和实施。报表系统在前两个系统开始一段时间后展开,使得客户对前两个系统有比较充分的了解后,可以提出更加符合实际要求的报表需求,也可将后续的修改要求降到最低。
功能与特点
深化系统监控,提高反应和处理能力
(1) 通过对各类事件的分析、整理、过滤,只将最终需要的信息通知相关的维护人员和主管;
(2) 同时,通过对事件影响范围的定制,将受影响的业务服务图示出来,帮助服务人员判定问题的严重程度和影响范围,提高反应速度。
服务管理视图
建立服务台,向客户提供统一的服务接口:
公示网络部门的服务目录和客户服务呼叫流程,对于重点客户进行服务呼叫的推广培训;
高效的突发事件管理流程,能尽快将服务恢复为正常状态,将对业务的负面影响降为最低,确保服务质量和可用性满足要求
(1) 流程设计中不仅考虑到服务事件的升级,还为多人协同工作时设计了相应的协作方法和过程。
(2) 在实现主要服务流程外,还结合监控系统的消息通知,实现了服务流程的自动传递。
(3) 对于一些受行政或业务影响不能进入相应服务流程的事件,开辟了另外的处理通道,实现了特殊事件处理流程。
统一配置管理
(1) 建立了完整的配置管理数据库,不仅记录了软硬件基础设施和机房环境设施(UPS、机柜)等实体信息,还记录了设备信息之间,以及与管理信息之间的关联性,这些管理信息包括组织信息、人员信息,以及设备位置信息等。可以很容易地获得目前IT基础设施的准确信息。
(2) 通过配置管理流程,以流程和制度的方式保证了在操作过程中的授权、审计、跟踪、记录,以保证配置信息记录与实际环境的一致性。
数据分析量化服务质量
(1) 通过对系统信息的统计和分析,能够及时了解到指定时间段内IT系统的运行状况、存在问题及潜在问题,辅助用户对于IT系统的改造工作进行决策;
(2) 通过对服务管理信息的统计和分析,能够了解当前自身的服务能力,发现近阶段的服务质量趋势,同时对于个人服务数据的详细统计,能够提让部门领导准确了解到个人服务能力信息,进而可以通过培训、人员调配等方式,加强服务提供能力。
服务质量与人员绩效报告示意
总的说来,随着运维管理和资源分析项目的实施,系统维护人员已经很少像救火队员一样,每天忙于解决各种突发问题,IT环境变得越来越可控,来自业务部门的抱怨也越来越少,人员的效率在不断提高。运维管理人员可以专注于认证分析以前发现的问题,并找出根本原因。
应用效果与收益
国家统计局负责运维的领导认为:通过此次项目的实施取得的突出成果有——
通过配置信息的统一管理,可以随时了解每台设备的各种详细信息,如使用情况、维保情况等,提供各种分析报表给各级领导做决策时使用。
监控系统的预警信息确实帮助避免了可能对业务系统造成的影响。
以前由于人员流动所带来的困扰,随着标准化流程的实行,得到了较好地解决。
对资源使用情况的监控和分析,为将来业务系统改造或新系统上马,提供了宝贵的数据资料,为投资决策提供支持数据。
针对业务应用的监控,用户感觉这是一种较新的监控方式,可以做到事件发生时,能够准确定位对关键应用的影响以及影响程度。
|