您好,欢迎来到知库网。
搜索
您的当前位置:首页信息化建设解决方案之运维篇

信息化建设解决方案之运维篇

来源:知库网


随着组织信息化建设的不断深入,信息化的重点从 IT 建设转向 IT 运维,IT 运维难度

不断增加、 IT 运维成本不断上升、 IT 运维服务水平参差不齐、突发事件频繁发生给 IT 管理者造 成为了一定的困扰,那末根源是什么?

随着 IT 建设的不断深入和完善,计算机硬软件系统的运行维护已经成为了各行各业各 单位领导和信息服务部门普遍关注和不堪重负的问题,据统计, IT 运维服务占到 IT 部门工 作量的 80%摆布。国内企事业单位的 IT 运维普遍存在以下现象:

IT 运维服务人员工作的一个普遍现象是“很忙碌,坐不下”,每一个 IT 运维服务人员都 很忙碌,到处在各个业务部门间解决和处理问题,就像“救火员”。虽然如此忙碌,但业务人 员还是时常抱怨“找不到人”、“解决问题太慢”等等。 IT 运维服务人员的工作始终得不到 业务部门的认可, 而且工作量也难以量化。 运维或者信息部门作为单位的业务支撑部门, 在信 息系统的战略规划项目立项等工作中话语权较弱, 更谈不上决策权, 往往是项目建设完成之 后才介入系统的管理和维护,等到发现问题为时已晚.

随着组织信息化的不断投入,组织的硬件设施、软件系统不断增加,软硬件设备的增加 在一定程度上增加 IT 运维的复杂性,包括各类开辟系统、各类应用架构、不同品牌厂商设 备等等,需要不断增加人力投入, IT 运维成本居高不下。对业务连续性要求较高的单位, 系统一旦宕机损失是巨大的,运维部门压力可想而知.有的单位由于缺乏系统的资产管理, 运维部门很难准确了解公司到底有多少 IT 资产,公司是否需要购置新机也缺少数据支撑. 在年底审计时全团队奋战多日才干完成单位的 IT 资产清查工作,然而来年又会因为设备报 废,或者员工离职而发生不少变化,还是无法做到实时掌握准确数据。

大多数时候, 运维人员都在进行着简单重复的工作, 且很难得到最终用户的肯定, 他们 私下用“碌碌无为”、“穷忙族”来形容自己,人心涣散,自我认可度低,团队人员流动率较 大. 情况往往是某人好不容易成为熟练工了,却因为看不到职业前景或者感觉不受重视而提出 辞职.这些中坚力量的离职,会造成客户满意度和运维质量相当长一段时间内浮现波动。

IT 运维服务外包存在一定风险,关键在于对于 IT 运维服务外包供应商的管理不到位, 具体体现在招标环节疏于审查、 过程监督环节疏于监管、 以及事后评价环节疏于考核。 通过 在招标环节加强对供应商资质、 能力水平、 案例等考察可以有效包括准入关; 通过在服务过 程中加强监督可及时发现供应商服务提供能力的异常;通过事后评价可以建立供应商的退出 机制,保证供应商提供优秀的服务。

从以上现象可以看出,IT 运维服务的所有问题的根源都不是技术问题,而是管理问题, 包括流程管理的问题、评价管理的问题、应急管理的问题等等。主要包括:

IT 运维服务管理方式包括自营管理和外包管理, 随着 IT 系统复杂程度的增加,对于 IT 运维能力的要求也越来越高, 自营服务的成本已远远大于外包服务的成本, 在某些非关键的 领域,应该引入 IT 运维服务外包这一创新管理模式以降低服务成本,同时将组织自身的 IT 运维人员出来,做更有价值和意义的工作。

IT 运维服务人员很忙碌却得不到业务部门认可的根本原因是双方缺少IT 运维服务沟通 的基本语言, 也就是 IT 运维服务管理规范不明确, 导致业务部门对于 IT 运维服务部门提供 哪些服务不清晰、提供服务的流程不清晰、对于服务的评价指标不清晰,同时也导致IT 运 维服务人员工作职责不清晰、人员间工作交接不顺畅、服务过程缺少监督等。

人员管理问题, 根源在于运维工作分配不合理,业绩无法考核.若将运维人员分成一、二、 三线支持, 不同运维人员各司其职, 能使有限的运维力量得到合理利用, 整体工作效率将明 显提升; 同时也方便对各自的工作业绩进行评估。 再据此制定相应奖惩措施, 或者针对不同岗 位提供不同服务技能培训, 亦能提高员工工作积极性。 同时, 加强运维团队内部知识系统的 建设,有利于沉淀内部知识积累,快速培训新员工,减少核心员工离职带来的冲击。

IT 运维服务外包存在一定风险,关键在于对于 IT 运维服务外包供应商的管理不到位, 具体体现在招标环节疏于审查、 过程监督环节疏于监管、 以及事后评价环节疏于考核。 通过 在招标环节加强对供应商资质、能力水平、案例等考察可以有效的对供应商的资格进行把关; 通过在服务过程中加强监督可及时发现供应商服务提供能力的异常;通过事后评价可以建立 供应商的退出机制,保证供应商提供优秀的服务。

解决 IT 运维服务问题,需要借鉴国内外优秀企事业的最佳实践,建立适合自身的

IT 运维服务管理体系,并引入 IT 外包等先进管理模式,来解决 IT 运维服务能力、质量、水平、 成本之间的矛盾。

根据国家标准 GB/T 28827,IT 运维服务定义为:采用信息技术服务和手段,依据需求提供的服 务级别要求,对其所使用的信息系统运行环境、业务系统等提供的综合服务。

IT 运维服务包括自有运维、外包运维、自有与外包相结合的方式.下面将对两种不同模式下 的管理进行阐述。

IT 运维管理作为 IT 服务管理的主要范畴,目前国际上的研究和论证比较成熟,主要成果包 括 ISO20000 系列的国际标准以及 ITIL 最佳实践方,两者从理论基础上是一致的, 区别在于标 准和标准的实践。下面以 ITIL 为例介绍 IT 运维管理的最佳实践。

ITIL(IT Infrastructure Library)诞生于 1980 年, 由英国发起, 委托 CCTA(Central Computer and Telecommunications Agency)组织, 后成立 OGC (Office of Government Commerce)专门负责 英国和其它公共事业组织对 IT 资源的有效及低成本利用。目前 ITIL 已经成为 IT 行业服务管 理的理论基础。在此基础上建立的非赢利性 ITSM 论坛(itSMF-IT Service Management Forum)已 成为公认的 ITSM 的权威性社区。

ITIL 是基于流程的方。 IT 部门可用其检查是否用一种可控的和训练有素的方法为最终用 户交付所需的 IT 服务.ITIL 合并了一套最佳的实践惯例, 可合用于几乎所有 IT 组织, 无论其规模 大小, 或者采取何种技术。 ITIL 被用来建立和交付服务管理流程;这些管理任务可被某些服务及系 统管理工具所简化.

ITIL 对 IT 服务管理实践中涉及的许多重要问题进行了系统的分析, 包括全面的检查清单 (checklist)、任务、程序、责任等与任何 IT 服务组织密切相关的问题。这些概念的定义也涵盖了 大多数 IT 服务组织的主要行为。IT 服务组织可以借助 ITIL 的指导建立和拓展自己的 IT 服务流程。

ITIL V3 的核心设施是基于服务生命周期的, 服务生命周期框架下图所示, 服务战略是生命 周期运转的轴心;服务设计、服务转换和服务运营是实施阶段;服务改进则在于对服务的定位,基 于战略目标对有关的进程和项目的优化改进。

ITIL V3 包含的各模块内容如下:

服务战略为组织在设计、开辟和实施服务管理从组织能力和战略资产两个战略角度来提供指 导。 该部份内容提出了服务管理实践过程中整个服务生命周期的策略、 指南和过程。 服务战略是 服务设计、服务转换、服务运营和服务改进的基础,它的主题包括了市场开辟、 、内部和外部的 服务提供、服务资产、服务目录,以及整个服务生命周期过程中战略的实施 .

服务设计描述了对服务及服务管理过程设计和开辟的知道, 它包括将战略目标转变成服务投 资组合和服务资产的原则和方法, 服务设计的范围不仅限于新的服务, 它还包括为保持和增加客 户价值而实行服务生命周期过程中必要的变更和改进,服务的连续性,服务水平的满足,以及对标 准,规则的遵从性.它指导组织如何开辟设计服务管理的能力.

服务转换为如何将新的或者变更的服务转换到运营过程中有关能力的开辟和改进的指导, 服务 战略需求通过服务设计进行编码, 而服务转换则是探讨如何将这种编码有效导入到服务运营的体 系中,与此同时,还应控制失败的风险和服务的中断。

服务运营包含了在服务运营方面的实践,它对如何达到服务支持和交付的效果与效率,确保客 户与服务供应商的价值提供了指导,并最终通过服务运营实现战略目标.

服务改进为创造和保持客户价值而用更优化的服务设计、 转换和运营提供指导。 它结合了质 量管理、变更管理和能力改进方面的原则、 实践和方法。 组织要学会在服务质量、运营效率和业 务连续性方面的不断提高和改进意识.此外,它还为改进所取得的成就与服务战略、服务设计和服 务转换之间如何建立关联提供指导,为基于戴明环(PDCA)形成计划性变更的闭环反馈系统的建立 提供思路。

在 IT 运维服务体系中,ITIL 是一套基于流程的方法和规则。 在组织信息化建设中, ITIL 可以指 导信息化部门向用户提供更为高效可靠的服务。下面对这些关键流程进行简要的介绍。

服务台是用户与 IT 部门进行沟通的惟一平台.服务台为用户提供了服务联系点,利用这个联系 点促进组织业务流程与服务管理基础架构的集成。服务台的主要设计目标是加强用户与 IT 服务 部门之间沟通,为组织的信息化建设服务。

事件与故障管理的主要功能包括对事件与故障进行记录, 分类, 并安排专家管理故障处理的 全过程。事件与故障管理的目标是在避免影响客户和用户业务的前提下让 IT 系统能够迅速恢复 到安全级别。

问题管理流程是指通过事件发生的原因进行分析,制定问题的解决方案以及预防措施, 降低 因问题和事件而产生的消极影响。 与故障管理单纯强调故障的处理速度不同, 问题管理模块的核 心功能是找到事件发生的深层次原因,并相应的提出合理的解决方案防止问题的再次发生 .

配置管理模块负责识别和确认系统配置项、 记录和报告配置项状态和变更请求、 检验配置项 的正确性和完整性等活动。设置配置管理的主要目的在于为组织提供 IT 基础架构的逻辑模型, 对变更管理和发布管理提供有效的支持。

变更管理是在最短的时间内完成系统架构,并在服务的任一方面发生变更时对其进行控制的 服务管理流程。该模块的设计目标是确保在变更实施过程中使用标准的方法体系并提高变更的效 率,并降低由业务变更导致的业务中断对组织产生的影响。

发布管理流程负责对经过测试后导入实际应用的新增或者修改的配置项进行分发和宣传。发布 管理之前进行的是软件的控制和分发,该过程由变更管理流程进行管理。

该项管理的目的在于为签订服务级别的协议而进行一系列活动所组成的服务管理流程, 其中 主要的活动包括协议的计划、草拟、以及签订服务级别等方面.有效的服务级别管理可以保证 IT 服务质量在不提高成本的前提下能够稳步提高。

IT 服务财务管理模块主要是指 IT 服务过程中所需的成本进行预算和核算,根据预算情况向 客户收取相应的费用。所涉及的费用主要包括投资预算、服务成本的核算以及服务计费三部份。 合理的财务管理以及计费方法可以通过量化服务成本降低开消, 避免风险的发生并引导客户的合 理行为。财务管理流程产生的预算和核算信息可以为 IT 服务提供有效的辅助决策信息。

IT 服务持续性管理指当系统发生故障时有可靠的技术、财务和管理资源保证组织的 IT 服务 能够正常运行。保持 IT 服务持续性的关键在于当故障发生时,系统仍可以提供预定级别的服务, 从而确保系统的业务可以稳定持续的运行。

能力管理既考虑运营成本也考虑业务需求,对服务能力进行合理配置从而达到 IT 资源发挥最 大效能的目的。该流程包括服务能力管理、业务能力管理和资源能力管理等方面。

可用性管理流程通过分析用户和业务方的可用性需求并以此为依据来优化和设计 IT 基础架 构的可用性,有效的可用性管理可以在控制成本的前提下提高系统的可用性。有效的可用性管理 可以通过定位业务以及对用户的可用性需求进行分析,从而使 IT 服务的设计能够满足用户的需求, 并且可以避免 IT 服务运作中可用性级别过高的情况发生,这一设计思想对于降低 IT 服务的运作 成本具有重要意义。

IT 外包是指组织为了实现自己的目标, 通过合同或者协议的方式将部份或者全部的信息技术职 能交由外部的服务提供商提供的一种管理模式。 IT 外包普通还伴有着组织的 IT 资产、人员、租 赁资产交由 IT 服务商管理。

选择 IT 外包有以下好处:专业公司提供的外包服务,比组织自身服务部门的工作更为高效、 专业; 利用第三方的资源和技术优势, 降低组织管理与运行成本; 组织自身则集中精力发展其核 心业务,增强核心竞争力;以组织业务特点定制的解决方案,彻底人性化的集成及服务;单一的 联系点,全面支持客户众多品牌的软硬件产品,避免多厂商 IT 设备条件下的协调成本等。

对于外包的客户方组织而言,要成功实施 IT 外包服务,主要经过以下几个阶段:

在这一阶段,组织的高层管理者主要工作是确定外包的需求并制定实施的策略 .要从外包中 获得效益,组织的最高决策层必须采取主动的态度,因为惟独最高决策层才具有外包成功所必需的 视角和推动变革的力量。

在选择外包商时, 要先将自己要求的底线与外包商所能提供的服务进行比较。 通过识别潜在 的外包商,向外包商发布信息并邀请竞标,接收和分析外包商的标书,审阅外包商的证明文件, 验证他们在提供外包服务上的经验与能力,甄选最终外包商并进行合同谈判。

该阶段涉及到人事过渡、资源移交、工作场所变更、系统切换等过程。

这一阶段对外包关系进行管理, 并就任何外包关系的维护与变化进行商议或者谈判, 加以实 施。 客户在这一阶段要保持对外包业务性能的随时监测和评估, 并及时与外包商交换意见, 保证 外包工作的顺利进行。

IT 外包风险是由许多不确定因素造成的。其中可能涉及配合外包服务提供商的需求进行一些 额外工作, 包括协调成本、 签约金和监督外包商发展的支出, 这些可能导致实际成本远高于预期 成本.此外,还有一些合同风险—-在与外包服务提供商订立合同时,如果条款说明不明确或者漏 掉重要条款,都可能会让组织遭受极大的损失。

由于外包必然会涉及风险, 于是在外包决策前必须对风险进行管理,进行风险评估, 要辨别、 分析风险并按照优先次序对其进行排序,考虑如何才干消除或者减小风险, 同时还要考虑在外包协 议生效期间产生的管理费用。

IT 外包风险管理是指根据信息资源对于组织的价值,对风险进行预测、识别、评估、分析, 识别、 评价组织的信息资源的威胁和脆弱性, 并在此基础上有效地处置风险, 从而使风险达到可 接受的水平。主要包括以下几个步骤:

风险识别:识别和评估潜在的风险领域

风险分析:分析外包关系可能会产生的风险

风险排序:对风险的优先级进行排序

风险控制:考虑采用什么样的方法对它们进行管理与控制。

外包合同管理是外包服务管理的一个重要组成部份。 由于外包项目时常涉及到的交易金额庞 大,而且外包服务对于组织的高效运营非常关键,因此需要专业的法律文件支撑。合同应该灵便 而又能够解决交易中真正问题,使客户和外包商双方均受到保护,能

对价值的创造和风险的管理起到支持作用。

外包服务合同包括服务水平协议(SLA — Service Level Agreement) 。外包合同普通为 5 年、 10 年。合同条款是外包服务中最重要的环节,合同条款制定的详细程度和明确性直接影响合同 的履行。 合同条款涵盖的内容非常全面, 包括:合同的合用范围和预期客户资源需求、 合同条件、 基准及衡量办法、有效期、终止原因、知识产权、合同转让、关键项目实施人员及补救办法、未 来价格灵便性、 未来服务的灵便性、 付款方式和时间、 风险管理以及其它法律规定的合同必备条 款.好的外包合同条款对合同中的工作有清晰的界定,能够在双方浮现分歧时成为解决争端的依 据.

在 IT 服务外包中, 合同是要求双方履行承诺的主要约束力.然而仅靠合同并不能保证外包的 成功。 由于外包合同在多数情况下是不完善的, 合同是逐步实施并且不断变化的, 所以在合同中 不可能对外包服务需求的所有环节都做出具体的规定, 如果客户在外包职能范围内浮现新的需求, 而且需求在合同中没有做出具体规定,就无法靠合同解决.

在这种关系下, 客户方需要与外包商建立起相互协作和相互理解的关系, 这样外包商才会对 变化与额外的需求做出善意反应。 因此, 外包商和客户之间的稳固关系显然是长期业务外包关系 成功的关键,也是解决外包中分歧的有效方法。

要正确维系与外包商之间的关系,需要进行关系管理.外包关系管理是指一整套能够使外包 关系运营的人事、流程、工具和系统。外包关系管理是组织确保实现合同价值的最重要的工作。

实践经验显示,成功实施外包关系管理的组织通常非常关注以下几个关键成功因素 :

成功的外包关系焦点在结果而不在手段。 需要制定客观的绩效度量标准, 能够保证结果的可 度量性。 惟独通过与绩效的客观标准相比较, 顾客才知道他们正在接受的服务正是期望获得的服 务,外包商才知道他们正在满足顾客期望的需求。

正式的、 多层次的关系管理结构可以将客户和外包商连在一起。 外包关系要求用它自己的管 理结构去替代以前内部的管理系统,这种新型结构通常采用联合管理团队的形式.管理团队或者大 型合同的多个管理团队负责日常的、战术和战略方面的关系管理。 每一个团队的职责、 议程、 会议 频度以及与其他团队的关系都有明确的界定。 这种关系管理结构建立起识别、 解决问题的重要机 制,能够实现问题的及时上报、处理和解决。

基于绩效的定价可以确保不断地激励外包商去达到或者超越设定的绩效标准.当绩效超过标准 时,就赋予奖励;当绩效低于标准时,就赋予处罚。对处于外包关系中的双方的员工来说 ,这些 激励也可转化为绩效标准.把所有的基于绩效的风险和收益转换成个人的绩效标准时有利于双方 关注焦点的适当调整。

负责为顾客管理外包关系的员工应接受专门的职业培训, 包括全面理解合同的商业目标, 双 方认可的具体的绩效标准,以及他们个人的角色、 职责、 权力和报告结构.此外, 最终用户也应该 接受适当的培训,以理解商业的总体目标、问题的识别和解决方式、沟通的渠道等 .培训和交流 也可以减少客户可能存在的不满或者抵制情绪。

两个组织之间持续不断的、自由的知识和技能的交流是成功的外包管理的标志 .每方都有他 们自己的特长,当这些特长被共享时,它不仅对双方关系的成功有所贡献,而且对己方的成功也有 所贡献。培训计划、岗位经验、与专家交流、技术和工序都是有助于实现交流的具体方式。

作为专业的 IT 运维服务供应商,我们向客户提供包括咨询、服务外包、工具一系

列的 IT 运维服务,匡助客户实现 IT 运维的高效管理.

完整的 IT 运维服务框架包括管理咨询、外包服务以及工具服务,以 IT 运维咨询服务为先导 进行顶层设计, 规范组织内部 IT 运维和 IT 外包业务; 以 IT 运维外包为过程环节, 实现 IT 运维的 专业化和高效化;以 IT 运维服务工具为支撑,实现流程的固化和实时监测,提高 IT 运维服务的效 率.总体框架图如下:

针对客户的实际需要,我们将提供如下服务项目:

IT 运维管理咨询服务就是以 IT 管理思想为指导, 以推动 IT 与业务的动态融合为出发点,基于 ITIL 最佳实践经验,为客户建设以服务为导向的 IT 运维管理体系;匡助制定规范化的 ITIL 服务流 程,建立信息部门和业务部门之间沟通的桥梁, 辅助信息部门选择或者开辟规范化的日常管理工具。

具体内容包括:

IT 运维现状评估:通过现状、访谈、研讨等形式了解客户 IT 运维现状,并基于 ISO20000

体系进行评估;

IT 运维体系设计:基于 ITIL 最佳实践,搭建组织 IT 运维组织职能和流程; IT 服务外包管控设计:设计 IT 服务外包的管理体系。

通过咨询,匡助企业梳理现有的 IT 运维业务流程,建立基于 ITIL 最佳实践的运维流程和组织 职能,通过引入服务台、服务水平管理等最佳实践,有效提高 IT 部门对业务需求的响应速度,建立 IT 与业务的沟通“语言”和沟通桥梁,平衡 IT 与业务的关系,平衡 IT 服务质量与服务水平,提高业 务满意度,提高 IT 资产价值利用率。

针对 IT 运维工作量大,技术繁琐,专业性高等特点,提供专业的基于 IT 全生命管理工具平 台的 MaxValue IT 运维外包服务,匡助用户实现以花费更少、历时更短、风险更小、更为专业的服 务维护信息技术应用。

匡助用户解决桌面级管理运维工作繁锁且占用大量工作时间的困惑,提供基础档案维护、软 件维护及设施维护等专业运维服务,专业的人做专业的事, 更迅速,效率更高,使组织总成本更 节省。

提供基础设施相关的档案、 物理环境、 计算机网络的运维以及应急救援服务, 保证用户现有 基础设施正常运行,降低整体管理成本,同时根据日常维护的数据和记录,提供用户基础设施整

体建设规划和建议,更好地为用户信息化发展提供有力保障。

提供系统软件相关档案、主机存储设备、应用软件、系统数据的运维以及应急救援服务,保 障用户系统软件正常运行, 降低整体管理成本. 同时,协调各业务应用系统内部运作, 提高系统可用 性。

提供信息安全相关档案维护、监测预警、风险评估、安全加固、应急救援的运维以及信息安 全意识培训服务,及时掌握网络安全系统资源现状和配置信息,全面提高系统信息安全性。

针对机房中物理设备、计算机网络设备、服务器存储设备、应用软件系统突发的重大事件, 包括信息安全事件, 以最快的时间进行故障排查定位和应急处理, 匡助客户实现事件发生后控制 事态,影响,避免或者减少次生灾害的发生。

主要内容包括:

基础设施应急救援:包括网络故障、设备宕机等故障救援

软件系统应急救援:包括系统不可用、系统性能差等故障救援

信息安全应急救援:包括网络受攻击、病毒攻击、系统被篡改、泄密等故障救援。

MaxValue IT 全生命周期管理平台作为运维服务辅助工具,具有全面的运维监控分析管理功 能,全面覆盖 IT 运维工作的各个阶段。

IT 全生命周期管理平台的机房中心、 监控中心、 网络中心、 安全中心能够全面采集运维过程 中浮现的各种事件、告警、问题、变更等信息。能够全面地采集各种资产的监控指标,并根据客 户实际业务系统整合监控指标和组合算法进行核心业务的监控。 将系统的可用性、 性能情况、 容 量估算等可视化数据实时推送到用户端。

系统采用统一的事件分析规则引擎。 事件综合分析包括事件关联分析、 逻辑关联分析、 影响 范围分析等手段,根据事件的影响范围、破坏性、 可恢复性等风险评估结果对事件进行分级, 根 据分级结果对事件进行处理。

运维中心是运维系统的管理平台。系统采用全球 IT 运维最佳实践的 ITIL 作为管理流程设计 的依据.运维中心包括服务台、服务级别管理、事件管理、问题管理、配置管理、变更管理、发 布管理、日常运维管理等功能模块,全面覆盖运维管理的整个过程。

报表中心能够对 IT 系统运行状况信息进行汇总,并以图表的方式为管理人员提供直观的分

析结果,匡助更全面的了解网络、主机、数据库、应用系统的运行状况和运行趋势,为决策提供 支持信息.报表支持多种格式的导出与自动发送功能,根据不同角色人员的需要,灵便定制报表 的内容和格式。

展示方面系统支持 PORTAL 平台形式的可定制首页功能, 更能支持手机、PAD 等终端的访问, 支持大屏幕的展示.

资产管理。资产管理问题是 IT 运维工作的核心问题。 IT 全生命周期管理平台提供全面的 IT 资产管理解决方案,能够对资产的购进、使用、变更、处置等全生命周期进行管理 。

运维知识库。 运维服务人员处理问题的工具库。 系统提供的运维知识系统, 不仅能够匡助运 维运维查询知识解决一线支持问题,还能够培训考核新员工,加强内部交流 .运维知识系统能够 提高问题解决效率, 降低运维人员的工作强度,提高服务满意度。

MaxValue IT 全生命周期管理平台架构图

针对 IT 运维服务管理,国内外的大量实践已经为我们提供了优秀的经验。

不少客户都希翼加强自身内部的 IT 运维服务管理或者加强对 IT 外部服务的管控,但是苦于 没有经验,在实际建设过程中浮现设计不完善、不能落地的现象。

实践证明, 通过引入第三方咨询服务可以有效解决此问题。 第三方咨询服务依靠大量的服务 实践和成熟的实施方,可以匡助客户在最短期内实现适合客户自身特点的 IT 运维服务管理 体系的设计, 并能辅导客户实现管理体系与日常管理的有效融合, 匡助客户最大程度上发挥最佳 实践的功效.

在 IT 运维服务过程中, 很困扰客户的一个问题就是业务对于 IT 运维服务质量的要求与 IT 运 维服务能力和服务成本间的矛盾.伴有着组织 IT 系统复杂程度的不断增加, 为保证 IT 运维服务质 量,IT 运维服务成本激增,如何来解决?

通过引入 IT 运维服务外包, 将部份或者全部 IT 运维服务交付给专业的第三方 IT 运维服务提供 商,可有效解决 IT 运维成本与运维质量的矛盾。

选择 IT 外包有以下好处: 专业公司提供的外包服务, 比组织自身服务部门的工作更为高效、 专业; 利用第三方的资源和技术优势, 降低组织管理与运行成本; 组织自身则集中精力发展其核 心业务,增强核心竞争力.

信息系统的运维工作,涉及对网络、业务应用、桌面、安全、告警、运维服务模块等上百个

指标的检查,对于这些指标的检查如果通过人工巡检的方式进行,巡检效率低,并且可能浮现漏 检、重检的情况.

自动巡检时,巡检中心按照巡检表要求定时启动巡检;巡检指令由适配器接收并执行,并将

检查结果反馈到巡检中心;巡检中心实时展现当前巡检过程执行情况,发现异常情况即以工单、 告警等方式及时通知给应急维护人员; 针对每次巡检过程, 能够自动产生巡检结果报告。 对于所 有历史巡检结果报告, 支持按照多种查询条件进行快速检索。 自动巡检系统还能够根据设定, 定 期自动产生统计分析和趋势分析报告,支持高层领导决策。

相对于人工巡检, 自动巡检系统由中心和适配器分工协作实现自动巡检。 运维中心负责执行 巡检计划、分发指令、人机交互等;适配器通过调用资产数据接口或者执行命令脚本, 实现对资产 信息状况的检查。自动巡检很好的解决了上述这些问题,是运维巡检的最佳实践之一。

服务水平协议 (Service Level Agreement,SLA) 是一种由服务供应商与用户签署的法律文件, 其中承诺只要用户向服务供应商支付相应费用,就应享受到服务供应商提供的相应服务质量,是定 义服务提供者和用户之间关系的一个文件。

服务水平协议内容普通包括提供的服务、服务水平、 问题管理、 法律合用和解决争端、 客户 的义务和责任、安全、知识产权和机密资料等。

有效的应用服务水平协议, 将有助于确定并界定用户需求、 提供便于理解的框架、 简化复杂 问题、减少冲突范围、在发生争议时加强对话、消除双方不切实际的期望等。服务水平协议将建 立服务双方共同的愿景和考量标准,实现对服务水平的统一理解,有助于改善服务接收方对服务 提供方服务水平和服务质量的认可度。

持续监测就是通过部署监测工具对 IT 系统的关键指标进行 7*24 小时不间断的监测,一旦 指标浮现异常,将自动通过邮件、短信等方式提醒 IT 运维服务人员进行关注并分析.

通过持续监测 IT 系统的关键指标,IT 运维服务人员可以在故障发生前提前介入并进行调查分 析,并将故障在萌芽阶段予以排除,实现提前预警、提前处理,避免故障发生给业务造成的影响, 降低客户损失,提高 IT 系统的可用性。

由于持续监测需要部署专业工具, 还需要 IT 运维人员24 小时的驻场服务,总体投资比较大, 对于可用性要求比较高的 IT 系统是必须的。如果客户所应用的 IT 系统并不要求非常高的可用性, 持续监测这种服务方式就显得昂贵了,此时采用定期巡检的方式不失为一个好的选择。

定期巡检就是周期性地对 IT 系统进行一次全面的健康检查,周期的频率取决于客户对于 IT 系统可用性的要求。定期巡检的检查项目与持续巡检检查项目一致,通过规定项目的定期检查和 日志分析,可以判断 IT 系统的健康状况,查找系统漏洞和安全隐患,并采取措施进行加固。由于 定期巡检不需要一次性的工具和人员投入, 也能取得较好的故障预防效果, 是一种投入产出比较 高的故障预防手段。

配置管理数据库(Configuration Management Database ,CMDB)是用于存储配置项及配置项 关系的数据库。在数据库中,配置项及其关系利用关系数据库的方式对客户 IT 服务的整体架构 进行了描述,包括 IT 服务、 IT 基础设施、 IT 应用系统、 IT 人员、 IT 文档等。

配置管理数据库是 IT 运维服务工作开展的基础。通过配置项的上下级关系将匡助 IT 运维人

员实现由故障点上下快速定位;通过配置项的横向关系将匡助 IT 运维人员实现故障影响范围的 快速确定;通过配置项的属性信息实现配置项关键信息的信息存储和检索。总的来说,配置管理 数据库是 IT 运维服务工作快速、高效、准确的利器。

运维知识库是系统知识积累的重要方式,是员工日常工作的重要工具。通过对知识库维护和

使用,不仅可以在故障自动处理和人工处理的过程中从知识库中得到相关故障维护的分类和快速 定位,找到匹配的处理案例,便于处理人进行借鉴,而且知识库具有的业务匡助功能, 能使相关 人员可以通过关键字查询业务匡助、产品、市场活动、发生过的处理流程、电子文档等。

运维知识库普通具有的功能有知识的录入和查询、知识的分类展示、知识的转移和版本管理。 知识的录入普通支持多种方式,手工录入、模版导入、批量导入、事件关联等。在知识查询上一 般支持多种搜索方式,关键字搜索、条件搜索、高级搜索、附件全文检索等。版本管理能够管理 不同版本的知识,做到知识可追溯,修改有依据。

运维知识库系统还能具备个人知识的学习、 员工的在线培训和考试、 知识问答等功能, 提升 运维工作的支持效率,加强了内部交流和知识积累。

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- zicool.com 版权所有 湘ICP备2023022495号-2

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务