AXELOS ®发布了其广受欢迎的ITSM(信息技术服务管理)框架ITIL ® 4的最新版本。在本博客中,我们将介绍该框架的一个组成部分:事件管理。
什么是 ITIL 事件管理?
要了解事件管理,您必须首先了解 ITIL 上下文中的“事件”是什么——即影响组织 IT 服务的中断。这包括从影响单个用户的问题到扰乱组织中每个人的问题的方方面面。同样,它涵盖了完全关闭服务的问题以及服务只是以不应该的方式运行的问题。
事件管理是记录、记录和解决这些问题的过程。事件管理的首要目标是尽快将运营恢复到正常状态,并将对业务运营的影响降到最低。在这个过程中,恢复速度往往是重中之重。这意味着问题通常是通过临时修复而不是永久解决方案来解决的(我们稍后会进行永久性修复)。由于事件管理会影响整个组织,因此它通常是组织服务台的一部分,这为所有用户提供了单一联系点,并为组织提供了一个负责处理事件的专门团队。
事件管理与问题管理
“事件”和“问题”听起来像是同一件事的两个词,但它们在 ITIL 中有不同的定义。“问题”是导致一个或多个事件的根本问题。例如,用户可能会记录一个抱怨说“我的电脑不工作”。那是一个事件。只有在您的 IT 部门有人与用户交谈后,他们才能确定问题所在。这就是问题管理,它侧重于为事件寻找长期修复方法以及防止它们再次发生的方法。
将事件管理和问题管理分开至关重要,因为在任何使用 IT 的组织中都会不断出现问题,并且重大延迟可能代价高昂。例如,如果计算机损坏的用户必须等到 IT 找出问题的原因,他们可能会整天坐在那里而无法做任何更多的工作。这显然是在浪费他们的时间,他们理所当然地会感到沮丧。但组织也会遭受同样的痛苦,因为停机时间会影响生产力。但是,如果您提供了一个快速解决方案——比如给用户一台新电脑——你就能解决这个问题,并为自己争取时间来解决潜在的问题。
跟踪事件、问题及其解决方式是问题管理的核心。它为 IT 员工提供了一份他们可以尝试的常见修复程序列表,从而加快故障排除过程。记录事件还有助于组织确定是否需要审查某些技术或流程的使用。例如,如果用户不断注意到打印机因为墨水用完而无法工作,则组织应该进行调查。也许组织中的某个人正在滥用他们的打印权限。更有可能的是,打印机硬件有问题,墨盒实际上不是空的。
示例事件
事件可以分为两类。首先是与用户体验相关的那些。前面提到的打印机和损坏的计算机示例就是这种情况。
此类别中的其他事件包括连接到网络的问题、应用程序无法打开或用户在尝试工作时发现的任何其他异常。第二类是技术事故。这些是用户不一定会注意到的硬件或软件错误,例如硬盘驱动器已满或计算机网卡出现问题。在常规监控期间,它们往往会被 IT 发现。
ITIL 事件管理的好处
采用 ITIL 的事件管理流程有几个原因:
- 改进的事件响应时间
ITIL 的事件管理标准化方法可确保您提供快速响应、分析、文档、持续管理和事件报告。
- 增强的事件可见性
通过明确的事件记录流程,您可以确保组织中的每个人都知道如果遇到 IT 问题该怎么办以及正在采取的措施。您还将全面了解整个组织中的问题。这有助于您确定您是否有资源及时解决您的问题。
- 提高用户满意度
没有人希望他们的工作表现因 IT 问题而受到影响,因此及时的响应将使用户感到满意。ITIL 的事件管理流程还将帮助负责解决事件和问题的团队。他们已经记录了要遵循的指导方针,帮助他们更有效地操作并记录他们所做的工作。
- 提高生产力
通过将事件管理活动与组织其他部门的活动保持一致,您将看到其快速检测和解决问题的能力得到显着提高。
ITIL 事件管理生命周期
ITIL 提供了一个七步流程(或“生命周期”)来处理事件:
1) 事件识别
这是服务台第一次意识到问题的时候。用户可能会检测到与用户体验相关的事件,并提出投诉。另一方面,技术事故通常是在日常监控中发现的。
2) 事件记录
一旦确定了事件,服务台就应该将其记录下来。他们通常会要求确定事件的人的姓名、发现的日期和时间以及对错误的描述。然后服务台将进行事件分类。这是一种确定问题类型的方法(它影响单个用户还是许多人,是硬件问题还是软件问题等)
事件分类有两个目标:使服务台能够查找任何趋势,并通知事件优先级。事件优先级是确定解决方案紧迫性的过程。这通常被定义为“高”、“中”或“低”,并基于受影响用户的数量和事件造成的破坏程度。
3) 事故调查与诊断
这是解决事件的第一步。受影响的用户与服务台的一名成员讨论该事件,以查看是否有立即解决的方法(“您是否尝试过将其关闭并再次打开?”),或者他们是否可以快速识别问题(“您需要执行系统更新“)。
如果服务台的假设成功,则问题已解决,您可以直接跳到步骤 5。但是,如果没有立即修复,事件将需要进入下一阶段。
4) 事件分配或升级
由于需要进一步工作,服务台会将事件分配给现场技术人员或经过认证的支持人员,他们将寻找解决方法,然后调查事件原因。
5) 事件解决
顾名思义,此步骤涉及服务台确认事件已解决。
6) 事件结束
此时,事件被视为已结束,流程结束。
7) 用户满意度调查
组织可能会要求用户在问题解决后完成一份简短的问卷,以确定他们是否对服务交付感到满意。这是识别事件管理过程中任何问题的好方法,例如无用的服务台员工或不满意的解决方案。同时,压倒性的积极反馈是提高员工士气的好方法,它可以帮助您识别在工作中表现出色的团队成员。
相关 ITIL 流程
事件管理与其他几个 ITIL 服务管理流程密切相关,例如:
- 变更管理
在解决事件时,您可能会确定需要更改的内容(软件、硬件、流程等)。重大变化也往往会导致事件激增,用户突然不得不习惯一种新的工作方式。
- 问题管理
正如我们之前所讨论的,问题是事故的根本原因,因此每当您启动事故管理流程时,您可能还需要调查潜在的问题。
- 服务资产和配置管理
组织的配置管理系统有助于检测服务组件之间的关系。它还将配置数据与事件和问题数据集成在一起。
- 服务水平管理
服务台必须保持与他们合作的组织商定的服务水平。SLM(服务级别管理)是确保这种情况发生的系统。
事件管理角色和职责
事件管理团队包括:
- 事件经理
事件经理全面负责组织遵守 ITIL 事件管理流程。他们领导团队的其他成员,向管理层报告 KPI(关键绩效指标)并审查事件管理流程的持续改进。在中小型组织中,此角色通常分配给服务台经理。较大的组织可能会选择任命专门负责该角色的人员。
- 一线支持
这是对传入事件进行登记和分类并立即采取补救措施的人。他们将拥有扎实的 IT 知识,但不一定是专家。
- 二级支持
这些是具有高级软件和硬件知识的 IT 专业人员。如果事件没有易于识别的解决方案,一线支持人员会将问题上报给他们。二级支持可能需要与来自软件或硬件供应商的第三方专家互动,以帮助恢复服务。
备注:本文为英文翻译稿,原作者是英国的卢克·欧文。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。