PagerDuty助力ServiceNow整合IBM云端事件管理

关于IBM

作为有史以来最成功的科技公司之一,IBM能走到今天,靠的并不是一劳永逸。为了时刻保持技术的领先性和相关性,IBM不得不不断地重塑自己,并寻找新的方法来超越竞争对手。IBM Cloud和Watson认知计算系统都是很好的例子。但是这些产品该如何解决威胁客户体验的基础设施事件呢?

通过Pagerduty+Servicenow的集成。

是时候做出改变了

在2016年末,IBM的Cloud部门决定使用一个标准化的工具系统来处理事件管理,升级,根本原因分析(RCA)和相关过程。该小组拥有IBM整个云组织的运营工具集,并且知道其现有的即时通信系统也是一直没完没了的。分散的框架导致分散了联系和升级程序,手动升级通常会浪费掉几个小时的时间。同样,孤立的知识也常常过时且不一致的。

IBM Cloud团队希望实现其IM流程自动化,同时进一步推动采用ServiceNow(其记录系统)来处理事件票证,跟踪和文档。同时,他们需要一种解决方案,该解决方案还应有助于自动化自我修复工作流程并改善实时事件响应。为了做到这一点,事件响应生态系统的所有移动部分都必须协同工作。

灵活性和自治性

在选择供应商以增强其现有ServiceNow实施时,IBM Cloud意识到只有PagerDuty符合要求。IBM Cloud云服务管理程序总监Travis Warner表示:“首先,这具备了用户的可配置性。不需要有一个管理员团队说“去为用户A编辑这个组或创建这个计划”。每个人都可以做自己的事。” 他还指出,从工具的角度来看看,自己完全不使用工具,只是让管理人员处理自己的团队和服务。通过集成,PagerDuty和ServiceNow现在还为现有ServiceNow客户(如IBM Cloud)提供了全面的事件管理功能。使用这两种产品的客户可以快速轻松地集成它们,同时享受快速的入门和实施指导。

“大约18个月前,自我修复自动化达到了个位数。到2017年底,已经接近65%,我们的目标是今年达到80%。”—— Travis Warner ,IBM Cloud云服务管理程序总监

实时支持,自动执行工作流程

对于IBM Cloud来说,PagerDuty + ServiceNow集成使公司能够通过PagerDuty实时处理事件并通过ServiceNow记录事件。一旦PagerDuty从IBM Cloud的监视工具收到事件警报,它便能够支持自动化的工作流程和事件分析。然后,根据警报中的内容,PagerDuty触发自动自我修复或将事件升级到适当的团队和流程。因此,团队无需再四处寻找任何人来做对应的事了。

根据Warner所说,“ PagerDuty确实可以帮助我们自动化IM流程。我们之所以喜欢它,是因为它减少了人们收到通知的次数,并在问题影响我们的客户之前避免了问题。如果自动化失败,那么PagerDuty会将事件发生的历史和其他详细信息发给正确的响应人员,以便他们可以立即解决该问题。”更好的是,所有IBM Cloud事件数据都在PagerDuty和ServiceNow之间自动同步。这种双向信息流为员工提供了很大的工作方式灵活性。正如Warner所指出的那样,PagerDuty的“任何设备,随时随地的概念实际上都是它的价值所在。”

IBM Cloud自我修复

自2016年11月启动以来,现在已有近4,000名使用PagerDuty的IBM Cloud员工。随着部署的顺利进行,IBM Cloud团队在事件管理方面也看到了巨大的进步。PagerDuty的简化框架缩短了解决时间,集中了可见性,并自动呼叫合适的人力资源,从而为员工创造更好的生活与工作平衡。

PagerDuty和ServiceNow的集成还使得IBM Cloud部门更易于自动执行自我修复。尽管只有5%到10%的事件是在部署前自我修复的,但到2017年底,这一数字上升到了惊人的65%。不止于此:IBM Cloud的目标是在2018年实现80%的自我修复。

未来展望

IBM Cloud组对PagerDuty的使用仅代表其在IBM云组织中更广泛的DevOps部署的一部分。IBM Cloud已经配置了将近3,000个服务,并使用PagerDuty和ServiceNow。