全球科技公司使用Pagerty导航实时操作
客户:全球科技公司
这家全球技术公司专门为全球企业和消费者提供地图和导航技术,并将其产品套件扩展为混合软件/硬件模型,提供云服务。
一位管理站点可靠性工程团队的高级项目经理解释说:“减少对个人导航设备的关注,更多地关注基于云服务的构建,这为我们打开了通往以往从未想过的产品机会的大门。”
面临的挑战
但全面的数字化转型是复杂的,该公司需要确保其工程团队能够立即得到系统中断和事故的通知。
在使用PagerDuty之前,该公司的工程组织遇到了一些挑战,包括:
- 由于事件响应和管理过程中存在瓶颈,使用传统的、自制的工具,导致平均响应时间过长
- 由于待命人员需要共享物理传呼机,导致事件确认和紧急通信的延迟
- 由于孤立的工作流程和跨工程团队的工具蔓延,服务和应用程序缺乏问责制和所有权
- 难以扩展定制的寻呼工具,该工具只能零星地通知待命人员
- 事件管理流程没有嵌入到工程基础设施中,这导致了人工依赖性和缺乏与关键利益相关者的沟通
- 语言障碍使世界各地的设施工作人员难以通过主要的、讲英语的服务台号码来沟通他们建筑物中的问题
PagerDuty 的优势
借助 PagerDuty 的 500 多个集成生态系统,该公司将其整个工具堆栈集成到一个单一的摄取点中,以提高对其基础架构运行状况的可见性。PagerDuty 与Slack、JIRA、AppDynamics、Prometheus、Nagios和Terraform的集成使公司的团队能够获得可见性和可操作的洞察力,并了解他们需要从集中式平台主动解决事件。
自从实施 PagerDuty 以来,公司已经看到了成效,包括:
- 一种问责文化,鼓励整个开发人员组织的全方位服务所有权,从而提高代码质量
- 在工具标准化和协调整体响应方面改进了跨团队协调
- 将重大事件和事件的解决时间缩短 75% 以上
“PagerDuty 帮助我们更好地了解我们的服务中正在发生的事情并增加完整的可见性。以前,我们有太多的孤岛。PagerDuty 帮助我们分解它们并最终集中我们的运营,”高级项目经理说。
使用实时呼叫路由为全球设施团队提供本地化支持
使用 PagerDuty 的另一个好处是帮助公司的分布式设施团队解决紧急问题。在 PagerDuty 之前,全球的设施团队会拨打英语服务台号码,语言障碍会延迟对管道泄漏或电力中断等紧急问题的响应。通过利用PagerDuty 实时呼叫路由,该公司可以将呼叫路由到本地号码,在该号码上,设施工作人员可以立即用他们自己的语言与相应的待命人员讨论紧急问题。
未来蓝图
随着工程组织继续投资于云服务和基础设施自动化,他们计划进一步将 PagerDuty 嵌入到他们的数字环境中,并使用结合了人类行为和机器学习数据的Event Intelligence来帮助扩大他们对事件的理解。
该公司还计划使用 PagerDuty与 Terraform 的集成,将基础设施内的响应播放作为代码自动化,并将其扩展到更大的开发人员组织。此外,该公司计划将 PagerDuty 与ServiceNow集成,以进一步集中 ITSM 和数字运营工作流程。正如高级项目经理所解释的那样,“我将 PagerDuty 视为数字合作伙伴。该平台为团队协作创造机会的能力对于我们的数字运营环境来说是无价的。”
其他团队正在继续扩大对 PagerDuty 的使用,包括安全、NOC、设施和工程团队。工程团队还在研究PagerDuty 利益相关者通知,作为其应急响应流程的一部分,以提高可见性并确保所有团队为未来可能扰乱正常业务的事件(如 COVID-19 大流行)做好充分准备。“我们在 PagerDuty 环境中添加的团队越多,我们就越能做好应对未来可能影响日常运营的紧急情况的准备。”
I may need your help. I tried many ways but couldn’t solve it, but after reading your article, I think you have a way to help me. I’m looking forward for your reply. Thanks.