虹科PagerDuty推动英国Auto Trader的事件响应

虹科PagerDuty推动英国Auto Trader的事件响应

客户→ Auto Trader UK

Auto Trader UK是英国和爱尔兰最大的数字汽车市场,每月平均吸引 5500 万次平台访问,消费者搜索和查看来自近 14,000 家英国零售商的汽车、货车和自行车广告。“我们是一家基于网络的企业,因此我们需要确保我们的商店全天候营业,”Auto Trader UK 的高级运营工程师 Ryan 说。

通过其数字平台的不断发展和数据产品的创新,Auto Trader UK 使客户的购车过程更加轻松。但是,在进行公有云迁移的同时维护一个可靠、无故障的平台很困难,所以Auto Trader UK 的运营团队要能够在出现问题时做出积极主动的响应变得比以往任何时候都更加重要。随着 Auto Trader UK 继续其公有云迁移,PagerDuty帮助公司在管理事件响应方面具有灵活性,确保他们能够立即采取行动并在事件发生后立即解决

没有警报丢失或延迟

运营团队管理和监控整个企业的基础架构。他们是有关 Auto Trader UK 系统警报的第一响应者,并与产品开发团队合作以根据需要解决问题。“一旦开发人员部署,我们就会进行大量维护以确保应用程序健康,”Ryan 解释说。“如果出现问题,我们会与开发团队沟通并提供诊断信息以帮助他们解决问题。”

团队面临的挑战之一是电子邮件警报通知被延迟或从未收到的情况。“有时电子邮件警报会在事件实际开始后 10 或 20 分钟收到,”Ryan 分享道。“更糟糕的是,有时我们根本不会收到电子邮件,这会导致对事件的响应延迟。”

通过利用SolarWinds集成(PagerDuty 提供的 300 多个集成之一),团队可以直接在 PagerDuty 中接收警报,从而完全消除来自 SolarWinds 的电子邮件警报。因此,该团队降低了警报延迟和丢失的风险。此外,使用 PagerDuty 作为主要的警报和通知平台,团队可以比以往任何时候都更有信心地更快地做出响应。“我们所有的监控都与 PagerDuty 相关,”他解释道。“根据该警报消息中嵌入的上下文,我们对事件是什么有一个很好的了解。当我们修复它时,它会自动解决。”

在公有云迁移过程中提高责任感

对于 Auto Trader UK,使用 PagerDuty 是接受 DevOps 文化中的一大进步。“我们的计划是摆脱集中式管理模式,而将警报分发给适当的开发团队。这意味着在未来我们可以选择让他们随叫随到,这样他们就可以拥有更多的产品所有权,尤其是在产品投入生产时,”Ryan 说。

向更分散的事件响应模型的转变与 Auto Trader UK 的公有云迁移紧密相关。该公司正在从传统的本地环境迁移到 Google Cloud,以获得更好的灵活性和可扩展性。“随着我们迁移到混合公有云环境,主要是在 Google 的云上,一套全新的工具和监控系统将会涌现,我们可以将它们与 PagerDuty 集成,”Ryan 说。

由于 PagerDuty 平台用途广泛,因此团队可以灵活地在组织准备就绪时添加更多开发团队。“我们喜欢 PagerDuty,因为它现在对我们有用,而且当我们将它部署到不同的小队时,它也会对我们有用。如果我们决定在未来改变公司结构,PagerDuty 将有助于促进这一点,”他说。

改善工作与生活的平衡

由于 PagerDuty 会捕获每个警报,因此团队现在可以轻松掌握事件并直接从 PagerDuty 移动应用程序做出响应。由于团队可以管理自己的日程安排并采取行动,而不必打扰其他人,因此工作与生活的平衡得到了改善。“如果我们需要有人负责通宵轮班进行维护,我们可以使用 PagerDuty 自动重新的路由警报,并默默地进行过渡,”Ryan 解释说。“这比在晚上叫醒某人,只是让他们关闭警报要好得多。”

确保客户获得无缝式体验

除了降低停机风险和改善团队健康之外,该团队还使用 PagerDuty 在事件期间主动与 Auto Trader UK 客户沟通。该团队使用 PagerDuty 的StatusPage.io集成以在出现问题时自动共享更新,从而为最终用户提供更高的透明度。“我们想要一种更直观的方式来在发生中断时通知我们的客户,”Ryan 分享道。“在 PagerDuty 中发送到我们的 StatusPage 服务的警报将自动在我们的状态页面上生成带有相关信息的事件,因此我们的客户知道我们已经在处理这个问题。一旦事件得到解决,PagerDuty 将在我们的 StatusPage 中解决事件”。因此,与其团队不得不手动创建 StatusPage 事件作为调查的一部分,PagerDuty 会自动使最终用户通知成为 Auto Trader UK 的一个灵活而简单的过程。

我们喜欢 PagerDuty,因为它现在对我们有用,而且当我们将它部署到不同的小队时,它也会对我们有用。

–  Ryan O’Gorman ,Auto Trader 高级运营工程师

发表评论