这家自动驾驶初创公司采用了 PagerDuty 的数字运营管理平台,以实现其全面的响应功能和 600 多个集成的生态系统。通过使用 PagerDuty,该组织成功完成了云迁移,而没有任何服务中断。
PagerDuty 提供直观的状态控制界面,通过系统健康状况的共享视图动态地将信息更新给团队,以实时提高对运营问题的认识。“无论是AWS CloudWatch还是其他集成,都可以将有效和简化的信息导入 PagerDuty,以便我们知道该服务何时会存在潜在的问题,这种功能是非常让人欣喜的,”工程经理分享道。“PagerDuty 的兼容性(特别是与Slack和Jira等集成)很强大,意味着工程部门以外的人员(例如车辆测试人员)可以使用他们选择的界面来响应 PagerDuty 提出的问题。”
实施 PagerDuty 还使团队能够简化事件通知并减少警报噪音。该平台的机器学习算法有助于减少误报警报的数量。例如,如果 Docker 容器消失,PagerDuty 将等待检查替代的容器是否启动,然后再发送警报。
“PagerDuty 为我们提供了一种更智能的方式来管理事件并减少警报疲劳,”工程经理解释说。“如果凌晨 3 点出现故障,可能不需要立即修复。借助 PagerDuty,我们设置了在工作时间以外通过电子邮件发送的低紧急通知,这样人们就可以为那些可以等待的小问题睡上一觉。”