部署 Webhook 桥接器
创建一个小型服务,用于监听 PagerDuty 在 app.devin.ai 的 设置 > 服务用户 中创建一个 服务用户,并为其授予
incident.resolved 事件,并启动一个 Devin 会话来撰写事后分析报告。将其部署为无服务器函数 (AWS Lambda、Cloudflare Worker) 或轻量级容器:ManageOrgSessions 权限。复制创建后显示的 API 令牌,并将其保存为桥接服务中的 DEVIN_API_KEY。将 DEVIN_ORG_ID 设置为你的组织 ID——可通过使用你的令牌调用 GET https://api.devin.ai/v3/enterprise/organizations 获取。将 WEBHOOK_SECRET 设置为一个你也会在 PagerDuty 中配置的共享密钥。配置 PagerDuty
- 在 PagerDuty 中,前往 Services > [your service] > Integrations
- 点击 Add Integration,然后选择 Generic Webhooks (v3)
- 将 Webhook URL 设置为你的桥接端点 (例如:
https://your-bridge.example.com/pagerduty-resolved) - 在 Custom Headers 下,添加
X-Webhook-Secret,其值与您保存为WEBHOOK_SECRET的值相同 - 在 Event Subscription 下,按事件类型
incident.resolved进行筛选,以便仅在事件关闭后触发事后复盘
如果你希望 Devin 在事件仍在处理中时就开始收集数据,也可以订阅
incident.acknowledged,然后在事件解析后完成事后复盘。接入可观测性 MCP(可选)
当 Devin 可以访问你的遥测数据时,就能撰写更高质量的事后复盘。启用一个或多个 MCP,以便 Devin 可以拉取事故时间段内的真实数据:Datadog MCP — 前往 Settings > MCP Marketplace,找到 Datadog,点击 Enable,然后输入你的 API/Application 密钥。Devin 将查询日志、指标、部署事件和监控历史。Sentry MCP — 在 MCP Marketplace 中找到 Sentry,点击 Enable,并完成 OAuth 流程。Devin 将拉取错误详情、堆栈跟踪和发布标签。连接后,Devin 会自动将遥测数据与事故时间线关联起来,从而生成一份有据可依的事后复盘。详细了解连接 MCP 服务器。
自定义复盘
根据你团队的事后复盘流程定制这条流水线:使用 Playbook 定义你的事后复盘模板——包括章节、严重性分级、必填字段以及输出的存储位置。在 API 请求中传入
playbook_id,即可统一每一份事后复盘的格式。按严重性分流。 在你的桥接服务中添加逻辑,仅为 P1/P2 事故生成事后复盘。严重性较低的事故可能不需要完整的书面总结。添加 Knowledge,纳入你的架构、服务负责人以及过往事故等信息,这样 Devin 就能串联起相关线索——例如,“orders-service 依赖 inventory-service,而后者已知在高负载下容易出现超时问题。”发布到你的 wiki。 与其提交到 repo,不如让 Devin 通过会话提示将事后复盘发布到 Confluence、Notion 或你的内部 wiki。