跳转到主要内容
将 Devin 接入你的事件频道,即可搭建一套始终在线的 SRE 值班响应机制。当有人对一条 Slack 消息用 🚨 表情作出回应时,Devin 就会立即介入——关联 Datadog 指标、Sentry 异常和最近的部署记录,并在人类连第一杯咖啡都还没喝完之前,就把根因摘要发回会话线程。

使用此模板

在 Devin 中打开 SRE Incident Response,并使用默认配置创建此自动化。你可以在保存前进行自定义。

此自动化功能的作用

此自动化功能围绕通用的 🚨 emoji 反应构建——这是标记“这是一个事件”的最快方式。当 Devin 发现 #incidents 中出现该反应时 (或你指定的任何频道) ,它会读取完整的消息会话线程以获取上下文,拉取过去一小时内的 Datadog 告警和 Sentry 错误,检查最近的合并中是否存在可疑更改,并发布一份结构化的事后分析草稿。之后可由人工接手,或在线程中发送后续消息来引导调查。

工作原理

触发器Slack 事件reaction.added
  • 事件slack:reaction_added
    • 条件
      • reaction eq rotating_light
      • channel eq #incidents
Devin 会执行的操作:在包含完整事件上下文的情况下启动一个会话,执行下方提示,并在失败时选择性通知你。

前提条件

示例提示

此模板自带以下提示。点击 使用模板 后可进行编辑,也可保持不变。

进行设置

  1. 在 Devin 中打开 Automations → Templates
  2. 点击 SRE Incident Response。系统会打开创建页面,并预先填入此模板。
  3. 连接所有必需的集成;如果你还没有安装 MCP 服务器,请先安装。
  4. 替换触发条件中的所有占位符值 (例如,将 your-org/your-repo 替换为你的实际 repo) 。
  5. 检查提示,并根据你团队的语言风格、规范和护栏进行调整。
  6. 点击 创建自动化
大多数自动化模板都包含建议的 ACU 和调用次数限制,以便在 rollout 初期控制成本。在你对自动化的行为有足够把握之前,请保持这些设置不变;之后再根据你的工作负载提高限制。

何时使用此模板

  • 大幅缩短生产环境告警的平均调查时间 (MTTI)
  • 让值班工程师甚至在打开笔记本电脑之前,就先拿到一份初步调查报告
  • 根据实时会话线程自动生成事件事后分析草稿
  • 在并非每个班次都有专职 SRE 的情况下,对数十个服务的告警进行分类处置

自定义建议

  • 更改反应 emoji (例如 :fire::warning:、团队专用的自定义 emoji)
  • 按服务或区域将范围限定到特定频道
  • 添加 Sentry MCPDatadog MCP,以扩大调查覆盖面
  • 附加一个 runbook playbook,让 Devin 按照你团队的标准事件流程执行

另请参阅