Skip to main content

Resumo Diário de Saúde do Datadog

Sessão diária que analisa o Datadog em busca de erros e publica um resumo de saúde no Slack.
AuthorCognition
CategoryAutomatizações
FeaturesAgendamentos, MCP, Integrações
1

Habilitar o Datadog MCP

Vá para Settings > MCP Marketplace e pesquise por Datadog. Clique em Enable e adicione dois segredos:Se a sua instância do Datadog usar um site personalizado (por exemplo, datadoghq.eu), defina também a variável opcional DATADOG_SITE.
2

Crie a programação diária

Navegue até Schedules na barra lateral esquerda em app.devin.ai e clique em Create schedule:
  • Frequency: Daily — escolha um horário entre 30 e 60 minutos antes do standup para que a equipe possa revisar os resultados durante a reunião
  • Slack channel: Selecione um canal (por exemplo, #ops-alerts) para que sua equipe receba o resumo automaticamente
  • Prompt: Seja específico sobre os limites — instruções vagas como “look for issues” produzem resumos ruidosos que acabam sendo ignorados
Adicione entradas de Knowledge sobre seus serviços para que Devin possa distinguir o que é normal do que é anormal — por exemplo: “O serviço de pagamentos normalmente opera com p99 de 200 ms; qualquer valor acima de 400 ms é motivo de atenção. O serviço de busca tem uma taxa de erro base conhecida de 0,5%.”
3

O que sua equipe vê no Slack

Todas as manhãs, Devin consulta o Datadog via MCP, verifica os resultados em relação aos seus limiares e envia um resumo para o seu canal:
Daily Health Digest — Feb 10, 2026

CRITICAL
  payments-service: Error rate at 3.2% (threshold: 1%)
  Started 4h ago, correlates with deploy #487.
  -> Check /api/checkout handler and recent changes.

WARNING
  search-service: p99 latency at 620ms (threshold: 500ms)
  Gradual increase over 3 days. Likely index degradation.
  -> Review query plans for the product search endpoint.

  web-app: Memory at 82% (threshold: 80%)
  Trending upward since Tuesday.
  -> Investigate session handler for possible memory leak.

INFO
  All other services within normal parameters.
  2 monitors recovered in past 24h: cdn-latency, db-replication-lag.
Responda na thread do Slack para detalhar qualquer achado — Devin mantém todo o contexto da varredura:
4

Agendar atualizações semanais do Knowledge

Suas verificações diárias de saúde geram um fluxo de sugestões de Knowledge — especialmente quando você responde às descobertas com feedback como “this is a known baseline” ou “ignore this monitor during deploys.” Agende uma sessão semanal do Advanced Devin para processar essas sugestões, de modo que as próximas execuções fiquem automaticamente mais inteligentes.Configure isso para ser executado semanalmente (por exemplo, na segunda-feira de manhã) como uma sessão Advanced Devin, para que Devin tenha acesso às ferramentas de gerenciamento de Knowledge. Com o tempo, esse ciclo de feedback faz com que seus resumos diários se tornem mais precisos — menos falsos alarmes, melhores avaliações de severidade e recomendações mais inteligentes.