Passer au contenu principal
Assurez l’audit de vos opérations de production sans payer un consultant SRE dédié. Cette automatisation planifiée passe en revue votre infrastructure as code, votre configuration CI/CD, votre configuration de supervision et vos runbooks, en signalant les écarts par rapport aux bonnes pratiques SRE : alertes manquantes, rotations d’astreinte obsolètes, runbooks absents pour les services critiques, playbooks non acquittés.

Utiliser ce modèle

Ouvrez SRE Health Checker dans Devin et créez l’automatisation avec la configuration par défaut. Vous pouvez la personnaliser avant de l’enregistrer.

Ce que fait cette automatisation

L’ingénierie de la fiabilité consiste à maintenir une base de référence. SRE Health Checker s’exécute chaque semaine, audite votre configuration et vous fournit un rapport noté au regard des principales pratiques de fiabilité — afin que vous puissiez repérer les écarts avant qu’ils ne deviennent un incident et les corriger de manière proactive.

Fonctionnement

Déclencheur : Événement de planificationrecurring
  • Événement : schedule:recurring
    • Conditions :
      • rrule correspond à FREQ=WEEKLY;BYDAY=MO;BYHOUR=9;BYMINUTE=0
Ce que Devin fait : Lance une session avec l’intégralité du contexte de l’événement, exécute le prompt ci-dessous et, le cas échéant, vous avertit en cas d’échec.

Prérequis

Exemple de prompt

Ce modèle inclut ce prompt. Vous pouvez le modifier après avoir cliqué sur Utiliser le modèle, ou le laisser tel quel.

Configuration

  1. Ouvrez Automations → Templates dans Devin.
  2. Cliquez sur SRE Health Checker. La page de création s’ouvre avec ce modèle déjà prérempli.
  3. Connectez toutes les intégrations requises et installez les serveurs MCP si vous ne l’avez pas déjà fait.
  4. Remplacez toutes les valeurs fictives dans les conditions de déclenchement (par exemple, remplacez your-org/your-repo par votre dépôt réel).
  5. Passez en revue le prompt et adaptez-le à la terminologie, aux conventions et aux garde-fous de votre équipe.
  6. Cliquez sur Create automation.
La plupart des modèles d’automatisation incluent des limites suggérées d’ACU et d’invocations pour contenir les coûts lors du déploiement initial. Conservez-les telles quelles jusqu’à ce que vous ayez confiance dans le comportement de l’automatisation, puis augmentez-les en fonction de votre charge de travail.

Quand utiliser ce modèle

  • Équipes d’ingénierie en pleine croissance mettant en place leurs premières pratiques de fiabilité
  • Revues post-incident visant à repérer des lacunes systémiques
  • Équipes plateforme et infrastructure gérant de nombreux services
  • Intégration de nouveaux services dans des normes de fiabilité

Idées de personnalisation

  • Limiter le périmètre à des services, repos ou équipes spécifiques
  • Personnaliser les critères d’audit (ajouter des normes de fiabilité propres à l’équipe)
  • Recouper avec les données MCP de Datadog, PagerDuty ou Opsgenie
  • Ajuster les niveaux de gravité et les procédures d’escalade

Voir aussi