Zum Hauptinhalt springen
Richten Sie eine ständig verfügbare SRE-Rufbereitschaft ein, indem Sie Devin mit Ihrem Incident-Channel verknüpfen. Wenn jemand mit 🚨 auf eine Slack-Nachricht reagiert, schaltet sich Devin ein, gleicht Datadog-Metriken, Sentry-Exceptions und aktuelle Deployments ab und postet dann noch vor der ersten Tasse Kaffee eines Menschen eine Zusammenfassung der Grundursache in den Thread.

Diese Vorlage verwenden

Öffnen Sie SRE Incident Response in Devin und erstellen Sie die Automatisierung mit der Standardkonfiguration. Sie können sie vor dem Speichern anpassen.

Was diese Automatisierung macht

Diese Automatisierung basiert auf der universellen 🚨-Emoji-Reaktion — der schnellsten Möglichkeit, „Das ist ein Incident“ zu kennzeichnen. Wenn Devin sieht, dass die Reaktion in #incidents gesetzt wurde (oder in dem Channel, den Sie festlegen), liest es den vollständigen Nachrichten-Thread, um den Kontext zu erfassen, ruft die Datadog-Alerts und Sentry-Fehler der letzten Stunde ab, prüft kürzliche Merges auf verdächtige Änderungen und veröffentlicht einen strukturierten Postmortem-Entwurf. Danach kann ein Mensch übernehmen oder im Thread mit einer Folgenachricht die Untersuchung steuern.

So funktioniert es

Auslöser: Slack-Ereignisreaction.added
  • Ereignis: slack:reaction_added
    • Bedingungen:
      • reaction eq rotating_light
      • channel eq #incidents
Was Devin macht: Startet eine Sitzung mit dem vollständigen Ereigniskontext, führt den unten stehenden Prompt aus und benachrichtigt Sie optional im Fehlerfall.

Voraussetzungen

Beispiel-Prompt

Die Vorlage wird mit diesem Prompt mitgeliefert. Sie können ihn nach Klick auf Vorlage verwenden bearbeiten oder unverändert lassen.

So richten Sie es ein

  1. Öffnen Sie in Devin Automations → Templates.
  2. Klicken Sie auf SRE Incident Response. Die Erstellungsseite wird mit dieser Vorlage vorab ausgefüllt geöffnet.
  3. Verbinden Sie alle erforderlichen Integrationen und installieren Sie MCP-Server, falls Sie das noch nicht getan haben.
  4. Ersetzen Sie alle Platzhalterwerte in den Trigger-Bedingungen (zum Beispiel your-org/your-repo durch Ihr tatsächliches Repo).
  5. Prüfen Sie den Prompt und passen Sie ihn an Sprache, Konventionen und Vorgaben Ihres Teams an.
  6. Klicken Sie auf Automatisierung erstellen.
Die meisten Automatisierungsvorlagen enthalten empfohlene ACU- und Aufruflimits, um die Kosten zu Beginn des Rollouts zu begrenzen. Belassen Sie diese Werte zunächst unverändert, bis Sie mit dem Verhalten der Automatisierung vertraut sind, und erhöhen Sie sie dann passend zu Ihrem Workload.

Wann diese Vorlage sinnvoll ist

  • Die mittlere Zeit bis zum Beginn einer Untersuchung (MTTI) bei Produktionsalarmen drastisch verkürzen
  • On-Call-Engineers noch vor dem Aufklappen ihres Laptops einen ersten Untersuchungsbericht als Ausgangsbasis bereitstellen
  • Entwürfe für Incident-Postmortems automatisch aus laufenden Threads erstellen
  • Alarme über Dutzende von Services hinweg triagieren, ohne in jeder Schicht ein dediziertes SRE zu haben

Anpassungsideen

  • Das Reaktions-Emoji ändern (z. B. :fire:, :warning:, teamspezifische benutzerdefinierte Emojis)
  • Auf bestimmte Channels pro Service oder Region eingrenzen
  • Sentry MCP und Datadog MCP hinzufügen, um den Untersuchungsumfang zu erweitern
  • Ein Runbook-Playbook anhängen, damit Devin dem üblichen Incident-Ablauf Ihres Teams folgt

Siehe auch