Zum Hauptinhalt springen
Wenn Datadog einen Alert in Slack auslöst, kümmert sich Devin sofort darum. Diese Vorlage reagiert auf Alert-Nachrichten aus der Datadog-App, verwendet das Datadog MCP, um die zugrunde liegenden Metriken, Logzeilen und verteilten Traces abzurufen, und postet dann noch im Thread eine Root-Cause-Analyse, bevor ein Mensch den Alert überhaupt zu Ende gelesen hat.

Diese Vorlage verwenden

Öffnen Sie Datadog-Alarmanalyse in Devin und erstellen Sie die Automatisierung mit der Standardkonfiguration. Sie können sie vor dem Speichern anpassen.
Suchen Sie nach einer praxisnahen Anleitung? Sehen Sie sich das Schritt-für-Schritt-Tutorial für Datadog-Alarmanalyse an.

Was diese Automatisierung macht

Das Muster dieser Automatisierung ist vom Alert zur Untersuchung in Sekunden. Anstatt jedes Mal einen Menschen zu alarmieren, wenn ein Schwellenwert überschritten wird, lässt du Devin die ersten 15 Minuten der Arbeit übernehmen — aktuelle Deployments auflisten, Metriken korrelieren, verdächtige Logzeilen herausziehen —, sodass die Person, die schließlich Slack öffnet, direkt bei der Phase „Was machen wir als Nächstes?“ einsteigt statt bei der Phase „Was ist eigentlich kaputt?“.

So funktioniert es

Auslöser: Slack-Ereignismessage
  • Ereignis: slack:message
    • Bedingungen:
      • channel eq #alerts
Was Devin tut: Startet eine Sitzung mit dem vollständigen Ereigniskontext, führt den folgenden Prompt aus und benachrichtigt Sie optional bei einem Fehlschlag.

Voraussetzungen

Beispiel-Prompt

Die Vorlage enthält diesen Prompt. Sie können ihn bearbeiten, nachdem Sie auf Vorlage verwenden geklickt haben, oder unverändert lassen.

So richten Sie es ein

  1. Öffnen Sie in Devin Automations → Templates.
  2. Klicken Sie auf Datadog-Alarmanalyse. Die Erstellungsseite wird mit dieser Vorlage bereits vorausgefüllt geöffnet.
  3. Verbinden Sie alle erforderlichen Integrationen und installieren Sie MCP-Server, falls Sie das nicht bereits getan haben.
  4. Ersetzen Sie alle Platzhalterwerte in den Trigger-Bedingungen (zum Beispiel your-org/your-repo durch Ihr tatsächliches Repo).
  5. Prüfen Sie den Prompt und passen Sie ihn an die Sprache, Konventionen und Guardrails Ihres Teams an.
  6. Klicken Sie auf Create automation.
Die meisten Automatisierungsvorlagen enthalten empfohlene ACU- und Aufruflimits, um die Kosten während der frühen Einführungsphase zu begrenzen. Belassen Sie diese Werte unverändert, bis Sie vom Verhalten der Automatisierung überzeugt sind, und erhöhen Sie sie dann passend zu Ihrer Arbeitslast.

Wann diese Vorlage sinnvoll ist

  • Alert-Channels mit viel Rauschen, in denen sich die meisten Meldungen als bekannte Fehlalarme herausstellen
  • SRE-Organisationen mit vielen Monitoren, die es sich nicht leisten können, für jeden Alert zunächst einen Menschen einzusetzen
  • Regression-Alerts nach Deployments, die sich bestimmten PRs zuordnen lassen
  • Zur Verringerung von Alarmmüdigkeit in Rufbereitschaftsrotationen

Ideen für Customization

  • Nach bestimmten Monitor-Namen, Tags oder Schweregraden filtern
  • Verschiedene Monitore an verschiedene Playbooks weiterleiten
  • Sentry MCP hinzufügen, um Exceptions abzugleichen
  • Benachrichtigungen mit dem höchsten Schweregrad an SRE Incident Response eskalieren

Siehe auch