Skip to main content

Täglicher Datadog-Gesundheitsreport

Tägliche Auswertung, die Datadog nach Fehlern durchsucht und einen Gesundheitsbericht in Slack postet.
AuthorCognition
CategoryAutomatisierungen
FeaturesZeitpläne, MCP, Integrationen
1

Datadog-MCP aktivieren

Wechseln Sie zu Settings > MCP Marketplace und suchen Sie nach Datadog. Klicken Sie auf Enable und fügen Sie zwei Secrets hinzu:Wenn Ihre Datadog-Instanz eine benutzerdefinierte Site verwendet (z. B. datadoghq.eu), setzen Sie außerdem die optionale Variable DATADOG_SITE.
2

Tagesplan erstellen

Navigiere in der linken Seitenleiste von app.devin.ai zu Schedules und klicke auf Create schedule:
  • Frequency: Täglich – wähle eine Uhrzeit 30–60 Minuten vor dem Standup-Meeting, damit das Team die Ergebnisse während des Meetings durchgehen kann
  • Slack channel: Wähle einen Kanal (z. B. #ops-alerts), damit dein Team die Zusammenfassung automatisch erhält
  • Prompt: Sei bei Schwellenwerten konkret – vage Anweisungen wie „look for issues“ erzeugen rauschige, leicht ignorierte Zusammenfassungen
Füge Knowledge-Einträge zu deinen Services hinzu, damit Devin zwischen normalem und abnormalem Verhalten unterscheiden kann – zum Beispiel: „Der Zahlungsservice läuft normalerweise mit 200 ms p99; alles über 400 ms ist ein Problem. Der Suchservice hat eine bekannte grundlegende Fehlerrate von 0,5 %.“
3

Was Ihr Team in Slack sieht

Jeden Morgen fragt Devin Datadog über MCP ab, prüft die Ergebnisse anhand deiner Schwellenwerte und postet eine Zusammenfassung in deinem Channel:
Daily Health Digest — Feb 10, 2026

CRITICAL
  payments-service: Error rate at 3.2% (threshold: 1%)
  Started 4h ago, correlates with deploy #487.
  -> Check /api/checkout handler and recent changes.

WARNING
  search-service: p99 latency at 620ms (threshold: 500ms)
  Gradual increase over 3 days. Likely index degradation.
  -> Review query plans for the product search endpoint.

  web-app: Memory at 82% (threshold: 80%)
  Trending upward since Tuesday.
  -> Investigate session handler for possible memory leak.

INFO
  All other services within normal parameters.
  2 monitors recovered in past 24h: cdn-latency, db-replication-lag.
Antworte im Slack-Thread, um jedem Befund weiter nachzugehen — Devin behält den vollständigen Kontext des Scans:
4

Plane wöchentliche Knowledge-Updates

Ihre täglichen Health-Checks erzeugen einen Strom von Knowledge-Vorschlägen — insbesondere, wenn Sie auf Findings mit Feedback wie „das ist ein bekannter Baseline-Wert“ oder „diesen Monitor während Deployments ignorieren“ antworten. Planen Sie eine wöchentliche Advanced Devin-Session ein, um diese Vorschläge zu verarbeiten, sodass zukünftige Durchläufe automatisch intelligenter werden.Konfigurieren Sie dies als wöchentliche Ausführung (z. B. Montagmorgen) als Advanced Devin-Session, damit es Zugriff auf die Knowledge-Verwaltungstools hat. Mit der Zeit führt diese Feedbackschleife dazu, dass Ihre täglichen Digests genauer werden — weniger Fehlalarme, bessere Einstufungen der Schweregrade und intelligentere Empfehlungen.