Skip to main content

Resumen diario de salud de Datadog

Sesión diaria que analiza Datadog en busca de errores y publica un resumen de estado en Slack.
AuthorCognition
CategoryAutomatizaciones
FeaturesProgramaciones, MCP, Integraciones
1

Habilitar el MCP de Datadog

Ve a Settings > MCP Marketplace y busca Datadog. Haz clic en Enable y añade dos secretos:Si tu instancia de Datadog usa un sitio personalizado (por ejemplo, datadoghq.eu), configura también la variable opcional DATADOG_SITE.
2

Crear el horario diario

Ve a Schedules en la barra lateral izquierda de app.devin.ai y haz clic en Create schedule:
  • Frequency: Daily: elige una hora entre 30 y 60 minutos antes del standup para que el equipo pueda revisar los resultados durante la reunión
  • Slack channel: Selecciona un canal (por ejemplo, #ops-alerts) para que tu equipo reciba el resumen automáticamente
  • Prompt: Sé específico con los umbrales: instrucciones vagas como “look for issues” generan resúmenes ruidosos que se acaban ignorando
Añade entradas de Knowledge sobre tus servicios para que Devin pueda distinguir entre lo normal y lo anormal; por ejemplo: “El servicio de pagos normalmente funciona con una p99 de 200 ms; cualquier valor por encima de 400 ms es preocupante. El servicio de búsqueda tiene una tasa de error base conocida del 0,5 %.”
3

Lo que ve tu equipo en Slack

Cada mañana, Devin consulta Datadog a través de MCP, compara los resultados con tus umbrales y envía un resumen a tu canal:
Daily Health Digest — Feb 10, 2026

CRITICAL
  payments-service: Error rate at 3.2% (threshold: 1%)
  Started 4h ago, correlates with deploy #487.
  -> Check /api/checkout handler and recent changes.

WARNING
  search-service: p99 latency at 620ms (threshold: 500ms)
  Gradual increase over 3 days. Likely index degradation.
  -> Review query plans for the product search endpoint.

  web-app: Memory at 82% (threshold: 80%)
  Trending upward since Tuesday.
  -> Investigate session handler for possible memory leak.

INFO
  All other services within normal parameters.
  2 monitors recovered in past 24h: cdn-latency, db-replication-lag.
Responde en el hilo de Slack para investigar cualquier hallazgo: Devin mantiene todo el contexto del análisis:
4

Programar actualizaciones semanales de Knowledge

Tus comprobaciones diarias de estado generan un flujo de knowledge suggestions, especialmente cuando respondes a los hallazgos con comentarios como “this is a known baseline” o “ignore this monitor during deploys.” Programa una sesión semanal de Advanced Devin para procesar esas sugerencias, de modo que las próximas ejecuciones sean automáticamente más inteligentes.Configura esto para que se ejecute semanalmente (por ejemplo, los lunes por la mañana) como una sesión de Advanced Devin para que tenga acceso a las herramientas de gestión de Knowledge. Con el tiempo, este ciclo de retroalimentación hará que tus resúmenes diarios sean más precisos: menos falsas alarmas, mejores niveles de severidad y recomendaciones más inteligentes.