Vai al contenuto principale
Quando Datadog invia un alert su Slack, Devin se ne occupa subito. Questo template rimane in ascolto dei messaggi di alert dell’app Datadog, usa Datadog MCP per recuperare le metriche, le righe di log e le tracce distribuite alla base del problema, quindi pubblica un’analisi della causa principale nel thread prima ancora che una persona abbia finito di leggere l’alert.

Usa questo template

Apri Datadog Alert Investigation in Devin e crea l’automazione con la configurazione predefinita. Puoi personalizzarla prima di salvarla.
Cerchi una guida pratica? Consulta il tutorial passo passo per Datadog Alert Investigation.

Cosa fa questa automazione

Il modello di automazione qui è dall’alert all’indagine in pochi secondi. Invece di avvisare una persona ogni volta che viene superata una soglia, lasci che Devin si occupi dei primi 15 minuti di lavoro — elencare i deploy recenti, correlare le metriche, recuperare le righe di log sospette — così la persona che alla fine apre Slack parte dalla fase “cosa facciamo adesso?” invece che dalla fase “cosa si è rotto?”.

Come funziona

Attivazione: evento Slackmessage
  • Evento: slack:message
    • Condizioni:
      • channel eq #alerts
Cosa fa Devin: Avvia una sessione con il contesto completo dell’evento, esegue il prompt seguente e, facoltativamente, ti notifica in caso di errore.

Prerequisiti

Esempio di prompt

Il template include questo prompt. Puoi modificarlo dopo aver fatto clic su Usa template oppure lasciarlo così com’è.

Configurazione

  1. Apri Automations → Templates in Devin.
  2. Fai clic su Datadog Alert Investigation. Si apre la pagina di creazione con questo template già precompilato.
  3. Collega le integrazioni richieste e installa i server MCP, se non l’hai già fatto.
  4. Sostituisci eventuali valori segnaposto nelle condizioni del trigger (ad esempio, sostituisci your-org/your-repo con la tua repo effettiva).
  5. Rivedi il prompt e adattalo al linguaggio, alle convenzioni e alle barriere di sicurezza del tuo team.
  6. Fai clic su Crea automazione.
La maggior parte dei template di automazione include limiti suggeriti per ACU e invocazioni per contenere i costi durante il rollout iniziale. Lasciali invariati finché non sei sicuro del comportamento dell’automazione, poi aumentali in base al tuo carico di lavoro.

Quando usare questo modello

  • Canali di alert molto rumorosi, in cui la maggior parte delle segnalazioni si rivela dovuta a problemi intermittenti già noti
  • org SRE con molti monitoraggi che non possono permettersi un primo intervento umano su ogni alert
  • Alert di regressione post-deploy correlati a PR specifiche
  • Mitigazione dell’affaticamento da paging nei turni di reperibilità

Idee per Customization

  • Filtra per nomi di monitor specifici, tag o livelli di gravità
  • Instrada monitor diversi a playbook diversi
  • Aggiungi Sentry MCP per correlare le eccezioni
  • Esegui l’escalation a SRE Incident Response per gli avvisi di gravità massima

Vedi anche