Vai al contenuto principale
Mantieni le tue operazioni di produzione costantemente verificate senza dover pagare un consulente SRE dedicato. Questa automazione pianificata esamina la tua infrastruttura come codice, la configurazione CI/CD, l’assetto di monitoraggio e i runbook, segnalando eventuali lacune rispetto alle best practice SRE: avvisi mancanti, turni di reperibilità non aggiornati, runbook assenti per i servizi critici, playbook non presi in carico.

Usa questo template

Apri SRE Health Checker in Devin e crea l’automazione con la configurazione predefinita. Puoi personalizzarla prima di salvarla.

Cosa fa questa automazione

L’ingegneria dell’affidabilità consiste nel mantenere una base solida. SRE Health Checker viene eseguito ogni settimana, controlla la configurazione e fornisce un report con punteggio rispetto alle principali pratiche di affidabilità, così puoi individuare eventuali scostamenti prima che diventino un incidente e correggerli in modo proattivo.

Come funziona

Trigger: Evento di pianificazionerecurring
  • Evento: schedule:recurring
    • Condizioni:
      • rrule corrisponde a FREQ=WEEKLY;BYDAY=MO;BYHOUR=9;BYMINUTE=0
Cosa fa Devin: Avvia una sessione con il contesto completo dell’evento, esegue il prompt seguente e, facoltativamente, ti invia una notifica in caso di errore.

Prerequisiti

Esempio di prompt

Il template include questo prompt. Puoi modificarlo dopo aver fatto clic su Usa template oppure lasciarlo così com’è.

Configurazione

  1. Apri Automations → Templates in Devin.
  2. Fai clic su SRE Health Checker. Si aprirà la pagina di creazione con questo template precompilato.
  3. Collega le integrazioni richieste e installa i server MCP se non l’hai ancora fatto.
  4. Sostituisci i valori segnaposto nelle condizioni del trigger (ad esempio, sostituisci your-org/your-repo con la tua repo).
  5. Rivedi il prompt e adattalo al linguaggio, alle convenzioni e alle barriere di sicurezza del tuo team.
  6. Fai clic su Create automation.
La maggior parte dei template di automazione include limiti consigliati per ACU e invocazioni per contenere i costi durante il rollout iniziale. Lasciali invariati finché non avrai piena fiducia nel comportamento dell’automazione, quindi aumentali in base al tuo carico di lavoro.

Quando usare questo template

  • Team di sviluppo in crescita che stanno definendo le prime pratiche di affidabilità
  • Analisi post-incidente per verificare eventuali lacune sistemiche
  • Team di piattaforma e infrastruttura che gestiscono numerosi servizi
  • Inserimento di nuovi servizi negli standard di affidabilità

Idee per la personalizzazione

  • Definisci l’ambito per servizi, repo o team specifici
  • Personalizza i criteri di audit (aggiungi norme di affidabilità specifiche del team)
  • Incrocia con i dati MCP di Datadog, PagerDuty o Opsgenie
  • Regola i livelli di gravità e i flussi di escalation

Vedi anche