Présentation
- Consigner les messages suspects pour examen (
log_only) - Avertir l’utilisateur au moyen d’une bannière visible tout en continuant à traiter le message (
warn_user) - Bloquer les messages qui enfreignent les politiques de l’organisation (
block_message) - Mettre fin à la session lorsqu’une violation critique est détectée (
kill_session)
Configuration des garde-fous
- Filtre d’organisation — Afficher et gérer les garde-fous pour des organisations spécifiques au sein de l’Enterprise
- Garde-fous prédéfinis — Activer ou désactiver les garde-fous disponibles et choisir l’action à effectuer en cas de violation (
log_only,warn_user,block_messageoukill_session) - Liens vers les sessions — Chaque événement de garde-fou renvoie à la session d’origine pour analyse
Événements de garde-fou
- le message utilisateur qui a déclenché le garde-fou
- la règle de garde-fou correspondante
- l’action effectuée (
log_only,warn_user,block_messageoukill_session) - un lien vers la session où l’événement s’est produit
ai_guardrail_violation, ce qui permet une surveillance et des alertes automatisées. Vous pouvez également récupérer les événements de garde-fou par programmation via l’API des violations de garde-fou.
Cas d’utilisation
- Détection de l’injection de prompt — Identifier et bloquer les messages des utilisateurs qui tentent de remplacer les instructions de Devin ou de manipuler son comportement
- Prévention de l’exfiltration de données — Signaler ou bloquer les messages qui tentent d’instruire Devin afin qu’il envoie des données sensibles vers des destinations non autorisées
- Faire respecter les politiques — Filtrer les demandes des utilisateurs afin de s’assurer qu’elles sont conformes aux politiques de sécurité et d’utilisation de l’organisation
AI Guardrails est une fonctionnalité Enterprise. Contactez votre équipe en charge de votre compte pour en savoir plus sur l’activation d’AI Guardrails pour votre organisation.

