Overview
- Registrar mensajes sospechosos para su revisión (
log_only) - Advertir al usuario con un banner visible mientras se sigue procesando el mensaje (
warn_user) - Bloquear mensajes que infringen las políticas de la organización (
block_message) - Finalizar por completo la sesión cuando se detecta una infracción crítica (
kill_session)
Configuring Guardrails
- Filtro de organización — Ver y administrar guardrail para organizaciones específicas dentro de Enterprise
- Guardrail preestablecidos — Habilitar o deshabilitar los guardrail disponibles y elegir la acción que se debe tomar en caso de violación (
log_only,warn_user,block_messageokill_session) - Enlaces de sesión — Cada evento de guardrail se vincula con la sesión de origen para su investigación
Guardrail Events
- El mensaje del usuario que activó el guardrail
- La regla de guardrail que coincidió
- La acción realizada (
log_only,warn_user,block_messageokill_session) - Un enlace a la sesión donde ocurrió el evento
ai_guardrail_violation, lo que permite el monitoreo y las alertas automatizados. También puedes recuperar eventos de guardrail de forma programática mediante la API de infracciones de guardrails.
Casos de uso
- Detección de prompt injection — Identificar y bloquear mensajes de usuario que intentan anular las instrucciones de Devin o manipular su comportamiento
- Prevención de exfiltración de datos — Marcar o bloquear mensajes que intentan instruir a Devin para que envíe datos sensibles a destinos no autorizados
- Garantizar el cumplimiento de políticas — Analizar las solicitudes de los usuarios para asegurarse de que se alineen con las políticas de seguridad y uso de la organización
AI Guardrails es una funcionalidad de Enterprise. Ponte en contacto con tu equipo de cuentas para obtener más información sobre cómo habilitar guardrails para tu organización.

