Visão geral
- Registrar mensagens suspeitas para revisão (
log_only) - Avisar o usuário com um banner visível enquanto a mensagem ainda é processada (
warn_user) - Bloquear mensagens que violem as políticas da organização (
block_message) - Encerrar totalmente a sessão quando uma violação crítica for detectada (
kill_session)
Configurando Guardrails
- Filtro de organização — Visualize e gerencie guardrails para organizações específicas dentro da Enterprise
- Guardrails predefinidos — Ative ou desative os guardrails disponíveis e escolha a ação a ser tomada em caso de violação (
log_only,warn_user,block_messageoukill_session) - Links de sessão — Cada evento de guardrail contém um link para a sessão de origem para investigação
Eventos de guardrail
- A mensagem do usuário que disparou o guardrail
- A regra de guardrail que foi acionada
- A ação executada (
log_only,warn_user,block_messageoukill_session) - Um link para a sessão em que o evento ocorreu
ai_guardrail_violation, permitindo monitoramento e alerta automatizados. Você também pode recuperar eventos de guardrail de forma programática pela API de violações de guardrail.
Casos de uso
- Detecção de prompt injection — Identificar e bloquear mensagens de usuários que tentam substituir as instruções do Devin ou manipular seu comportamento
- Prevenção de exfiltração de dados — Marcar ou bloquear mensagens que tentam instruir o Devin a enviar dados confidenciais para destinos não autorizados
- Garantia de conformidade com políticas — Verificar solicitações de usuários para garantir que estejam alinhadas com as políticas organizacionais de segurança e uso
AI Guardrails é um recurso Enterprise. Entre em contato com a equipe da sua conta para saber mais sobre como ativar guardrails para sua organização.

