Pular para o conteúdo principal
Guardrails de IA permitem que administradores Enterprise definam limites de segurança sobre como os usuários interagem com o Devin em toda a organização. Esses guardrails analisam automaticamente as mensagens recebidas dos usuários — incluindo mensagens iniciais, mensagens de acompanhamento e comentários em PR — para detectar prompt injection, tentativas de exfiltração de dados e violações de políticas antes que o Devin as processe.

Visão geral

Os guardrails funcionam como uma camada adicional de supervisão em mensagens enviadas para o Devin. Eles analisam mensagens de usuários em tempo real e podem:
  • Registrar mensagens suspeitas para revisão (log_only)
  • Avisar o usuário com um banner visível enquanto a mensagem ainda é processada (warn_user)
  • Bloquear mensagens que violem as políticas da organização (block_message)
  • Encerrar totalmente a sessão quando uma violação crítica for detectada (kill_session)

Configurando Guardrails

Administradores Enterprise podem configurar guardrails na página de configurações da Enterprise ou na página de configurações da organização em Settings > Guardrails. A página de configuração de guardrails inclui:
  • Filtro de organização — Visualize e gerencie guardrails para organizações específicas dentro da Enterprise
  • Guardrails predefinidos — Ative ou desative os guardrails disponíveis e escolha a ação a ser tomada em caso de violação (log_only, warn_user, block_message ou kill_session)
  • Links de sessão — Cada evento de guardrail contém um link para a sessão de origem para investigação

Eventos de guardrail

Quando um guardrail é disparado, Devin registra o evento com detalhes, incluindo:
  • A mensagem do usuário que disparou o guardrail
  • A regra de guardrail que foi acionada
  • A ação executada (log_only, warn_user, block_message ou kill_session)
  • Um link para a sessão em que o evento ocorreu
Os eventos de guardrail aparecem nos logs de auditoria com o tipo de ação ai_guardrail_violation, permitindo monitoramento e alerta automatizados. Você também pode recuperar eventos de guardrail de forma programática pela API de violações de guardrail.

Casos de uso

Configurações comuns de guardrails incluem:
  • Detecção de prompt injection — Identificar e bloquear mensagens de usuários que tentam substituir as instruções do Devin ou manipular seu comportamento
  • Prevenção de exfiltração de dados — Marcar ou bloquear mensagens que tentam instruir o Devin a enviar dados confidenciais para destinos não autorizados
  • Garantia de conformidade com políticas — Verificar solicitações de usuários para garantir que estejam alinhadas com as políticas organizacionais de segurança e uso
AI Guardrails é um recurso Enterprise. Entre em contato com a equipe da sua conta para saber mais sobre como ativar guardrails para sua organização.