Guardrails de IA - Devin Docs

Guardrails de IA permitem que administradores Enterprise definam limites de segurança sobre como os usuários interagem com o Devin em toda a organização. Esses guardrails analisam automaticamente as mensagens recebidas dos usuários — incluindo mensagens iniciais, mensagens de acompanhamento e comentários em PR — para detectar prompt injection, tentativas de exfiltração de dados e violações de políticas antes que o Devin as processe.

Visão geral

Os guardrails funcionam como uma camada adicional de supervisão em mensagens enviadas para o Devin. Eles analisam mensagens de usuários em tempo real e podem:

Registrar mensagens suspeitas para revisão (log_only)
Avisar o usuário com um banner visível enquanto a mensagem ainda é processada (warn_user)
Bloquear mensagens que violem as políticas da organização (block_message)
Encerrar totalmente a sessão quando uma violação crítica for detectada (kill_session)

Configurando Guardrails

Administradores Enterprise podem configurar guardrails na página de configurações da Enterprise ou na página de configurações da organização em Settings > Guardrails. A página de configuração de guardrails inclui:

Filtro de organização — Visualize e gerencie guardrails para organizações específicas dentro da Enterprise
Guardrails predefinidos — Ative ou desative os guardrails disponíveis e escolha a ação a ser tomada em caso de violação (log_only, warn_user, block_message ou kill_session)
Links de sessão — Cada evento de guardrail contém um link para a sessão de origem para investigação

Eventos de guardrail

Quando um guardrail é disparado, Devin registra o evento com detalhes, incluindo:

A mensagem do usuário que disparou o guardrail
A regra de guardrail que foi acionada
A ação executada (log_only, warn_user, block_message ou kill_session)
Um link para a sessão em que o evento ocorreu

Os eventos de guardrail aparecem nos logs de auditoria com o tipo de ação ai_guardrail_violation, permitindo monitoramento e alerta automatizados. Você também pode recuperar eventos de guardrail de forma programática pela API de violações de guardrail.

Casos de uso

Configurações comuns de guardrails incluem:

Detecção de prompt injection — Identificar e bloquear mensagens de usuários que tentam substituir as instruções do Devin ou manipular seu comportamento
Prevenção de exfiltração de dados — Marcar ou bloquear mensagens que tentam instruir o Devin a enviar dados confidenciais para destinos não autorizados
Garantia de conformidade com políticas — Verificar solicitações de usuários para garantir que estejam alinhadas com as políticas organizacionais de segurança e uso

AI Guardrails é um recurso Enterprise. Entre em contato com a equipe da sua conta para saber mais sobre como ativar guardrails para sua organização.

​Visão geral

​Configurando Guardrails

​Eventos de guardrail

​Casos de uso

Visão geral

Configurando Guardrails

Eventos de guardrail

Casos de uso