Überblick
- Verdächtige Nachrichten protokollieren zur Überprüfung (
log_only) - Den Benutzer warnen mit einem sichtbaren Banner, während die Nachricht weiterhin verarbeitet wird (
warn_user) - Nachrichten blockieren, die gegen Richtlinien der Organisation verstoßen (
block_message) - Die Sitzung vollständig beenden, wenn ein kritischer Verstoß erkannt wird (
kill_session)
Konfiguration von Guardrails
- Organisationsfilter — Anzeigen und Verwalten von Guardrails für bestimmte Organisationen innerhalb der Enterprise-Umgebung
- Vordefinierte Guardrails — Aktivieren oder Deaktivieren verfügbarer Guardrails und auswählen der Aktion bei Verstößen (
log_only,warn_user,block_messageoderkill_session) - Sitzungslinks — Jedes Guardrail-Ereignis führt zur weiteren Untersuchung zurück zur ursprünglichen Sitzung
Guardrail-Ereignisse
- der Nutzernachricht, die das Guardrail ausgelöst hat
- der Guardrail-Regel, auf die es zutraf
- der ergriffenen Aktion (
log_only,warn_user,block_messageoderkill_session) - einem Link zu der Sitzung, in der das Ereignis aufgetreten ist
ai_guardrail_violation und ermöglichen automatisierte Überwachung und Benachrichtigungen. Sie können Guardrail-Ereignisse auch programmgesteuert über die API für Guardrail-Verstöße abrufen.
Anwendungsfälle
- Erkennung von Prompt-Injection — Erkennen und Blockieren von Nutzernachrichten, die versuchen, Devins Anweisungen zu überschreiben oder sein Verhalten zu manipulieren
- Verhinderung von Datenexfiltration — Markieren oder Blockieren von Nachrichten, die versuchen, Devin anzuweisen, vertrauliche Daten an nicht autorisierte Ziele zu senden
- Durchsetzung der Einhaltung von Richtlinien — Überprüfen von Nutzeranfragen, um sicherzustellen, dass sie mit den Sicherheits- und Nutzungsrichtlinien der Organisation übereinstimmen
AI Guardrails ist eine Enterprise-Funktion. Wenden Sie sich an Ihr Account-Team, um mehr darüber zu erfahren, wie Sie Guardrails für Ihre Organisation aktivieren können.

