AI Guardrails

Le AI Guardrails consentono agli amministratori Enterprise di definire i limiti di sicurezza relativi alle modalità con cui gli utenti interagiscono con Devin all’interno dell’organizzazione. Le barriere filtrano automaticamente i messaggi in arrivo degli utenti — inclusi messaggi iniziali, messaggi di follow-up e commenti alle pull request (PR) — per rilevare prompt injection, tentativi di esfiltrazione di dati e violazioni delle policy prima che Devin li elabori.

Panoramica

Le barriere di sicurezza costituiscono un ulteriore livello di supervisione sui messaggi inviati a Devin. Analizzano i messaggi degli utenti in tempo reale e possono:

Registrare nei log i messaggi sospetti per una revisione (log_only)
Avvisare l’utente con un banner visibile continuando comunque a elaborare il messaggio (warn_user)
Bloccare i messaggi che violano le policy dell’organizzazione (block_message)
Interrompere l’intera sessione quando viene rilevata una violazione critica (kill_session)

Configurazione delle barriere di sicurezza

Gli amministratori Enterprise possono configurare le barriere di sicurezza dalla pagina delle impostazioni Enterprise o dalla pagina delle impostazioni dell’organizzazione in Settings > Guardrails. La pagina di configurazione delle barriere di sicurezza offre:

Filtro per organizzazione — Visualizza e gestisci le barriere di sicurezza per organizzazioni specifiche all’interno dell’Enterprise
Barriere di sicurezza predefinite — Abilita o disabilita le barriere di sicurezza disponibili e scegli l’azione da intraprendere in caso di violazione (log_only, warn_user, block_message o kill_session)
Collegamenti alle sessioni — Ogni evento della barriera di sicurezza include un collegamento alla sessione di origine per ulteriori analisi

Eventi delle barriere di sicurezza

Quando una barriera di sicurezza viene attivata, Devin registra l’evento includendo i seguenti dettagli:

Il messaggio dell’utente che ha attivato la barriera di sicurezza
La regola della barriera di sicurezza che è stata applicata
L’azione intrapresa (log_only, warn_user, block_message o kill_session)
Un collegamento alla sessione in cui si è verificato l’evento

Gli eventi delle barriere di sicurezza compaiono nei log di audit con il tipo di azione ai_guardrail_violation, consentendo il monitoraggio e l’invio di avvisi automatici. Puoi anche recuperare gli eventi delle barriere di sicurezza a livello di codice tramite l’API delle violazioni delle barriere di sicurezza.

Casi d’uso

Le configurazioni dei guardrail più comuni includono:

Rilevamento di prompt injection — Identificare e bloccare i messaggi degli utenti che tentano di sovrascrivere le istruzioni di Devin o di manipolarne il comportamento
Prevenzione dell’esfiltrazione di dati — Segnalare o bloccare i messaggi che tentano di istruire Devin a inviare dati sensibili a destinazioni non autorizzate
Garantire la conformità alle policy — Analizzare le richieste degli utenti per assicurarsi che siano allineate alle policy di sicurezza e di utilizzo dell’organizzazione

AI Guardrails è una funzionalità Enterprise. Contatta il tuo team di account per saperne di più su come abilitare i guardrail per la tua organizzazione.

Introduzione

Distribuzione

Gestione degli ambienti

Integrazioni

Sicurezza e accesso

Casi d'uso e tutorial

Panoramica

Configurazione delle barriere di sicurezza

Eventi delle barriere di sicurezza

Casi d’uso

​Panoramica

​Configurazione delle barriere di sicurezza

​Eventi delle barriere di sicurezza

​Casi d’uso

Panoramica

Configurazione delle barriere di sicurezza

Eventi delle barriere di sicurezza

Casi d’uso