Fast Context

Fast Context é um subagente especializado no Devin Desktop que recupera código relevante da sua base de código em até 20x menos tempo do que a busca tradicional baseada em agentes. Ele permite que o Cascade entenda rapidamente grandes bases de código, mantendo a inteligência dos modelos de última geração.

Como usar Fast Context

Quando o Cascade recebe uma consulta que exige pesquisa de código, o Fast Context é acionado automaticamente. Você perceberá que o Fast Context está funcionando quando:

O Cascade identifica rapidamente arquivos relevantes em toda a sua base de código
Consultas em bases de código grandes são concluídas mais rapidamente do que antes
O Cascade passa menos tempo lendo código irrelevante

Como funciona

O Fast Context usa SWE-grep e SWE-grep-mini, modelos personalizados treinados especificamente para recuperação rápida de código. Esses modelos combinam a velocidade da busca tradicional por embeddings com a inteligência da exploração por agentes. Quando você faz uma consulta ao Cascade que exige pesquisar na sua base de código, o Fast Context é ativado automaticamente para:

Identificar arquivos e trechos de código relevantes usando chamadas paralelas a ferramentas
Executar várias buscas simultaneamente
Retornar resultados precisos em segundos, em vez de minutos

Essa abordagem evita a poluição de contexto e ajuda a mitigar o trade-off tradicional entre velocidade e precisão. Ao delegar a recuperação a um subagente especializado, o Cascade preserva seu orçamento de contexto e sua capacidade de raciocínio para a tarefa em questão.

Modelos SWE-grep

O Fast Context é baseado na família de modelos SWE-grep:

SWE-grep: Variante de alta inteligência otimizada para tarefas complexas de busca
SWE-grep-mini: Variante ultrarrápida que opera a mais de 2.800 tokens por segundo

Ambos os modelos são treinados com aprendizado por reforço para se destacarem em chamadas paralelas a ferramentas e na navegação eficiente pela base de código. Eles executam até 8 chamadas paralelas a ferramentas por turno, em no máximo 4 turnos, o que permite explorar diferentes partes da sua base de código simultaneamente. Os modelos usam um conjunto restrito de ferramentas compatíveis entre plataformas (grep, read, glob) para garantir desempenho consistente em diferentes sistemas operacionais e ambientes de desenvolvimento.

Devin Desktop

Central de Comando do Agente

Lançamentos

Plugins do Windsurf

Contas

Segurança

Como usar Fast Context

Como funciona

Modelos SWE-grep

​Como usar Fast Context

​Como funciona

​Modelos SWE-grep

Como usar Fast Context

Como funciona

Modelos SWE-grep