Pular para o conteúdo principal

Documentation Index

Fetch the complete documentation index at: https://docs.devin.ai/llms.txt

Use this file to discover all available pages before exploring further.

Fast Context é um subagente especializado no Devin Desktop que recupera código relevante da sua base de código em até 20x menos tempo do que a busca tradicional baseada em agentes. Ele permite que o Cascade entenda rapidamente grandes bases de código, mantendo a inteligência dos modelos de última geração.

Como usar Fast Context

Quando o Cascade recebe uma consulta que exige pesquisa de código, o Fast Context é acionado automaticamente. Você perceberá que o Fast Context está funcionando quando:
  • O Cascade identifica rapidamente arquivos relevantes em toda a sua base de código
  • Consultas em bases de código grandes são concluídas mais rapidamente do que antes
  • O Cascade passa menos tempo lendo código irrelevante

Como funciona

O Fast Context usa SWE-grep e SWE-grep-mini, modelos personalizados treinados especificamente para recuperação rápida de código. Esses modelos combinam a velocidade da busca tradicional por embeddings com a inteligência da exploração por agentes. Quando você faz uma consulta ao Cascade que exige pesquisar na sua base de código, o Fast Context é ativado automaticamente para:
  1. Identificar arquivos e trechos de código relevantes usando chamadas paralelas a ferramentas
  2. Executar várias buscas simultaneamente
  3. Retornar resultados precisos em segundos, em vez de minutos
Essa abordagem evita a poluição de contexto e ajuda a mitigar o trade-off tradicional entre velocidade e precisão. Ao delegar a recuperação a um subagente especializado, o Cascade preserva seu orçamento de contexto e sua capacidade de raciocínio para a tarefa em questão.

Modelos SWE-grep

O Fast Context é baseado na família de modelos SWE-grep:
  • SWE-grep: Variante de alta inteligência otimizada para tarefas complexas de busca
  • SWE-grep-mini: Variante ultrarrápida que opera a mais de 2.800 tokens por segundo
Ambos os modelos são treinados com aprendizado por reforço para se destacarem em chamadas paralelas a ferramentas e na navegação eficiente pela base de código. Eles executam até 8 chamadas paralelas a ferramentas por turno, em no máximo 4 turnos, o que permite explorar diferentes partes da sua base de código simultaneamente. Os modelos usam um conjunto restrito de ferramentas compatíveis entre plataformas (grep, read, glob) para garantir desempenho consistente em diferentes sistemas operacionais e ambientes de desenvolvimento.