Zum Hauptinhalt springen

Documentation Index

Fetch the complete documentation index at: https://docs.devin.ai/llms.txt

Use this file to discover all available pages before exploring further.

Fast Context ist ein spezialisierter Subagent in Devin Desktop, der relevanten Code aus deiner Codebasis bis zu 20-mal schneller abruft als herkömmliche agentenbasierte Suche. Es ermöglicht Cascade, große Codebasen schnell zu erfassen, ohne auf die Intelligenz modernster Modelle zu verzichten.

Fast Context verwenden

Wenn Cascade eine Anfrage erhält, die eine Codesuche erfordert, wird Fast Context automatisch aktiviert. Sie erkennen, dass Fast Context arbeitet, wenn:
  • Cascade relevante Dateien in Ihrer Codebasis schnell identifiziert
  • Anfragen in großen Codebasen schneller abgeschlossen werden als zuvor
  • Cascade weniger Zeit damit verbringt, irrelevanten Code zu lesen

So funktioniert es

Fast Context verwendet SWE-grep und SWE-grep-mini, benutzerdefinierte Modelle, die speziell für die schnelle Codesuche trainiert wurden. Diese Modelle kombinieren die Geschwindigkeit der herkömmlichen Embedding-Suche mit der Intelligenz agentengestützter Exploration. Wenn Sie eine Abfrage an Cascade stellen, die eine Suche in Ihrer Codebasis erfordert, wird Fast Context automatisch aktiviert, um:
  1. Relevante Dateien und Codeabschnitte mithilfe paralleler Tool-Aufrufe zu identifizieren
  2. Mehrere Suchen gleichzeitig auszuführen
  3. Gezielte Ergebnisse in Sekunden statt in Minuten zurückzugeben
Dieser Ansatz verhindert eine Überfrachtung des Kontexts und soll den herkömmlichen Zielkonflikt zwischen Geschwindigkeit und Genauigkeit verringern. Indem die Informationsbeschaffung an einen spezialisierten Subagenten delegiert wird, spart Cascade sein Kontextbudget und seine Intelligenz für die eigentliche Aufgabe.

SWE-grep-Modelle

Fast Context basiert auf der SWE-grep-Modellfamilie:
  • SWE-grep: Leistungsstarke Variante, optimiert für komplexe Retrieval-Aufgaben
  • SWE-grep-mini: Ultraschnelle Variante mit mehr als 2.800 Tokens pro Sekunde
Beide Modelle werden mit Reinforcement Learning trainiert, um bei parallelen Tool-Aufrufen und der effizienten Navigation in der Codebasis besonders gut zu sein. Sie führen pro Durchgang bis zu 8 parallele Tool-Aufrufe über maximal 4 Durchgänge aus, sodass sie verschiedene Teile Ihrer Codebasis gleichzeitig erkunden können. Die Modelle verwenden einen eingeschränkten Satz plattformübergreifend kompatibler Tools (grep, read, glob), um eine konsistente Leistung über verschiedene Betriebssysteme und Entwicklungsumgebungen hinweg sicherzustellen.