Passer au contenu principal

Documentation Index

Fetch the complete documentation index at: https://docs.devinenterprise.com/llms.txt

Use this file to discover all available pages before exploring further.

Fast Context est un sous-agent spécialisé de Devin Desktop qui récupère le code pertinent de votre base de code jusqu’à 20x plus vite qu’une recherche agentique traditionnelle. Il permet à Cascade de comprendre rapidement de grandes bases de code tout en conservant l’intelligence des modèles de pointe.

Utiliser Fast Context

Lorsque Cascade reçoit une requête qui nécessite une recherche de code, Fast Context se déclenche automatiquement. Vous remarquerez que Fast Context fonctionne lorsque :
  • Cascade identifie rapidement les fichiers pertinents dans votre base de code
  • Les requêtes sur de grandes bases de code s’exécutent plus rapidement qu’auparavant
  • Cascade passe moins de temps à lire du code non pertinent

Comment cela fonctionne

Fast Context utilise SWE-grep et SWE-grep-mini, des modèles personnalisés entraînés spécifiquement pour retrouver rapidement du code. Ces modèles associent la rapidité de la recherche traditionnelle par embeddings à l’intelligence d’une exploration pilotée par agent. Lorsque vous adressez à Cascade une requête qui nécessite de parcourir votre base de code, Fast Context s’active automatiquement pour :
  1. Identifier les fichiers et sections de code pertinents à l’aide d’appels d’outils en parallèle
  2. Exécuter plusieurs recherches simultanément
  3. Renvoyer des résultats ciblés en quelques secondes plutôt qu’en quelques minutes
Cette approche évite de surcharger le contexte et vise à atténuer le compromis traditionnel entre vitesse et précision. En déléguant la recherche à un sous-agent spécialisé, Cascade préserve son budget de contexte et son intelligence pour la tâche proprement dite.

Modèles SWE-grep

Fast Context s’appuie sur la famille de modèles SWE-grep :
  • SWE-grep : variante très performante optimisée pour les tâches de recherche complexes
  • SWE-grep-mini : variante ultra-rapide offrant plus de 2 800 tokens par seconde
Les deux modèles sont entraînés par apprentissage par renforcement afin d’exceller dans l’exécution parallèle d’outils et la navigation efficace dans la base de code. Ils exécutent jusqu’à 8 appels d’outils en parallèle par tour, sur un maximum de 4 tours, ce qui leur permet d’explorer simultanément différentes parties de votre base de code. Les modèles utilisent un ensemble restreint d’outils compatibles multiplateformes (grep, read, glob) afin de garantir des performances cohérentes sur différents systèmes d’exploitation et environnements de développement.