Saltar al contenido principal

Documentation Index

Fetch the complete documentation index at: https://docs.devinenterprise.com/llms.txt

Use this file to discover all available pages before exploring further.

Fast Context es un subagente especializado de Devin Desktop que recupera código relevante de tu base de código hasta 20 veces más rápido que la búsqueda tradicional basada en agentes. Potencia la capacidad de Cascade para comprender rápidamente grandes bases de código sin perder la inteligencia de los modelos de última generación.

Cómo usar Fast Context

Cuando Cascade recibe una consulta que requiere búsqueda de código, Fast Context se activa automáticamente. Notarás que Fast Context está funcionando cuando:
  • Cascade identifica rápidamente archivos relevantes en toda tu base de código
  • Las consultas en bases de código grandes se completan más rápido que antes
  • Cascade dedica menos tiempo a leer código irrelevante

Cómo funciona

Fast Context usa SWE-grep y SWE-grep-mini, modelos personalizados entrenados específicamente para recuperar código con rapidez. Estos modelos combinan la velocidad de la búsqueda tradicional por embeddings con la inteligencia de la exploración basada en agentes. Cuando haces una consulta en Cascade que requiere buscar en tu base de código, Fast Context se activa automáticamente para:
  1. Identificar archivos relevantes y secciones de código mediante llamadas a herramientas en paralelo
  2. Ejecutar múltiples búsquedas simultáneamente
  3. Devolver resultados precisos en segundos en lugar de minutos
Este enfoque evita la contaminación del contexto y busca mitigar la disyuntiva tradicional entre velocidad y precisión. Al delegar la recuperación a un subagente especializado, Cascade reserva su presupuesto de contexto y su capacidad de razonamiento para la tarea real en cuestión.

Modelos SWE-grep

Fast Context funciona con la familia de modelos SWE-grep:
  • SWE-grep: Variante de alta capacidad optimizada para tareas complejas de recuperación
  • SWE-grep-mini: Variante ultrarrápida que ofrece más de 2.800 tokens por segundo
Ambos modelos están entrenados mediante aprendizaje por refuerzo para destacar en la ejecución paralela de herramientas y en la navegación eficiente por la base de código. Ejecutan hasta 8 llamadas paralelas a herramientas por turno, durante un máximo de 4 turnos, lo que les permite explorar simultáneamente distintas partes de tu base de código. Los modelos usan un conjunto restringido de herramientas compatibles entre plataformas (grep, read, glob) para garantizar un rendimiento uniforme en distintos sistemas operativos y entornos de desarrollo.