Définition
La perte de contexte d'agent est la perte de l'état de raisonnement accumulé lorsqu'un échec d'appel d'outil en milieu de session amène un agent à redémarrer ou à diverger de sa tâche originale sans conserver le contexte antérieur.
En profondeur
La perte de contexte est plus courante avec les outils de recherche exposés via MCP qui renvoient des erreurs HTTP en raison de limites de taux. Lorsqu'un appel d'outil de recherche d'un agent renvoie une erreur 429 ou 503, la plupart des frameworks d'agent transmettent l'erreur au LLM comme résultat d'outil. Le LLM peut interpréter cela comme 'aucun résultat trouvé' et poursuivre avec une approche différente — contredisant souvent les conclusions antérieures basées sur des recherches réussies. L'agent n'a pas planté ; il est silencieusement erroné. Le mécanisme varie selon le framework. Dans LangChain's AgentExecutor, un outil renvoyant une chaîne d'exception fait que l'agent continue avec cette chaîne comme contexte, ce qui peut polluer les étapes de raisonnement ultérieures. Le ReActAgent de LlamaIndex continue de manière similaire après des erreurs d'outil, traitant les messages d'erreur comme des données d'observation. Seules les configurations explicites d'arrêt sur erreur empêchent la contamination en avant. Les outils de recherche MCP limités en taux sont le déclencheur principal car ils échouent par intermittence — certains appels réussissent, d'autres échouent — créant un contexte partiellement construit. Une session qui a effectué 8 recherches avec succès avant d'atteindre une limite de taux dispose de 8 résultats de contexte ancré suivis d'un échec. Le raisonnement ultérieur de l'agent est construit sur un mélange de données réelles et absentes. Prévention : enveloppez les appels d'outils MCP dans une couche de réessai avec backoff exponentiel avant qu'ils n'atteignent l'agent. Enregistrez tous les résultats d'outils (succès et échecs) en externe. Utilisez des retours d'erreur structurés que le prompt du LLM gère explicitement ('Si vous voyez TOOL_RATE_LIMITED, attendez et réessayez la même requête').
Exemple d'utilisation
Un agent de recherche parcourant 15 requêtes a rencontré une limite de taux sur la requête 9. Les requêtes 10 à 15 ont utilisé 'recherche échouée' comme contexte, produisant un résumé de recherche qui contredisait sa propre section de sources — une erreur silencieuse sans exception levée.
Plateformes
Perte de contexte d'agent est pertinent sur les plateformes suivantes, toutes accessibles via l'API unifiée de Scavio :
Termes associés
Fiabilité des outils MCP
La fiabilité d’un outil MCP est la probabilité qu’un outil exposé via MCP renvoie une réponse valide et utilisable au co...
Démarrage à froid du serveur MCP
Le démarrage à froid du serveur MCP est la latence supplémentaire subie lors de la première requête à un serveur MCP qui...
Budget de recherche agentique
Un budget de recherche agentique est le nombre maximum de crédits ou le montant en dollars qu'un agent d'IA peut dépense...