Perte de contexte d'agent

Définition

La perte de contexte d'agent est la perte de l'état de raisonnement accumulé lorsqu'un échec d'appel d'outil en milieu de session amène un agent à redémarrer ou à diverger de sa tâche originale sans conserver le contexte antérieur.

En profondeur

La perte de contexte est plus courante avec les outils de recherche exposés via MCP qui renvoient des erreurs HTTP en raison de limites de taux. Lorsqu'un appel d'outil de recherche d'un agent renvoie une erreur 429 ou 503, la plupart des frameworks d'agent transmettent l'erreur au LLM comme résultat d'outil. Le LLM peut interpréter cela comme 'aucun résultat trouvé' et poursuivre avec une approche différente — contredisant souvent les conclusions antérieures basées sur des recherches réussies. L'agent n'a pas planté ; il est silencieusement erroné. Le mécanisme varie selon le framework. Dans LangChain's AgentExecutor, un outil renvoyant une chaîne d'exception fait que l'agent continue avec cette chaîne comme contexte, ce qui peut polluer les étapes de raisonnement ultérieures. Le ReActAgent de LlamaIndex continue de manière similaire après des erreurs d'outil, traitant les messages d'erreur comme des données d'observation. Seules les configurations explicites d'arrêt sur erreur empêchent la contamination en avant. Les outils de recherche MCP limités en taux sont le déclencheur principal car ils échouent par intermittence — certains appels réussissent, d'autres échouent — créant un contexte partiellement construit. Une session qui a effectué 8 recherches avec succès avant d'atteindre une limite de taux dispose de 8 résultats de contexte ancré suivis d'un échec. Le raisonnement ultérieur de l'agent est construit sur un mélange de données réelles et absentes. Prévention : enveloppez les appels d'outils MCP dans une couche de réessai avec backoff exponentiel avant qu'ils n'atteignent l'agent. Enregistrez tous les résultats d'outils (succès et échecs) en externe. Utilisez des retours d'erreur structurés que le prompt du LLM gère explicitement ('Si vous voyez TOOL_RATE_LIMITED, attendez et réessayez la même requête').

Exemple d'utilisation

Exemple concret

Un agent de recherche parcourant 15 requêtes a rencontré une limite de taux sur la requête 9. Les requêtes 10 à 15 ont utilisé 'recherche échouée' comme contexte, produisant un résumé de recherche qui contredisait sa propre section de sources — une erreur silencieuse sans exception levée.

Plateformes

Perte de contexte d'agent est pertinent sur les plateformes suivantes, toutes accessibles via l'API unifiée de Scavio :

google

Termes associés

Fiabilité des outils MCP

La fiabilité d’un outil MCP est la probabilité qu’un outil exposé via MCP renvoie une réponse valide et utilisable au co...

Démarrage à froid du serveur MCP

Le démarrage à froid du serveur MCP est la latence supplémentaire subie lors de la première requête à un serveur MCP qui...

Budget de recherche agentique

Un budget de recherche agentique est le nombre maximum de crédits ou le montant en dollars qu'un agent d'IA peut dépense...

Questions fréquentes

Perte de contexte d'agent est pertinent pour google. Scavio fournit une API unifiée pour accéder aux données de toutes ces plateformes.

En profondeur

Exemple d'utilisation

Exemple concret

Questions fréquentes

Perte de contexte d'agent est pertinent pour google. Scavio fournit une API unifiée pour accéder aux données de toutes ces plateformes.

Définition

En profondeur

Exemple d'utilisation

Plateformes

Termes associés

Fiabilité des outils MCP

Démarrage à froid du serveur MCP

Budget de recherche agentique

Questions fréquentes

Que signifie Perte de contexte d'agent ?

Comment Perte de contexte d'agent est-il utilisé en pratique ?

Quelles plateformes sont liées à Perte de contexte d'agent ?

Pourquoi Perte de contexte d'agent est-il important pour les développeurs ?