Définition
Une tempête de relances est un mode de défaillance dans lequel de nombreux agents relancent simultanément une requête en échec temporaire, ce qui provoque des plafonds de limitation de débit ou une surcharge de dépendance et peut parfois dégénérer en incidents.
En profondeur
Les tempêtes de relances surviennent lorsqu'un harnais d'agent relance agressivement des erreurs ambiguës (timeouts, échecs de parseur, 5xx transitoires) sans logique de backoff ni de circuit-breaker. Sous charge, les relances d'un agent entrent en collision avec celles d'un autre et la dépendance soit limite le débit, soit s'effondre. La solution combine des codes d'erreur structurés qui permettent à l'agent de distinguer les vraies défaillances des transitoires, un backoff exponentiel avec jitter et des timeouts par appel. Scavio publie des codes d'erreur typés précisément pour aider les harnais d'agent à éviter les tempêtes de relances.
Exemple d'utilisation
Un ingénieur d'astreinte a attribué une alerte de pager un vendredi après-midi à une tempête de relances déclenchée par un battement de parseur dans l'outil de recherche personnalisé de l'équipe.
Plateformes
Tempête de relances est pertinent sur les plateformes suivantes, toutes accessibles via l'API unifiée de Scavio :
- Amazon
- YouTube
- Walmart
Termes associés
Agent Harness
Un agent harness est la couche d'exécution et d'orchestration autour d'un LLM qui décide quand appeler des outils, comme...
Sous-agent
Un sous-agent est un agent spécialisé généré par un agent parent pour gérer une tâche délimitée, permettant de décompose...
Limitation de débit API
La limitation de débit API est un mécanisme qui restreint le nombre de requêtes qu'un client peut effectuer vers une API...