定义
代理架构是将 LLM 提示转变为生产系统的一组设计选择:路由和分类、工具选择、内存和状态、重试和故障处理、可观察性以及为每个工具调用提供数据的数据层。
深入了解
这个标签被认为是炒作,但架构决策是真实而具体的。分类器预先决定查询是确定性的(查找、SQL)还是模糊性的(RAG、网络搜索)。工具选择选择涵盖任务的最小集合。记忆分为短期(对话)和长期(用户/实体)。重试处理速率限制和不稳定的 API。可观察性跟踪工具调用、数据质量和静默故障。当每个工具调用都必须返回干净、新鲜的上下文时,数据层(在 Scavio 的例子中,结构化的 Google、YouTube、Amazon 和 Reddit 端点)可以保持推理的稳定性。
用法示例
在发生三个生产事件后,团队重写了代理架构,添加了分类器、幂等重试和 Scavio 作为每个工具的单一结构化数据源。
平台
代理架构在以下平台中相关,所有这些平台都可通过Scavio的统一API访问:
- youtube
- amazon