定义
在多步骤 AI 代理管道中的步骤之间高效传递搜索结果数据的技术,使用摘要、密钥提取或结构化序列化来防止上下文窗口溢出,同时保留下游推理所需的信息。
深入了解
执行网络搜索的多步骤代理会生成大量上下文数据。一次 Google 搜索会返回 10 多个带有标题、摘要和 URL 的有机结果。执行 5 次搜索的代理会累积 15-30KB 的原始搜索文本,这可能会消耗可用上下文窗口的很大一部分,尤其是与系统提示、对话历史记录和工具模式结合使用时。 按上下文效率排名的切换策略: (1) 关键提取——每次搜索后,仅提取所需的特定事实(价格、日期、名称)并丢弃完整结果。最有上下文效率,但失去了支持细节。 (2) 结构化摘要——使用 LLM 将搜索结果汇总为具有预定义字段的紧凑 JSON 对象。将 5KB 的结果减少到 200-500 字节。 (3) Top-N 截断——只保留前 3 个结果,而不是全部 10 个。简单,但可能会错过较低位置的相关结果。 (4) 参考索引——将完整结果存储在外部存储中,仅将索引/ID 传递到下一个代理步骤,并在需要时检索。零上下文开销,但需要外部存储。 对于使用 Scavio 结构化 JSON 响应的代理,数据已经针对切换进行了部分优化。结构化字段(标题、片段、链接)比原始 HTML 更紧凑。进一步优化:剥离下一步不需要的字段。如果代理只需要 URL,则仅传递链接数组。如果需要摘要,请仅传递片段字段。 实际实现:为每个代理步骤定义一个切换模式,指定要保留哪些搜索结果字段。该架构充当过滤器,在每个搜索步骤之后、结果进入上下文窗口之前应用。
用法示例
研究代理对每个任务执行 8 次搜索。如果没有切换优化,搜索上下文会消耗 40KB(可用窗口的 60%)。实施密钥提取后,每个搜索结果提取的事实减少到约 300 字节,使总搜索上下文达到 2.4KB(窗口的 4%)。
平台
代理上下文窗口切换在以下平台中相关,所有这些平台都可通过Scavio的统一API访问:
- Amazon
- YouTube