什么是上下文膨胀？| Scavio 术语表

定义

上下文膨胀是AI代理的上下文窗口被不必要或低价值的信息填满的现象，导致推理质量下降、成本增加和处理速度变慢。

深入了解

上下文膨胀是代理系统的隐形性能杀手。每次工具调用的结果、每轮对话的历史、每个工具的描述都累积在上下文中。当总量接近窗口限制时，模型性能急剧下降。膨胀来源：累积的工具调用结果（搜索结果未经压缩直接注入）、完整的对话历史（早期轮次未摘要）、工具描述开销（注册工具越多描述越长）和重复信息（相同内容在不同轮次中重复出现）。管理策略：搜索结果压缩（只注入结构化摘要而非全文）、对话历史滚动摘要（定期压缩早期轮次为摘要）、选择性工具加载（只加载当前任务需要的工具描述）和去重（检测并移除重复内容）。搜索API返回结构化、token高效的结果对于控制膨胀至关重要。

用法示例

真实世界示例

代理的上下文从8000 token增长到45000 token——其中60%是早期对话的冗余工具结果。推理质量明显下降，模型开始忽略早期指令。清理后保留15000 token核心上下文，任务完成率从64%恢复到91%。

平台

上下文膨胀在以下平台中相关，所有这些平台都可通过Scavio的统一API访问：

google

上下文膨胀

定义

深入了解

用法示例

平台

相关术语

MCP 网关

代理架构

LLM工作流接地

常见问题

上下文膨胀是什么意思？

上下文膨胀在实践中如何使用？

哪些平台与上下文膨胀相关？

上下文膨胀对开发者为何重要？

上下文膨胀

上下文膨胀

定义

深入了解

用法示例

平台

相关术语

MCP 网关

代理架构

LLM工作流接地

常见问题

上下文膨胀是什么意思？

上下文膨胀在实践中如何使用？

哪些平台与上下文膨胀相关？

上下文膨胀对开发者为何重要？

上下文膨胀