定义
搜索 API 每上下文窗口成本是为单个任务向 AI Agent 上下文填充搜索锚定数据所产生的总 API 费用,包括多次查询、结果解析和后续搜索。
深入了解
单个 Agent 任务很少只涉及一次搜索查询。一个研究任务可能需要3-5次搜索:一次初始宽泛查询、2-3次精炼查询和一次验证查询。每上下文窗口成本捕获的是一次完整 Agent 交互的总搜索 API 支出。计算公式:cost_per_window = avg_queries_per_task * cost_per_query。按 Scavio 的 $0.005/credit,一个典型的4次查询研究任务的每上下文窗口成本为 $0.02。按 Tavily 的 Researcher 层($30/月1,000次请求),同样的任务成本 $0.12。按 Perplexity Sonar($5-12/1K 次请求),成本 $0.02-0.048。按 Brave 的 $5/1K 查询,成本 $0.02。这个指标很重要,因为 LLM 推理成本在 Agent 预算中占主导,搜索是第二大成本中心。优化每上下文窗口搜索成本包括:减少冗余查询(缓存近期结果)、使用结构化响应减少后续搜索,以及选择单次调用返回丰富数据的 API。Scavio 的结构化响应包含 AI Overview、Knowledge Graph 和 People Also Ask 数据,通常能减少后续查询的需要,将每上下文窗口成本降到单次查询价格以下。
用法示例
一个 Agent 框架跨供应商基准测试了每上下文窗口的搜索成本。使用 Tavily 时,平均每个任务使用4.2次查询($0.126/窗口)。使用 Scavio 时,结构化 SERP 数据将平均查询减少到2.8次($0.014/窗口),因为 AI Overview 和 PAA 数据在初次响应中就回答了后续问题。
平台
搜索 API 每上下文窗口成本在以下平台中相关,所有这些平台都可通过Scavio的统一API访问: