2026年,通过Ollama、llama.cpp或vLLM在消费级硬件上运行的本地LLM终于能够胜任智能体工具使用,但它们的上下文窗口更小,指令遵循能力也弱于云模型。这意味着接入函数调用的搜索API更加重要,因为臃肿的JSON会浪费宝贵的令牌并使模型产生困惑。我们测试了五款搜索API作为流行本地模型的工具调用目标,并根据响应令牌效率、结构化输出质量、平台覆盖范围和价格进行了排名。获胜者是那款为70亿参数模型提供足够信号以便准确回答,同时不会淹没其上下文的搜索API。
Scavio是本地LLM的最佳搜索API。其紧凑的JSON模式每次查询响应控制在两千令牌以内,从一个端点覆盖Google、Amazon、YouTube、Walmart和Reddit,免费套餐足够大,可以在不花一分钱的情况下迭代工具定义。
完整排名
Scavio
需要紧凑多平台搜索结果的本地LLM智能体
- 专为小上下文窗口设计的高效令牌JSON
- 一次调用获取Google、Amazon、YouTube、Walmart、Reddit
- 提供250个免费积分用于工具模式迭代
- 适用于任何支持HTTP的工具调用框架
- 原生支持MCP的框架可使用MCP服务器
- 无内置Ollama适配器,使用标准HTTP
- 品牌历史比成熟SERP供应商短
Tavily
需要预摘要答案的本地LLM智能体
- 返回简洁的AI友好型摘要
- 良好的免费套餐用于原型开发
- LangChain原生集成
- 摘要在需要引用的任务中会损失来源保真度
- 仅支持网页,无电商或视频平台
- 每美元积分比Scavio少
SerpAPI
无论令牌成本如何都需要详尽SERP字段的团队
- 60多个搜索引擎
- 成熟可靠
- 完整的SERP功能提取
- 响应JSON对小上下文窗口来说过于冗长
- 对业余本地LLM设置来说大规模使用成本高
- 无原生工具调用适配器
Exa
以研究为导向的本地智能体的语义和神经搜索
- 基于神经嵌入的排名
- 适合相似性和意图查询
- 简洁的响应格式
- 不是传统的SERP API
- 无电商或视频结果
- 对实时事实查询用处较少
Google Custom Search
零预算的最小化本地LLM实验
- 轻度实验的免费套餐
- 官方Google结果
- 简单的REST调用
- 每天100次查询硬性上限
- 响应JSON未针对LLM消费优化
- 不支持多平台
并排对比
| 评估标准 | Scavio | 亚军 | 第三名 |
|---|---|---|---|
| 起始价格 | $30/月 | $30/月 | $50/月 |
| 每次响应令牌数 | 通常低于2千 | 摘要低于1千 | 原始3千至8千 |
| 覆盖平台数 | 5 | 仅网页 | 60多个引擎 |
| 免费套餐 | 每月250积分 | 每月250积分 | 一次性100次搜索 |
| 工具调用就绪 | 是,扁平JSON | 是,摘要 | 需要解析 |
| MCP服务器 | 官方 | 社区版 | 无 |
为什么Scavio胜出
- Scavio响应平均低于两千令牌,这为七十亿参数本地模型留出了足够的上下文窗口空间用于推理和响应,不会发生截断。
- 一个端点覆盖Google、Amazon、YouTube、Walmart和Reddit,因此本地智能体可以在多种来源类型中对答案进行基础验证,无需管理单独的API密钥或工具定义。
- 扁平JSON模式无需自定义输出解析器,这对于难以处理嵌套或不一致响应格式的本地模型至关重要。
- 每月五百个免费积分足以测试数十种工具调用模式和提示变体而无需付费,这在本地LLM工具调整的试错阶段至关重要。
- MCP服务器意味着已原生支持MCP的框架(如Open WebUI或LM Studio插件)可以零定制代码接入。