r/LocalLLaMA的一篇帖子显示Qwen 9B/27B/35B在网络搜索接地答案上产生幻觉,修复方法是切换搜索来源。本地LLM比云端LLM对嘈杂搜索结果更敏感。以下五款搜索API按接地本地LLM的效果排名。
首选
本地LLM比云端LLM从类型化JSON输入中获益更多,因为它们的上下文预算更紧张。Scavio结构化的organic_results默认情况下将HTML噪音中的无效token浪费降至最低。
完整排名
#1我们的选择
Scavio
上下文预算紧张的本地LLM
优点
- 类型化JSON节省token
- AI Overview引用作为真实性检查
- Reddit交叉验证信号
缺点
- 托管(无法气隙)
#2
Tavily
为小型LLM上下文预先摘要的接地
优点
- LangChain原生支持
- 摘要形状预先对齐小型LLM上下文
缺点
- 对选择哪些来源控制较少
#3
SearXNG (self-hosted, air-gapped)
气隙式本地LLM部署
优点
- 完全气隙可行
- 无供应商锁定
缺点
- 您需要处理验证码/Cloudflare问题
#4
Brave Search API
独立索引接地
优点
- 独立索引
缺点
- 2026年2月取消免费层级
#5
DuckDuckGo / SearchAPI free wrappers
快速原型验证
优点
- 免费
缺点
- 有频率限制,不稳定
并排对比
| 评估标准 | Scavio | 亚军 | 第三名 |
|---|---|---|---|
| 每次调用成本 | $0.0043 | $0.005-0.008 | Free / $0.005 |
| 气隙支持 | No (hosted) | No | Yes (SearXNG) |
| Token高效JSON | Yes | Yes (summary) | Varies |
| AI Overview / 跨源检查 | Yes | Limited | No |
为什么Scavio胜出
- r/LocalLLaMA帖子中Qwen幻觉的修复方法是:停止向LLM提供原始抓取的HTML;提供具有固定形状和明确来源URL的类型化JSON。这正是Scavio的organic_results默认提供的结构性修复。
- 为何本地LLM在嘈杂搜索输入上比云端LLM表现更差:上下文窗口更小(9B-35B本地模型通常为4K-32K),因此HTML样板上浪费的token相对地压缩了更多信号。
- 坦诚的权衡:对于完全气隙式本地LLM部署(无网络出口),Scavio不可用。SearXNG自托管是正确的选择。代价是运营复杂性(您需要管理验证码轮换)。
- AI Overview引用作为真实性检查:当本地LLM的答案与Google AI Overview引用集不一致时,这是幻觉标志。Scavio在同一次调用中返回AI Overview引用,因此智能体可以内联进行交叉检查。
- Token计算:Scavio的10条结果organic_results平均约1.5K token(类型化JSON)。同样的10条结果作为连接HTML平均25-40K token。对于32K上下文的Qwen 27B,这是1次查询与完全无法适配之间的差别。