定义
通过搜索 API 的 LLM grounding 是在 LLM 补全之前运行搜索查询,然后将搜索结果作为编号来源格式化在 LLM 提示中并附带明确引用指令的模式,使 LLM 的回答绑定在检索到的来源上而非训练数据。
深入了解
Grounding 解决三种 LLM 失败模式:幻觉(虚构事实)、陈旧性(训练截止漂移)和不可验证性(无来源可查)。本地 LLM(Qwen 9B-35B、Llama-3、DeepSeek)比云 LLM 对来源质量更敏感,因为其上下文窗口更紧——HTML 噪声浪费的 token 压缩了信号。搜索 API 的类型化 JSON(Scavio 的 organic_results、Tavily 的 results)相比原始 HTML 减少约 10 倍的上下文浪费。grounding 提示通常:(1)列出编号来源 [1] [2] [3]...;(2)指示每条声明用 [N] 标记回答;(3)告诉 LLM 如果不支持则回避(「根据这些来源我不知道」)。2026 年 4 月一篇 r/LocalLLaMA 帖子记录了通过此模式修复 Qwen 幻觉的经验。
用法示例
一个使用原始爬取 HTML 进行 grounding 的本地 LLM 代理在 100 个问题基准测试中幻觉率为 18%。切换到 Scavio 类型化 JSON 来源 + 明确引用提示后,同一基准测试的幻觉率降至 <3%。
平台
通过搜索 API 的 LLM Grounding在以下平台中相关,所有这些平台都可通过Scavio的统一API访问: