当你跑着成千上万次多跳查询、又无力自己拥有索引、去重和 token 清理时,就付费买深度研究 API。当数量适中、你想要控制权时,就自己搭循环。这就是 r/aiagents 和 r/Rag 在 2026 年年中反复打转的那个问题的完整答案,下面全是支撑它的推理和数字。
深度研究 API 实际上卖的是什么
深度研究 API 不是一个你能轻易重建的搜索循环。Parallel 自己的团队在 r/aiagents 上回复时说得很直白:对于你不在乎延迟、成本或质量的基础 Agent,你不会察觉到差别;而跑着数百万次搜索的企业不想自己拥有那套基础设施。你租来的是三样东西:一个为 LLM 上下文(而非人类点击)排序的索引、来源溯源与引用,以及在规模化时由别人吞下延迟和去重。
索引这一点才是真正的要害。Google 给结果排序,是为了让人点击第一条蓝色链接。LLM 原生索引则为摘要对上下文窗口的相关性排序,这意味着每次查询浪费的 token 更少。在数百万次查询的量级上,无关上下文带来的 token 膨胀是一笔账;在几千次时,它不是。
DIY 循环实际上要花多少
DIY 版本是一个搜索 API、一个精炼步骤和一个停止条件。打一个搜索端点,读头部结果,判断你够不够了,不够就用更锐利的查询再搜一次。正如一位 r/aiagents 评论者所说,这差不多就是「深度研究」模式底层在做的事——一个搜索循环加一个精炼循环。你接手的活是编排:查询改写、去重、决定何时停止,以及拼装引用。
对适中量来说这很便宜,而且你保住了控制权。你拥有提示词、停止条件和数据形态。当结果看起来不对时,你不必去调一个不透明的流程。
2026 价格,已核对
2026-06-26 对照厂商页面核对:
- Exa:标准神经搜索每 1,000 次 $7(2026 年 3 月从 $5 上调),deep $12/千次,deep-reasoning $15/千次,每月 1,000 次免费搜索。
- Parallel:每 1,000 次请求 $5、含 10 条结果,每额外 1,000 条 +$1,约 16,000 次免费请求。
- Tavily:每月 1,000 免费积分,basic 1 积分,advanced 2 积分,按量付费每积分 $0.008。
- 一个普通 SERP API(Scavio):每积分 $0.005,完整 SERP 2 积分,Reddit 2 积分,在 $30/7,000 积分套餐上约合每 1,000 次完整 SERP 调用 $4.30。
deep 档($12-$15/千次)正是溢价咬人的地方。如果你的「深度」需求其实只是「搜索、精炼一次、再搜索」,那么在一个 $4-$5/千次的 API 上套个循环就能更便宜地做到。
DIY 在哪里失效
对天花板要诚实。在真正的规模上——跨数百万次查询的多跳链——托管索引赚回了它的费用。跨数千个来源去重、能拿给客户看的溯源,以及在数百万次调用上复利累积的 token 效率,都是你本来要自己搭建并运维的真实基础设施。Parallel 那位代表在这一点上没吹牛。
DIY 的另一个弱点是索引质量。一个套在 Google 式结果上的循环,会继承 Google 的人类点击排序。对于开放式文献扫描,像 Exa 这样的神经索引确实能浮现关键词搜索漏掉的页面。
一条决策规则
用 Scavio 的研究成本测试:估算每月研究查询次数乘以 deep 档单价,再去对比一个普通 SERP API 加上你自己跑循环的工程工时。
- 每月约 5 万次以内、且多为事实接地:在结构化 SERP API 上跑 DIY 循环。更便宜,且你保住控制权。
- 大批量、多跳、对溯源敏感(你要向客户展示引用):买 Parallel 或 Exa。你是在花钱「不拥有」那套基础设施,这在那个规模上是正确的取舍。
- 开放式语义发现(「帮我找到所有类似这样的」):选 Exa 的神经搜索,不论量大小。
DIY 阵营还低估了一件事:很多「研究」问题根本不是网络问题。「大家实际上是怎么评价这个工具的」是一次 Reddit 调用。「这个产品在不在火」是一次 Amazon 或 TikTok 调用。像 Scavio 这样的多平台 API 用一把密钥跨这一切做接地——每积分 $0.005,注册先送 50 积分——这是任何纯网络研究 API 都触及不到的。本次实测验证:一次 light_request:false 的 /api/v1/google 调用返回了 7 条自然结果外加 8 条相关搜索和知识图谱模块,2 积分——而这本就是大多数研究循环要坐在其上的接地层。
深度研究 API 不是骗局,DIY 循环也不总是幼稚。按量来选,按你到底是在做接地还是真正的多跳研究来选。大多数 Agent 在做接地,却在付研究的价。