定义
一种 AI Agent 架构,网络搜索能力由自托管基础设施(SearXNG、自定义爬虫、缓存索引)而非第三方搜索 API 提供,以运维复杂度换取零单次查询成本。
深入了解
自托管搜索 Agent 吸引想要无限查询且无 API 费用、查询数据隐私控制以及独立于第三方供应商的团队。最常见的方法使用 SearXNG,一个免费的元搜索引擎,在统一接口后聚合来自 Google、Bing、DuckDuckGo 和其他引擎的结果。自托管架构组件:VPS 上的 SearXNG 实例($10-50/月)、Redis 缓存用于结果去重、JSON 归一化层(SearXNG 返回不同格式)、代理轮换服务(避免 IP 封锁,$20-100/月)以及上游引擎变更监控。50,000次查询/月的真实成本分析:VPS 托管 $20/月 + 代理服务 $50/月 + 工程维护4-8小时/月(按 $75/时 = $300-600/月)= 总计 $370-670/月。对比 API 成本:Serper $50/50k credits = $50/月,Scavio $0.005 x 50k = $250/月,DataForSEO 队列 $0.0006 x 50k = $30/月。诚实计算工程时间后,自托管方式在中等量级下比付费 API 更贵。只有在500,000+次查询/月以上,单次查询 API 成本超过固定基础设施成本时才变便宜。可靠性挑战是主要的实际关切。Google、Bing 和其他引擎积极检测和封锁 SearXNG 实例。封锁模式不可预测地变化,导致突然的搜索中断。即使采取代理轮换、请求速率限制、用户代理随机化和维护多个 SearXNG 实例冗余等措施,团队报告85-95%的正常运行时间,而付费 API 达99.5%以上。自托管搜索也无法提供 Scavio 等 API 原生返回的结构化平台特定数据(Amazon 产品价格、TikTok 指标、YouTube 元数据)。
用法示例
团队为其研究 Agent 运行了一个 SearXNG 实例,但在一个月内第三次 Google 封锁事件打断其内容管道后切换到 Scavio。$250/月的 API 成本低于调试 SearXNG 故障所花的工程时间。
平台
自托管搜索 Agent在以下平台中相关,所有这些平台都可通过Scavio的统一API访问: