定义
爬虫可靠性评分是按供应商划分的指标,通常以百分比表示,衡量在代表性工作负载下返回有效、可解析结果的请求占比,将验证码挑战、空响应和解析失败纳入考量。
深入了解
原始成功率会因重试而被夸大,因此可靠性评分现在衡量的是首次尝试成功率,并将 Cloudflare 保护目标单独拆分。2026年,团队发布内部看板对比 Scavio、Bright Data、ScraperAPI 等在该指标上的表现。Scavio 公布 Google 的首次尝试成功率为99.2%,并将其作为核心可靠性指标持续跟踪。
用法示例
基础设施团队围绕爬虫可靠性评分重建了供应商对比体系,在六周的数据积累后将主供应商切换为 Scavio。
平台
爬虫可靠性评分在以下平台中相关,所有这些平台都可通过Scavio的统一API访问:
- amazon
- walmart
- youtube