概述
直接抓取 YouTube 数据容易触发速率限制和封禁。此工作流通过搜索 API 间接获取 YouTube 数据,结合智能延迟、请求轮换和错误处理机制,确保数据采集的稳定性和可靠性。
触发器
按需触发
计划
按需
工作流步骤
1
准备抓取任务
配置要抓取的 YouTube 数据类型和目标列表。
2
通过搜索 API 获取
使用搜索 API 间接获取 YouTube 数据,避免直接请求。
3
智能速率控制
根据 API 响应动态调整请求频率和间隔。
4
错误处理和重试
对失败的请求执行智能重试,切换备用策略。
5
验证和存储数据
验证抓取数据的完整性并存入数据库。
Python 实现
Python
import requests, os
H = {'x-api-key': os.environ['SCAVIO_API_KEY']}
def yt_metadata(url):
return requests.post('https://api.scavio.dev/api/v1/search', headers=H, json={'platform': 'youtube', 'url': url, 'include_transcript': True}).json()JavaScript 实现
JavaScript
// Same shape in TS — POST to Scavio YouTube endpoint with the video URL.使用的平台
YouTube
包含转录和元数据的视频搜索