定义
一种预定义的 JSON 结构,无论上游数据提供者如何,都能标准化线索充实数据的输出格式,防止充实源变更或返回不一致字段时下游工作流中断。
深入了解
线索充实管道通常串联 3-5 个数据提供者,每个返回不同的 JSON 结构。没有标准化 schema,下游系统(CRM、评分模型、外展序列)会在提供者更改响应格式或替换新提供者时中断。充实 schema 作为数据收集和数据消费之间的契约。实用的充实 schema 包含以下字段组:身份(company_name、domain、linkedin_url)、企业信息(industry、employee_count_range、annual_revenue_range、founding_year、headquarters_location)、联系人(decision_maker_name、title、email、email_confidence_score)、数字存在(google_organic_keywords_estimate、monthly_traffic_estimate、social_profiles)和充实元数据(enriched_at 时间戳、source_providers 数组、confidence_score)。使用规范化函数的实现模式: ```typescript interface EnrichedLead { company_name: string; domain: string; industry: string | null; employee_range: string | null; search_presence: { google_ranking_keywords: number | null; reddit_mentions_30d: number | null; tiktok_brand_videos: number | null; }; enriched_at: string; sources: string[]; } ``` 每个提供者的原始响应通过特定于提供者的规范化器映射到此通用 schema。当 Scavio 搜索结果是充实的一部分(查询 Google 获取公司域名、Reddit 获取品牌提及,每次 $0.005)时,规范化器将排名信号和社区情绪提取到标准化字段中。Schema 版本控制至关重要:使用语义版本控制(v1.0、v1.1、v2.0),在主要版本内保持向后兼容。破坏性更改(删除字段、更改类型)需要主要版本升级和迁移期。跳过 schema 标准化的团队通常会在某个工作日凌晨 2 点提供者 API 更新导致 CRM 集成中断时发现代价。
用法示例
充实管道将 Clearbit 企业信息、Scavio 搜索存在数据和 Apollo 联系人详情规范化为单一的 EnrichedLead schema,使评分模型始终接收一致的字段,无论哪些上游提供者成功或失败。
平台
线索充实 Schema在以下平台中相关,所有这些平台都可通过Scavio的统一API访问:
- TikTok