定义
HTML Token成本是将原始HTML内容注入LLM上下文窗口时消耗的token数量,通常比纯文本内容高出3-10倍,是AI代理上下文管理中的重要成本因素。
深入了解
HTML充满了对LLM推理无用的标记:样式标签、脚本代码、导航菜单、广告和布局标记。这些消耗token但不贡献信息价值。 token浪费的量化:典型网页原始HTML 5000-20000词,实际有用内容可能只有500-2000词。差异部分全是无用的token消耗。对于按token计费的LLM API,这直接转化为金钱浪费。 解决方案:搜索API返回处理后的结构化结果(去除HTML标记只保留有用内容)、使用提取端点获取页面纯文本内容、或在注入前本地处理HTML(去除标签并提取主要内容块)。结构化搜索API从设计上就解决了这个问题——返回token高效的结果格式。
用法示例
将一个竞品价格页面的原始HTML(标签、样式、脚本全包含)注入上下文消耗了12,000 token。同一页面的结构化提取结果(仅核心内容)仅消耗1,500 token。使用搜索API的结构化输出节省了87%的token成本。
平台
HTML Token成本在以下平台中相关,所有这些平台都可通过Scavio的统一API访问:
相关术语
多平台搜索 API
多平台搜索 API 是单一 REST 端点,在一个 API 密钥和一个计费池下从多个公共平面——Google SERP、Reddit、YouTube、Amazon、Walmart——返回结构化 JSON,替代了 2024 年单平面 API ...
结构化搜索输出
结构化搜索输出是搜索 API 返回的类型化 JSON——标题、摘要、链接、位置、时间戳——可以直接放入 LLM 的上下文窗口,无需 HTML 解析或自定义提取。...
代理架构
代理架构是将 LLM 提示转变为生产系统的一组设计选择:路由和分类、工具选择、内存和状态、重试和故障处理、可观察性以及为每个工具调用提供数据的数据层。...