完成如何构建一个没有代币溢出的研究助理教程需要多长时间？

大多数开发者在15到30分钟内完成本教程。您需要一个Scavio API密钥（免费套餐即可）和可用的Python或JavaScript环境。

开始前需要准备什么？

Python 3.10+. Scavio API 密钥. Scavio API密钥注册即送50个免费积分。

我可以用免费套餐运行本教程吗？

可以。免费套餐注册即送50个积分，完全足够完成本教程并构建一个可运行的原型解决方案。

这支持哪些框架？

Scavio提供原生LangChain包（langchain-scavio）、MCP服务器以及适用于任何HTTP客户端的REST API。本教程使用 the raw REST API, 但您可以根据需要适配您选择的框架。

无代币溢出的研究助理（2026）

r/n8n 线程抱怨搜索 API 返回原始 HTML 打破了令牌限制或剥离了太多上下文。本教程走中间路线：通过 Scavio 构建结构化片段，仅针对前 1-2 个点击进行全页摘录。

前置条件

Python 3.10+
Scavio API 密钥

操作指南

步骤 1: 搜索返回 10 个键入的片段

每个片段可容纳大约 100 个标记。

Python

import requests, os
API_KEY = os.environ['SCAVIO_API_KEY']

def snippets(q):
    r = requests.post('https://api.scavio.dev/api/v1/search',
        headers={'x-api-key': API_KEY}, json={'query': q}).json()
    return r.get('organic_results', [])[:10]

步骤 2: LLM 选择前 1-2 篇来完整阅读

比全部 10 个都便宜。

Python

import anthropic
client = anthropic.Anthropic()

def pick(q, snips):
    msg = client.messages.create(model='claude-sonnet-4-6', max_tokens=200,
        messages=[{'role':'user','content':f'Q: {q}. SNIPPETS: {snips}. Return indices of the top 2 to read fully.'}])
    return msg.content[0].text

步骤 3: 将这些页面提取为 markdown

Markdown 比 HTML 更便宜。

Python

def fetch(url):
    r = requests.post('https://api.scavio.dev/api/v1/extract',
        headers={'x-api-key': API_KEY}, json={'url': url, 'format': 'markdown'}).json()
    return r.get('markdown', '')[:5000]  # token-budget the page

步骤 4: 撰写最终答案

片段提供广度，整页提供深度。

Python

def answer(q):
    snips = snippets(q)
    picks = [int(i) for i in pick(q, snips).split(',') if i.strip().isdigit()]
    deep = [fetch(snips[i]['link']) for i in picks[:2]]
    return {'snippets': snips, 'deep_reads': deep}

步骤 5: 代币数学

10 个片段 ≈ 1K 代币； 2 个修剪后的页面 ≈ 8K 令牌；总上下文 ≈ 9K 令牌 — 适合任何 200K 上下文模型。

Text

// Token budget: well under 16K even for a 32K-context model.

Python 示例

Python

# Per question: 1 search + 2 extracts = 3 credits = $0.013. Plus LLM token cost.

JavaScript 示例

JavaScript

// Same pattern in TS.

预期输出

JSON

Per question, the agent has 10 snippets and 2 full reads in its context. No raw HTML, no manual cleaning, no token overflow.

前置条件

Python 3.10+
Scavio API 密钥

操作指南

步骤 1: 搜索返回 10 个键入的片段

每个片段可容纳大约 100 个标记。

Python

import requests, os
API_KEY = os.environ['SCAVIO_API_KEY']

def snippets(q):
    r = requests.post('https://api.scavio.dev/api/v1/search',
        headers={'x-api-key': API_KEY}, json={'query': q}).json()
    return r.get('organic_results', [])[:10]

步骤 2: LLM 选择前 1-2 篇来完整阅读

比全部 10 个都便宜。

Python

import anthropic
client = anthropic.Anthropic()

def pick(q, snips):
    msg = client.messages.create(model='claude-sonnet-4-6', max_tokens=200,
        messages=[{'role':'user','content':f'Q: {q}. SNIPPETS: {snips}. Return indices of the top 2 to read fully.'}])
    return msg.content[0].text

步骤 3: 将这些页面提取为 markdown

Markdown 比 HTML 更便宜。

Python

def fetch(url):
    r = requests.post('https://api.scavio.dev/api/v1/extract',
        headers={'x-api-key': API_KEY}, json={'url': url, 'format': 'markdown'}).json()
    return r.get('markdown', '')[:5000]  # token-budget the page

步骤 4: 撰写最终答案

片段提供广度，整页提供深度。

Python

def answer(q):
    snips = snippets(q)
    picks = [int(i) for i in pick(q, snips).split(',') if i.strip().isdigit()]
    deep = [fetch(snips[i]['link']) for i in picks[:2]]
    return {'snippets': snips, 'deep_reads': deep}

步骤 5: 代币数学

10 个片段 ≈ 1K 代币； 2 个修剪后的页面 ≈ 8K 令牌；总上下文 ≈ 9K 令牌 — 适合任何 200K 上下文模型。

Text

// Token budget: well under 16K even for a 32K-context model.

Python 示例

Python

# Per question: 1 search + 2 extracts = 3 credits = $0.013. Plus LLM token cost.

JavaScript 示例

JavaScript

// Same pattern in TS.

预期输出

JSON

Per question, the agent has 10 snippets and 2 full reads in its context. No raw HTML, no manual cleaning, no token overflow.

如何构建一个没有代币溢出的研究助理

前置条件

操作指南

步骤 1: 搜索返回 10 个键入的片段

步骤 2: LLM 选择前 1-2 篇来完整阅读

步骤 3: 将这些页面提取为 markdown

步骤 4: 撰写最终答案

步骤 5: 代币数学

Python 示例

JavaScript 示例

预期输出

相关教程

常见问题

完成如何构建一个没有代币溢出的研究助理教程需要多长时间？

开始前需要准备什么？

我可以用免费套餐运行本教程吗？

这支持哪些框架？

相关资源

2026 年法学硕士最佳网页抓取 API

2026年本地LLM最佳网络搜索API

n8n 搜索数据增强工作流

通过 API 本地 LLM 搜索基础

Brave Search API vs Scavio

Brave Search API vs Scavio

开始构建

如何构建一个没有代币溢出的研究助理

前置条件

操作指南

步骤 1: 搜索返回 10 个键入的片段

步骤 2: LLM 选择前 1-2 篇来完整阅读

步骤 3: 将这些页面提取为 markdown

步骤 4: 撰写最终答案

步骤 5: 代币数学

Python 示例

JavaScript 示例

预期输出

相关教程

常见问题

完成如何构建一个没有代币溢出的研究助理教程需要多长时间？

开始前需要准备什么？

我可以用免费套餐运行本教程吗？

这支持哪些框架？

相关资源

2026 年法学硕士最佳网页抓取 API

2026年本地LLM最佳网络搜索API

n8n 搜索数据增强工作流

通过 API 本地 LLM 搜索基础

Brave Search API vs Scavio

Brave Search API vs Scavio

开始构建