O Exa Search custa US$ 7 por 1.000 requisições (US$ 0,007 cada), o Deep Search fica entre US$ 12 e US$ 15 por 1.000, e o plano gratuito dá 20.000 requisições por mês. Então, quando alguém no r/AI_Agents escreve "os preços do Exa Web Search estão acabando com nossas margens, o que estou fazendo de errado?", a resposta honesta costuma ter duas partes: você está enviando mais consultas do que precisa e, mesmo depois de corrigir isso, existem backends mais baratos para busca de alto volume.
Comece pelo volume, não pelo fornecedor. O comentário mais certeiro daquele tópico acertou em cheio: nessa escala, os pipelines fazem muito mais consultas do que o necessário porque ninguém voltou para auditar o que era realmente preciso depois da primeira versão. É essa a conta real. Um agente recém-construído tende a buscar a cada turno, repete a mesma entidade três vezes numa sessão e pede 20 resultados quando lê só 3. Nada disso é culpa do Exa. É desperdício acumulado que ninguém podou.
Audite o volume antes de trocar qualquer coisa
Quatro cortes tiram da maioria das equipes de 40 a 70 por cento do gasto sem trocar de fornecedor:
- Faça cache pela string da consulta. Normalize a consulta, gere um hash e guarde o resultado por algumas horas. Os agentes se repetem o tempo todo dentro de uma sessão e entre usuários. Um acerto de cache não custa nada.
- Deduplique dentro de uma execução. Se três chamadas de ferramenta numa mesma tarefa buscam "preços da Acme Corp", só uma era necessária. Junte as consultas idênticas e quase idênticas antes que saiam do seu processo.
- Reduza o top-k. Se você pede 20 resultados e passa 3 para o modelo, peça 3. Muitas APIs cobram ou ranqueiam pela quantidade de resultados.
- Pare de rebuscar a mesma entidade. Depois de resolver "quem é o diretor financeiro da Acme", guarde na memória de trabalho pelo resto da sessão. Reconsultar o mesmo dado é a forma de desperdício mais comum.
Faça isso primeiro. Se resolver suas margens, você não precisa migrar nada e mantém o comportamento do Exa exatamente como está.
Se você ainda precisar de volume mais barato
Com o pipeline enxuto e ainda querendo um preço unitário menor para alto volume, a faixa de US$ 0,005 por requisição é onde olhar. O Linkup custa US$ 5 por 1.000 (US$ 0,005). O Brave Search API custa US$ 5 por 1.000 com cerca de 1.000 requisições grátis por mês. O Parallel custa US$ 5 por 1.000 com até 16.000 requisições grátis. O Scavio custa US$ 0,005 por crédito, sem compromisso mensal no pague-conforme-o-uso e sem depósito mínimo, e cobre Google, Reddit, YouTube, Amazon, Walmart e TikTok com uma só chave. Se suas buscas são puro SERP do Google, o Serper fica em torno de US$ 1 por 1.000 (só Google, sem Reddit nem redes sociais).
Aqui vai uma chamada ao SERP do Google no Scavio, pronta para substituir sua busca por palavra-chave:
import os, requests
H = {"Authorization": f"Bearer {os.environ['SCAVIO_API_KEY']}", "Content-Type": "application/json"}
r = requests.post("https://api.scavio.dev/api/v1/google", headers=H,
json={"query": "best serp api", "light_request": False})
data = r.json()
for row in data["organic_results"]:
print(row["position"], row["title"], row["link"])Um SERP completo do Google no Scavio custa 2 créditos (US$ 0,01); uma requisição leve, 1 crédito (US$ 0,005). Então, em preço bruto, o Scavio não é o piso: o Serper sai mais barato para só Google, e o DataForSEO custa menos por chamada depois do seu depósito mínimo de US$ 50. O argumento do Scavio é o pool multiplataforma e o pague-conforme-o-uso sem piso, não o menor preço.
O porém honesto: não largue o Exa no escuro
A busca neural e semântica do Exa de fato encontra coisas que uma API de SERP por palavra-chave deixa passar. "Encontrar páginas similares" e a descoberta difusa pelo significado, e não por termos exatos, são forças reais, e um backend de palavra-chave não é um substituto 1:1 para isso. Então divida o tráfego. Mantenha o Exa para a descoberta semântica, que é o motivo real de tê-lo adotado, e mova as buscas determinísticas de alto volume ("me dê o SERP desta frase exata") para um backend mais barato. A maioria dos pipelines tem muito mais do segundo tipo que do primeiro, e é aí que a margem se esconde.