Exa Searchは1,000リクエストで7ドル(1件0.007ドル)、Deep Searchは1,000件で12〜15ドル、無料枠は月20,000リクエストだ。だからr/AI_Agentsで「Exa Web Searchの料金で利益が消える。何が間違っているのか」と投稿があったとき、正直な答えはたいてい二つある。必要以上のクエリを投げていること、そしてそれを直してもなお、大量検索なら安いバックエンドが存在することだ。
まずベンダーではなく量から見直す。あのスレッドで一番的を射たコメントが核心を突いている。この規模のパイプラインは、最初の構築後に「本当に何が必要か」を誰も監査し直さないせいで、必要よりはるかに多くクエリを投げている。それが本当の請求額だ。作ったばかりのエージェントは毎ターン検索し、同じ対象を1セッションで三度調べ直し、3件しか読まないのに20件を取りにいく。どれもExaのせいではない。誰も刈り込まなかった、積もり積もった無駄だ。
乗り換える前に、まずクエリ量を監査する
次の四つの削減で、ほとんどのチームは提供元を変えずに40〜70パーセント減らせる。
- クエリ文字列でキャッシュする。 クエリを正規化してハッシュ化し、結果を数時間保持する。エージェントは1セッション内でもユーザー間でも、絶えず同じことを繰り返す。キャッシュヒットは無料だ。
- 1回の実行内で重複を除く。 1タスク中の三つのツール呼び出しがどれも「Acme Corpの料金」を検索しているなら、必要だったのは一つだけ。同一・ほぼ同一のクエリは、プロセスを出る前にまとめる。
- top-kを削る。 20件取得してモデルに3件しか渡さないなら、3件だけ要求する。多くのAPIは結果件数で課金、またはランク付けする。
- 同じ対象を検索し直さない。 「AcmeのCFOは誰か」を一度解決したら、そのセッションの残りは作業メモリに保持する。同じ事実の再検索が、最も多い無駄の形だ。
まずこれをやる。これで利益が戻るなら、移行は不要で、Exaの挙動はそのまま保てる。
それでも安い大量処理が必要なら
パイプラインを絞ったうえで、なお大量検索の単価を下げたいなら、1リクエスト0.005ドル帯を見るとよい。Linkupは1,000件で5ドル(0.005ドル)。Brave Search APIは1,000件で5ドル、月およそ1,000件まで無料。Parallelは1,000件で5ドル、最大16,000件まで無料。Scavioは1クレジット0.005ドルで、従量課金に月額のコミットなし、最低デポジットもなし。そしてGoogle、Reddit、YouTube、Amazon、Walmart、TikTokを一つのキーでまかなう。検索が純粋なGoogle SERPだけなら、Serperは1,000件およそ1ドル(Googleのみ。RedditやSNSは不可)。
キーワード検索の差し替えとして使える、ScavioのGoogle SERP呼び出しはこうだ。
import os, requests
H = {"Authorization": f"Bearer {os.environ['SCAVIO_API_KEY']}", "Content-Type": "application/json"}
r = requests.post("https://api.scavio.dev/api/v1/google", headers=H,
json={"query": "best serp api", "light_request": False})
data = r.json()
for row in data["organic_results"]:
print(row["position"], row["title"], row["link"])ScavioのフルGoogle SERPは2クレジット(0.01ドル)、軽量リクエストは1クレジット(0.005ドル)。だから素の単価ではScavioが底値ではない。Google専用ならSerperが下回り、DataForSEOは50ドルの最低デポジット後なら1件あたりがさらに安い。Scavioの売りは最安単価ではなく、マルチプラットフォームの共通プールと、下限のない真の従量課金だ。
正直な落とし穴。Exaを闇雲に外さない
Exaのニューラル・セマンティック検索は、キーワードSERP APIが取りこぼすものを実際に見つける。「似たページを探す」、そして厳密な語ではなく意味でのあいまい発見は本物の強みで、キーワードのバックエンドはその1:1の置き換えにはならない。だからトラフィックを分ける。導入した本当の理由であるセマンティックな発見にはExaを残し、大量で決定的な検索(「この一文の厳密なSERPをくれ」)は安いバックエンドに移す。たいていのパイプラインは前者より後者がはるかに多く、利益はそこに隠れている。