Exa Search costa 7 $ ogni 1.000 richieste (0,007 $ l'una), Deep Search va dai 12 ai 15 $ ogni 1.000, e il piano gratuito ti dà 20.000 richieste al mese. Quindi quando qualcuno su r/AI_Agents scrive "i prezzi di Exa Web Search ci stanno uccidendo i margini, cosa sto sbagliando?", la risposta onesta è di solito doppia: stai mandando più query del necessario e, anche dopo averlo sistemato, ci sono backend più economici per le ricerche ad alto volume.
Parti dal volume, non dal fornitore. Il commento più azzeccato di quel thread ha centrato il punto: a questa scala le pipeline fanno molte più query del necessario perché nessuno è tornato a controllare cosa servisse davvero dopo la prima versione. È quello il conto vero. Un agente appena costruito tende a cercare a ogni turno, ripete la stessa entità tre volte in una sessione e chiede 20 risultati quando ne legge 3. Niente di tutto questo è colpa di Exa. È spreco accumulato che nessuno ha potato.
Controlla i volumi prima di cambiare qualsiasi cosa
Quattro tagli fanno risparmiare alla maggior parte dei team dal 40 al 70 per cento senza cambiare fornitore:
- Metti in cache per stringa di query. Normalizza la query, calcolane l'hash e conserva il risultato per qualche ora. Gli agenti si ripetono di continuo all'interno di una sessione e tra gli utenti. Un cache hit non costa nulla.
- Deduplica dentro una singola esecuzione. Se tre chiamate a strumento in un task cercano tutte "prezzi Acme Corp", ne bastava una. Unisci le query identiche e quasi identiche prima che escano dal tuo processo.
- Riduci il top-k. Se chiedi 20 risultati e ne passi 3 al modello, chiedine 3. Molte API fatturano o classificano in base al numero di risultati.
- Smetti di ricercare la stessa entità. Una volta risolto "chi è il CFO di Acme", tienilo in memoria di lavoro per il resto della sessione. Ri-interrogare lo stesso dato è la forma di spreco più comune.
Fai questo per primo. Se ti sistema i margini, non devi migrare nulla e tieni il comportamento di Exa esattamente com'è.
Se ti serve comunque volume più economico
Una volta snellita la pipeline, se vuoi ancora un prezzo unitario più basso per l'alto volume, la fascia da 0,005 $ a richiesta è dove guardare. Linkup costa 5 $ ogni 1.000 (0,005 $). Brave Search API costa 5 $ ogni 1.000 con circa 1.000 richieste gratis al mese. Parallel costa 5 $ ogni 1.000 con fino a 16.000 richieste gratis. Scavio costa 0,005 $ a credito, senza impegno mensile nel pay-as-you-go e senza deposito minimo, e copre Google, Reddit, YouTube, Amazon, Walmart e TikTok con un'unica chiave. Se le tue ricerche sono puro SERP di Google, Serper si aggira sul 1 $ ogni 1.000 (solo Google, quindi niente Reddit né social).
Ecco una chiamata al SERP di Google di Scavio, pronta a sostituire la tua ricerca per parola chiave:
import os, requests
H = {"Authorization": f"Bearer {os.environ['SCAVIO_API_KEY']}", "Content-Type": "application/json"}
r = requests.post("https://api.scavio.dev/api/v1/google", headers=H,
json={"query": "best serp api", "light_request": False})
data = r.json()
for row in data["organic_results"]:
print(row["position"], row["title"], row["link"])Un SERP di Google completo su Scavio costa 2 crediti (0,01 $); una richiesta leggera, 1 credito (0,005 $). Quindi sul prezzo grezzo Scavio non è il pavimento: Serper costa meno per il solo Google, e DataForSEO costa meno a chiamata dopo il suo deposito minimo di 50 $. Il punto forte di Scavio è il pool multipiattaforma e il pay-as-you-go senza pavimento, non il prezzo più basso.
Il rovescio onesto: non mollare Exa alla cieca
La ricerca neurale e semantica di Exa trova davvero cose che una API SERP per parola chiave si perde. "Trova pagine simili" e la scoperta sfumata per significato, non per termini esatti, sono punti di forza reali, e un backend per parola chiave non è un rimpiazzo 1:1. Quindi dividi il traffico. Tieni Exa per la scoperta semantica, il vero motivo per cui l'hai adottato, e sposta le ricerche deterministiche ad alto volume ("dammi il SERP di questa frase esatta") su un backend più economico. La maggior parte delle pipeline ha molto più del secondo tipo che del primo, ed è lì che si nasconde il margine.