Le problème
Les agents IA qui injectent du HTML brut provenant de recherches web consomment 20 000 à 25 000 tokens par requête. Avec la tarification LLM (3 $/M de tokens d'entrée pour Claude Sonnet), un agent utilisant beaucoup de recherches coûte 7 à 8 $/jour rien qu'en tokens d'entrée. Le HTML inclut navigation, publicités, scripts et pieds de page qui n'apportent aucune valeur à l'agent.
La solution Scavio
Remplacez le scraping de HTML brut par une API de recherche structurée qui renvoie uniquement les titres, extraits et URL au format JSON. Les mêmes résultats de recherche tokenisent à 800-1 200 tokens au lieu de 20 000-25 000, réduisant les coûts LLM de 90 % ou plus.
Avant
Avant l'optimisation, un agent de recherche effectuait 100 recherches par jour. Chaque recherche injectait 25K tokens de HTML brut. Total : 2,5 M de tokens d'entrée/jour = 7,50 $/jour en coûts LLM (225 $/mois). Plus les coûts d'infrastructure de scraping.
Après
Après être passé au JSON structuré, les mêmes 100 recherches injectent 1 200 tokens chacune. Total : 120K tokens/jour = 0,36 $/jour + 0,50 $ de coût API = 0,86 $/jour (26 $/mois). Économies mensuelles : 199 $. L'agent traite également les résultats plus rapidement car il y a moins de bruit dans le contexte.
À qui cela s'adresse
Développeurs d'agents IA, créateurs d'applications LLM et équipes optimisant les coûts d'exploitation des agents en réduisant la consommation de tokens lors des recherches web.
Avantages clés
- Réduction de 25K à 1 200 tokens par recherche (réduction de 95 %)
- Le coût mensuel LLM passe de 225 $ à 26 $ pour 100 recherches quotidiennes
- Le JSON structuré élimine l'analyse et le nettoyage du HTML
- Un schéma cohérent signifie que les agents peuvent extraire les champs de manière fiable
- Recherche multiplateforme sans infrastructure de scraping séparée
Exemple Python
import requests, os
H = {'x-api-key': os.environ['SCAVIO_API_KEY']}
def efficient_search(query, max_results=5):
r = requests.post('https://api.scavio.dev/api/v1/search', headers=H,
json={'platform': 'google', 'query': query}, timeout=10).json()
results = r.get('organic_results', [])[:max_results]
return [{'title': r['title'], 'snippet': r.get('snippet', ''),
'url': r.get('link', '')} for r in results]
# ~200 tokens vs ~25,000 from raw HTML
context = efficient_search('best vector database 2026')
print(f'{len(context)} results, ~{sum(len(str(c)) for c in context)} chars')Exemple JavaScript
const H = {'x-api-key': process.env.SCAVIO_API_KEY, 'Content-Type': 'application/json'};
async function efficientSearch(query) {
const r = await fetch('https://api.scavio.dev/api/v1/search', {
method: 'POST', headers: H,
body: JSON.stringify({platform: 'google', query})
}).then(r => r.json());
return (r.organic_results || []).slice(0, 5).map(r => ({
title: r.title, snippet: r.snippet || '', url: r.link || ''
}));
}
efficientSearch('best vector database 2026').then(r => console.log(`${r.length} results`));Plateformes utilisées
Recherche web avec graphe de connaissances, PAA et aperçus IA
Communauté, publications et commentaires imbriqués de n'importe quel subreddit