Le problème
La génération naïve enrichie par la recherche déverse l'intégralité des résultats de recherche dans le contexte LLM, gaspillant 40 à 60 % des tokens en métadonnées, miniatures et champs non essentiels. À 15 $/M tokens pour les modèles de classe GPT-4, ce gaspillage s'accumule.
Comment Scavio aide
- Réduction de 40 à 60 % des tokens de contexte de recherche
- Budget de tokens prévisible par appel de recherche
- Champs essentiels uniquement (titre, extrait, URL) vs réponse complète
- La troncature adaptée au budget préserve les résultats les plus pertinents
- Fonctionne avec tout LLM (GPT-4, Claude, open-source)
Plateformes pertinentes
Recherche web avec graphe de connaissances, PAA et aperçus IA
Communauté, publications et commentaires imbriqués de n'importe quel subreddit
YouTube
Recherche de vidéos avec transcriptions et métadonnées
Amazon
Recherche de produits avec prix, notes et avis
Démarrage rapide : exemple Python
Voici un exemple rapide de recherche de "L'agent définit un budget de 2000 tokens pour le contexte de recherche. La réponse complète de l'API serait de 5000 tokens. Le gestionnaire de budget extrait titre + extrait + URL par résultat, inclut les 8 premiers résultats dans le budget, tronque proprement. Le LLM reçoit un contexte ciblé, génère une réponse tout aussi bonne, coûte 60 % de moins." sur Google :
import requests
API_KEY = "your_scavio_api_key"
response = requests.post(
"https://api.scavio.dev/api/v1/search",
headers={
"x-api-key": API_KEY,
"Content-Type": "application/json",
},
json={"query": query},
)
data = response.json()
for result in data.get("organic_results", [])[:5]:
print(f"{result['position']}. {result['title']}")
print(f" {result['link']}\n")Conçu pour Ingénieurs IA optimisant les coûts LLM, équipes construisant des applications enrichies par la recherche à grande échelle
Scavio gère l'infrastructure de recherche — proxys, CAPTCHA, limites de débit et détection anti-bot — afin que vous puissiez vous concentrer sur le développement de votre solution contexte de recherche efficace en tokens pour les pipelines llm. L'API renvoie du JSON structuré prêt à être traité, analysé ou transmis à des agents IA.
Commencez par le niveau gratuit (50 crédits à l'inscription, sans carte de crédit) et passez à des offres payantes lorsque vous avez besoin d'un volume plus élevé.