Combien de temps dure ce tutoriel comment ancrer un llm avec les données d'un dépôt github ?

La plupart des développeurs terminent ce tutoriel en 15 à 30 minutes. Vous aurez besoin d'une clé API Scavio (l'offre gratuite suffit) et d'un environnement Python ou JavaScript fonctionnel.

De quoi ai-je besoin avant de commencer ?

Python 3.10+. Une clé API Scavio. Une clé API LLM. Une clé API Scavio vous donne 50 crédits gratuits à l'inscription.

Puis-je suivre ce tutoriel avec l'offre gratuite ?

Oui. L'offre gratuite comprend 50 crédits à l'inscription, ce qui est largement suffisant pour terminer ce tutoriel et prototyper une solution fonctionnelle.

Avec quels frameworks cela fonctionne-t-il ?

Scavio dispose d'un package natif LangChain (langchain-scavio), d'un serveur MCP et d'une API REST simple qui fonctionne avec tout client HTTP. Ce tutoriel utilise the raw REST API, mais vous pouvez l'adapter à votre framework de prédilection.

Ancrer un LLM avec les données d'un dépôt GitHub (2026)

Ancrer les réponses des LLM dans le code source est plus efficace que des explications hallucinées. Ce tutoriel utilise le SERP de Scavio avec site:github.com et son endpoint fetch pour intégrer le contenu du dépôt dans la boucle de l'agent sans lourde intégration de l'API GitHub.

Prérequis

Python 3.10+
Une clé API Scavio
Une clé API LLM

Parcours

Étape 1: Rechercher dans un dépôt via SERP

La recherche ciblée site:github.com/ORG/REPO trouve rapidement le bon fichier.

Python

import requests, os
API_KEY = os.environ['SCAVIO_API_KEY']

def repo_search(repo, query):
    r = requests.post('https://api.scavio.dev/api/v1/search',
        headers={'x-api-key': API_KEY},
        json={'query': f'site:github.com/{repo} {query}', 'num_results': 10})
    return r.json().get('organic_results', [])

Étape 2: Récupérer le fichier sélectionné

Les URLs brutes GitHub fonctionnent avec l'endpoint fetch de Scavio.

Python

def fetch_raw(url):
    raw = url.replace('github.com', 'raw.githubusercontent.com').replace('/blob/', '/')
    r = requests.post('https://api.scavio.dev/api/v1/extract',
        headers={'x-api-key': API_KEY},
        json={'url': raw})
    return r.json().get('content', '')

Étape 3: Ancrer la réponse

Passer le contenu récupéré dans le prompt LLM avec citation de la source.

Python

import anthropic
client = anthropic.Anthropic()

def grounded_answer(repo, question):
    hits = repo_search(repo, question)
    content = fetch_raw(hits[0]['link']) if hits else ''
    msg = client.messages.create(
        model='claude-sonnet-4-6',
        max_tokens=1024,
        messages=[{'role': 'user', 'content': f'{question}\n\nCONTEXT:\n{content[:4000]}'}])
    return msg.content[0].text

Étape 4: Ajouter la composition multi-fichiers

Extraire les 3 premiers résultats, classer par pertinence, composer le contexte.

Python

def multi_file_context(repo, question):
    hits = repo_search(repo, question)[:3]
    return '\n\n'.join([fetch_raw(h['link'])[:2000] for h in hits])

Étape 5: Valider les citations

S'assurer que la réponse du LLM mentionne au moins une URL source.

Python

def has_citations(answer, urls):
    return any(u in answer for u in urls)

Exemple Python

Python

import os, requests
API_KEY = os.environ['SCAVIO_API_KEY']

def repo_grounded(repo, question):
    r = requests.post('https://api.scavio.dev/api/v1/search',
        headers={'x-api-key': API_KEY},
        json={'query': f'site:github.com/{repo} {question}'})
    return r.json().get('organic_results', [])[:3]

print(repo_grounded('prisma/prisma', 'migrate.ts'))

Exemple JavaScript

JavaScript

const API_KEY = process.env.SCAVIO_API_KEY;
export async function repoGrounded(repo, question) {
  const r = await fetch('https://api.scavio.dev/api/v1/search', {
    method: 'POST',
    headers: { 'x-api-key': API_KEY, 'Content-Type': 'application/json' },
    body: JSON.stringify({ query: `site:github.com/${repo} ${question}` })
  });
  return ((await r.json()).organic_results || []).slice(0, 3);
}

Sortie attendue

JSON

LLM answers cite exact files and code paths in the target repo. Hallucination rate drops materially versus ungrounded answers.

Tutoriels associés

Prérequis

Python 3.10+
Une clé API Scavio
Une clé API LLM

Parcours

Étape 1: Rechercher dans un dépôt via SERP

La recherche ciblée site:github.com/ORG/REPO trouve rapidement le bon fichier.

Python

import requests, os
API_KEY = os.environ['SCAVIO_API_KEY']

def repo_search(repo, query):
    r = requests.post('https://api.scavio.dev/api/v1/search',
        headers={'x-api-key': API_KEY},
        json={'query': f'site:github.com/{repo} {query}', 'num_results': 10})
    return r.json().get('organic_results', [])

Étape 2: Récupérer le fichier sélectionné

Les URLs brutes GitHub fonctionnent avec l'endpoint fetch de Scavio.

Python

def fetch_raw(url):
    raw = url.replace('github.com', 'raw.githubusercontent.com').replace('/blob/', '/')
    r = requests.post('https://api.scavio.dev/api/v1/extract',
        headers={'x-api-key': API_KEY},
        json={'url': raw})
    return r.json().get('content', '')

Étape 3: Ancrer la réponse

Passer le contenu récupéré dans le prompt LLM avec citation de la source.

Python

import anthropic
client = anthropic.Anthropic()

def grounded_answer(repo, question):
    hits = repo_search(repo, question)
    content = fetch_raw(hits[0]['link']) if hits else ''
    msg = client.messages.create(
        model='claude-sonnet-4-6',
        max_tokens=1024,
        messages=[{'role': 'user', 'content': f'{question}\n\nCONTEXT:\n{content[:4000]}'}])
    return msg.content[0].text

Étape 4: Ajouter la composition multi-fichiers

Extraire les 3 premiers résultats, classer par pertinence, composer le contexte.

Python

def multi_file_context(repo, question):
    hits = repo_search(repo, question)[:3]
    return '\n\n'.join([fetch_raw(h['link'])[:2000] for h in hits])

Étape 5: Valider les citations

S'assurer que la réponse du LLM mentionne au moins une URL source.

Python

def has_citations(answer, urls):
    return any(u in answer for u in urls)

Exemple Python

Python

import os, requests
API_KEY = os.environ['SCAVIO_API_KEY']

def repo_grounded(repo, question):
    r = requests.post('https://api.scavio.dev/api/v1/search',
        headers={'x-api-key': API_KEY},
        json={'query': f'site:github.com/{repo} {question}'})
    return r.json().get('organic_results', [])[:3]

print(repo_grounded('prisma/prisma', 'migrate.ts'))

Exemple JavaScript

JavaScript

const API_KEY = process.env.SCAVIO_API_KEY;
export async function repoGrounded(repo, question) {
  const r = await fetch('https://api.scavio.dev/api/v1/search', {
    method: 'POST',
    headers: { 'x-api-key': API_KEY, 'Content-Type': 'application/json' },
    body: JSON.stringify({ query: `site:github.com/${repo} ${question}` })
  });
  return ((await r.json()).organic_results || []).slice(0, 3);
}

Sortie attendue

JSON

LLM answers cite exact files and code paths in the target repo. Hallucination rate drops materially versus ungrounded answers.

Comment ancrer un LLM avec les données d'un dépôt GitHub

Prérequis

Parcours

Étape 1: Rechercher dans un dépôt via SERP

Étape 2: Récupérer le fichier sélectionné

Étape 3: Ancrer la réponse

Étape 4: Ajouter la composition multi-fichiers

Étape 5: Valider les citations

Exemple Python

Exemple JavaScript

Sortie attendue

Tutoriels associés

Questions fréquentes

Combien de temps dure ce tutoriel comment ancrer un llm avec les données d'un dépôt github ?

De quoi ai-je besoin avant de commencer ?

Puis-je suivre ce tutoriel avec l'offre gratuite ?

Avec quels frameworks cela fonctionne-t-il ?

Ressources connexes

RAG Grounding après Google I/O 2026

Contexte d'issue GitHub pour agents de codage

Meilleurs outils d'ancrage de recherche pour agents en 2026

Améliorez la qualité des réponses RAG avec l'ancrage de recherche

Agent RAG Style Wiki LLM de Karpathy

Ancrage des workflows LLM

Commencer

Comment ancrer un LLM avec les données d'un dépôt GitHub

Prérequis

Parcours

Étape 1: Rechercher dans un dépôt via SERP

Étape 2: Récupérer le fichier sélectionné

Étape 3: Ancrer la réponse

Étape 4: Ajouter la composition multi-fichiers

Étape 5: Valider les citations

Exemple Python

Exemple JavaScript

Sortie attendue

Tutoriels associés

Questions fréquentes

Combien de temps dure ce tutoriel comment ancrer un llm avec les données d'un dépôt github ?

De quoi ai-je besoin avant de commencer ?

Puis-je suivre ce tutoriel avec l'offre gratuite ?

Avec quels frameworks cela fonctionne-t-il ?

Ressources connexes

RAG Grounding après Google I/O 2026

Contexte d'issue GitHub pour agents de codage

Meilleurs outils d'ancrage de recherche pour agents en 2026

Améliorez la qualité des réponses RAG avec l'ancrage de recherche

Agent RAG Style Wiki LLM de Karpathy

Ancrage des workflows LLM

Commencer