정의
검색-증강 생성(RAG)은 먼저 외부 소스에서 관련 문서를 검색한 후 해당 컨텍스트를 사용하여 더 정확하고 근거 있는 응답을 생성함으로써 대규모 언어 모델 출력을 향상시키는 AI 아키텍처입니다.
심층 분석
RAG는 LLM의 근본적인 한계, 즉 훈련 데이터에 마감일이 있고 사실을 환각할 수 있다는 점을 해결합니다. RAG 파이프라인에서는 LLM이 응답을 생성하기 전에 검색 단계에서 관련 문서, 웹 결과 또는 데이터베이스 레코드를 가져옵니다. 이렇게 하면 출력이 실제 데이터에 기반을 둡니다. 최신 정보가 필요한 애플리케이션의 경우 RAG를 Scavio와 같은 실시간 검색 API와 결합하면 검색 단계에서 항상 최신 결과를 반환할 수 있습니다. 일반적인 RAG 아키텍처는 저장된 문서에 벡터 데이터베이스를 사용하고 라이브 웹 데이터에 검색 API를 사용하여 둘을 결합하여 포괄적인 컨텍스트 창을 제공합니다.
사용 예제
고객 지원 봇은 RAG를 사용하여 제품 질문에 답변합니다. Scavio의 Google 검색 결과에서 최신 사양을 검색하고 내부 문서와 결합한 후 응답을 생성하여 재훈련 없이 정확성을 보장합니다.
플랫폼
검색-증강 생성 (RAG)은(는) Scavio의 통합 API를 통해 액세스할 수 있는 다음 플랫폼에서 관련이 있습니다:
- YouTube
관련 용어
의미 기반 검색과 키워드 검색
키워드 검색은 쿼리의 정확한 용어가 포함된 문서를 매칭하는 반면, 의미 기반 검색은 벡터 임베딩을 사용하여 다른 단어를 사용하더라도 개념적으로 유사한 문서를 찾습니다....
AI 에이전트 툴 호출
툴 호출은 AI 에이전트가 대규모 언어 모델(LLM)에 외부 함수나 API를 호출하도록 지시하는 메커니즘으로, 에이전트가 훈련 데이터를 넘어서 작업을 수행하고 데이터를 검색할 수 있게 합니다....
구조화된 검색 결과
구조화된 검색 결과는 제목, URL, 스니펫, 가격, 평점 및 기타 데이터 포인트에 대해 명확하게 라벨링된 필드와 함께 JSON과 같은 기계 판독 가능 형식으로 파싱되고 구성된 검색 엔진 결과입니다....