Definição
Mascaramento de PII em RAG é a disciplina de redigir informações pessoais identificáveis de pedaços de documentos antes de serem incorporados, para que a recuperação vetorial em si não possa vazar dados sensíveis de volta para um LLM ou usuário.
Aprofundamento
O erro comum em RAG é incorporar conteúdo bruto e planejar limpar depois. Se PII reside nas incorporações, a recuperação se torna a superfície de vazamento — uma consulta de similaridade retorna o trecho sensível e o LLM é então solicitado a responder a partir dele. O padrão correto é mascarar primeiro, depois fragmentar, depois incorporar. Domínios bancários, de saúde e com muita conformidade também aplicam filtros de metadados (região, linha de produto, frescor) para evitar rotear consultas para documentos desatualizados ou não permitidos. Quando o Scavio é a fonte de ingestão, o mascaramento acontece entre a busca do Scavio e a etapa de incorporação, antes que o trecho toque o armazenamento vetorial.
Exemplo de Uso
A equipe bancária adicionou uma etapa de mascaramento de PII em RAG entre a ingestão do Scavio e o upsert do Pinecone, redigindo nomes e identificadores de contas antes que qualquer trecho fosse incorporado.
Plataformas
Mascaramento de PII em RAG é relevante nas seguintes plataformas, todas acessíveis através da API unificada do Scavio:
Termos Relacionados
Fundamentação de Fluxos de Trabalho com LLM
A fundamentação de fluxos de trabalho com LLM é o padrão de injetar contexto verificado, atual e estruturado — de APIs d...
Geração Aumentada por Recuperação (RAG)
Geração Aumentada por Recuperação (RAG) é uma arquitetura de IA que melhora as saídas de grandes modelos de linguagem ao...
Otimização para Mecanismos de Resposta (AEO)
Otimização para Mecanismos de Resposta (AEO) é a disciplina de 2026 que otimiza conteúdo, menções e dados estruturados p...