Uma vez que gerar um conjunto de dados de avaliação RAG a partir…

Como criar um conjunto de dados de avaliação RAG a partir...

Crie involuntariamente conjuntos de dados específicos de domínio em qualquer linguagem usando LLMs

Rumo à ciência de dados
Sua visita nos ajuda a continuar oferecendo o melhor para você! srcset="https://miro.medium.com/v2/resize:fit:640/format:webp/1*aYb8AgzctiTtUYofqQq9ug.png 640w, https://miro.medium.com/v2/resize:fit:720/format:webp/1*aYb8AgzctiTtUYofqQq9ug.png 720w, https://miro.medium.com/v2/resize:fit:750/format:webp/1*aYb8AgzctiTtUYofqQq9ug.png 750w, https://miro.medium.com/v2/resize:fit:786/format:webp/1*aYb8AgzctiTtUYofqQq9ug.png 786w, https://miro.medium.com/v2/resize:fit:828/format:webp/1*aYb8AgzctiTtUYofqQq9ug.png 828w, https://miro.medium.com/v2/resize:fit:1100/format:webp/1*aYb8AgzctiTtUYofqQq9ug.png 1100w, https://miro.medium.com/v2/resize:fit:1400/format:webp/1*aYb8AgzctiTtUYofqQq9ug.png 1400w" sizes="(min-resolution: 4dppx) and (max-width: 700px) 50vw, (-webkit-min-device-pixel-ratio: 4) and (max-width: 700px) 50vw, (min-resolution: 3dppx) and (max-width: 700px) 67vw, (-webkit-min-device-pixel-ratio: 3) and (max-width: 700px) 65vw, (min-resolution: 2.5dppx) Sua visita nos ajuda a continuar oferecendo o melhor para você! (max-width: 700px) 80vw, (-webkit-min-device-pixel-ratio: 2.5) and (max-width: 700px) 80vw, (min-resolution: 2dppx) and (max-width: 700px) 100vw, (-webkit-min-device-pixel-ratio: 2) and (max-width: 700px) 100vw, 700px" type="image/webp"/>O cartão do conjunto de dados HuggingFace mostrando um exemplo de conjunto de dados de avaliação RAG que geramos.
Nosso conjunto de dados de avaliação RAG gerado involuntariamente no Hugging Face Hub (Registo de ingresso PDF da União Europeia licenciada sob CC POR 4,0). Imagem do responsável

Neste cláusula vou mostrar uma vez que gerar seu próprio conjunto de dados RAG formado por contextos, perguntas e respostas de documentos em qualquer linguagem.

Geração Aumentada de Recuperação (RAG) [1] é uma técnica que permite aos LLMs acessar uma base de conhecimento externa.

Ao fazer upload de arquivos PDF e armazená-los em um banco de dados vetorial, podemos restabelecer esse conhecimento por meio de uma pesquisa de similaridade vetorial e, em seguida, inserir o texto renovado no prompt do LLM uma vez que contexto suplementar.

Isto fornece ao LLM novos conhecimentos e reduz a possibilidade de o LLM inventar factos (alucinações).

Sua visita nos ajuda a continuar oferecendo o melhor para você! pa">Uma visão geral do pipeline RAG. Para armazenamento de documentos: documentos de entrada -> pedaços de texto -> protótipo do codificador -> banco de dados vetorial. Para solicitação de LLM: Pergunta do usuário -> protótipo do codificador -> banco de dados de vetor -> principais pedaços relevantes -> protótipo LLM do gerador. O LLM portanto responde à pergunta com o contexto renovado.” class=”bh ms ny c” width=”700″ height=”608″ loading=”lazy”/></picture></div><figcaption class=O pipeline RAG imprescindível. Imagem do responsável do cláusula “Uma vez que erigir um chatbot LLM lugar de código lhano com RAG”

No entanto, há muitos parâmetros que precisamos definir em um pipeline RAG, e os pesquisadores estão sempre sugerindo novas melhorias. Uma vez que sabemos quais parâmetros escolher e quais métodos realmente melhorarão o desempenho para nosso caso de uso específico?

É por isso que precisamos de um conjunto de dados de validação/desenvolvimento/teste para calcular nosso pipeline RAG. O conjunto de dados deve ser do domínio que estamos interessados…

Tags:

Crédito: Natividade Original

Adriano Pina

Adriano Pina

Análise de Sistemas | SEO e Google Ads | Fundador da Loja Script PHP Aqui & Marca Shoslh de tecnologia

Especialista em transformar ideias em soluções digitais e acelerar o crescimento online.

Deixe um comentário

Tem perguntas? Nos envia sua mensagem 24/7!

(17) 99100-0874

Endereço & Contato

Centro, Interior de São Paulo
E-mail: [email protected]

Links Úteis
BAIXAR APP | SCRIPT PHP AQUI
Certificados
0
    0
    Seu carrinho
    Seu carrinho está vazio

    Usamos cookies para garantir que oferecemos a melhor experiência em nosso site. 

       

    X

    Clique em um de nossos representantes abaixo para conversar no WhatsApp ou envie um email para: 📧 [email protected]

    Precisa de ajuda fale conosco?