Arquitectura RAG con DeepSeek

Diseñaremos una Arquitectura RAG (Retrieval-Augmented Generation) contemplando el uso  de DeepSeek como LLM, DeepSeek se encarga de combinar el motor de búsqueda semántica como pipeline que permitará enriquecer las respuestas del modelo (LLM) basada en información actualizada y contextual.

A modo de introducción podemos especificar que RAG (Retrieval-Augmented Generation) es una técnica que mejora la precisión y relevancia de los modelos de lenguaje como DeepSeek al combinar generación de texto con recuperación de información externa. Se aplica ampliamente en atención al cliente, búsqueda empresarial, educación, salud y legal para ofrecer respuestas actualizadas y confiables.

Diagrama de Arquitectura RAG con DeepSeek (Enumerado)

RAG con DeepSeek (Enumerado)

1️⃣ 👤 Usuario

  • Inicia la consulta con una pregunta o solicitud.
  • Representado como el punto de entrada del flujo.

2️⃣ 🔎 Embeddings

  • Transforma la consulta en vectores semánticos.
  • Permite realizar búsquedas por similitud en el espacio vectorial.

3️⃣ 🗄️ Vector Store

  • Base de datos vectorial que almacena los embeddings de documentos.
  • Se consulta para recuperar información relevante.

4️⃣ 📄 Documentos relevantes

  • Resultado de la búsqueda semántica.
  • Proporciona el contexto necesario para enriquecer la respuesta.

5️⃣ 📝 Prompt Builder

  • Construye el prompt combinando la consulta del usuario y los documentos recuperados.
  • Define las instrucciones que se enviarán al modelo.

6️⃣ 🤖 DeepSeek LLM

  • Modelo de lenguaje que genera la respuesta final.
  • Usa el contexto proporcionado para producir una salida más precisa.

7️⃣ 💬 Respuesta enriquecida

  • Salida final hacia el usuario.
  • Precisa, contextualizada y con referencias.

Publicar un comentario

0 Comentarios