跳转到内容

RAG 系统分层架构实战

  1. Retrieval:多路召回,优先保证召回率。
  2. Rerank:用轻量重排模型提升相关性。
  3. Generation:控制上下文预算,避免冗余提示词。
  4. Evaluation:离线集 + 线上反馈双通道评估。
  • 每段都打可观测埋点:耗时、命中率、错误类型。
  • 先做“可解释失败”,再追求“更高指标”。
  • 版本化你的 prompt、索引和 rerank 配置。