RAG 系统分层架构实战
四段式流水线
Section titled “四段式流水线”Retrieval:多路召回,优先保证召回率。Rerank:用轻量重排模型提升相关性。Generation:控制上下文预算,避免冗余提示词。Evaluation:离线集 + 线上反馈双通道评估。
- 每段都打可观测埋点:耗时、命中率、错误类型。
- 先做“可解释失败”,再追求“更高指标”。
- 版本化你的 prompt、索引和 rerank 配置。
Retrieval:多路召回,优先保证召回率。Rerank:用轻量重排模型提升相关性。Generation:控制上下文预算,避免冗余提示词。Evaluation:离线集 + 线上反馈双通道评估。