RAG Day3一、RAG 分类朴素 RAG 优化 RAG朴素 RAG流程最简文档分块 → 向量化 → 向量检索 → 直接给大模型生成。缺点容易检索不准、上下文丢失、回答容易片面。优化 RAG在朴素 RAG 基础上加增强环节重排序、查询改写、摘要索引、多路检索、上下文压缩等提升准确率。二、重排序Rerank作用向量库先粗筛出 Top-N 片段再用重排序模型重新打分排序。价值剔除看似向量相近、实际语义不相关的片段提高检索精准度。位置向量检索之后、传给大模型之前。三、查询改写场景用户提问口语化、太简短、语义模糊直接检索容易找不到相关文档。常见做法问题扩写把短句补全成完整专业问句反问拆解一个复杂问题拆成多个子问题同义改写换多种表达方式并行检索四、上下文窗口与块大小限制大模型有上下文长度上限不能塞无限多文档片段。文本块不能过大冗余多、浪费 Token、容易超上下文。文本块不能过小语义断裂检索出来没用。五、RAG 常见落地痛点检索不准向量相似但语义无关上下文溢出片段太多塞不下幻觉残留不参考检索内容自己瞎编分块不合理语义被硬生生切断RAG Day4一、两种主流索引方式1. 块索引普通分块索引文档直接切成固定小块向量化存库。优点简单易实现缺点大块语义不完整小块容易断上下文2. 摘要索引先对整篇文档 / 大章节生成摘要摘要向量化存库检索到摘要后再关联原文详细片段。优点检索更准、语义更完整缺点多一步摘要生成消耗更多 Token二、多路检索同时用多种方式检索再合并结果向量语义检索关键词精确检索标题目录检索互补向量管语义关键词管精准匹配避免漏资料。三、上下文压缩把检索到的片段做精简剔除无关句子、保留核心有效信息减少 Token 占用、不超上下文。四、RAG 完整工业级标准流程文档接入→ 文本分块 / 摘要索引→ 嵌入模型向量化入库→ 用户提问查询改写→ 向量库粗检索 Top-N→重排序 Rerank精选优质片段→ 上下文压缩、拼接 Prompt→ 大模型基于参考资料生成答案五、RAG 与 普通大模型对话核心区别总结普通大模型靠训练知识库作答有时间限制、易幻觉、不能用私有文档。RAG 大模型靠实时检索私有文档作答知识可随时更新、不瞎编、支持内部资料。