RAG我懂你：从架构到知识库构建

张

张建站

2026/5/20 2:52:19

10分钟阅读

导航传统大语言模型主要依赖参数中的隐式知识进行回答容易受到知识过期、幻觉和领域知识不足等问题影响。RAG 的核心思想是在生成答案之前先从外部知识库中检索相关信息再将这些信息作为上下文提供给大语言模型从而提升回答的准确性、可追溯性和时效性。检索增强生成架构架构类型是否修改大模型参数是否修改检索器参数代表方法特点无微调 RAG否否In-Context RALM简单、易落地检索器微调否是REPLUG适合黑盒大模型仅语言模型微调是否RETRO强化模型利用外部知识的能力检索器与模型协同微调是是Atlas效果潜力高但训练复杂黑盒增强架构黑盒增强架构指的是不修改或无法访问大语言模型内部参数主要通过Prompt、外部检索、检索器优化或输出反馈来提升生成效果。无微调无微调架构是所有RAG架构中形式最简单的。该架构中检索器和语言模型经过分别独立的预训练后参数不再更新直接组合使用。In-Context RALM是该框架下的代表性方法在实际工程中大多数企业级 RAG 系统最初都采用这种形式知识库、Embedding 模型、向量数据库和大语言模型相互独立只通过 Prompt 将检索结果注入上下文。检索器微调在检索器微调架构中大语言模型参数保持不变仅通过语言模型的输出反馈来优化检索器。其核心思想是如果某个文档能让语言模型更容易生成正确答案那么这个文档就应该被检索器赋予更高权重。REPLUG 是这类方法的代表之一。它利用语言模型对不同检索文档的困惑度变化作为监督信号训练检索器更倾向于召回那些能显著提升生成质量的文档。白盒增强架构大语言模型和检索器是独立预训练的二者可能存在匹配欠佳的情况。白盒增强架构通过微调大语言模型来配合检索器以提升RAG 的效果。根据是否对检索器进行微调分为两类• 仅语言模型微调• 检索器和语言模型协同微调仅微调语言模型仅微调语言模型指的是检索器作为一个预先训练好的组件其参数保持不变大语言模型根据检索器提供的上下文信息对自身参数进行微调。RETRO是微调语言模型的代表性方法之一。检索器和语言模型协同微调在该架构中检索器和语言模型同时进行微调以实现更好的协同效果。该方法的代表性方法是Atlas。知识库构建在RAG 框架中知识库构建主要涉及数据采集及预处理与知识库增强两个步骤。数据采集及预处理• 数据采集: 来自不同渠道的数据被整合、转换为统一的文档对象。这些文档对象不仅包含原始的文本信息还携带有关文档的元信息Metadata• 预处理: 预处理可以提升数据质量和可用性。数据预处理主要包括数据清洗和文本分块两个过程。• 数据清洗旨在清除文本中的干扰元素。• 文本分块是将长文本分割成较小文本块的过程文本分块的效果直接影响后续检索结果的质量知识库增强知识库增强是通过改进和丰富知识库的内容和结构以提升其质量和实用性• 查询生成利用大语言模型生成与文档内容紧密相关的伪查询。这些伪查询从查询的角度来表达文档的语义可以作为相关文档的“键”供检索时与用户查询进行匹配。• 标题生成利用大语言模型为没有标题的文档生成合适的标题查询与检索增强查询增强查询增强是指在检索阶段对用户输入的查询进行改进和优化以提升检索结果的相关性和准确性。查询增强的主要方法包括• 查询语义增强: 通过同义改写和多视角分解等方法来扩展、丰富用户查询的语义以提高检索的准确性和全面性• 查询内容增强: 通过生成与原始查询相关的背景信息和上下文从而丰富查询内容提高检索的准确性和全面性。查询内容增强方法通过引入大语言模型生成的辅助文档为原始查询提供更多维度的信息支持检索器检索器是RAG系统中的核心组件负责从知识库中检索出与用户查询相关的文档判别式检索器判别式检索器通过判别模型对查询和文档是否相关进行打分。判别式检索器通常分为两大类• 稀疏检索器稀疏检索器Sparse Retriever是指使用稀疏表示方法来匹配文本的模型通过统计文档中特定词项出现的统计特征来对文档进行编码然后基于此编码计算查询与知识库中的文档的相似度来进行检索• 稠密检索器稠密检索器一般利用预训练语言模型对文本生成低维、密集的向量表示通过计算向量间的相似度进行检索生成式检索器生成式检索器通过生成模型对输入查询直接生成相关文档的标识符。检索效率增强向量数据库可以实现高效的向量检索与查询。向量数据库的核心是设计高效的相似度索引算法。常用的索引技术主要分为三大类• 基于空间划分: 将搜索空间划分为多个区域来实现索引• 基于乘积量化: 将高维向量空间划分为多个子空间并在每个子空间中进行聚类得到码本和码字以此作为构建索引的基础• 基于图: 构建一个邻近图将向量检索转化为图的遍历问题检索结果重排通过对检索结果重排可以提升检索结果的相关性和准确性。常见的重排方法包括• 基于交叉编码的方法基于交叉编码的重排方法利用交叉编码器Cross-Encoders来评估文档与查询之间的语义相关性• 基于上下文学习的方法基于上下文学习的方法是指通过设计精巧的Prompt使用大语言模型来执行重排任务RAG 系统评估RAG 系统的评估通常需要同时关注检索质量和生成质量。检索质量评估• Recall相关文档是否被召回。• Precision召回结果中有多少是真正相关的。• MRR正确文档是否排在靠前位置。• nDCG综合考虑相关性和排序位置。生成质量评估• 正确性答案是否符合事实。• 忠实性答案是否基于检索到的证据生成。• 完整性是否覆盖用户问题的关键方面。• 可引用性是否能给出明确来源。• 幻觉率是否编造不存在的信息。优化增强过程RAG 并不意味着每次生成都必须检索。是否检索、在哪里融合检索结果、是否需要多轮检索都会影响系统成本、延迟和答案质量。何时增强判断是否需要增强的核心在于判断大语言模型是否具有内部知识。判断模型是否具有内部知识的方法可以分为两类:• 外部观测法通过 Prompt 询问模型是否具备相关知识或通过置信度、困惑度等统计信号进行判断。• 内部观测法通过检测模型内部神经元或隐藏状态判断模型是否存储相关知识。这类方法通常需要访问模型内部参数更适合白盒场景。内部/外部观测法都存在一定局限性最好是定义一个决策链: 规则兜底 LLM 判断检索质量评估证据充分性验证.何处增强可以在输入端、中间层、输出端使用检索的结果:• 输入端: 直接将检索到的外部知识文本与用户查询拼接到Prompt中然后输入给大语言模型,主流方式。• 中间层: 先将检索到的外部知识转换为向量表示然后将这些向量插入通过交叉注意力融合到模型的隐藏状态中。黑盒架构中无法使用。• 输出端: 利用检索到的外部知识对大语言模型生成的文本进行校准是一种后处理的方法多次增强• 分解式增强将复杂问题分解为多个子问题子问题间进行迭代检索增强最终得到正确答案• 渐进式增强将问题不断细化然后分别对细化的问题进行检索增强力求给出全面的答案以覆盖用户需要的答案学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

从“能聊天”到“能值班”：MateClaw 企业化场景里的 Java Harness 应用

一家企业如果真的要把 Agent 放进生产系统，它需要的不只是一个会回答问题的模型，而是一套可治理、可审计、可恢复、可持续运行的 AI 工作系统。Java 版 Harness 提供“长期运行 Agent 内核”，MateClaw 提供“企业 AI 控制平面”，两…...

2026/5/20 2:50:05 阅读更多 →

芯片HAST测试：通电工作下如何精准模拟极端环境挑战？

为了确保产品在高温、高湿等恶劣条件下仍能正常工作，HAST（Highly Accelerated Stress Test）测试成为不可或缺的一部分。本文将深入解析HAST测试，并探讨如何在通电工作状态下进行精准模拟，以应对极端环境挑战。什么是HA…...

2026/5/20 2:42:41 阅读更多 →

新手必看：轻松掌握Harness Engineering核心——构建私域知识护城河（收藏）

当 Harness Engineering 成为 2026 年最热门的 AI 工程话题，业界争论焦点集中在"该用多大的模型"还是"该搭多复杂的工作流"时，我们团队在落地实践中发现了一个被低估的事实——构建 Harness 工作流不是最终目的，私域和团…...

2026/5/20 2:41:44 阅读更多 →

app扫描wifi的时候需要打开GPS定位----否则扫不到

这是很奇怪的一个事情，wifi和定位有什么关系？但是就是要打开。...

2026/5/18 6:22:28 阅读更多 →

AMD Ryzen调试神器SMUDebugTool：免费开源工具让你的处理器性能飞起来！

AMD Ryzen调试神器SMUDebugTool：免费开源工具让你的处理器性能飞起来！ 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Tab…...

2026/5/19 8:13:30 阅读更多 →

Midjourney抽象表现主义风格迁移全链路（从梵高笔触到AI熵增美学的底层逻辑解密）

更多请点击： https://intelliparadigm.com 第一章：Midjourney抽象表现主义风格迁移全链路（从梵高笔触到AI熵增美学的底层逻辑解密） 抽象表现主义并非仅关乎色彩与笔触的失控，而是神经感知系统在高维特征空间中对抗坍缩…...

2026/5/19 8:47:40 阅读更多 →

2026届毕业生推荐的AI科研方案实际效果

Ai论文网站排名（开题报告、文献综述、降aigc率、降重综合对比） TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 处在学术研究的起始阶段，开题报告的撰写常常令好多研究生以及青年学者觉得麻烦&…...

2026/5/18 10:49:06 阅读更多 →