RAG-day3、day4

张

张建站

2026/5/8 4:44:37

10分钟阅读

RAG Day3一、RAG 分类朴素 RAG 优化 RAG朴素 RAG流程最简文档分块 → 向量化 → 向量检索 → 直接给大模型生成。缺点容易检索不准、上下文丢失、回答容易片面。优化 RAG在朴素 RAG 基础上加增强环节重排序、查询改写、摘要索引、多路检索、上下文压缩等提升准确率。二、重排序Rerank作用向量库先粗筛出 Top-N 片段再用重排序模型重新打分排序。价值剔除看似向量相近、实际语义不相关的片段提高检索精准度。位置向量检索之后、传给大模型之前。三、查询改写场景用户提问口语化、太简短、语义模糊直接检索容易找不到相关文档。常见做法问题扩写把短句补全成完整专业问句反问拆解一个复杂问题拆成多个子问题同义改写换多种表达方式并行检索四、上下文窗口与块大小限制大模型有上下文长度上限不能塞无限多文档片段。文本块不能过大冗余多、浪费 Token、容易超上下文。文本块不能过小语义断裂检索出来没用。五、RAG 常见落地痛点检索不准向量相似但语义无关上下文溢出片段太多塞不下幻觉残留不参考检索内容自己瞎编分块不合理语义被硬生生切断RAG Day4一、两种主流索引方式1. 块索引普通分块索引文档直接切成固定小块向量化存库。优点简单易实现缺点大块语义不完整小块容易断上下文2. 摘要索引先对整篇文档 / 大章节生成摘要摘要向量化存库检索到摘要后再关联原文详细片段。优点检索更准、语义更完整缺点多一步摘要生成消耗更多 Token二、多路检索同时用多种方式检索再合并结果向量语义检索关键词精确检索标题目录检索互补向量管语义关键词管精准匹配避免漏资料。三、上下文压缩把检索到的片段做精简剔除无关句子、保留核心有效信息减少 Token 占用、不超上下文。四、RAG 完整工业级标准流程文档接入→ 文本分块 / 摘要索引→ 嵌入模型向量化入库→ 用户提问查询改写→ 向量库粗检索 Top-N→重排序 Rerank精选优质片段→ 上下文压缩、拼接 Prompt→ 大模型基于参考资料生成答案五、RAG 与普通大模型对话核心区别总结普通大模型靠训练知识库作答有时间限制、易幻觉、不能用私有文档。RAG 大模型靠实时检索私有文档作答知识可随时更新、不瞎编、支持内部资料。

Gitless测试与贡献指南：如何参与这个开源项目的开发

Gitless测试与贡献指南：如何参与这个开源项目的开发【免费下载链接】gitless A simple version control system built on top of Git 项目地址: https://gitcode.com/gh_mirrors/gi/gitless Gitless是一个基于Git构建的简单版本控制系统，旨在提供…...

2026/5/8 4:44:25 阅读更多 →

gh_mirrors/home/homelab：从零开始构建专业级家庭实验室的终极指南

gh_mirrors/home/homelab：从零开始构建专业级家庭实验室的终极指南【免费下载链接】homelab This is my entire homelab documentation files. Here youll find notes, setups, and configurations for infrastructure, applications, networking, and more. 项目…...

2026/5/8 4:44:00 阅读更多 →

Lichess Mobile广播功能解析：如何观看和分享大型赛事

Lichess Mobile广播功能解析：如何观看和分享大型赛事【免费下载链接】mobile Lichess mobile app 项目地址: https://gitcode.com/gh_mirrors/mobile6/mobile Lichess Mobile是一款功能强大的国际象棋移动应用，其中的广播功能让用户能够实时观看…...

2026/5/8 4:43:12 阅读更多 →

ColorControl：一键掌控多设备显示与智能控制的终极方案

ColorControl：一键掌控多设备显示与智能控制的终极方案【免费下载链接】ColorControl Easily change NVIDIA display settings and/or control LG TVs 项目地址: https://gitcode.com/gh_mirrors/co/ColorControl ColorControl 是一个专注于显示参数优化与智…...

2026/5/8 2:36:29 阅读更多 →

使用Taotoken CLI工具一键配置开发环境与多工具API密钥的教程

使用Taotoken CLI工具一键配置开发环境与多工具API密钥的教程 1. 安装Taotoken CLI工具 Taotoken CLI工具提供两种安装方式。对于需要频繁使用CLI的场景，推荐全局安装： npm install -g taotoken/taotoken若只需临时使用或避免全局依赖，可通…...

2026/5/5 1:47:46 阅读更多 →

C语言固件完整性保护全栈方案（含国密SM4+可信执行环境TEE落地代码）

更多请点击： https://intelliparadigm.com 第一章：Shell脚本的基本语法和命令 Shebang 与执行方式每个可执行 Shell 脚本的第一行应以 Shebang（ #!/bin/bash）开头，用于指定解释器路径。保存为 hello.sh 后&#xf…...

2026/5/7 11:30:49 阅读更多 →

在 Node.js 后端服务中集成 Taotoken 实现多模型对话路由

在 Node.js 后端服务中集成 Taotoken 实现多模型对话路由 1. 准备工作在开始集成 Taotoken 之前，需要确保您的开发环境已满足以下条件。Node.js 版本建议使用 18.x 或更高 LTS 版本。通过运行 node -v 可以检查当前版本。如果尚未安装 openai 包，可以…...

2026/5/4 5:56:10 阅读更多 →