RAG-day8

张

张建站

2026/5/10 5:32:32

10分钟阅读

一、三种高级文本分块方式1. 滑动窗口分块把一篇长文章切成一段一段的前后两段留一部分重复内容。作用防止一句话、关键内容刚好被切在两段中间导致检索时找不到。优点简单好用不容易丢信息缺点会有少量重复内容占一点存储空间2. 递归分块按照先大后小的顺序拆分先按标题、章节分 → 再按段落分 → 最后按固定字数分。适用有层级的文档比如笔记、技术文档、手册这类能尽量保持内容完整不乱拆。3. 父子分块分两层理解父块一大段完整内容子块把父块再拆成很多小块使用逻辑存数据时只用子块做向量存入库中绑定对应的父块。查问题时用小块去匹配搜索找到后拿出完整父块给大模型用。好处搜索精准同时上下文内容完整项目里常用这种方式。二、向量数据库进阶1. 常用向量数据库介绍FAISS本地用、学习测试、小项目够用Chroma上手简单适合练手、快速做 demoMilvus企业正式项目用能存海量数据Weaviate适合图片文字的多模态场景Pinecone云端服务不用自己维护底层2. 索引基础向量数量很大时挨个对比很慢。索引就是给向量建快速查找结构能实现毫秒级搜到相似内容常用 HNSW 索引。3. 元数据过滤给每一段文档打上标签比如时间、文档类型、所属部门。搜索时可以加条件只在指定范围里找减少无关内容。三、多模态 RAG不只能处理纯文字还能处理图片、表格、PDF 扫描件。流程用 OCR 识别图片、扫描件里的文字把文字和图片转成统一向量格式实现文字搜图片、图文一起问答适用带图表手册、扫描文件、图文资料解析。四、RAG 效果怎么判断好不好不用凭感觉看主要看两方面检索层面召回率该找到的相关内容有没有都找出来精确率找出来的内容是不是真的相关生成层面忠实度回答是不是照着查到的内容说的不瞎编相关性答案和用户问题是否匹配常用工具RAGAS、LangSmith用来自动评测 RAG 效果。五、解决大模型幻觉的两种进阶方式1. Self-RAG模型可以自己判断需不需要检索、搜到的内容好不好、生成答案有没有乱编自己检查自己减少编造。2. RAG 微调搭配RAG 用来补外部私有知识微调让模型更懂行业业务话术和知识。两者配合能明显减少大模型瞎编的情况。

ARM PMU架构与PMCNTENCLR_EL0寄存器详解

1. ARM PMU架构概述性能监控单元(Performance Monitoring Unit, PMU)是现代ARM处理器中用于硬件级性能分析的核心组件。作为芯片上的专用硬件模块，PMU通过一组可编程计数器来捕获处理器运行时的各类微架构事件。与软件性能分析工具相比，PMU具有零开销、…...

2026/5/10 5:30:47 阅读更多 →

预测锦标赛：解码AGI发展的集体智慧与风险评估

1. 项目概述：当预测竞赛成为AGI的“试金石”最近几年，一个现象在科技圈和投资圈悄然兴起：预测锦标赛。这可不是什么体育博彩，而是一种基于群体智慧，对未来特定事件发生概率进行量化预测的竞赛。参与者们像下注一样&…...

2026/5/10 5:22:49 阅读更多 →

Cursor AI 编码助手规则集配置指南：从代码规范到项目定制

1. 项目概述：一个为 Cursor 编辑器量身定制的规则集如果你和我一样，日常重度依赖 Cursor 这款 AI 驱动的代码编辑器，那你一定遇到过这样的场景：面对一个复杂的重构任务，你满怀期待地输入指令，结果 AI 生成的…...

2026/5/10 5:20:46 阅读更多 →

【阳师范学院主办，多高校承协办 | IET出版，往届连续4届EI稳定检索，平均刊后2个月EI检索，EI检索稳定 | 择优至EI期刊】第五届电力工程与电气技术学术会议（ICPEET 2026）

ICPEET 2026 已申请IET (CA) EAI (JA) 出版会议论文（CA）： 会议已申请IET Conference Proceedings (ISSN: 2732-4494) 出版，收录于IET数字图书馆，并提交EI Compendex、Scopus、IEEE Xplore等数据库进行检索。期刊论文…...

2026/5/10 0:00:32 阅读更多 →