收藏 | 从0到1成为优秀大模型应用开发工程师：RAG/Agent/部署优化6个月进阶路线

张

张建站

2026/4/9 15:23:12

10分钟阅读

收藏 | 从0到1成为优秀大模型应用开发工程师：RAG/Agent/部署优化6个月进阶路线

本文为程序员和小白提供了成为优秀大模型应用开发工程师的6个月学习路线图涵盖Python、AI基础及大模型概念。内容重点聚焦RAG、Agent和推理部署优化三大核心技术通过分阶段学习计划帮助读者掌握向量数据库、Embedding模型、检索策略、Agent架构、Function Calling、多Agent协作、模型量化、推理引擎部署等关键技能。最后通过企业智能助手平台和垂直领域专业助手两个实战项目全面提升工程能力并附有学习资源汇总和能力评估清单助力读者在大模型领域快速成长。技术栈总览┌─────────────────────────────────────────────────────────────┐ │ 大模型应用工程师技术栈 │ ├─────────────────────────────────────────────────────────────┤ │ 基础层 │ │ ├── Python 编程(必备)│ │ ├── Linux 基础(必备)│ │ ├── Git 版本控制(必备)│ │ └── Docker 容器化(必备)│ ├─────────────────────────────────────────────────────────────┤ │ AI 基础 │ │ ├── 机器学习基础 │ │ ├── 深度学习基础(Transformer 架构)│ │ ├── NLP 基础 │ │ └── 大模型基础概念(Prompt/Token/Context 等)│ ├─────────────────────────────────────────────────────────────┤ │ 核心技术 - RAG │ │ ├── 向量数据库(Chroma/Milvus/Weaviate/Pinecone)│ │ ├── Embedding 模型 │ │ ├── 检索策略(稠密/稀疏/混合)│ │ ├── RAG 优化(重排序/查询改写/多跳检索)│ │ └── 框架(LangChain/LlamaIndex)│ ├─────────────────────────────────────────────────────────────┤ │ 核心技术 - Agent │ │ ├── Agent 架构(ReAct/Plan-and-Solve)│ │ ├── Function Calling │ │ ├── 工具调用与集成 │ │ ├── 多 Agent 协作 │ │ ├── 记忆机制 │ │ └── 框架(LangChain/AutoGen/CrewAI)│ ├─────────────────────────────────────────────────────────────┤ │ 核心技术 - 推理部署 │ │ ├── 模型量化(INT8/INT4/FP8)│ │ ├── 推理引擎(vLLM/TGI/TensorRT-LLM)│ │ ├── 服务化(FastAPI/Triton)│ │ ├── 性能优化(批处理/KV Cache/连续批处理)│ │ └── 监控可观测性 │ ├─────────────────────────────────────────────────────────────┤ │ 工程能力 │ │ ├── API 设计与开发 │ │ ├── 数据库(SQL/NoSQL)│ │ ├── 消息队列(Redis/RabbitMQ)│ │ ├── CI/CD │ │ └── 云服务平台(AWS/Azure/阿里云)│ └─────────────────────────────────────────────────────────────┘学习阶段规划总体时间线6 个月阶段时间主题目标第一阶段第 1-4 周基础筑基PythonAI 基础大模型概念第二阶段第 5-10 周RAG 专项掌握 RAG 全流程与优化第三阶段第 11-16 周Agent 专项掌握 Agent 设计与开发第四阶段第 17-22 周推理部署掌握模型部署与性能优化第五阶段第 23-26 周综合实战完整项目实战与优化RAG 专项学习计划第 5-10 周6 周第 5 周RAG 基础与向量数据库天数学习内容实践任务产出Day 1-2RAG 原理与架构 - 检索增强生成概念 - RAG 基本流程 - 应用场景分析阅读论文 “Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks”学习笔记Day 3-4向量数据库入门 - Chroma 基础使用 - 向量相似度计算 - 索引类型安装 Chroma 完成基础 CRUD 操作代码示例Day 5-7Embedding 模型 - 主流 Embedding 模型对比 - 中文 Embedding 选型 - 嵌入维度选择使用 text-embedding 模型构建小型向量库向量库 demo实践项目构建一个简单的文档检索系统# 目标实现文档分块→向量化→存储→检索的完整流程第 6 周检索策略与 LangChain 集成天数学习内容实践任务产出Day 1-2检索策略 - 稠密检索 vs 稀疏检索 - 混合检索策略 - MMR(Maximal Marginal Relevance)对比不同检索策略效果对比报告Day 3-5LangChain RAG - Document Loaders - Text Splitters - VectorStores - Retrievers使用 LangChain 重构检索系统LangChain 版本代码Day 6-7检索评估 - RecallK - PrecisionK - MRR(Mean Reciprocal Rank)构建评估数据集量化检索效果评估脚本实践项目多策略检索对比系统第 7 周RAG 优化技术上天数学习内容实践任务产出Day 1-2查询改写 - HyDE(Hypothetical Document Embeddings) - Query Expansion - 同义词扩展实现查询改写模块改写模块代码Day 3-4文档分块优化 - 固定长度分块 - 语义分块 - 递归分块 - 父子文档检索对比不同分块策略分块策略对比Day 5-7重排序 (Rerank) - Cross-Encoder 原理 - BGE-Reranker 使用 - 两阶段检索架构集成 Rerank 模型优化检索排序Rerank 集成代码实践项目带 Rerank 的高质量检索系统第 8 周RAG 优化技术下天数学习内容实践任务产出Day 1-3多跳检索 (Multi-hop) - 迭代检索 - 子查询分解 - GraphRAG 概念实现多跳检索逻辑多跳检索 demoDay 4-5上下文优化 - 上下文压缩 - 相关片段选择 - 上下文窗口管理优化 Prompt 上下文上下文管理模块Day 6-7RAG 评估框架 - RAGAS 框架 - 评估指标 (Faithfulness, Answer Relevance 等)使用 RAGAS 评估系统评估报告实践项目完整的 RAG 评估体系第 9 周高级 RAG 架构天数学习内容实践任务产出Day 1-2混合检索进阶 - BM25 向量混合 - 加权融合策略 - Reciprocal Rank Fusion实现混合检索融合混合检索模块Day 3-4多向量检索 - ColBERT 原理 - Late Interaction - 多表示检索了解多向量架构技术方案文档Day 5-7企业级 RAG - 权限控制 - 多租户架构 - 增量更新设计企业 RAG 架构架构设计文档实践项目企业级 RAG 系统架构设计第 10 周RAG 综合实战完整项目智能知识库问答系统功能要求 ├── 多格式文档支持(PDF/Word/Markdown/HTML)├── 智能分块与向量化 ├── 混合检索 Rerank ├── 查询改写与扩展 ├── 溯源与引用 ├── 检索效果评估 └── Web 界面展示技术栈• Backend: FastAPI LangChain/LlamaIndex• Vector DB: Chroma/Milvus• Embedding: BGE-M3 / text-embedding-3-large• Rerank: BGE-Reranker• Frontend: Streamlit/GradioAgent 专项学习计划第 11-16 周6 周第 11 周Agent 基础与 ReAct 架构天数学习内容实践任务产出Day 1-2Agent 基础概念 - Agent 组成要素 - 规划与执行 - 反思机制阅读论文 “ReAct: Synergizing Reasoning and Acting”学习笔记Day 3-5ReAct 架构深入 - Thought-Action-Observation 循环 - Prompt 设计 - 停止条件实现基础 ReAct AgentReAct Agent 代码Day 6-7LangChain Agent - Agent 类型 (Zero-shot, Plan-and-execute) - Tools 定义 - AgentExecutor使用 LangChain 构建 AgentLangChain Agent实践项目支持工具调用的 ReAct Agent第 12 周Function Calling 与工具集成天数学习内容实践任务产出Day 1-3Function Calling - OpenAI Function Calling - 参数解析与验证 - 多函数选择实现 Function Calling 模块函数调用代码Day 4-5工具开发 - 工具定义规范 - 错误处理 - 工具描述优化开发 5 个实用工具 (搜索/计算/数据库等)工具库Day 6-7工具注册与发现 - 动态工具加载 - 工具描述 Embedding - 工具检索实现工具检索机制工具管理系统实践项目可扩展的工具调用框架第 13 周Agent 规划与记忆天数学习内容实践任务产出Day 1-3规划策略 - Plan-and-Solve - Tree of Thoughts - 任务分解实现任务分解模块规划模块代码Day 4-5记忆机制 - 短期记忆 vs 长期记忆 - 记忆存储与检索 - 记忆压缩实现对话记忆系统记忆模块Day 6-7反思与自我改进 - 自我批评 - 执行反思 - 迭代优化实现反思机制反思模块实践项目带记忆和反思的 Agent第 14 周多 Agent 协作天数学习内容实践任务产出Day 1-2多 Agent 架构 - 角色分工 - 通信机制 - 协调策略阅读 AutoGen/CrewAI 文档架构理解文档Day 3-5AutoGen 框架 - Agent 定义 - Group Chat - 嵌套对话使用 AutoGen 构建多 Agent 系统AutoGen 项目Day 6-7CrewAI 框架 - Role-Goal-Task 模型 - 流程编排 - 结果聚合使用 CrewAI 重构项目CrewAI 项目实践项目多 Agent 协作系统如研究团队/开发团队第 15 周Agent 高级主题天数学习内容实践任务产出Day 1-2Agent 安全 - Prompt 注入防护 - 工具调用限制 - 输出验证实现安全防护模块安全模块Day 3-4Agent 评估 - 任务完成率 - 执行效率 - 工具使用准确性构建评估基准评估框架Day 5-7人机协作 - 人在回路 (Human-in-the-loop) - 审批流程 - 干预机制实现人工审批流程人机协作模块实践项目安全可控的企业 Agent第 16 周Agent 综合实战完整项目智能数据分析 Agent功能要求├── 自然语言查询数据库├── 自动生成分析代码├── 数据可视化├── 报告生成├── 多轮对话澄清├── 执行审批流程└── 结果解释与溯源技术栈• Agent 框架LangChain / AutoGen / CrewAI• 数据库SQLite / PostgreSQL• 可视化Matplotlib / Plotly• 部署FastAPI Docker推理部署优化专项学习计划第 17-22 周6 周第 17 周大模型推理基础天数学习内容实践任务产出Day 1-2Transformer 推理原理 - Self-Attention 计算 - KV Cache 机制 - 解码策略 (Greedy/Sample/Beam)阅读推理相关论文学习笔记Day 3-5推理指标 - 首 token 延迟 (TTFT) - 解码延迟 - 吞吐量 (tokens/s) - 显存占用基准测试不同模型性能基准报告Day 6-7HuggingFace 推理 - Pipeline 使用 - 批处理 - 设备管理HF 模型本地部署部署脚本实践项目基础推理服务第 18 周模型量化天数学习内容实践任务产出Day 1-2量化基础 - INT8/INT4/FP8 原理 - 量化类型 (PTQ/QAT) - 量化对精度影响理论学习和实验量化笔记Day 3-4GPTQ 量化 - GPTQ 原理 - AutoGPTQ 使用 - 量化配置量化一个 7B 模型量化模型Day 5-7AWQ 量化 - AWQ 原理 - 激活感知量化 - 与 GPTQ 对比AWQ 量化实验对比 GPTQ量化对比报告实践项目模型量化流水线# 目标实现模型量化→评估→部署的完整流程第 19 周推理引擎上- vLLM天数学习内容实践任务产出Day 1-2vLLM 架构 - PagedAttention - 连续批处理 - 共享 KV Cache阅读 vLLM 论文架构理解文档Day 3-4vLLM 部署 - 安装配置 - 模型加载 - API 服务启动部署 vLLM 服务部署文档Day 5-7vLLM 优化 - 并发配置 - 内存优化 - 多 GPU 部署性能调优实验优化报告实践项目高并发推理服务第 20 周推理引擎下- TGI TensorRT-LLM天数学习内容实践任务产出Day 1-3Text Generation Inference (TGI) - HuggingFace TGI 架构 - 部署配置 - 性能特性部署 TGI 服务TGI 部署文档Day 4-5TensorRT-LLM 基础 - NVIDIA 推理栈 - 引擎构建 - 优化策略了解 TensorRT-LLM技术方案Day 6-7推理引擎对比 - vLLM vs TGI vs TensorRT-LLM - 选型指南 - 场景匹配多引擎对比测试对比报告实践项目多引擎性能对比第 21 周服务化与 API 设计天数学习内容实践任务产出Day 1-3API 设计 - RESTful 设计 - 流式响应 (SSE) - 异步处理设计推理 APIAPI 文档Day 4-5FastAPI 部署 - 异步处理 - 请求队列 - 限流与熔断实现推理服务 API服务代码Day 6-7服务治理 - 负载均衡 - 健康检查 - 灰度发布设计服务治理方案治理方案实践项目生产级推理 API 服务第 22 周监控与可观测性天数学习内容实践任务产出Day 1-2监控指标 - 延迟指标 - 吞吐量指标 - 错误率 - 资源使用定义监控指标体系指标文档Day 3-4日志与追踪 - 结构化日志 - 分布式追踪 - 请求追踪集成日志系统日志方案Day 5-7可观测性平台 - Prometheus Grafana - 告警配置 - 看板设计搭建监控看板监控看板实践项目完整的监控告警系统实战项目建议综合实战项目第 23-26 周项目一企业智能助手平台项目概述构建一个集成了 RAG、Agent 和优化部署的企业级智能助手平台核心功能├── 知识库管理│ ├── 多格式文档上传与解析│ ├── 智能分块与向量化│ ├── 版本管理与增量更新│ └── 权限控制├── 智能问答│ ├── 混合检索 Rerank│ ├── 多轮对话│ ├── 溯源引用│ └── 答案评估├── Agent 能力│ ├── 工具调用 (数据库/API/搜索)│ ├── 任务规划与执行│ ├── 人机协作审批│ └── 执行日志├── 推理服务│ ├── 模型量化部署│ ├── 高并发推理│ ├── 多模型路由│ └── 监控告警└── 管理后台 ├── 用户管理 ├── 使用统计 ├── 效果评估 └── 系统配置技术栈- 前端React/Vue TypeScript- 后端FastAPI Python- 向量库Milvus/Chroma- 推理vLLM- 部署Docker Kubernetes- 监控Prometheus Grafana项目二垂直领域专业助手选择一个垂直领域深入• 法律助手合同审查/法律咨询• 医疗助手病历分析/健康咨询• 金融助手研报分析/投资建议• 教育助手个性化学习/作业辅导学习资源汇总核心课程资源链接/平台说明DeepLearning.AIdeeplearning.aiAndrew Ng 系列课程HuggingFace Coursehuggingface.co/learnNLP 与大模型实战LangChain Docsdocs.langchain.comLangChain 官方文档vLLM Docsdocs.vllm.aivLLM 官方文档必读论文论文主题重要性Retrieval-Augmented Generation for Knowledge-Intensive NLP TasksRAG⭐⭐⭐⭐⭐ReAct: Synergizing Reasoning and ActingAgent⭐⭐⭐⭐⭐PagedAttention: Efficient Memory Management for LLM InferencevLLM⭐⭐⭐⭐⭐Chain of Thought PromptingPrompt Engineering⭐⭐⭐⭐Toolformer: Language Models Can Teach Themselves to Use ToolsTool Use⭐⭐⭐⭐️ 实践平台平台用途HuggingFace模型下载与实验Google Colab免费 GPU 环境Kaggle数据集与竞赛Replicate模型部署体验资讯渠道渠道说明HuggingFace Blog最新模型与技术LLM 周报中文大模型资讯Twitter/X关注领域专家GitHub Trending发现开源项目能力评估清单✅ 基础能力• Python 编程熟练装饰器、异步、并发• Linux 常用命令熟练• Git 工作流熟练• Docker 容器化部署• RESTful API 设计✅ RAG 能力• 理解 RAG 基本原理与架构• 熟练使用向量数据库Chroma/Milvus• 掌握 Embedding 模型选型与使用• 实现混合检索策略• 集成 Rerank 优化检索• 实现查询改写与扩展• 使用 RAGAS 进行评估• 构建企业级 RAG 系统✅ Agent 能力• 理解 ReAct 架构原理• 实现 Function Calling• 开发自定义工具• 实现 Agent 记忆机制• 实现任务规划与分解• 使用 LangChain/AutoGen/CrewAI• 构建多 Agent 协作系统• 实现人机协作流程✅ 推理部署能力• 理解 Transformer 推理原理• 掌握模型量化GPTQ/AWQ• 部署 vLLM 推理服务• 部署 TGI 推理服务• 实现高并发 API 服务• 性能调优与基准测试• 搭建监控告警系统• 多 GPU 部署经验✅ 工程能力• 代码规范与重构• 单元测试与集成测试• CI/CD 流程• 日志与错误处理• 安全与权限控制• 文档编写能力学习建议1. 理论与实践并重• 每学一个概念立刻动手实现• 不要只看不练代码量是硬指标2. 建立知识库• 用 Markdown 记录学习笔记• 整理代码片段库• 积累常见问题解决方案3. 参与开源• 给 LangChain/LlamaIndex 等提交 PR• 参与社区讨论• 分享自己的项目4. 持续学习• 大模型领域发展极快• 保持对新技术的敏感度• 定期 review 和更新知识5. 构建作品集• GitHub 上维护项目• 写技术博客• 参与技术分享里程碑检查点时间里程碑验收标准第 4 周基础完成能独立实现 Prompt Engineering 任务第 10 周RAG 完成部署完整的 RAG 问答系统第 16 周Agent 完成实现多 Agent 协作项目第 22 周部署完成生产级推理服务上线第 26 周综合完成完整作品集技术博客记住学习是一个持续的过程这份计划是路线图而非束缚。根据自己的背景和兴趣调整节奏关键是保持动手实践和持续学习的热情。如何学习大模型 AI 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。但是具体到个人只能说是“最先掌握AI的人将会比较晚掌握AI的人有竞争优势”。这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。我在一线科技企业深耕十二载见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事早已在效率与薪资上形成代际优势我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套AI 大模型突围资料包✅ 从零到一的 AI 学习路径图✅ 大模型调优实战手册附医疗/金融等大厂真实案例✅ 百度/阿里专家闭门录播课✅ 大模型当下最新行业报告✅ 真实大厂面试真题✅ 2026 最新岗位需求图谱所有资料 ⚡️ 朋友们如果有需要《AI大模型入门进阶学习资源包》下方扫码获取~① 全套AI大模型应用开发视频教程包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点② 大模型系统化学习路线作为学习AI大模型技术的新手方向至关重要。正确的学习路线可以为你节省时间少走弯路方向不对努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划带你从零基础入门到精通③ 大模型学习书籍文档学习AI大模型离不开书籍文档我精选了一系列大模型技术的书籍和学习文档电子版它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。④ AI大模型最新行业报告2025最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。⑤ 大模型项目实战配套源码学以致用在项目实战中检验和巩固你所学到的知识同时为你找工作就业和职业发展打下坚实的基础。⑥ 大模型大厂面试真题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我精心整理了一份大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。以上资料如何领取为什么大家都在学大模型最近科技巨头英特尔宣布裁员2万人传统岗位不断缩减但AI相关技术岗疯狂扩招有3-5年经验大厂薪资就能给到50K*20薪不出1年“有AI项目经验”将成为投递简历的门槛。风口之下与其像“温水煮青蛙”一样坐等被行业淘汰不如先人一步掌握AI大模型原理应用技术项目实操经验“顺风”翻盘这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。以上全套大模型资料如何领取