“技术的价值在于应用理论与实践相结合才能事半功倍”最近一段时间就发现了一个问题写的越理论的东西看的人越多越实际越细节的东西看的人越少不知道是因为系统推送的原因还是观看者的原因。‍‍‍‍‍因此根据这个现象就想提几个学习的建议让大家少走一点弯路。‍‍‍‍‍‍‍‍‍‍‍‍‍01人工智能技术学习建议‍‍‍这个关于学习人工智能技术的建议也可以说是一个学习技术的方法论。首先大家要明白一点——(任何)技术都是一个更偏向于实践的东西具体来说就是学习技术实践要大于理论要以实践为主理论为辅而不是反其道而行之但是在实际的经历和观察中我发现很多人却是以理论为主实践为辅。‍‍知行合一在知中行在行中知_‍‍就拿这个公众号来说越理论的东西看的人越多真的涉及到实操的部分看的人反而变少了。比如说很多人对什么是人工智能什么是神经网络什么是大模型什么是多模态大模型等等很感兴趣但对大模型实际过程中的训练数据的收集与清洗损失差和反向传播等核心操作却视若无睹。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍但是这些理论的东西每个理解过人工智能技术的人都能说上几句但真的让他来实际操作从大模型的选型模型的训练和部署来打造一个能用的大模型这时他就开始傻眼了。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍理论需不需要懂‍‍‍‍需要但并不是特别需要很多理论只是看别人的书和文章你是不会真正明白的只有实际动手操作时才能真正理解理论。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍就类似于java面试八股文随便一个面试者都可以说上几句但一旦涉及到具体的业务场景或技术场景这时很多人就傻眼了而这也是不同面试者之间的差距。‍‍‍‍‍‍‍‍‍‍‍‍‍‍理论并不等于技术技术也不等于理论技术更多时候是理论和实践的结合在实践中检验理论在理论中指导实践最后理论和实践互相验证互相修正。‍‍‍‍所以说学习大模型技术最重要的是上手实践一下不一定非要像openAI谷歌meta一样搞那么大的模型哪怕只是设计一个两三层的神经网络模型然后自己完成模型的设计训练和部署也比一直看理论更有用。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍或者是找一些开源的大模型项目看看它们解决了哪些问题是怎么做的又为什么这么做是否有其它解决方案而且一些小模型个人电脑就可以跑的起来或者找一些免费的GPU资源比如谷歌的Colab平台。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍这样你才能知道不同模型之间的差别是什么怎么使用模型解决不同领域的问题等。‍‍‍‍‍‍‍‍‍_学习大模型的三个方向_‍‍很多人学习人工智能技术就一心扑在技术上认为自己把技术学好了就一定能找到工作一定能成为公司技术部核心成员但大家要明白的一个事实是技术是为业务服务的技术的作用是解决业务问题而不是搞学术研究。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍学习大模型技术个人认为有三个方向‍大模型基础技术大牛‍‍‍‍‍说白了就是数学大牛大模型技术本质就是一个数学模型因此需要做这个方向的技术人员更多的是数学专业的大牛比如说微分概率线性代数等。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍他们的作用是设计更好的机器学习算法和打造更好的技术学习模型比如怎么设计一个更好的神经网络怎么设计更好的损失函数怎么优化反向传播算法等。‍‍‍‍‍‍‍‍这种工作更加偏向于底层技术和学术研究而且这种人才待遇好要求高基本上不是名牌大学毕业的很难参与进来。‍‍‍‍‍‍‍‍‍大模型“运维”人员‍‍‍‍之所以说是“运维”人员是这个方向需要做的就是根据企业的业务需求找到合适的商业或开源模型然后能够收集和处理训练数据然后完成模型的训练部署和升级等任务能够熟练使用不同的模型和工具处理不同领域的问题。因为他们特别像传统的服务器维护人员因此叫大模型“运维”。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍这个技术方向就需要懂得大模型的基础理论并且有很强的实操能力然后有充足的业务经验能够把大模型和业务场景相结合因此这个更看重的是经验和实操反而技术要求并不高重要的是能够熟练使用各种工具。‍‍‍‍‍‍‍‍‍‍‍‍‍大模型上层应用构建‍‍再一个方向就是基于大模型构建上层应用这个方向更像是一个传统的技术开发者不需要了解大模型的运作原理只需要能使用大模型的功能文档和接口文档即可如果能懂一些大模型的理论就更好不过了。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍个人建议对大部分人来说选择后两种方式比较好最好是能把后两种方向结合起来。因为研究大模型基础技术的成本太高绝大部分企业都没有足够的资金和技术来实现因此其就业的压力和竞争力可想而知。‍‍‍‍‍‍‍‍‍其次后两个方向只需要有一定的经验和学习能力就可以做到甚至很多程序员可以直接转行成为第三种大模型应用开发者。‍‍‍‍‍‍‍‍所以对大部分人来说最好的选择就是搞大模型应用门槛相对较低前景广阔。‍‍‍因此对个人来说一定要弄清楚自己的定位否则就会导致自己没有努力的方向然后这个也想学那个也想学最后什么都会又什么都不会。‍‍‍‍‍‍‍‍‍‍‍对技术人员来说写作应该是一项必不可少的技能之一。写作的作用并不是说要你的文笔有多好而是要把自己学习和思考的过程给记录下来哪怕是错的。‍一是方便后续回顾二是写作的过程是一个从新思考的过程有些不明白不清晰的地方在写作的过程中就会重新进行思考这时就会有一个更加清晰的认识。‍‍‍‍‍‍‍‍‍有句老话叫“厉害的不是你学会了什么而是你能够用简单的语言把你学的东西讲明白”。‍‍‍‍‍‍‍‍‍‍‍‍学习是一个输入端过程而写作是一个输出的过程。‍‍‍最近两年大模型发展很迅速在理论研究方面得到很大的拓展基础模型的能力也取得重大突破大模型现在正在积极探索落地的方向如果与各行各业结合起来是未来落地的一个重大研究方向大模型应用工程师年包50w属于中等水平如果想要入门大模型那现在正是最佳时机2025年Agent的元年2026年将会百花齐放相应的应用将覆盖文本视频语音图像等全模态如果你对AI大模型入门感兴趣那么你需要的话可以点击这里大模型重磅福利入门进阶全套104G学习资源包免费分享扫描下方csdn官方合作二维码获取哦给大家推荐一个大模型应用学习路线这个学习路线的具体内容如下第一节提示词工程提示词是用于与AI模型沟通交流的这一部分主要介绍基本概念和相应的实践高级的提示词工程来实现模型最佳效果以现实案例为基础进行案例讲解在企业中除了微调之外最喜欢的就是用提示词工程技术来实现模型性能的提升第二节检索增强生成RAG可能大家经常会看见RAG这个名词这个就是将向量数据库与大模型结合的技术通过外部知识来增强改进提升大模型的回答结果这一部分主要介绍RAG架构与组件从零开始搭建RAG系统生成部署RAG性能优化等第三节微调预训练之后的模型想要在具体任务上进行适配那就需要通过微调来提升模型的性能能满足定制化的需求这一部分主要介绍微调的基础模型适配技术最佳实践的案例以及资源优化等内容第四节模型部署想要把预训练或者微调之后的模型应用于生产实践那就需要部署模型部署分为云端部署和本地部署部署的过程中需要考虑硬件支持服务器性能以及对性能进行优化使用过程中的监控维护等第五节人工智能系统和项目这一部分主要介绍自主人工智能系统包括代理框架决策框架多智能体系统以及实际应用然后通过实践项目应用前面学习到的知识包括端到端的实现行业相关情景等学完上面的大模型应用技术就可以去做一些开源的项目大模型领域现在非常注重项目的落地后续可以学习一些Agent框架等内容上面的资料做了一些整理有需要的同学可以下方添加二维码获取仅供学习使用