AI 根本不是神它只是个“一无所知但干劲十足的顶配实习生”。作者 | 吴恩达编译 | 王启隆出品丨AI 科技大本营IDrgznai100昨天DeepLearning.AI 发布了吴恩达最新的《2026 提示词工程大师课》。如果你对提示词工程还有一点 2023 年式的想象看到这套课第一反应大概率会是原来这一行已经不是当年那套玩法了。过去两年大语言模型一边在变强Agent 出来之后大家都在研究 Skill 怎么玩但其实提示词这件事本身一点也不能落下。早期大家热衷的还是那些短促、漂亮、带点技巧感的咒语式指令比如让模型一步一步思考、给它一个角色、套一个固定模板仿佛谁手里掌握了几条秘诀谁就比别人更懂 AI。但吴恩这次出山要做的就是不断拆这些旧想象。他并没有把提示词讲得更玄反而讲得更冒犯。在这套最新课程里吴恩达反复在说一件事很多人之所以还用不好 AI不是因为模型不够强而是因为他们还在把 AI 当搜索框、当许愿机、当一个会自动脑补你真实意图的聪明人。可现实是今天真正会用 AI 的人早就不是靠几个“金句提示词”取胜了而是靠一整套新的协作方式给足上下文、把 AI 当思维伙伴、让它先做研究再下结论、先搭骨架再写正文、先按评分标准批判再决定采不采纳。过去那套流行的提示词技巧很多已经过时了。那些年被反复传播的口诀并没有完全错但它们已经越来越像新手教程而不是今天的高阶工作流。真正拉开差距的也不再是你会不会写一句漂亮 prompt而是你知不知道什么时候该上传更多背景材料什么时候该让模型深度思考什么时候该新开对话清空上下文什么时候该让 AI 只先列大纲、不要急着吐正文。以下为这套 DeepLearning.AI 最新发布的吴恩达 2026 提示词大师课内容整理以吴恩达第一视角叙述让我们看看它相较于旧提示词技巧到底升级在了哪里。引言时间来到 2026 年如今的 AI 提示词工程与 2022 年 ChatGPT 刚问世时早已不可同日而语。毫无疑问熟练驾驭 AI 是当下最具影响力的技能之一。那些尚未触及 AI 时代前沿的人常常会因为 AI 生成的糟糕结果而感到挫败。为了让你成为一名提示词专家充分驾驭如今比一年前强大得多的 AI 工具让我们先来看看两种截然不同的体验AI 新手与AI 高阶玩家。许多 AI 专家已经学会用它来解答复杂的难题。相比之下包括新手在内的许多人可能仍习惯于像用谷歌搜索一样向 AI 抛出简单的问题。比如你会问“塔可钟Taco Bell现在还有双层塔可饼吗” 得到一个简单的答案这当然没问题。但如果你面临更棘手的难题你完全可以把它交给 AI并给它留出“思考”的时间。例如如果你打算买车你可以向 ChatGPT、Gemini、Anthropic 的 Claude 等主流商业模型上传一系列文件包括成本规格、报价单、保险计划等然后问它“我正在考虑这几款车它们各自的利弊是什么” 并在提示词中要求它“阅读所有材料并在回答前进行深度思考”。这会促使 AI 花费几十秒甚至几分钟的时间去推理最终为你生成一份详尽的报告。在处理许多日常事务时我发现这能节省海量的时间。再举个例子AI 高阶玩家懂得为 AI 提供正确的上下文Context或背景信息为其成功解答问题铺平道路。反观一些新手他们往往只给出简短的提示词然后奢望 AI 能自己“脑补”出缺失的细节。你不妨把 AI 想象成一个极其聪明的名校应届毕业生——他干劲十足但对你的实际情况一无所知。如果你给的提示词太短他根本没有足够的背景信息来准确作答。所以如果你对 AI 说“请帮我写一份出色的年终自评发给老板。” 因为你根本没告诉它你过去一年做了什么它只能写出一份毫无用处的套话。相比之下我发现 AI 高阶玩家对 AI 几乎有一种“同理心”。我不想过度将 AI 拟人化但如果你能换位思考站在接收指令者的角度问问自己“它真的足够了解我、能胜任这项任务吗” 那么高阶玩家的做法是向 AI 上传大量信息——也许是展示工作内容的项目进度截图、近期的项目文档或者是你口述项目细节的语音备忘录然后再告诉它“写一份发给老板的自评”。这样写出来的东西才能完美捕捉到你最引以为傲的工作成果。AI 开发者计划开放申请免费领 100 小时云算力券支持主流 AI 框架与模型部署破解 AI 的“迎合效应”高阶玩家掌握的另一项绝技是如何引导 AI 给出真实的反馈。AI 的一个大毛病是它太想取悦你了。事实上许多 AI 系统在训练时初衷就是努力让用户开心。如果你问了一个带有倾向性的问题它通常会顺着你的心意给出一个带有偏见的答案。例如如果你说“我有一个绝妙的商业点子移动扎染。请评价一下。” 因为你已经给它定性为“绝妙的点子”而且强调这是“你的”主意AI 自然会想顺着你夸赞道“真是个好主意”我们将这种现象称为“迎合效应Sycophancy”。众所周知只要你稍微暗示一下你心里期待的答案AI 极大概率只会把你的偏好或成见像照镜子一样反射给你。相反AI 高阶玩家倾向于使用中立的提问方式不给 AI 留下任何关于“你期待什么答案”的蛛丝马迹。或者你可以给 AI 提供一个评分量表Rubric或评估标准以此作为它回答的基础这能强迫它保持客观。比如你可以这样下指令“请客观分析以下商业理念移动扎染。不要凭空捏造观点。请使用上述评分标准例如‘是否存在痛点’ ‘是否有市场’ ‘我是否有竞争优势’”当你给出这样的指令时AI 就不知道你到底是希望它夸你还是希望它劝你别在一个糟糕的点子上浪费时间。此时它更有可能告诉你“哦这个点子只能打 8 分满分 100以下是得分较低的原因。”顺便说一句如果你真的在经营移动扎染业务我祝你好运AI 也能通过提出有用的问题帮你思考如何改进业务。拒绝“AI 工业糖精”新手和高阶玩家让 AI 写作的方式截然不同。新手只会下达类似“写一篇关于黑莓手机的博客文章”的指令然后 AI 就会生成一堆看起来像“AI 浆糊AI slop”的文字——一堆空洞无物、占据篇幅的套话。相比之下高阶玩家通常不会让 AI 直接开始正文写作而是要求它先列出文章大纲然后对大纲进行批判性修改与 AI 迭代几次来塑造文章的骨架最后才让 AI 开始起草正文。你可以上传一份笔记作为背景信息像专家一样下达指令“根据我的笔记列出一篇关于黑莓手机的博客大纲确保你知道我想谈论的核心内容。” AI 会给出一份初步大纲。接着你可以向 AI 提供反馈告诉它你喜欢什么、不喜欢什么。甚至可以来回切磋几个回合直到你对大纲完全满意。然后你再让它把大纲扩展成核心要点Bullet points。同样对要点进行几轮审视和修改直到你满意后再让它扩写成最终的文本。这种高阶玩家的工作流极大概率能生成让你满意的文字而不是一堆 AI 废话。在这个过程中你实际上是把 AI 当作一个思维伙伴Thinking partner帮助你进行头脑风暴探索不同的写作方向。理性看待 AI 的错误AI 系统确实会犯错但可能比大多数人想象的要少尤其是当你提示得当的时候。相比于 2022 或 2023 年它们现在的错误率已经大幅下降。然而一些在社交媒体上疯传的 AI 翻车案例让人们误以为它经常犯错。有个广为人知的例子有人问 AI “Strawberry草莓这个词里有几个 R” 之前的 AI 认为只有两个。还有一个让我觉得很搞笑的例子“我想去洗车我应该步行还是开车去” AI 回答“步行”这简直会让你洗个寂寞。但这些病毒式传播的案例并不能代表 AI 真正的实力。高阶玩家深知AI 能够通过执行复杂任务来创造巨大价值比如进行深度研究并撰写报告或者分析你的个人健康数据心率、跑步配速等甚至我们稍后会讲到的为你搭建网站。我亲眼见证了成为 AI 高阶玩家是如何极大地造福个人及其企业的。它能为你节省时间提升职业与个人生活质量并帮你创造许多酷炫的东西。无论你身处什么岗位达到专家级别的提示词水平都是一项极具需求的工作技能。在接下来的内容中我希望能带你完成向 AI 高阶玩家的蜕变。关于 AI 的实用性已经谈得够多了但我发现使用 AI 其实也非常有趣你将在后续内容中看到这样的例子。AI 是如何获取知识的为了更好地与 AI 协同工作一项基础知识至关重要你需要了解 AI 是从哪里获取知识的。这样你就能更好地预测它什么时候是对的什么时候你需要质疑它的答案。你小时候是怎么学会写作的大概率是通过大量的阅读。AI 也是如此。AI 系统通过阅读互联网上海量的文本来学习其中的规律。只要理解了 AI 读过什么你就能预测它的行为。AI 模型能回答五花八门的问题。如果你问“我的手机掉进汤里了该怎么办” 它希望能给出些实用的建议。或者问“为什么猫总是盯着墙看好像看到了鬼一样”我女儿很喜欢猫她真的很好奇这个。AI 会告诉你原来猫能察觉到人类经常忽略的细微声音和动作。因为 AI 阅读了互联网上的海量信息它甚至掌握了鲜为人知的冷知识。如果你问几十年前发射到太空的黑胶唱片里都有什么AI 会知道这是 NASA 在上世纪 70 年代发射的“旅行者 1 号”探测器目前距地球约 250 亿英里并能准确告诉你唱片里的内容。我觉得 NASA 选择用 55 种不同的语言向可能遇到该探测器的外星生命致以问候这事儿简直酷毙了。预训练知识的奥秘AI 模型的训练数据来源极其广泛主要来自互联网这些海量且多样化的知识源构成了它的“预训练知识Pre-trained knowledge”。你不需要纠结“预训练”这个术语这只是 AI 训练的最初阶段它代表了 AI 学习的基石。这些知识源可能包括 Reddit 等社交媒体上的海量文本里面有类似“必看电影清单”的答案它可能读过关于乐高微型城市的书或者维基百科上关于“仙女面包Fairy bread”的词条它还读过大量的新闻报道和学术论文。数以万亿计的词汇就这样注入了 AI 模型的“大脑”。要知道不同类型的数据在互联网上出现的频率是不同的因此预训练知识会反映出训练数据中的频率或模式。例如烹饪是全人类的共同体验网上有海量的烹饪文章名人八卦和电影资讯也多如牛毛所以 AI 对这些话题了如指掌。相反像“类星体Quasars一种由超大质量黑洞驱动的极亮天体”这样高度专业的话题网上的文章就比烹饪少得多。虽然互联网上大部分内容是英文但 AI 系统也学习了其他语言的数据比如粤语。全球有超过 8000 万人说粤语但这远少于英语人口粤语数据可能只占互联网总内容的不到 0.1%。最后有些东西 AI 是一无所知的比如你公司的核心商业机密——希望这些数据没有泄露在公开网络上因此 AI 也就无从学起。所以我总结出一个经验法则思考某类数据在互联网上出现的频率能帮你很好地评估 AI 回答的可靠性。由于 AI 学习过这些数据有时它能展现出令人惊讶的理解力。如果你飞快地打出带有错别字的句子“微泼炉能煮鸡蛋嘛can u cook eggs in microwave?”它能像理解标准句子一样完美领会你的意思。顺便说一句我自己就在微波炉里炸过几次鸡蛋如果你想避免这种惨剧不妨问问 AI 怎么做别像我一样付出惨痛代价。它之所以这么擅长理解错别字是因为它在学习时就看过大量带有拼写错误的信息源。所以当你在使用 AI 时我并不是鼓励你故意用错语法但如果你打字太快出现了一些甚至很多错别字别太在意。直接把提示词发给 AI 就行没必要把时间浪费在纠正每一个语法小错误上。但坏消息是AI 的许多信息源也包含错误观念和过时信息。因此驾驭 AI 的一项核心技能就是如何通过提示词引导它让它给出的答案尽可能规避错误并且不过度依赖过时的信息。突破时间冻结网络搜索与深度研究构建 AI 模型的人必须在某个时刻停止训练所以 AI 的知识库有一个“截止日期Knowledge cutoff date”。也就是说AI 只阅读了该日期之前的互联网信息它的认知被“冻结”在了那一刻。但世界依然在运转新事件不断发生。让我们看看 AI 如何通过网络搜索来收集新信息从而回答那些超出其知识截止日期的问题。如果你使用的是 ChatGPT、Gemini 或 Claude 等主流 AI 模型某些问题大概率会触发它的网络搜索功能。比如你问“2025 年的 67 梗是什么意思” 它很可能会去网上搜索然后告诉你“67 梗”发音就是“六七”读起来挺顺口是在几个社交平台上广泛传播的流行语。为什么这个问题会触发搜索因为“2025 年”这个时间线索让 AI 意识到它需要更新的信息这可能是一个在它知识截止日期之后才出现的梗。以 OpenAI 的 GPT-4.5 模型为例它的知识截止日期是 2025 年 8 月。在这之前互联网上关于 6 和 7 的文本大多是“6 * 7 42”或者是那个经典的儿童冷笑话“为什么 6 害怕 7因为 7 吃了 97 8 9 / seven ate nine”。所以当 67 梗在这个日期之后爆发时它并不在 GPT-4.5 的预训练知识里。有些问题 AI 会直接用预训练知识回答而另一些则倾向于触发搜索。比如你问“请帮我在加州山景城找一家评价很高的健身房。” 健身房的评价、开业或倒闭状态是随时间变化的这大概率会触发搜索。如果你问“什么是库珀山滚奶酪比赛” 因为这是个极其冷门的知识它在网上没看过太多相关信息也很可能会去搜索以给你一个准确的答案。如果你好奇的话这是一项非常有趣的活动人们会追着一块滚下山的奶酪跑。总结一下触发搜索的场景预训练知识足以应对手机掉汤里怎么办、猫为什么盯墙、旅行者 1 号里有什么因为这些是互联网上的常识。需要网络搜索时事热点、特定地理位置信息、高度冷门的信息。对于大多数主流 AI网络搜索可以自动触发也可以由你明确指定比如点击界面上的搜索按钮或者在提示词里写“请在网上搜索这个”。驾驭搜索过滤互联网的杂音网络搜索虽然极具价值但并不完美。就像你自己用谷歌搜索一样有时也会搜到过时或不准确的来源。如果你问 AI“灰色市场的多肽一种补充剂有多安全” 它可能会搜到社交媒体、Reddit 或 Quora 上的帖子或者干脆搜到那些靠卖多肽赚钱的网站这些网站当然倾向于说它安全。你得到的答案可能准确也可能非常离谱。但如果你在提示词中引导 AI 使用官方组织的来源或参考严谨的科学研究它就更有可能去查阅世界卫生组织、美国食品药品监督管理局FDA或欧洲药品管理局的资料从而给你更可靠、更具科学可信度的答案。无论是人类还是 AI网络搜索都倾向于提取“热门”来源。有报告显示AI 模型引用最多的网站是 Reddit其次是维基百科、YouTube、谷歌本身、Yelp 等。互联网上充斥着社交媒体和论坛的文本而经过科学验证的高可靠性文本相比之下少得可怜。如果你不去引导模型它极有可能“捡到篮里都是菜”抓取最容易获得的信息而不是最可靠的信息。AI 搜索的另一个局限是网页可能已经过时。最近我用 AI 帮我在内华达州亨德森市找个跑步的地方。这是个特定地点的冷门查询触发了搜索它给我列出了一些跑步地点。但遗憾的是它抓取的是二十多年前的网页信息推荐的一所学校现在早已不对公众开放跑步了。AI 搜索的底层逻辑为了让你更好地理解 AI 如何利用搜索信息我简要解释一下它底层的运作机制。这是一个多步骤的过程。想象一下你在向一个由两人组成的客服团队提问面向用户的 AI 模型你在和它对话。助手 AI 模型专门负责搜索。当你发送提示词时面向用户的模型会决定是否需要呼叫助手模型“嘿帮我上网搜一下这个信息。” 助手模型会在类似谷歌或必应的搜索引擎上进行搜索扫描结果过滤掉无关内容下载最相关的网页并进行总结。然后助手模型把总结汇报给面向用户的模型后者再利用这些总结为你生成最终答案。这里有一个有趣的细节需要注意面向用户的 AI 模型并没有完整阅读它为你引用的所有网页它看到的只是摘要。这有时会导致它误解网页的真实含义。这就是为什么你有时会看到一种滑稽的现象AI 引用了一个网页声称该网页支持某个结论但当你自己点开那个网页时发现它根本不是 AI 说的那个意思。那么何时该用谷歌何时该用 AI 呢如果你想快速浏览多个来源、寻找特定网站或者查看原始数据比如买个 2013 款本田思域的空气滤清器传统的搜索引擎是最好的选择。但如果你需要综合多个来源的信息权衡利弊或者对比不同观点得出深入的结论AI 模型能高效地为你汇总多个网页的结果省去你自己阅读大量网页的时间。终极武器深度研究Deep Research有时候你希望 AI 综合的不是几个来源而是几十个来源并进行深度思考为你提供最详尽的研究答案。目前主流的 AI 界面如 ChatGPT、Gemini、Claude都具备“深度研究模式”。我发现这是一个极具价值却被严重低估的工具。假设你想用 AI 帮你策划一个万圣节鬼屋。你可以写一段提示词告诉它你的地理位置、前院的面积、你想要的恐怖体验等详细的上下文。接到这样的提示词后AI 模型会制定一个研究计划思考需要查找哪些类型的资料。许多系统会让你有机会批准或修改这个计划。如果没问题我会直接启动它。在这个例子中它会先收集帕洛阿尔托市关于许可证、万圣节条例的规定阅读并综合这些信息。然后它可能决定进一步搜索消防安全指南接着再去寻找装饰灵感。它会在遵循初始计划的同时保持灵活性随时深入挖掘需要的信息。经过一段时间可能长达几分钟的搜索它最终会为你写出一份详细的研究报告。顺便说一句这个过程是智能体 AIAgentic AI的一个典型例子——在深度研究过程中AI 有一定的自主决策权能自己决定下一步该做什么比如是否需要进行额外的搜索。最终的输出是一份极其详尽、考虑周全的计划包含结构、法规、安全等各个维度的章节。如果你使用的是谷歌的 Gemini它甚至能轻松地将这份深度研究转化为网页或信息图表包含预算饼图、噪音条例的可视化图表甚至还有一个帮你统筹活动的核对清单Checklist。深度研究是如何运作的在制定计划后AI 会同时发出多个网络搜索请求并同时获取多个网页。这是它的巨大优势——无需一次次单线程搜索效率极高。系统会快速评估哪些来源相关哪些无关并决定是否需要使用新的搜索词进行补充搜索。经过几轮“搜索-评估-补充”的循环后它认为资料足够了就会将下载的所有页面进行总结、提炼添加引用最终呈现给你。何时使用哪种模式预训练知识“手机掉汤里怎么办”耗时几秒无需联网适合寻找常识、定义。普通网络搜索“帮我找个高分健身房。”耗时十几秒下载少数来源适合获取最新信息。深度研究“日常步数对长期健康的影响是什么”耗时几分钟甚至更长下载几十个来源适合需要综合海量信息、进行复杂推理的任务。将 AI 视为你的思维伙伴AI 最强大的用途之一是作为“思维伙伴”。当我在思考复杂问题或做艰难决定时如果身边没有人类专家知识渊博的 AI 就是一个极佳的探讨对象。我们先从头脑风暴说起。很多人只是让 AI 列个清单但这远非最高效的用法。让我告诉你如何进阶。根据 OpenAI 的数据约一半的 ChatGPT 对话是寻求写作和实用指导而创意构思占了近 4%。我发现 AI 在提供选项方面非常出色。有一个经典的创造力测试说出砖头的 200 种用途。这对人类来说很难镇纸花盆盖房子但 AI 能轻松列出长长的一串而你的任务就是从中评估并挑选出你喜欢的。在头脑风暴中“量变引起质变”是常理让 AI 生成大量想法供你挑选是找到好点子的有效途径。但我更想展示一种进阶的头脑风暴形式提供更多上下文并与 AI 进行更长时间的迭代对话。如果你只说“帮我制定一个健身计划。我 38 岁初学者有 10 磅的哑铃每天有 15 分钟。” 它会给出非常中规中矩的答案深蹲、俯卧撑等。很合理但很普通。如果你想要更有创意的选项可以增加上下文“我坚持不下来这些。给我一些保持动力的黑客技巧。我有一个蹦床和一只猫。”通过强迫它将蹦床和猫纳入健身选项这是一种非常规的思路它可能会建议你进行“蹦床休息法”或者“猫咪触发的微型健身”——比如每次看到猫摇尾巴就做个微型运动。这些想法显然更有创意。为什么基本提示词只能得到平庸的答案因为 AI 的输出带有一定的随机性但它更倾向于给出“常识性”的回应。如果你画一个坐标轴横轴是回答的独特性/创意度纵轴是 AI 给出该回答的概率。你会发现像“哑铃弯举”这样的常识性回答概率极高而“猫咪触发健身”的概率极低。这是因为它是在互联网文本上训练出来的网上谈论哑铃弯举的内容比猫咪健身多得多。对于寻求事实比如“世界最高楼是什么”这种倾向是好事因为网上的主流观点通常是事实。但在头脑风暴中主流观点就意味着平庸。如何打破平庸答案就是上下文Context。当你告诉它你讨厌深蹲、有蹦床、有猫、缺乏动力时这些上下文就像一个力场把 AI 从“常识区间”推向了“高度相关且充满创意的定制区间”。如果你不知道该给 AI 提供什么上下文有一个非常实用的技巧与 AI 迭代。假设我想让 AI 帮我制定还债计划我列出了我的信用卡债务、学生贷款和家庭借款。首先不要让 AI 直接给你“一个”方案而是让它提供 3 到 5 个选项。它可能会给出方案一保留现金流、方案二先还高息贷款、方案三优先还家人钱。这些都很合理但它还不知道你偏好哪一种。此时你对这些选项的反馈就是最完美的上下文。你可以说“我不喜欢方案一太保守了。我喜欢先还 19% 利息的想法。哦对了我忘了说我马上有一笔 450 美元的现金进账而且我最近要搬家。”有了这些反馈AI 就能为你生成三个全新的计划。你可以再次给出反馈如此循环往复直到它拿出一个让你满意的完美计划。对 AI 认为的好主意进行反馈是高效提取并输入有用上下文的最佳机制。总结头脑风暴的秘诀尽可能提供预先背景 - 索要多个选项 - 给出反馈 - 索要新选项 - 循环迭代。驾驭上下文Context的魔力心理学家说人类的工作记忆Active working memory同时只能容纳大约 7 个事物。这就是为什么记住 7 件杂货勉强可行但记住 20 件就极其困难。但有趣的是现代 AI 模型可以处理海量的上下文有些甚至能容纳数十万字。比如在选公寓时你可以上传数百页的租赁合同、租客评价和街区统计数据让 AI “阅读所有内容并告诉我每个选项的利弊”。顺便提一句告诉 AI “深度思考/Think hard”是另一个常见的高阶提示词技巧。上下文是如何运作的目前顶尖的 AI 模型可以接受约 75 万字的上下文这相当于前四五本《哈利·波特》的总字数或者连续几天的语音对话。很多人严重低估了 AI 的胃口。当你提问时AI 的上下文里默认包含了几样东西系统提示词System prompt告诉 AI 当前日期、它的名字、基本能力以及“要乐于助人”的通用指令。工具定义如果 AI 能联网系统会告诉它什么是搜索引擎以及如何使用。你的提示词与附件你输入的文本和上传的文件。聊天记录Chat history你们之前的所有对话都会被增量添加到上下文中。这意味着只要在同一个对话窗口里AI 就“记得”你们聊过的所有内容。但是如果你突然转换话题比如从“我的健身计划”跳到“给我妈制定一个健身计划”之前海量的上下文就会变成干扰信息导致 AI 表现下降。这就是为什么在讨论全新话题时强烈建议开启一个“新对话New chat”清空上下文轻装上阵。AI 桌面应用让 AI 自己寻找上下文AI 正在超越单纯的聊天界面。你可能听说过 Claude Computer Use、微软 Copilot Workspace 或谷歌 Project Astra。这些应用在获得你的权限后可以自主地Agentically在你的电脑上收集上下文——也就是自己找文件看从而完成任务。假设你做了一堆研究文件夹里乱七八糟地堆满了 PDF、报告和图片。你可以让 AI 桌面应用浏览这个文件夹并提出整理方案。AI 会自动查看文件命名理解内容提出一个重命名、新建子文件夹并移动文件的提案。如果你不满意可以给它反馈如果你满意点击确认它就会在你的电脑上自动执行这些操作。最佳工作流告诉它任务 - 让 AI 提出行动计划但先别执行 - 你审查并修改计划 - 确认无误后让它执行。安全警告这些应用可以读取、修改甚至删除你的文件。虽然误删很少见但确实发生过而且通常不会进回收站无法恢复。因此建议你只在特定文件夹内运行它不要给它整个硬盘的权限。当它请求权限时仔细审查它到底要读写什么。在完全熟悉这些工具之前保持谨慎。唤醒 AI 的深度推理能力Reasoning最新的 AI 模型具备极强的推理能力。只要给足上下文它们能对复杂任务进行长时间的严密思考。我越来越倾向于把 AI 当作一个“推理引擎”。随着模型不断进化它们执行长期任务的能力突飞猛进。一项研究表明在 2024-2025 年模型已经能以不错的成功率完成人类需要耗费数小时才能完成的复杂任务如审查法律合同、挖掘网络安全漏洞。还记得那个“Strawberry 里有几个 R”的例子吗这几年前是个难题。那个年代2023-2024人们流行在提示词里加一句“请一步步思考Think step by step”。在当时这是个好建议但在今天这个技巧已经过时了。现在我不再叫它一步步思考而是直接告诉它“深度思考Think hard”或“终极思考Ultra think”。现代模型完全懂这是什么意思它们会进入复杂的推理状态可能耗时几十秒到十几分钟甚至在思考中途决定去搜索更多信息然后再回来继续思考直到得出完美的答案。对于这些具备推理能力的模型我强烈建议你给它们派发真正困难的任务。不要只问简单的问题把你在创业、工作中的真实难题扔给它给足人类专家也需要的上下文看看它能为你创造什么奇迹。写作与编辑告别“AI 工业糖精”写作是人们使用 AI 最频繁的场景占 ChatGPT 任务的 24%。写作本质上是一种思考而擅长推理的 AI 绝对是你的好帮手。但如果只是简单地让 AI “帮我写”往往会得到“AI 浆糊/工业糖精”。什么是 AI 浆糊它乍一看文笔不错但经不起推敲。句子空洞、缺乏实质内容。AI 写作有明显的痕迹滥用破折号Em dash。词汇匮乏过度偏爱某些词比如“深入探讨/Delve”、“细微差别/Nuanced”。喜欢用“排比三段论”。喜欢用“不是 X 而是 Y”的模糊句式比如“这不仅仅关乎速度更关乎可用性”。 有趣的是因为人类看多了 AI 生成的文本连人类自己说话都开始带上这种“AI 味”了。如何避免使用“渐进式大纲Progressive Outlining”不要让 AI 直接写正文。写大纲给出观点和素材让 AI 提供 3 个大纲选项。改大纲挑选一个给出修改意见比如“把故事一移到前面加一个皮克斯的类比”。扩充要点满意大纲后让 AI 把标题扩展成核心要点Bullet points。改要点再次审阅、修改要点。写正文最后一步才让 AI 生成完整文章。为什么这样做因为如果 AI 直接写了一长篇文章你发现结构不对修改起来牵一发而动全身。而修改大纲只需改动几个字就能撬动最终文章里整段整节的变化。这是一种杠杆率极高的写作方式。建立客观的评分矩阵Rubric当你自己写了一篇文章想让 AI 帮忙润色时最好的方法是一段一段地改而不是把整篇文章扔给它。如果你需要对整篇文章进行宏观的评价记得防范我们前面提到的“迎合效应”。如果你问“我写了篇科幻小说你觉得怎么样” 它一定会把你夸上天。要获得有价值的批评你必须给 AI 一个评分量表/评估矩阵Rubric。 不要给出模糊的指令比如“满分 100给人物、情节打分”这会导致 AI 先拍脑袋定个分数然后再去圆谎。你需要制定极其明确、非黑即白的客观标准。例如人物25 分每一个有名字的角色是否都有明确的目标是得 10 分否得 0 分。冲突15 分角色目标之间是否有冲突把这套标准连同你的文章发给 AI并下令“请客观评价严格按照每个类别打分最后再汇总总分。” 这种毫无歧义的客观标准能强迫 AI 摘下“老好人”的面具给你真正有用的修改建议。如果你不知道怎么制定这个量表完全可以让 AI 帮你头脑风暴一个出来。跨模型审查与“参差不齐的智能”还有一个有趣的技巧让 Claude 来评价 ChatGPT 写的文章或者反过来。这种交叉审查有时能带来更好的效果。这引出了一个概念AI 模型拥有“参差不齐的智能Jagged intelligence”。AI 在某些方面如速读海量网页远超人类但在另一些方面又不如人类。而且不同的 AI 模型“偏科”的方向也不同。目前的 AI 市场竞争极其激烈最强模型的王座每个月都在轮换。因此我经常把同一个提示词喂给不同的模型对比它们的表现。这能不断打磨我的直觉让我知道在当下哪个模型最适合干哪种活。超越文本迈向多模态与编程在前面的模块中我们只谈了文本。但现代 AI 已经具备了生成图像、视频、声音甚至代码的“多模态Multimodal”能力。虽然多模态交互成本更高、速度更慢但它能让你完成不可思议的工作。我曾用谷歌的 Imagen 模型为我女儿生成了一张“猫咪在夜间偷偷经营咖啡馆”的图片她非常喜欢我们甚至找面包师把它做成了真实的 3D 生日蛋糕。AI 还能生成极其逼真的克隆语音甚至连我父母都分辨不出那是不是我本人的声音。理解生成成本差异文本最便宜、最快。语音稍贵、稍慢。图像更贵、更慢一张图可能需要几十秒和几美分。视频最昂贵、最耗时。当你要求 AI 生成图像时它使用的技术通常是扩散模型 Diffusion model与生成文本完全不同。它不是一个像素一个像素地画而是从一团纯粹的噪点开始逐步“去除”噪点最终显现出清晰的图像。这就是为什么 AI 有时会画出奇怪的手指或乱码文字但最新的模型已经在这些问题上取得了巨大进步。给 AI “看”图片的技巧一图胜千言。如果你在白板上画了一堆复杂的数学公式直接拍照发给 AI 问“这节课讲了什么” 它不仅能识别出“卷积神经网络”甚至能猜出你接下来要讲什么。强项识别手写体、发票、会议白板上的便利贴。弱项缺乏对细微差别的分辨力。如果你拍一张健身房器械的图它可能会认错因为在 AI 粗略的视觉里那些器械长得都差不多。但如果你拍一个极具辨识度的“真人尺寸仓鼠滚轮跑步机”它绝不会认错。零代码开发让 AI 为你写代码、做分析这曾经是专业程序员的专利但现在只要你会写提示词你就能构建简单的软件和网站。比如你可以输入“构建一个游戏用户可以放置障碍物和目标并模拟运行。” 就这么简单的一句话Claude 就能为你生成一个可玩的网页游戏。你可以用它做番茄钟、账单计算器、单词记忆卡甚至是一个绚丽的烟花模拟器。构建简单应用的提示词三要素目标你想创造什么比如一个好玩的烟花模拟器。输入用户需要做什么比如在屏幕上点击。输出应用会展示什么比如绚丽的烟花爆炸效果。我强烈建议你从最简单的想法开始尝试如果失败了也没关系这正是你建立“AI 能做什么、不能做什么”直觉的过程。数据分析神器如果你有智能手表导出的跑步数据或者奶茶店的月度销售报表Excel 格式你可以直接把文件传给 AI 并问“本月销售额有什么值得关注的”此时AI 会调用它的“代码执行工具Code execution tool”。它不会用嘴说而是直接在后台用 Python 写一段代码运行这些数据计算出平均值然后为你生成一张精美的折线图并告诉你“我发现草莓抹茶在春季卖得最好而新品椰奶茶在秋季异军突起。”如果你在提示词里加上“请仔细/深度分析Analyze carefully”它甚至会进入我们之前提到的自主分析流程思考好几分钟为你制作一份极其专业的“年度回顾幻灯片”。这比你自己吭哧吭哧拉 Excel 表格要快得多也极具启发性。结语恭喜你完成了这门课程掌握了这些技巧你已经做好了成为AI 高阶玩家的准备。我希望你能在生活和工作中找到无数个应用这些技能的场景用它来头脑风暴用“深度研究”来撰写详尽的报告用“渐进式大纲”来辅助写作甚至生成多模态内容和代码。AI 模型仍在以惊人的速度进化。请保持对新模型的好奇心不断给 AI 抛去困难的任务提供高质量的上下文持续打磨你对 AI 潜力的直觉。我深信这项不可思议的技术将为你带来巨大的回报。感谢你的坚持。希望你能用这些力量去帮助自己、帮助朋友、帮助社区为你和他人创造一个更美好的世界。点击阅读原文观看 Youtube 原视频免费领取 100 小时 AI 算力限时开放加入 AI 开发者计划获取✅ AI 算力资源✅ 官方技术社群✅ Workshop 与 AI Academy✅ 开发者专属福利完成认证后额外领取☕ 9.9 元瑞幸咖啡券立即加入