拆解 Hermes Agent：开源 Agent 里唯一的闭环学习系统

张

张建站

2026/4/11 6:13:23

10分钟阅读

最近不少朋友提及到一个开源的智能体Hermes Agent 。它针对目前出现的开源 Agent 做了能力改进具备闭环学习能力。能自主创建技能、在使用中改进技能、跨会话积累记忆、甚至能自我建模用户偏好。一、Hermes Agent 是什么美国开源 AI 研究实验室 Nous Research 在推出过 Hermes-4-405B、Hermes-4-70B 等开源模型之后推出了开源 AgentHermes Agent是从造模型到造 Agent的延伸。定位一个自我改进型的 AI Agent。不只是一次性帮你完成任务而是在长期使用中积累知识、改进技能、越来越懂你。二、六大核心能力速览能力概要闭环学习系统自动创建技能、改进技能、持久化记忆、辩证式用户建模多平台接入12 个消息平台Telegram/Discord/Slack/WhatsApp/Signal/Matrix/Mattermost/钉钉/飞书/Email/Home Assistant/Webhook CLI TUI单一 Gateway 进程统一管理40 内置工具Web 搜索提取 / 终端执行 / 文件读写 / 浏览器自动化 / 视觉分析 / 图像生成 / TTS / MoA 混合代理 / 技能管理 / 记忆 / 会话搜索 / 子代理 / Cron / MCP / 安全6 种执行后端Local / Docker / SSH / Daytona / Singularity / Modal子 Agent 委派隔离子 Agent 并行执行上下文隔离自我改进批量轨迹生成 / Atropos RL 环境 / 轨迹压缩 / WandB 追踪主要看看它的闭环学习系统。三、闭环学习——拆解最核心的差异化其他 Agent Claude Code、DeerFlow、OpenClaw——要么是无状态的要么只有被动记忆你告诉它记住什么它才记住。例如之前介绍 OpenClaw 安装的这方面技能文章让 OpenClaw 帮你干活四Proactive Agent 技能让AI眼里有活给 OpenClaw 装了一套“学习系统”Self-Improving AutoSkillAgent 开始自己进化了Hermes 的记忆是主动积累的它观察你自己总结自己改进。这个闭环分三个层次记忆系统、技能系统、实际效果。3.1 记忆系统从 Markdown 到辩证式用户建模Hermes 的记忆不是一坨向量数据库而是一个五层架构层级类型持久性一句话说明L1Transformer 上下文会话内短期推理会话结束即消失L2SKILL.md 程序性知识永久技能沉淀Agent 的肌肉记忆L3向量存储索引永久语义检索支持模糊召回L4Honcho 辩证式用户建模持续进化对你的理解随每次对话更新L5FTS5 全文检索 LLM 摘要永久跨会话搜索历史对话L1 和 L3、L5 比较好理解短期上下文、向量检索、全文搜索。L2SKILL.md 程序性知识。Agent 完成一次任务后会把流程沉淀成一个 SKILL.md 文件Markdown 格式下次遇到类似任务直接调用。把经验变成可复用的程序。OpenClaw 也有记忆但更偏向聊天摘要的存取Hermes 的技能更像是方法论。L4Honcho 辩证式用户建模。Honcho 是 Plastic Labs 开发的用户建模引擎借鉴了黑格尔的正-反-合辩证法•正题Thesis当前对用户的理解画像的现状•反题Antithesis新的对话中出现了与当前理解矛盾或补充的信息•合题Synthesis用 LLM 将正题和反题融合生成一个更新的、更准确的用户理解整个循环在 Agent 与 Honcho 服务之间运转对话结束时Agent 把消息历史发给 HonchoHoncho 提取新的用户观察反题与现有画像正题融合生成新画像合题新画像在下次对话时注入系统提示。这意味着你对 Agent 说过的偏好我喜欢简短的要点式答案、我的代码风格用制表符不用空格。不会在一周后被遗忘而是被持续整合进你的用户画像中。核心记忆存储在~/.hermes/memory/MEMORY.md中纯 Markdown 文件。用户可以直接打开查看 Agent 记住了什么甚至手动编辑。会话搜索用 SQLite FTS5 虚拟表porter unicode61分词器同时支持英文词干提取和中文搜索结果还会调用辅助 LLM 做摘要提炼。3.2 技能系统Agent 的程序性知识每个技能是一个目录包含一个 SKILL.md 文件skills/ ├── software-development/ │ ├── SKILL.md # 技能定义文档 │ └── templates/ # 可选的模板文件 ├── research/ │ ├── SKILL.md │ └── prompts/ └── creative/ └── SKILL.mdSKILL.md 遵循约定的 Markdown 结构标题、触发条件、步骤说明、注意事项。技能改进发生在使用过程中。当 Agent 加载并使用某个技能完成任务后如果发现技能文档中的步骤不完整、有错误、或者可以优化它会通过skill_manage工具的edit操作更新技能内容。这形成了一个正反馈循环创建技能 → 使用技能 → 发现改进点 → 更新技能 → 下次使用更好的版本3.3 闭环学习的实际效果以上是技术实现。实际用起来是什么感受根据真实用户反馈自我进化是真正的差异化。OpenClaw 像一个工具箱——你需要自己把工具放进去。Hermes 会观察你的使用方式并尝试创建和改进自身的工具。从长远来看这会带来能力的指数增长而不仅仅是线性增长。记忆深度明显提升。由于 Hermes 会自动总结和整理长期记忆因此每次使用后感觉更加连贯。更轻量、更个性化。部署速度更快资源需求更低。Hermes 非常适合希望进行深度定制但又不想管理庞大基础设施的个人用户或研究人员。从 OpenClaw 轻松迁移。如果你已经是 OpenClaw 用户Hermes 提供了一个一键迁移工具hermes claw migrate。它可以导入你的内存、技能、配置和 API 密钥。--dry-run选项可以先预览更改。具体在哪些任务上体现优势•长期个人知识管理——让它总结过去三个月里关于某个项目的所有讨论内容Hermes 的持久记忆和自动总结功能使答案更准确•重复性工作流程——例如每周从网站抓取数据、清理数据并生成报告前两次需要你指导第三次系统将开始使用自动生成的技能完成大部分工作当你要求调整时系统会更新该技能•跨会话个性化设置——只需设置一次我不喜欢在回复中使用表情符号或我的代码风格使用制表符之后每次新对话都会遵循这些设置。四、不锁定模型提供商Hermes 不限定你用哪家的模型支持 18 提供商类别提供商海外主流Anthropic / OpenAI / DeepSeek中国厂商智谱 AI (Z.AI/GLM) / 月之暗面 (Kimi/Moonshot) / MiniMax / 阿里 (DashScope)聚合平台Nous Portal (400 模型) / OpenRouter (200 模型) / HuggingFace / GitHub Copilot / Vercel AI Gateway本地推理Ollama / vLLM / llama.cpp自定义任意 OpenAI 兼容端点切换模型就一个命令hermes model。选择 provider 和 model无代码改动无锁定。上下文管理方面Hermes 实现了一个四阶段压缩流水线1.确定保护区域对话头部系统提示和最初几轮和尾部最近几轮被标记为受保护2.选择压缩候选中间地带消息中优先选择 token 数最多的工具结果消息3.LLM 摘要调用辅助 LLM 对选中消息做摘要保留关键事实丢弃冗余细节4.替换与验证用摘要替换原始消息重新计算 token 数必要时多次迭代同样Hermes 也支持智能模型路由否决式启发规则如果触发任何一条复杂性规则消息超过一定长度、包含技术关键词、需要文件操作等就路由到主力模型只有所有规则都通过简单判断时才使用廉价模型。这种否决式设计是保守的宁可多花一次贵模型的钱也不因路由错误导致低质量回复。五、API 与协议——开放标准Hermes 在协议层面走的是开放标准路线接口说明OpenAI 兼容 APIgateway/platforms/api_server.py提供 HTTP APIMCP 服务器mcp_serve.py实现 stdio MCP暴露 10 个工具可被 Claude Code/Cursor/Codex 调用ACP 协议acp_adapter/实现编辑器集成支持 VS Code、Zed、JetBrainsagentskills.io技能遵循开放标准已被 11 工具采纳Claude Code、Cursor、GitHub Copilot 等MCP 集成Hermes 支持 MCP Client Server 双向模式。技术上的一个难点是MCP 连接需要长生命周期的异步上下文而 Agent 的工具调用是同步的。Hermes 的解决方案是独立的后台事件循环每个 MCP 服务器在独立后台线程的事件循环上运行一个长生命的 MCPServerTask同步工具调用通过run_coroutine_threadsafe()桥接。安全机制上传递给 MCP 子进程的环境变量经过严格过滤只保留PATH、HOME等基线变量防止 API key 等敏感信息泄露。个性化定制Hermes 允许你给 Agent 设置人格内置了几个预设helpful友好通用/ concise简洁风格/ technical技术专家/ creative创意模式/ mother像妈妈一样有耐心但直奔主题/ teacher耐心老师/ kawaii可爱风。也可以自定义人格描述和皮肤Agent 名字、欢迎语、告别语、UI 颜色等。TTS 和 STT 支持TTS 三种后端Edge TTS 免费 ElevenLabs OpenAI TTSSTT 目前只支持 OpenAI Whisper。与 OpenClaw 的一个区别——OpenClaw 开了 TTS 之后每条消息都自动生成语音Hermes 不会需要你主动要求语音回复。大多数时候只想看文字这种方式更省资源。六、子 Agent 委派子 Agent 委派的核心理念是上下文隔离父 Agent 的上下文窗口只看到委派调用和摘要结果永远不会看到子 Agent 的中间工具调用或推理过程。安全约束比较严格• 工具限制delegate_task禁止递归委派、clarify禁止用户交互、memory禁止写入共享记忆等工具被永久封锁• 深度限制最多 2 层parent → child → grandchild 被拒绝• 并发限制最多 3 个子 Agent 同时运行• 工具集交集子 Agent 的工具集是其请求的工具集与父 Agent 工具集的交集这意味着子 Agent 既不能越权调用不该用的工具也不能乱说干扰父 Agent 的判断。是一个比较务实的设计。七、RL 训练系统——数据飞轮这是 Hermes 另一个独特的能力其他 Agent 框架都没有。Agent 在使用工具完成任务的过程中自动生成高质量的训练数据轨迹这些数据经过压缩和处理后直接用于通过强化学习训练更好的模型更好的模型又能生成更高质量的轨迹——形成正向循环。[Agent 执行任务] → [生成轨迹数据] → [压缩清洗] → [RL 训练] → [更强模型] → 回到起点为什么竞品没有这个能力三个层面的壁垒1.工具系统的完整性Hermes Agent 拥有产品级的工具系统可以生成真实的、多样化的工具调用轨迹2.端到端管道从轨迹生成到训练是完整的数据到训练管道竞品在Agent 使用和模型训练之间存在巨大鸿沟3.垂直集成NousResearch 同时拥有 AtroposRL 环境框架和 TinkerRL 训练器Hermes Agent 是第一个将 Agent 框架与 RL 训练框架完全打通的系统这意味着 Hermes 不只是用户工具也是训练下一代 tool-calling 模型的数据飞轮。用户使用得越多训练数据质量越高下一代模型越强。八、社区反馈与注意事项正面评价评价来源10/10 — 相当于已调试一周的 OpenClaw RAG 记忆持久化更好的工具调用Reddit自我改进是真的——做复杂任务时会自动创建技能Reddit我喜欢它的记忆管理在树莓派级设备上也能运行Reddit安全上线前必看的五层防线如果你准备认真部署 Hermes安全层面有五层防线值得了解1.用户授权消息平台 allowlist DM pairing2.危险命令审批manual / smart / off 三种模式命中规则后 CLI 要求确认once / session / always / deny3.容器隔离Docker 后端使用 no-new-privileges、cap-drop ALL、PIDs limit、tmpfs 等硬化参数4.MCP 凭证过滤子进程默认只拿到安全环境变量API Key 等敏感值会被剥离5.上下文文件注入扫描扫描 prompt injection 攻击最小生产配置参考approvals: mode: manual timeout: 60 terminal: backend: docker security: tirith_enabled: true几个关键验证点SSRF 防护默认开启且 fail-closedURL capable tools 会执行网站策略限制和地址校验MCP 子进程过滤敏感变量上下文文件会扫描 prompt injection。常见坑1.把 Hermes 当成单纯的对话 UI——它本质上是 Agent Runtime不只是聊天界面2.在本机 local backend 上直接放开高权限执行——安全上不划算生产环境优先用 Docker / Modal / Daytona 隔离后端3.一开始就全开平台、全开工具、全开插件——排障会很痛苦建议分层启用常见报错Windows 装不上或命令不可用Hermes 原生 Windows 暂不支持需要 WSL2。安装后记得source ~/.bashrcreload shell。消息平台接上了但没反应没配置 allowlist 或没完成 DM pairing网关默认拒绝未授权用户。用hermes pairing list和hermes pairing approve处理。快速自检清单• 是否在 Linux / macOS / WSL2 环境下安装• 是否先跑过hermes doctor• 是否明确了approvals.mode• 是否决定了terminal.backend• 是否配置了 allowlist 或 pairing• 是否只启用了当前任务真正需要的 tools 和 skills九、总结设计哲学纵观 Hermes Agent 的实现几个核心设计哲学贯穿始终1.保守但务实的并行策略——并行工具执行采用白名单制未知工具一律串行2.多层容错——API 层 3 次重试指数退避工具名自动修复预算压力多级警告3.缓存友好——系统提示只构建一次一切为了最大化 Anthropic prompt caching 的命中率4.可审计性——记忆用 Markdown 文件技能用结构化文档用户随时可以查看和编辑 Agent 的大脑5.安全深度防御——Prompt injection 检测、工具执行审批、SSRF 防护、子 Agent 工具限制6.渐进式降级——在每一层都有降级路径宁愿慢也不引入 bug7.数据飞轮思维——每一个设计决策都在为训练数据质量服务适合谁• ✅ 需要一个长期使用、越用越聪明的个人 AI 助手• ✅ 需要本地/私有化部署零 API 成本• ✅ 需要在 Telegram/Discord/Slack 等多平台随时触达 Agent• ✅ 需要 Agent 具有持久记忆和自我改进能力• ✅ 需要 research-ready 的 Agent 框架用于 RL 训练和数据生成不太适合谁• ❌ 需要快速搭建多角色 Agent 团队• ❌ 只需要最简单的 API 集成OpenAI SDK 更轻量• ❌ 不愿意碰配置、消息平台接入、WSL2 或容器的人总体评价Hermes Agent 的设计特点Agent 的价值不仅在于单次任务完成更在于长期积累的知识和对用户的理解。闭环学习这个方向对不对时间会验证。项目地址https://github.com/NousResearch/hermes-agent官方地址https://hermes-agent.org/zh官方文档http://hermes-agent.nousresearch.com你会从 OpenClaw 转向使用 Hermes Agent 吗欢迎评论区留言。-END-推荐阅读开源语音 AI3 秒克隆声音支持 9 种语言 — Voxtral TTSAI Code 企业落地问题成本失控与无法持续记忆上下文及解决方案490万浏览量的方案用 LLM 构建持续更新积累的个人知识库Claude Code 源码泄露解读背后的技术细节AI 不是在抢我的工作Harness 正在重构软件工程让 Agent 完成任何复杂任务让OpenClaw替你打工五没花什么钱养了6只虾还赚到了钱让 OpenClaw 帮你干活四Proactive Agent 技能让AI眼里有活让你的OpenClaw替你打工从0到1跑通小红书运营全流程实战教程谷歌提示工程白皮书Google Prompt Engineering White-paper