2026年04月06日

我为什么从 OpenClaw 切到了 Hermes：Agent 世界里，苹果正在赢安卓

从设计模式、开箱完整度、记忆能力、技能自优化、安全性和多会话管理几个角度，聊聊我为什么从 OpenClaw 切换到 Hermes。

约 19 分钟阅读

最近不少朋友问我，为什么我把主力 Agent 从 OpenClaw 切到了 Hermes。

先说结论：不是 OpenClaw 不好。恰恰相反，OpenClaw 当初最打动我的地方，就是它够猛，够自由，够像一台你可以随便改、随便接、随便折腾的 Agent 引擎。它像安卓，开放、灵活、想象空间大。

但也正因为这样，它很容易一路从“强大”滑向“失控”。

而 Hermes 给我的感觉，是另一条路。它没那么野，但它更完整、更稳、更像一个真正可以长期用、敢交给它跑起来的产品。你可以把它理解成 Agent 世界里的苹果：边界更清晰，系统更收敛，很多能力不是没有，而是已经被整理好了，装进一个更可控的框架里。

这篇文章不是参数对比，也不是功能表。我想从一个真正在两边都用过的人视角，聊聊我为什么最后决定切到 Hermes。

Hermes 启动界面

Hermes 的启动页给我的第一感觉就是：系统边界很清楚，信息密度也很高。工具、技能、模型、工作目录，开场就摆在台面上。

OpenClaw 为什么一开始那么让人上头

如果你用过 OpenClaw，大概率能理解那种感觉。

它最吸引人的，不是“能聊天”，而是“能长成任何样子”。

你可以给它做多 agent 架构，可以自己拼工作流，可以接各种插件，可以把不同能力揉成一个有点疯狂、但也很有创造力的个人系统。那种感觉很像第一次认真玩安卓自动化：你会觉得，原来系统还能这么改。

OpenClaw 最强的一面，其实是它给了你一种“这个系统没有天花板”的感觉。

但问题也恰恰出在这里。

当一个系统足够自由，真正的成本不是“不会”，而是“会了之后越来越乱”。

你会开始遇到这些问题：

配置越来越多，但不确定哪些还在生效
插件越来越多，但不知道哪些是稳定资产，哪些是历史包袱
记忆、技能、工作目录、渠道配置互相牵扯
同一个 Agent 今天还像 A，明天又像 B
你以为自己在增强它，结果往往是在制造更多不可预测性

这不是 OpenClaw 独有的问题。所有高度开放的系统，走到后面都会遇到这个坎。

自由，本身就是一种管理负担。

我切换的真正原因，不是功能，而是“系统感”

很多人选 Agent 工具，第一反应是看功能表：谁支持更多模型，谁的浏览器能力更强，谁的插件更多，谁更容易魔改。

但我现在越来越觉得，决定一个 Agent 能不能长期用下去的，不是功能点，而是系统感。

什么叫系统感？

就是它有没有把这些核心问题想明白：

配置边界在哪里
记忆边界在哪里
会话边界在哪里
工作目录边界在哪里
技能是怎么积累、怎么维护、怎么避免腐烂的
网关、消息渠道、CLI、工作区之间到底怎么隔离

OpenClaw 更像一套你可以自己搭的 Agent 操作系统。它很强，但很多系统级规则要你自己补。

Hermes 则明显更像一套已经定义好秩序的产品。它不是不让你扩展，而是先把最重要的边界给你立起来。

这对我很重要。

因为我后来已经不想再维护一个“随时可能因为历史配置、旧记忆、旧会话、旧工作区而行为漂移”的 Agent 了。我想要的是：它能变强，但不要变野。

Hermes 最让我舒服的一点，是它把“身份”和“工作现场”分开了

这点非常关键。

在 Hermes 里，profile 是 agent 身份，工作目录是工作现场，这两者是分开的。

一个 profile 下面，有它自己的：

config.yaml
.env
SOUL.md
memories/
sessions/
skills/
gateway
logs
state.db

也就是说，一个 profile 就是一整套独立 agent。

但它又不会强行把“当前在哪个项目干活”和“这个 agent 是谁”绑死。CLI 模式下，你在哪个目录启动，它就在哪个目录工作；消息网关模式下，你可以给它单独设 MESSAGING_CWD。

这个设计看上去保守，实际上非常成熟。

它解决了一个我在 OpenClaw 里越来越头疼的问题：Agent 的人格、记忆、技能、会话历史、工作区，不能再搅成一锅粥。

当这些东西搅在一起时，系统会越来越像一间没整理过的工具房。你每次进去都能找到东西，但你也越来越怕碰它。

Hermes 至少在架构上，是先把这间房分好了抽屉。

Hermes 内置技能总览（一）

Hermes 的 skill 体系不是“装几个插件看看”，而是一套已经成型的能力分层。你一眼就知道自己手里有什么，不像很多系统越用越像杂物间。

开箱完整度这件事，Hermes 确实更像成品

这是我切换后最直观的感受。

OpenClaw 的很多能力是“你可以做出来”。 Hermes 的很多能力是“它已经给你接好了”。

比如：

profile 体系不是概念，而是完整落地的
gateway 不是附属功能，而是系统一级能力
session 管理不是文件堆出来的，而是有完整的浏览、恢复、命名、统计机制
context files、SOUL、memory、skills 的关系是明确的
worktree、checkpoints、rollback 这些工程化能力，是直接放进主流程里的

这点对已经玩过 OpenClaw 的用户非常重要。

因为你真正缺的，往往不是“还能不能再多装一个能力”，而是“有没有一种不用自己一直兜底的日常使用方式”。

Hermes 给我的最大惊喜，不是某个单点特别炸裂，而是它整体上更像一个能长期用、能拿来跑生产节奏的系统。

很多事情你不是不能自己搭，而是你终于不需要每件事都自己搭。

记忆这件事，Hermes 让我第一次愿意“重训”而不是“迁就”

我这次迁移里，有一个动作特别说明问题：我最后把默认 profile 的记忆整个清空重建了。

原因很简单，旧记忆已经开始污染系统行为。

它会不断把 .openclaw 当成熟悉工作区，会把历史路径、历史任务、历史技能位置继续往当前会话里带。配置上看起来没问题，但模型的行为就是会往旧轨道滑。

这时候你会发现，一个 Agent 真正危险的地方，不是“不会记”，而是“记多了以后你不敢信”。

Hermes 在记忆这块最让我舒服的一点，是它至少把记忆机制做得很朴素，很可理解。

它不是那种神神叨叨的“神秘长期记忆”。它就是明确的 MEMORY.md、USER.md、sessions、frozen snapshot。你知道它从哪来，知道它写到哪去，也知道什么时候该清，什么时候该留。

这件事听起来不性感，但特别重要。

因为记忆系统一旦不可解释，就会逐渐从资产变成风险。

Hermes 没把记忆吹得很玄，反而让我更放心。

技能这件事，Hermes 比 OpenClaw 更像“可维护资产”

我以前在 OpenClaw 里也积累过不少技能、插件、扩展逻辑。问题不是不能用，而是越往后越像个人技术债仓库。

你写了一个技能，过一阵配置变了。你装了一个插件，过一阵上下游接口变了。你保存了一套经验，过一阵它已经不适合当前系统了。

Hermes 在技能这件事上的思路更接近“受控扩展”。

它的 skill 体系、profile 隔离、技能快照、按需加载，至少是在鼓励你把技能当成长期资产维护，而不是当成一次性的脚手架随手乱扔。

这点我特别认同。

因为一个 Agent 平台成熟不成熟，不是看你能不能不停加能力，而是看这些能力加进去之后，系统会不会越来越像垃圾场。

OpenClaw 更像是给你一块很大的地，你想盖什么都行。 Hermes 更像是已经给你规划好了区块、道路、电路和排水。

前者适合激情创业，后者适合真正住人。

Hermes 内置技能总览（二）

尤其是当你看到它内置的研究、生产力、软件开发这些能力已经分门别类摆好时，你会更容易理解 Hermes 的设计思路：先有秩序，再谈扩展。

安全性这件事，我现在站 Hermes

这部分我想说得直接一点。

OpenClaw 的问题，不是它不安全，而是它太容易进入一种“反正我自己知道自己在干嘛”的状态。

只要你是重度用户，你一定懂这种心态。最开始你会仔细管边界，后来你会越来越信任自己手上那套复杂系统，最后变成：算了，先让它跑。

然后一个系统只要长到一定复杂度，“先让它跑”基本就是一切失控的开端。

Hermes 在安全这件事上的好处，不是它绝对更安全，而是它更不鼓励你走到那种混乱状态。

profile 隔离
token lock
gateway 独立
工作目录边界明确
checkpoints / rollback
配置和状态有明确落点

这些东西单独看都不新鲜，但合在一起，会让你更少进入“算了，凑合跑”的阶段。

这就是我前面说的，Hermes 像苹果，OpenClaw 像安卓。

不是说安卓不好。安卓的自由，是它最迷人的地方。可一旦你开始把 Agent 当长期系统用，而不是当玩具用，你就会慢慢意识到：可控，有时候比可玩更贵。

浏览器能力上，Hermes 也没有我最开始以为的那么弱

这个点我一开始也有误解。

我以前在 OpenClaw 里很喜欢那种比较干净的结构化 browser snapshot 体验，像 browser(action=snapshot, refs="aria") 这种，拿到的是干净的无障碍结构，不用先走视觉模型。

到了 Hermes，我最开始以为它的 browser 主要靠截图和 vision，结果后来才搞明白，不是。

Hermes 的浏览器主路径其实也是 accessibility tree。它的 browser_snapshot 本质上就是在取页面的文本化可访问性结构，再基于 ref 做点击、输入、跳转。browser_vision 是补充，不是主路径。

这点挺重要。

因为很多人一看见 browser_vision 就以为 Hermes 走的是图像理解路线，其实不是。结构化页面读取能力是有的，只是工具名字和交互方式跟 OpenClaw 不一样，收敛到了更统一的 browser 工具里。

也就是说，Hermes 不是没能力，而是更像把这部分能力包装成了更标准的系统接口。

Hermes 内置工具总览

工具层也是同样的思路。浏览器、网页、终端、文件、记忆、技能、任务管理，一整套能力不是散着长出来的，而是作为系统能力统一存在。

对已经用过 OpenClaw 的人，我最想说的一句话是

如果你现在还在 OpenClaw 里折腾得很开心，那很好，继续折腾。它依然是一个很有创造力的平台。

但如果你已经开始出现这些感觉：

配置越来越多，自己都不敢动
想做多 agent，但越做越乱
会话、记忆、工作目录开始互相污染
技能积累得越多，越像历史包袱
想把它接到消息渠道里长期跑，又总担心哪天突然漂了

那你真的应该认真试试 Hermes。

不是因为 Hermes 在功能上碾压 OpenClaw。而是因为 Hermes 更像一个能把你从技术热情里接住的系统。

它不一定让你第一次用时最兴奋。但它更可能让你三个月后还愿意继续用。

这就是差别。

OpenClaw 很像一个天赋型选手，爆发力惊人。 Hermes 更像一个成熟体系，节奏稳，底盘厚，边界清楚。

一个适合不断突破上限。一个适合真正纳入日常。

而我现在更需要后者。

最后

我不是从 OpenClaw “逃到” Hermes 的。

我是从“不断给系统兜底”切换到了“终于可以少兜一点底”。

这件事，只有真的长期用过 Agent 的人，才会觉得珍贵。

如果你刚从 OpenClaw 走过来，我的建议很简单：

别一上来就想着把所有旧能力原封不动搬过去。先把 Hermes 当成一个新的系统来理解。

先接受它的边界。再利用它的边界。

等你真正把 profile、session、memory、gateway、cwd 这些概念理顺之后，你会发现它强的地方，不是“它还能再装多少东西”，而是“它终于没那么容易把自己玩坏”。

这就够了。

真够了。