$catSERPAPI||~9 min

从网关控制到自我进化:Hermes与OpenClaw核心架构与实战对比深度解析

advertisement

我是怎么在Hermes和OpenClaw之间反复横跳的——踩坑实录

说真的,2026年搞AI Agent的开发体验就是:选择困难症大爆发。一边是GitHub上star数暴涨的OpenClaw(大家叫它"龙虾"),另一边是Nous Research搞的Hermes Agent("爱马仕")。我两个都认真用了一段时间,踩了不少坑,今天就掰开了揉碎了聊聊。

一、先说架构,这俩东西长的根本不一样

OpenClaw的核心是个Gateway,你可以理解成一个超级总机。不管你从Telegram、Discord、微信还是Slack发消息过来,全走这个Gateway,它再分发给对应的Agent处理。我一开始觉得这架构挺合理——集中管理嘛,听着就靠谱。但用久了发现一个问题:Gateway就是个单点。它挂了全挂。而且它那个调度逻辑,说实话有点像Kubernetes调度Pod那套,配置起来很繁琐。

Hermes就不一样了。它的核心是Agent Runtime本身,消息接入反而是附属品。我第一次看它文档的时候有点懵——什么叫"Agent本身就是系统中心"?用了才知道,它整个思路就是:你给我任务,我做完之后自动总结经验、存成技能,下次遇到类似的直接调用。简单粗暴,但确实有效。

一句话总结我的感受:OpenClaw像个严谨的项目管理工具,Hermes像个越带越顺手的实习生。

二、技能系统——我踩的最大的坑

这块是两者差异最大的地方,也是我踩坑最深的地方。

OpenClaw:手动写技能,累死个人

OpenClaw的技能就是一个个Markdown文件,你得自己写SKILL.md,定义好流程,然后手动装上去,还得重启Gateway才生效。社区倒是有ClawHub市场,技能挺多的,但我下了几个质量参差不齐,有一次装了个第三方技能,Token直接暴涨到上下文爆掉——因为它加载技能是全量塞进上下文的。

这是我踩的第一个坑:技能加载没做渐进式,上下文管理基本靠自己。

yaml
1
# OpenClaw 手动技能文件示例 (SKILL.md)
2
---
3
name: daily-report-generator
4
description: "汇总各项目进度,生成团队日报"
5
---
6
# 每日报告生成流程
7
1. 调用 github 工具获取过去24小时各仓库的commit和PR
8
2. 调用 jira 工具获取已完成的issue
9
3. 汇总数据,按项目分类
10
4. 调用 notion 工具生成最终报告
11
5. 通过 slack 发送到指定频道

Hermes:自动技能生成,真的会"长出来"

Hermes的技能是Agent自己生成的。我第一次看到这个机制的时候半信半疑——自动写技能?不会写出垃圾来?

后来我让它做了一次完整的AWS Lambda部署流程(涉及好几个工具调用、还出过错要重试),做完之后它自动说"我检测到这是一个可复用的工作流,已创建新技能"。我看了下生成的技能文件,居然比我手写的还清晰。从那以后类似任务直接秒完成。

python
1
# Hermes 技能自动触发的逻辑(简化自源码 prompt_builder.py)
2
SKILL_GENERATION_PROMPT = '''
3
你刚完成了一个复杂任务。
4
请判断是否满足以下任一条件:
5
1. 成功完成了复杂任务(工具调用>=5次)
6
2. 从错误路径中找到了解决方案
7
3. 用户纠正了你的方法
8
4. 识别出了一个可复用、多步骤的工作流
9
如果满足,请使用 skill_manage 工具,将流程提炼为一个新技能。
10
'''

而且它的技能加载是渐进式的——先给你列个摘要清单,Agent自己决定要不要深入看某个技能。这个设计真的省Token,比我之前在OpenClaw上动不动就爆上下文强太多了。

三、记忆系统——别小看这个

OpenClaw的"文件即记忆"

OpenClaw就是靠MEMORY.md、USER.md这些文件存记忆。问题是它写入是被动的,通常在上下文快满的时候才往里塞。用了两个月,我的MEMORY.md膨胀到好几万行,检索效率一塌糊涂。

Hermes的三层记忆

Hermes搞了三层:会话记忆(临时的)、持久记忆(跨会话核心信息)、技能记忆(自动生成的技能库)。让我印象最深的是它的Nudge机制——每15轮对话自动触发一次反思,把重要内容提炼进持久记忆。而且MEMORY.md限制2200字符,逼着Agent只记高价值信息。

yaml
1
# Hermes 记忆配置 (config.yaml)
2
memory:
3
  max_memory_length: 2200
4
  max_user_profile_length: 1375
5
  reflection_interval: 15
6
  providers:
7
    - honcho
8
    - mem0

我踩过一个坑:一开始把reflection_interval设成3,结果Agent每隔几轮就"反思"一次,反而打断了正常工作流。后来改回15,体验就好多了。

四、安全这块,说真的我被吓到过

OpenClaw之前爆过CVE-2026-25253(CVSS 8.8),API密钥泄露那种级别的。我当时正好在生产环境用着,一听到消息手忙脚乱地改密钥。后来还爆出过ClawHub技能市场的供应链攻击("ClawHavoc"),恶意技能比例据说到了20%。这些事之后我对OpenClaw的信任度大打折扣。

Hermes目前是零Agent相关CVE。它的技能是自己生成的,不从社区下载,直接从源头干掉了供应链风险。Docker部署默认只读文件系统、有Prompt注入扫描、危险命令审批。安全这块Hermes确实做得更扎实。

五、部署踩坑补充

忘了说部署。OpenClaw主要支持本地和Docker,DigitalOcean能一键部署,但没有Serverless选项,成本优化全靠自己。Hermes这边我试过Daytona和Modal Serverless,按需唤醒、闲置休眠,闲置的时候真的不花钱,这对小团队太友好了。

六、到底怎么选?我的实际建议

用了这么久,我的总结是:

选OpenClaw的场景:你要是做全球化多渠道客服,要同时接LINE、WhatsApp、微信、Teams,那OpenClaw的50+平台集成是唯一选择,没得替代。

选Hermes的场景:DevOps自动化、重复性任务优化、对安全有严格要求的场景。Hermes的自学习闭环在这种场景下降维打击。我实测过,研究类任务用Hermes跑了两周,同样的活比OpenClaw省了将近40%的时间,因为技能积累起来了,很多事不用每次从头教。

混合方案:社区已经有人在玩——OpenClaw做调度中心管多渠道消息路由,Hermes做执行引擎负责深度任务,通过MCP协议桥接。我觉得这可能是未来的大方向。

最后说几句掏心窝的话

这两个项目都还很年轻,API改得飞快。我吃过亏:用Hermes的时候跟踪main分支,结果某次更新直接把我自定义的配置覆盖了。后来学乖了,锁版本号,生产环境绝不跟踪最新代码。

选框架其实就是选世界观。OpenClaw是"连接一切"的控制中枢,Hermes是"越用越聪明"的养成系助手。没有谁更好,只有谁更适合你的场景。

我是两个都用,主力Hermes、需要广度的时候拉OpenClaw出来。对了,如果你是初学者想快速上手,我建议先从Hermes开始,开箱即用的体验确实好。如果是企业团队要做大规模跨渠道服务,那OpenClaw的生态是绕不开的,但一定得花精力做安全加固,别偷懒。

有啥问题评论区聊,我踩的坑比写的多。

advertisement

从网关控制到自我进化:Hermes与OpenClaw核心架构与实战对比深度解析 — AI Hub