过去一年,我越来越少把 AI 当成一个“问答窗口”来用。
不是因为 ChatGPT 不好用。恰恰相反,它已经足够好,好到我开始意识到另一个问题:如果一件事每周都要做、每次都要复制资料、切换网页、保存文件、再发给别人,那它就不应该只停留在聊天框里。
ChatGPT 更像一个很聪明的临时顾问。你问,它答;你贴资料,它分析;你要求改写,它改写。这个模式适合临时问题,但一旦进入真实工作流,就会暴露出几个很明显的摩擦:
上次说过的背景,下次还要再说一遍;
生成的结果,还要我手动复制到文件、文档、消息软件;
查资料、读网页、跑命令、看日志,仍然要我在多个窗口之间来回切;
每天、每周重复的任务,AI 不能自己到点开始;
它能“建议我做什么”,但不能真的帮我把事做完。
所以我后来开始搭自己的 Agent。
这里说的 Agent,不是一个更会聊天的机器人,而是一个能连接工具、记住偏好、执行步骤、验证结果、定时工作的 AI 工作台。OpenClaw / Hermes 这类系统的价值,也正在这里。
它不是替代 ChatGPT,而是把 AI 从“对话能力”推进到“工作能力”。
一、Chat ...
之前的文章中,有用户留言希望了解Hermes相关的知识,所以有了这篇独立观察文章。我们换一个视角:如果 Hermes Agent 已经出现,我们还需要 OpenClaw 吗?Hermes 真的更好吗?它能不能完全替代 OpenClaw?
图:OpenClaw 与 Hermes Agent 不是简单的新旧版本关系,更像是同一类 Agent 系统在不同阶段的两种形态。
先给结论:
Hermes Agent 在工程化、平台化、可维护性和生态扩展上,整体比 OpenClaw 更成熟。但“更成熟”不等于“在任何场景都无脑替代”。
如果你只是问:
1我现在从零开始,该学 OpenClaw 还是 Hermes?
我的建议很明确:
优先学 Hermes Agent。
但如果你已经有一套 OpenClaw:有历史配置、有自定义 Skill、有 Telegram/Discord Bot、有 cron、有插件、有工作流,那问题就不能粗暴地变成“删掉 OpenClaw,换 Hermes”。
更合理的问题应该是:
1234哪些东西可以迁移?哪些东西需要重建?哪些东西短期不该动?Herm ...
OpenClaw 教程
未读
这是「OpenClaw 教程课程」第 30 课。上一课我们学会了自己写 Skill,把可复用的工作方法沉淀下来。今天继续往下走:当你不只是想教 Agent 怎么做,而是想给 OpenClaw 增加新能力时,就要进入 Plugin 的世界。
图:OpenClaw Plugin 可以扩展 provider、channel、tool、hook、HTTP route、CLI、service 等能力,是比 Skill 更靠近系统能力层的扩展方式。
第 29 课我们讲过:
Skill 是可复用工作方法。
它解决的是:
1这类任务应该怎么做?
但有些需求,Skill 解决不了。
比如:
接入一个新的 LLM provider
接入一个新的聊天渠道
增加一个真正的 agent tool
拦截工具调用并要求审批
增加 Gateway HTTP route
增加 CLI 子命令
增加后台 service
增加 image / video / music generation provider
增加 web search / web fetch provider
...
OpenClaw 教程
未读
这是「OpenClaw 教程课程」第 29 课。第 11 课我们讲过 Skills 是什么、怎么安装和使用。今天进入第七模块「进阶开发」,开始真正自己动手:写一个属于你的 Skill。
图:Skill 是给 Agent 的可复用能力包,可以包含 SKILL.md、scripts、references 和 assets,让经验沉淀成长期可调用的工作方法。
如果你已经用 OpenClaw 一段时间,大概率会遇到这种感觉:
有些事情,我每次都要重复教它一遍。
比如:
每次写博客都要提醒它标题、结构、配图建议
每次排查服务器都要提醒它先只读检查
每次处理发票都要提醒它字段格式
每次生成周报都要提醒它用固定模板
每次处理图片都要提醒它先备份再改
每次跑某个内部 API 都要提醒它参数含义
如果一件事只做一次,直接 prompt 就够了。
但如果它会反复出现,你就应该考虑:
把这套做法写成 Skill。
这一课我们不讲插件 SDK,也不写复杂代码。
只做一件事:
从零理解并写出一个最小可用的 SKILL.md。
一、先说结论:Skill 是“可复用工作方法”第 11 ...
OpenClaw 教程
未读
这是「OpenClaw 教程课程」第 28 课。这一课是第六模块「安全与运维」的收束课。前面我们讲了权限、安全加固、日志排错,今天讲一个更偏架构和运维的问题:什么时候该用多个 Gateway,什么时候其实只需要多个 Node?
图:OpenClaw 默认建议一个 host 一个 Gateway;需要更强隔离或救援通道时,可以用不同 profile、不同端口、不同状态目录运行多个 Gateway。
很多人搭到后面,会自然冒出一个想法:
我能不能多开几个 Gateway?
比如:
一个 Gateway 给自己用
一个 Gateway 给家人用
一个 Gateway 专门做救援 bot
一个 Gateway 跑在 VPS
一个 Gateway 跑在家里 Mac
一个 Gateway 接 Telegram
一个 Gateway 接 WhatsApp
一个 Gateway 专门跑浏览器自动化
这些想法不一定错。
但新手最容易把三个概念混在一起:
123多 Agent多 Node多 Gateway
它们不是一回事。
这一课我们先把边界讲清楚,再讲怎么安全地做多 Gateway 和远 ...
OpenClaw 教程
未读
这是「OpenClaw 教程课程」第 27 课。上一课我们讲了 SSH、防火墙、自动更新这些主机安全基线。今天继续进入运维核心:OpenClaw 出问题时,怎么看 Gateway 日志,怎么判断到底是哪一层坏了。
图:OpenClaw 排错不是只盯一行报错,而是把 status、health、logs、doctor、channels probe、security audit 组合起来看。
OpenClaw 跑久了,你一定会遇到这些问题:
Telegram 不回复了
WhatsApp 显示连接但消息没反应
Agent 一直思考但没有结果
模型报 429 或 auth error
exec 被拒绝
browser 打不开页面
node 已经 paired 但工具失败
cron / heartbeat 没按预期触发
Gateway 重启后状态不对
这时候最怕的是直接乱改配置。
正确姿势是:
先看状态,再看日志,再按层定位。
这一课就是一份实战排错手册。
一、先记住排错命令梯子OpenClaw 官方 troubleshooting 文档给了一个很实用的命令顺序:
123 ...
OpenClaw 教程
未读
这是「OpenClaw 教程课程」第 26 课。上一课我们讲了 OpenClaw 内部的权限控制:sandbox、tool policy、elevated、exec approvals。今天继续往外一层,讲运行 OpenClaw 的主机本身怎么加固:SSH、防火墙、自动更新和安全巡检。
图:OpenClaw 的安全不只在 Agent 配置里,也在宿主机的 SSH、防火墙、更新策略、备份和网络暴露面里。
很多人搭 OpenClaw 时,会把注意力放在功能上:
Telegram 能不能回复?
exec 能不能跑命令?
browser 能不能操作网页?
手机节点能不能拍照?
cron / heartbeat 能不能自动执行?
这些当然重要。
但只要 OpenClaw 开始接触真实文件、真实账号、真实设备,安全问题就不能再靠“应该没事”来处理。
特别是 Gateway 跑在 VPS 或家用服务器上时,你至少要回答几个问题:
SSH 会不会被公网爆破?
防火墙是不是只开放必要端口?
Gateway 端口有没有裸露公网?
Tailscale / SSH tunnel ...
这是「OpenClaw 教程课程」第 25 课。从这一课开始,我们进入第六模块:安全与运维。前面我们已经让 OpenClaw 能跨设备、能看图、能听语音、能执行任务。现在要认真回答一个问题:它到底应该被允许做什么?
图:OpenClaw 的权限控制不是一个开关,而是 sandbox、tool policy、elevated、exec approvals 多层共同作用。
很多人刚用 OpenClaw,会先关心:
怎么让 Agent 执行命令?
怎么让它改文件?
怎么让它操作浏览器?
怎么让它调用手机摄像头?
怎么让它跑在节点机器上?
这些当然重要。
但真正长期使用时,更重要的问题是:
哪些事可以自动做,哪些事必须问我,哪些事永远不该让它做?
OpenClaw 不是只靠“信任模型”来保证安全。
它有几层控制:
Sandbox:工具在哪里运行
Tool policy:哪些工具能被调用
Elevated:sandboxed exec 能不能逃逸到真实主机
Exec approvals:真实主机命令怎么审批
Node command policy:节点能力能不能调用
Channe ...
OpenClaw 教程
未读
这是「OpenClaw 教程课程」第 24 课。前三课我们讲了多节点架构、Tailscale 组网和节点配对排错。今天把这些基础落到真实能力上:让 OpenClaw 看见、听见,并把媒体内容纳入工作流。
图:OpenClaw 的媒体节点能力可以把手机、Mac、摄像头、语音消息、图片附件和视频片段接入 Agent 工作流。
如果说第 21 课解决的是“设备怎么协作”,第 22 课解决的是“跨网络怎么连”,第 23 课解决的是“连不上怎么排查”,那第 24 课要解决的就是:
节点连上以后,怎么真正用起来?
这里最有代表性的能力就是:
摄像头拍照
摄像头短视频
屏幕录制
语音消息转文字
图片 / 音频 / 视频理解
媒体文件作为回复发送
TTS 把文字变成语音
这些能力会让 OpenClaw 从“只会读文字的助手”,变成更接近真实世界的个人 AI 系统。
但也要先说清楚:
摄像头、麦克风、定位、屏幕录制都是高隐私能力,必须按最小权限开启。
这一课我们会边讲实战,边讲安全边界。
一、先建立一个媒体流向模型在 OpenClaw 里,媒体相关能力大致有两条流向 ...
OpenClaw 教程
未读
这是「OpenClaw 教程课程」第 23 课。前两课我们讲了多节点架构和 Tailscale 组网。这一课开始进入真正的排错现场:手机 / Mac / 树莓派 / headless node 配对不上,应该怎么查?
图:节点配对失败不要乱改配置,先按网络、认证、setup code、device pairing、node role、capabilities、permissions、approvals 分层排查。
多节点最折磨人的问题,往往不是“我不会搭”。
而是:
QR 扫了没反应
setup code 粘贴后连接失败
/pair 生成了,但手机连不上
openclaw devices list 看不到 pending
设备 approve 了,但 openclaw nodes status 没有
节点在线,但 camera / screen / location 调用失败
node host 连上了,但 exec host=node 跑不了
这类问题如果靠猜,会很痛苦。
正确方法是分层排查。
这一课我们不讲玄学。
就讲一个 ...























