Hermes Agent 新手教程,从入门到放弃的不完全指南

  • 本文适合完全没有命令行经验的Newbie,也适合从 OpenClaw 迁移过来的用户。手把手带你从零开始,装好 Hermes Agent,接入 Telegram,并了解它的核心玩法。

Hermes Agent 新手教程,从入门到放弃的不完全指南

🤔它是什么

Nous Research 今年 2 月底开源的 AI Agent 框架,上线不到两个月就冲到 35K star,速度相当快🚀。

大多数人用 AI 的方式是:打开网页、输入问题、等它回答、关掉窗口。Hermes 的定位不是这个,它是部署在服务器上、24 小时替你干活的数字员工。你关掉电脑,它还在跑;你睡着了,它还在处理任务。这是从”聊天工具”到”基础设施”的思路转变,理解这一点,才能真正用好它。

核心差异一句话:会自己变聪明。完成复杂任务后自动提炼成可复用技能(Skill)存起来,下次直接调用,还会随使用次数持续调优。有用户反馈两小时内自动生成三份技能后,重复任务速度提升了 40%。

底层用 Python 写的,OpenClaw 是 JS,AI 时代大多数工具和模型库都是 Python 生态,想改源码、加自定义工具、对接本地模型,Hermes 的门槛更低。

模型推荐用OpenRouter,有免费模型可用,零成本上手。

Hermes Agent 新手教程,从入门到放弃的不完全指南

  • ⚠️ 发文时更新:有推友今日下午反馈 Claude 订阅接入已失效。
  • Anthropic 4 月 7 日起调整政策,Hermes 等第三方工具不再走订阅额度,改为按量单独计费。建议优先用 OpenRouter 免费模型。

📋 开始之前

1. 系统支持情况

Hermes Agent 新手教程,从入门到放弃的不完全指南

  • 💡 Windows 用户:需要先安装 WSL2,再在 WSL2 环境里按本教程操作。可在微软官方文档搜索「安装 WSL」,按步骤装好后回来继续。

2. 确认 Git 已安装

打开终端,输入:

git version

能看到版本号(如 git version 2.x.x)就没问题。如果提示 command not found,先去git-scm.com 下载安装。

3. 准备好大模型 API Key

Hermes 支持接入 Claude、OpenAI、OpenRouter 等主流模型。安装时会引导你选择和配置,提前备好 Key 就行。

🔧 第一步:安装

打开终端(Windows 用户在 WSL2 里操作),执行:

脚本会自动完成所有准备工作:检测并安装 Python / Node.js / Git / ripgrep 等依赖、克隆仓库、创建全局 hermes 命令。

curl -fsSL  https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh| bash

  • ⚠️ 网络提示:要安装的东西比较多,网络不好的话多等一会儿,不要中途关掉终端。

安装完成后,脚本会自动进入引导设置,选择 Quick setup 模式,然后按提示配置模型。推荐选 OpenRouter,进入后可以选免费模型(如 google/gemma-4-31b-it:free),零成本跑起来先体验。如果之前本地已有 OpenAI 或 Codex 的授权配置,Hermes 会自动读取,不用重复填写。

配置最后会询问是否注册为系统服务,选 Y 可以开机自启、后台常驻,省去每次手动启动的麻烦。

如果你暂时不想配置聊天平台,选择跳过(Skip),直接在终端里输入:

hermes

能看到对话界面,说明安装成功了,可以直接在命令行里开聊。

Hermes Agent 新手教程,从入门到放弃的不完全指南

  • ⚠️ 如果提示找不到 hermes 命令,先执行 source ~/.bashrc 或 source ~/.zshrc 刷新一下 shell 环境,重新打开终端也行。
  • 实际体验下来,安装确实比 OpenClaw 方便,一次就配置成功了✌🏻

💬 第二步:接入 Telegram

  • 💡 如果你只想用命令行和 Hermes 交互,这一步可以跳过。想在手机或电脑的 Telegram 里聊,才需要配置。

2.1 先去 Telegram 创建一个 Bot

  1. 打开 Telegram,搜索 BotFather(官方账号,蓝色认证标)
  2. 发送 /newbot
  3. 根据提示依次输入 Bot 的显示名称(Name)和用户名(Username,必须以 bot 结尾)
  4. 创建成功后,BotFather 会返回一串 HTTP API Token,复制保存好

2.2 回到终端配置

如果安装时跳过了 IM 配置,可以随时重新运行:

hermes gateway setup

在引导界面选择 Telegram,将刚才复制的 Bot Token 粘贴进去。

  • ⚠️ 注意:粘贴 Token 时终端不会显示任何内容,这是正常的安全设计,直接按回车确认就行。

接着需要填写你自己的 Telegram 数字 ID(Allowed User ID)。查询方法:在 Telegram 里给@userinfobot发任意一条消息,它会立即回复你的账号 ID,复制那串数字填进去即可。不填则任何人都能使用你的 Bot。

2.3 完成配对

配置完成后,终端会给出一条命令,复制执行,然后打开 Telegram 找到你刚创建的 Bot,发一条消息,能收到回复就说明配对成功了。

Hermes Agent 新手教程,从入门到放弃的不完全指南

📱 其他聊天平台

飞书、企业微信、钉钉、Discord、WhatsApp 等平台的配置方式与 Telegram 大同小异,都在引导菜单里可以找到。详细参数配置可以参考官方文档:

👉消息平台接入指南

Hermes Agent 新手教程,从入门到放弃的不完全指南

✅ 第三步:验证安装

运行以下命令做一次全面检查:

hermes doctor

输出全绿就说明 Hermes 运行正常,依赖和配置都没问题。如果有报错,它会提示具体是哪里出了问题。

🚀核心特性

Skills 自动生成:完成一个复杂任务后,Hermes 会把整个执行过程沉淀成一份 Markdown 技能文档存起来,下次遇到类似任务直接调用。它还会记录每个 Skill 的调用次数和执行过程,到一定次数自动调优——技能真的会越用越好,不是说说而已。

分层记忆:核心信息常驻 MEMORY.md,每次对话都带着;历史对话全量存 SQLite,按需检索召回,容量没有上限。OpenClaw 是每次任务都把历史上下文塞进 prompt,记得越多烧得越多。Hermes 按需召回,用得越久成本反而稳定。

IM 里能看到 tool_call 过程,知道 agent 每一步在干什么,OpenClaw 这块是黑盒。另外支持 Profiles,可以同时跑多个隔离的 Agent 实例。

语音交互:CLI 里按 Ctrl+B 录音,Telegram / Discord 里可以直接语音对话,Discord 甚至能让 Agent 加入语音频道实时监听回话。支持本地 Whisper(免费)或 Groq 做语音识别,平时用不到但有需要时是个加分项。

SOUL.md 人格定制:在 ~/.hermes/SOUL.md 里写几行描述,就能给 Agent 定义一个跨所有平台的持久人格,说话风格、处事偏好、什么该避免。想要一个务实的工程师助手还是一个幽默的助理,完全自己决定。

总体来说,交互体验流畅,配置简洁但界面还需继续打磨。

Hermes Agent 新手教程,从入门到放弃的不完全指南

🔌 接入第三方界面

不想用命令行的话有两个选择:

Hermes WebUI:专门为 Hermes 开发的网页界面,直接对着 Agent 聊,比命令行直观不少,新手友好。

👉github.com/nesquena/hermes-webui

Hermes Agent 新手教程,从入门到放弃的不完全指南

接入现有工具:Hermes 内置兼容 OpenAI API 格式的服务端,Open WebUI、Cherry Studio 等支持自定义 API endpoint 的工具都可以直接接入,不用重新学界面。

配置方式参考官方文档:API Server 使用指南

💡 VPS 用户

如果你是在 VPS 上部署,并且已经安装了 Claude 或 Codex 这类 AI 工具,可以直接把 Hermes 的官方文档或者本文扔给它,让它自动读取并帮你执行配置步骤。省去逐行粘贴命令的麻烦,尤其适合环境依赖复杂、需要反复调试的情况。

⌨️ 常用命令速查

Hermes Agent 新手教程,从入门到放弃的不完全指南

💰 费用参考

Hermes 可以号称可以跑在 5 美元/月的 VPS 上,也支持 Docker 和 serverless 方案。以下是社区实测的费用参考:

Hermes Agent 新手教程,从入门到放弃的不完全指南

为什么同等使用强度下,Hermes 比 OpenClaw 便宜 30%-60%?原因在架构上:OpenClaw 每次任务都把历史上下文塞进 prompt,记得越多、单次 token 消耗越大,用得越久越贵。Hermes 的记忆系统是按需召回的,成本随时间保持稳定。

  • ⚠️ 社区高频翻车案例:忘了关 Sonnet 跑了一夜。OpenClaw 用户哭晕在厕所😄,Hermes 用户因为架构差异,翻车金额小一个数量级。

🔐 安全性

Hermes 实施了七层防御:用户授权白名单、危险命令人工审批、Docker 容器隔离、凭证过滤保护、内容注入扫描、URL 验证(防 SSRF)、预执行终端攻击检测。高风险操作默认需要人工确认,超时自动拒绝。

接入 IM 平台时,Hermes 支持配对码验证,8 位随机码,1 小时过期,5 次失败后锁定,比手动复制用户 ID 更安全。

配置上密钥和服务解耦管理,复杂度低,减少了配错把自己搞死的概率。

两个使用前需要知道的点:

  • 接入 Telegram 后账号就是控制入口,账号安全 = Agent 安全,⚠️建议开启两步验证⚠️
  • Skills 持久存活会被反复调用,有问题的技能需要手动清理
  • 💡 技能文件存在本地,可以随时打开查看和删除;hermes doctor 可以定期检查运行状态。

❓ 常见问题

Q:🚨Claude 订阅还能用吗?

4 月 7 日起 Anthropic 已调整政策,Hermes 等第三方工具不再走订阅额度,使用 Claude 需要单独按量付费。建议直接用OpenRouter,注册后有免费模型可用,入门零成本,后续有需要再接付费模型。

Q:安装后输入 hermes 提示 command not found 怎么办?

通常是 PATH 没刷新。关掉当前终端窗口,重新打开一个,再试一次。如果还不行,执行 source ~/.bashrc 或 source ~/.zshrc(取决于你用的 shell)。

Q:Windows 用户怎么办?

官方明确不支持 Windows 原生运行。需要先装 WSL2(Windows Subsystem for Linux 2),然后在 WSL2 里按本教程操作,安装命令完全一样。

Q:Bot Token 粘贴进去没有任何显示,是不是出错了?

没有出错,这是终端的安全机制,输入密钥类内容时不会回显。直接按回车确认即可。

Q:从 OpenClaw 迁移过来,原来的配置还能用吗?

可以,Hermes 内置了迁移命令:

hermes claw migrate

会自动导入原有的技能、记忆和设置,很多命令和 OpenClaw 也大同小异。

Q:/llm_wiki 是什么功能?

新版本新增的功能,支持 Karpathy wiki 方案——可以快速查阅大模型相关知识,在 IM 对话里直接 /llm_wiki 触发,比手动搜索方便不少。

官方文档👉🏻:

hermes-agent.nousresearch.com/docs

GitHub👉🏻:

github.com/NousResearch/hermes-agent

statement:The content of the source of public various media platforms, if the inclusion of the content violates your rights and interests, please contact the mailbox, this site will be the first time to deal with.
Encyclopedia

OpenCLaw field teaching: write your own Skill from 0 to 1

2026-4-7 15:55:20

Encyclopedia

Hermes Agent 从入门到精通:25 个致命坑避坑实战指南

2026-4-13 15:04:40

Search