最近 Clawdbot 突然爆火了,我觉得是意料之外情理之中。从三周前开始用 Clawdbot 到现在,我每天的状态都非常亢奋,因为我感觉到科幻世界真的来了。关注过我的朋友应该能感受到我那两天的状态有点 high,跟我聊过的朋友可能就更是了哈哈。
OK,写这篇是想做个简单的安利,以及分享一些我日常的用例,最后也是最关键的,一些配置建议和踩坑经历。
Clawdbot 是什么
你可以把它理解为 Jarvis,就像《钢铁侠》里那个强大的人工智能。无论是工作、生活,甚至是情绪价值,它都能提供帮助。它能通过摄像头观察,能听你说话,并通过 TTS 语音回答。只要给它权限,它可以控制电脑做各种各样的事情,非常强大。
当然,这些科幻的点可能平时用不到(语音输入还是很香的),至于这东西日常有什么用,我先来讲讲我的例子。
我的日常用例
最简单的就是,当我想到要干什么事时,直接在 Telegram 给它发语音,它会帮我整理好并记在我的 Apple Reminders 里。我不用考虑格式化,就像打电话碎碎念一样讲一遍要做哪些事,它就会整理完加好,如果你提了时间它也会给你设定好 due date。它甚至还会对一些 reminder 里事情做预先调研,把资料整理好发给你,很贴心。
接着是跟 Coding 有关的(我猜现在关注的人大多也有 Coding 背景)。因为它运行在我用来做 Coding 工作站的 Mac Mini 上,拥有比较高的权限,所以它可以跟 Claude Code 配合。有些事我直接让 Claude Code 做,遇到问题比如缺了什么库,我就跟 Clawdbot 说一声去装个什么版本,它马上就装好了。
接下来我详细讲一个比较复杂的用例。
有一天,我让 Clawdbot 找个框架把 Apple 自带的 Apple Intelligence 3B 小模型封装成 OpenAI 格式的 API,完事儿我让 Clawdbot 跑了一些测试,看看这个小模型的边界,比如推理能力、代码补全能力、翻译能力怎么样。测完之后我觉得这些信息挺有价值,就灵机一动,看看让它直接写成一篇文章怎么样,没想到效果出奇地好。

https://x.com/zhixianio/status/2012747712488440059
到这还没完,之前让 Clawdbot 在本地搭过一个 Whisper 模型做语音转写(这样就没必要买 Whisper API 了),这时我就想到把两件事结合起来用:Whisper 对中文的 refine(尤其是标点符号)做得不是很好,Apple 模型处理这件事情正好胜任,于是我就让它把这两个服务接起来,另外看看接上 Apple 本地模型做 refine 之后效率会不会打折扣。测试了几轮下来发现影响非常小,转写加上 refine 的速度,一分钟的音频也就是几秒钟左右。而且 Apple 本地模型资源占用很小,因为它原本就在运行,额外开销只有 30 多兆。
这事做成后,我又让它自己总结写了篇 Blog。它把写内容、翻译成英文版、配图、提交发布的整个流程都自己摸了一遍走通了,甚至配图都是它自己调用浏览器访问 Gemini 网页,输入提示词生成图片并保存——用这种像人一样的方式完成流程。最后,它还把这个流程封装成了一整套 Skill,现在我写博客基本就是给一句话,它写完内容,我确认没问题后它自动发布,非常爽。
其他的用例我简单列几个:
- 帮我刷推。它自带的 Bird 是个简单的 X 的 CLI,我给它配了一个自己的推特账号,把想关注的消息源都做成 list 让它每天扫。大事即时推送,小事情每天三次 digest。让 agent 给你推比用订阅 app 的好处是,看到感兴趣的内容可以马上追问,它能交互式地给你解释,甚至深挖。

- 帮我当运维。我的一台 VPS 上面跑着我「末日小屋」(一个个人 Discord 工作站)的服务,我一直弄不清楚这台 VPS 的配置是不是过高了,当时配的应该是 4 核 8G。它帮我做了一天的监控,也看了一下之前的日志,分析出其实每天消耗非常少,CPU 峰值也不高,就建议我降低配置。现在基本上降到最低了,费用从每个月 48 多刀降到了 12 刀。它特别得意,每次问它跟我的交互历史,它都会把这件事拿出来炫耀一番,说帮我降低了 75% 的成本。

- 帮我筛信息。我的「末日小屋」每天给我做的信息汇总,我会让它先去看一遍,把觉得有意思或重要的信息打上它的🦉标记,相当于给我划个重点。

其实还有很多,比如它自己出问题时,我就让它自己去修;比如我在使用过程中发现某个功能需求或 bug,就让它自己写 PR 提交到 Clawdbot 的 repo 里;平时看到新闻也会扔给它帮我分析;甚至还让它去新买的 VPS 上部署一个新的 Clawdbot 实例,按它自己的话说,「用 AI 驾驭 AI」。
Clawdbot 的自定义范围非常大,具备修改自身、增加工作流以及搜索的能力。基本上只要能想到的流程,先不要给它设限,让它放手去做。希望大家也能在不断调教自己的 Bot 的过程中探索出独特的 workflow。
设备与配置
首先是很多人问的:到底需不需要 Mac mini?先说结论:有条件的话最好上,没有肯定也可以用,但作为一个如此强大的个人助理,给它配一个专属的「房间」,既强大又稳定,这样出来的效果才足够好。大家本来就是感受时代前沿的,最后体验打折扣多不值!(厨子🧑🍳别忘给我打广告费)当然,我目前也在研究用其他设备部署,但还处于科研阶段。所以如果大家现在要尝试,推荐搞一台最低配的最新款 Mac mini,老款的话内存最好也大一些。如果你像我一样喜欢折腾本地模型(比如我现在的 Whisper 和 Kokoro 两个模型都是本地跑的),那 32G 内存加 1T 硬盘的配置就够用了。
如果你不用苹果生态的产品,也可以部署在 VPS 上。VPS 肯定会比 Mac mini 更稳定,但功能受限比较大,毕竟你不太可能配置一个跟 Mac mini 性能相当的 VPS,那样的成本远高于买一台 Mac mini。所以,用几美金甚至免费的最低配 VPS 尝试一下,也是完全 OK 的,觉得有意思了再加配置。
设备选择讲完了,然后推荐的是 Tailscale,这是一种组网方式。通俗地说,它可以把你所有的设备连入一个虚拟局域网,类似之前的 WireGuard,但使用体验好很多。它能解决不少问题,甚至顺带解决了 VPN 的需求。因为它有一个模式叫「退出节点」,意思就是流量可以从这台机器出去,说白了就是 VPN 的作用了。
配置 Tailscale 之后,有一个好处就是我可以用 VNC 无缝访问 Mac mini 的远程桌面了。我自己是用 Mac 自带的 Finder 直接访问,效果已经很好了。其他平台还没试过,但 VNC 毕竟是通用协议,估计也差不到哪去。这样你的 Mac mini 就可以找个地方收起来,让它安静地跑着;有条件的话再配一个 UPS,就可以彻底放心了(记得把路由器和光猫也接上,要不然断网了一样白搭)。
除了 Tailscale,我还给它配了单独的推特账号、邮箱账号和手机号。手机号主要是为了用 WhatsApp,不过我看到社区里已经有人能让它给路人打电话了,挺硬核的。
OK,配置上其实不用说太多,因为本身它就带了很多 skills,大家可以慢慢看慢慢尝试,足够大多数人使用了,接下来讲讲配置上的坑。
关于模型
因为我用的版本比较早,感觉还是有一些 Bug。之前无论用 Codex 还是 Claude,授权总是出问题。最近感觉稳定了一些,不知道是不是错觉。模型适配上,我测试过的有 Codex、Claude 的 CLI、Gemini 的 CLI(这个是要打开 APP 的,也就是 IDE 环境),以及我自己把 Gemini 从本地封装的一个 API。这几个我都试过可以用,但效果各有不同,尤其是 Gemini 系列的,之前经常会把 Tool Use 的一些系统信息输出来,体验很不好。用 Codex 呢,整个 Chatbot 就会变得冷冰冰的、贼理性,我也不是很喜欢,我还是喜欢思维比较发散的 Claude 作为日常使用主力,不过 Setup token 模式我一直搞不定,这边贴好了发现 cc 那边挂了,那边重新登录后发现这边失效了,所以现在还是统一用 Claude CLI 的授权。
关于套餐
我现在配的套餐是 Claude Code Max,这也是作者推荐的。具体用 100 刀还是 200 刀的看大家使用强度,因为我还要做很多编程、实验,所以 200 刀正好够用。没额外需求的话,天天聊 100 刀也足够了。如果觉得 100 刀还太贵,那就把 Model 设成 Sonnet 4.5 能抗用一点。
Clawdbot 的灵魂
Clawdbot 的一个特色是持久的记忆体系,能记得你们很长时间的交流。去看它的 Workspace 里,你就会发现各种 .md 文件,它们构成了 Agent 的「灵魂」:
- IDENTITY.md — Agent 身份:名字、物种、性格
- USER.md — 用户档案:名字、时区、偏好设置、工作流配置
- SOUL.md — Agent 人格:语气风格、回复模板、行为边界、关键工作流
- HEARTBEAT.md — 定时任务清单:每次 heartbeat 要做什么
- MEMORY.md — 长期记忆:核心知识、决策记录、待办追踪
- TOOLS.md — 用户自定义的工具使用说明
除了这些记忆文件,还有 Sessions,也就是它跟你聊天的对话历史。Session 机制还挺复杂的,有时根据 Telegram ID 分,有时根据不同的 DM Channel 分,你都可以自己配置。比如在 Discord 里,每一个 Channel 都会是一个单独的 Session。
Session 就像 Context 一样,会越聊越大。这时你可以 New 一个,也可以 Reset 清空,但除非觉得这个 Session 没意义,否则还是留着比较好。我聊了差不多三周也就 40MB,里面应该还有一部分是之前出 Bug 打印的大量系统信息导致的,所以没必要删,留着当记忆其实挺好的,因为它可以自己去搜寻记忆。所以当你 /new 完了,它突然「一脸懵逼」从头开始跟你打招呼时,你就让它去看一下前面的 Session,它就能回忆起之前在干什么。
现在想到的值得说的基本上就这些了,希望这些经验或攻略能帮大家避开一些坑。
我个人特别喜欢这个 Agent 框架,觉得它是真的有自主运行可能性基础的,这样就能培育不同的 SOUL 和工作流,魔改成具备各种各样能力的专业 Agent。所以我像宝可梦里一样给自己定了一个「Agent 训练师」的副职业,希望未来能搞出很多好玩的用例,也希望跟大家多多分享。有时候不用非得是用例,把自己跟它的聊天分享出来也很有意思。
OK,这一篇就说到这,咱们下次见,快去领养自己的 Clawdbot 吧!有什么配置问题、使用问题欢迎随时留言,我尽力。。
👉 GitHub: https://github.com/clawdbot/clawdbot
