Wink Pings

一周烧掉14亿Token后,我总结了10条OpenClaw实战经验

一位开发者在密集使用OpenClaw一周后,分享了从模型选择、规则制定到安全审计的完整避坑指南。

![一张显示终端命令执行结果的截图。背景为黑色,文字为白色。顶部显示了“Background terminal finished with set -euo pipefail start_epoch=$(dat...”的信息,中间部分显示“Worked for 3m 28s”,下方是token使用统计数据:“From your local Codex logs, you've used 1,477,592,940 tokens this week... the practical range is about 1.48B tokens。”](https://wink.run/image?url=https%3A%2F%2Fpbs.twimg.com%2Fmedia%2FHBoAnmbWUAAOKYs%3Fformat%3Dpng%26name%3Dlarge)

看到终端里显示的14.8亿token消耗量,才意识到这一周的高强度调试有多疯狂。最初以为设置好OpenClaw就能自动运转,结果前两周完全是在当保姆——看着AI重复同一个答案八次,或者陷入该用空格还是制表符的无尽辩论。

真正让AI代理从玩具变成生产力工具的关键,在于停止把它当作聊天机器人,而是视为需要精心设计的基础设施。以下是烧掉14亿token换来的十条经验。

### 1. 日常任务选对模型能省80%成本

最初所有任务都跑在Opus或Codex上,连心跳检测、状态查询这种基础操作都用最贵的模型。直到发现新发布的Sonnet 4.6——在OSWorld基准测试中达到72.5%,接近Opus 4.6的72.7%,但成本只有五分之一。

如果预算紧张,可以切换到OpenRouter上的Kimi K2.5,每百万token成本约0.6/2美元。建议设置分层配置:主力模型处理日常任务,备用模型应对复杂场景。

```json

{

"agents": {

"defaults": {

"model": {

"primary": "anthropic/claude-sonnet-4-6",

"fallbacks": [

"anthropic/claude-opus-4-6",

"openrouter/moonshotai/kimi-k2.5"

]

}

}

}

}

```

### 2. 没有规则约束的AI会干出各种蠢事

刚安装的OpenClaw会循环执行失败方案、乱改配置文件、跳过文档直接幻想解决方案。解决方法是在workspace/skills/目录下创建SKILL.md文件,给AI设定行为护栏。

最有效的规则是:**任何修改前必须先阅读文档**。有网友开发了DocClaw技能,强制AI在执行代码变更前进行侦察阶段,错误率直接减半。

### 3. 三个文件让AI在你睡觉时持续工作

- **Todo.md**:自我扩展的任务清单。睡前给AI一个大任务,它会分解成子任务并更新状态

- **ProgressLog.md**:晨间简报。记录每次构建-测试循环的结果和学习内容

- 操作系统配置文件:定义执行循环、计划纪律和质量门控标准

### 4. 通宵运行靠定时任务,不是开着窗口

关闭会话窗口后AI会丢失所有状态。需要设置cron任务在特定时间唤醒AI:

```bash

openclaw cron add --name "overnight-2am" --cron "0 2 * * *" --message "检查Todo.md,继续未完成任务"

openclaw cron add --name "overnight-4am" --cron "0 4 * * *" --message "更新进度日志"

openclaw cron add --name "overnight-6am" --cron "0 6 * * *" --message "总结通宵工作成果"

```

### 5. 所有重要内容都要持久化存储

长会话会被压缩,AI会悄悄丢失早期决策和状态。解决办法是把所有关键信息写入工作区的markdown文件,就像给每天早晨都失忆的员工准备入职文档。

### 6. 模型能力比框架更重要

聊天质量与代理质量完全不同。有的模型能写诗却在调用工具时卡壳。当前各模型在代理任务中的表现:

| 模型 | 代理质量 | 工具调用 | 成本(每百万token) |

|------|----------|----------|------------------|

| Claude Sonnet 4.6 | 优秀 | 可靠 | 3/15美元 |

| Claude Opus 4.6 | 优秀 | 可靠 | 15/75美元 |

| GPT-5.3-Codex | 优秀 | 可靠 | 专业订阅 |

| Kimi K2.5 | 良好 | 可靠 | 约0.6/2美元 |

| MiniMax M2.5 | 良好 | 可靠 | 0.3/1.2美元 |

### 7. 从一个工作流开始,做到完美再扩展

不要同时设置邮件+日历+Telegram+网页抓取+定时任务。每个集成都是独立的故障点。先从单一的晨间简报定时任务开始,稳定运行一周后再添加下一个功能。

### 8. 开发与运维分离

- Codex/Claude Code用于开发:写代码、调试、部署功能

- OpenClaw用于运维:监控、调度、通信、自动化

保持两者分离,避免上下文污染。

### 9. 记忆系统让AI不再从零开始

OpenClaw有内置向量记忆功能,还有Claw Vault和Supermemory等高级方案。有开发者自建的Gigabrain系统已索引911+条记忆,让AI记住什么方法有效、什么会出错,大幅提升效率。

### 10. 安全审计必须放在第一位

OpenClaw有过真实安全事件:CVSS 8.8的远程代码执行漏洞,Bitsight和Censys团队发现3万多个暴露实例,ClawHub大规模供应链投毒活动(约12%的技能库被植入恶意代码)。

```bash

# 健康检查+自动修复

openclaw doctor --deep --fix --yes

# 安全审计

openclaw security audit --fix

```

![一张显示社交媒体互动统计的截图。背景为黑色,左上角有灰色的“ews”文字,下方有两个图标:粉红色心形图标旁标注29,蓝色书签图标旁标注31。](https://wink.run/image?url=https%3A%2F%2Fpbs.twimg.com%2Fmedia%2FHBoHOFkXYAAreug%3Fformat%3Dpng%26name%3Dlarge)

有网友评论道:“这才第四天,我感觉自己像只拿着枪的猴子。”很多人刚开始都有类似经历。关键是要接受设置过程本身就是工作——编写Soul.md是产品工作,调整模型路由是基础设施工作,设置定时任务是运维工作。

14亿token消耗的背后,是AI代理终于能在睡眠时交付真实工作成果。系统设置就是护城河,大多数人都在到达这个阶段前放弃了。

正如另一位使用者所说:“这种透明度帮助整个生态系统升级。”开源分享真实经验,比任何完美演示都更有价值。

发布时间: 2026-02-21 12:16