昨天用 Claude Cowork 时,发现它操作的是沙盒环境,不能直接执行命令。我心想 Claude Code 不是什么都能干吗?为什么 Cowork 不行?查了一下,还真是——这二者虽然都是 agent,产品理念完全不一样。

下面我用 Anthropic 的产品和 Cursor 举例,类似的 Codex、Copilot 也是同理,就不展开了。

一. Cowork、Claude Code 与 Cursor 的差异

1. Cowork

Cowork 面向的是非技术人员——不懂编程,对 agent 操作文件的风险更是一无所知。万一 agent 乱改了用户的文件,产品可是要背大锅的。

说到 AI 背锅,想起昨天刷小红书看到的一条内容:微博老板发了条微博,说是他的 agent 工具发的。评论区一群人回复:谁说 AI 不能背锅!这不就能背吗!抖机灵归抖机灵,但也说明了一件事——用户对 AI 误操作的担忧是真实存在的。

所以 Cowork 做了一个关键限制:agent 的执行范围被框在沙盒环境里,不能直接在用户电脑上跑命令。代价就是我昨天遇到的情况——要自己复制粘贴命令执行完,再把结果贴回交互界面。

2. Claude Code

Claude Code 是给开发者用的。它直接跑在终端里,拥有完整的 shell 权限——装依赖、改配置、操作任意文件,什么都能干。

代价是:我们得自己把关。操作失误没有安全网。Auto Mode 有安全分类器兜底,但本质上还是你授权它在真实环境里执行。

个人感觉,写代码还是用这种 CLI 工具比较好,不是网上说的极客范,而是真的省事很多,还节省 token——这个后面会讲。

3. Cursor

Cursor 是 IDE 嵌入式方案。它能读取完整项目上下文,在本地执行,本质是「编辑器 + AI」而不是独立 agent(不过 Cursor 最近也强化了 Agent 模式,能自主拆任务、多步骤执行)。

二. Token 消耗为什么这么大

最近几个月发现我的 token 消耗量非常大,Claude 和 Codex 都是 20 刀的套餐,几个小任务就用完了。

分析下来,原因主要有三个:

第一,上下文太长。 中大型项目本身上下文就长,再加上我定的规则比较复杂,以及 agent 的系统提示词,token 消耗很容易上去。

第二,使用方式变了。 去年我会圈出特定文件让 agent 改,今年更激进——一句话说清需求,让 agent 自己拆任务、找文件、执行。agent 猜测意图、与我交互、搜索定位,每一步都在消耗 token。

第三,用错了产品。 这是最关键的一点。虽然都是 agent 产品,但定位和策略不一样。Cowork 会自己调用工具操作电脑、截图分析意图,还有记忆功能——这些都是开销。

这类工作助手最早主打的能力之一就是 Computer Use:帮用户操作电脑、处理文件。听起来很美好,但视觉理解比文本理解贵 10-50 倍。你跟 agent 说「这个界面有什么问题」,它会自己截图、分析内容——每一次视觉调用都是实打实的 token 支出。

还有一个容易忽略的点:Cowork 和 Codex 现在都支持 Memory 了。做过的任务会更新记忆,记忆本身也是一笔 token 开销。看起来是「帮你记住了」,实际上是「帮你花了钱」。

三. 程序员如何节省 token 消耗

  • 用对工具:写代码就用 Claude Code 这类 CLI 工具,别用 Cowork。同样一个需求,Cowork 要截图、分析界面、调用工具,token 消耗可能是 CLI 的好几倍
  • 喂准上下文:别一句话丢过去让 agent 自己猜。圈出相关文件、写清楚约束条件,agent 定位越准,中间的搜索和交互就越少
  • 控制规则长度:项目规则(AGENTS.md、.cursorrules)越长,每次对话带入的 token 就越多。定期清理过时的规则,只保留真正需要的
  • 渐进式加载上下文:特别是 monorepo 项目,模块多、上下文大,别一次性全喂进去。按需引用当前任务相关的模块,减少无关内容的 token 浪费
  • 排除无用文件:package-lock.json、node_modules 这类大文件对 agent 没有参考价值,但会占满上下文窗口。配置好 .gitignore 和忽略规则,别让它们混进来
  • 善用压缩:大部分 CLI 工具都支持上下文压缩,对话太长时主动触发一次,比让它自动压缩效果更好
  • 警惕 Memory:Memory 听起来很贴心,但每次读写都是 token。如果你的任务是一次性的,不需要让 agent 记住,可以关掉这个功能。另外提一点,不知道大家有没有发现,自从加了 Memory,agent 工具并没有更好用了,反而幻觉概览更高了。

四. 总结

这三个工具没有绝对的好坏,关键看你要干什么:

  • 处理日常文件 → Cowork,安全省心
  • 开发者写代码、搞工程 → Claude Code,能力天花板最高
  • 习惯所见即所得 → Cursor,上下文感知最好