记录一下自己现在使用 AI agent 工具时的判断。这里说的 agent 主要是能读写项目文件、调用终端、使用 MCP / skills / rules 的那类工具,不是普通聊天机器人。

工具形态

现在常见形态大概有这么几种:

  • 编辑器插件:比如 GitHub Copilot。侵入小,但上限受插件形态限制。
  • AI 集成编辑器:比如 Cursor。体验做得完整,但要迁移编辑器和配置体系。
  • CLI agent:比如 Claude Code、Codex CLI。更贴近真实开发环境,也方便和现有编辑器配合。
  • GUI / App agent:比如 Codex app。上手简单,但能不能融入本地工作流要看产品设计。

我现在还是更偏向 CLI。主要原因是已经重度使用 VSCode,不想为了 AI 功能迁移整个编辑器;而 CLI 本来就适合配合 Git、终端、项目脚本和现有编辑器。

模型选择

在可选范围内,我倾向于直接用最好的大模型。贵一点可以接受,差模型带来的返工和误改更麻烦。

写代码类 agent 会放大模型差距。普通聊天里看着还行的模型,进真实仓库以后经常会出这些问题:

  • 不理解已有代码结构。
  • 乱改无关文件。
  • 无法稳定执行多步任务。
  • 忽略测试结果或命令输出。
  • tool call、stream、长上下文、结构化输出兼容性不足。

所以成本不能只看 token 单价,还要看一次任务要返工几轮。

订阅和 API

能用官方订阅或官方 API,就尽量走官方路径。

来路不明的小中转站或聚合服务我基本不用。风险很直接:

  • 模型名和实际模型不透明。
  • 数据安全不可控。
  • 账号、密钥、请求内容存在泄露风险。
  • 服务随时跑路或限速。
  • tool call、stream、thinking、cache 等 agent 关键能力不完整。

已经在用官方订阅 / 官方 API 的情况下,不要为了“统一入口”把账号登录链路硬塞进 API 中转工具。订阅登录和 API key 是两套东西,混用只会增加账号风控和授权风险。

工具选择

Cursor 这类 AI 编辑器我会继续观察,但暂时不作为主力。不是说它不好用,而是我本来就能直接使用官方模型和独立 agent,迁移编辑器这件事的收益没有那么确定。

目前比较舒服的组合是:

  • 日常编辑:继续使用 VSCode。
  • 复杂项目修改:使用 Claude Code / Codex CLI。
  • 需要官方 GUI 工作流时:再使用 Codex app。
  • 需要团队共享项目规则时:维护 AGENTS.md / CLAUDE.md
  • 需要复用流程时:维护 skills。

配置习惯

  • 项目事实写进项目说明文件,例如 AGENTS.mdCLAUDE.md
  • 可复用流程写成 skill,不要把长流程堆进常驻说明。
  • API key 只放用户级环境变量、系统凭据管理器或软件自己的 secret storage。
  • 第三方 API 服务先用最小请求测通,再放进 agent 工具里配置。
  • agent 工具比普通聊天工具更挑兼容性,重点测试 tool call、stream、长上下文和模型专有字段。