工具选好，事才好做——用 AI Agent 做事系列开篇

在"从零构建 AI Agent"系列里，我们花了 7 篇文章，亲手造了一个 Agent。聊天、调工具、记忆、执行代码，一块一块拼起来。那个系列的目的不是造出一个能用的产品——而是搞清楚 Agent 到底是怎么运转的。

理解了原理，就够了。没必要自己造轮子。

这就是这个新系列要解决的问题。

这个系列是关于什么的

不讲原理，不谈架构。

每篇文章聚焦一个真实场景，面向一类真实用户，从头到尾走完整个流程。你是老师，想用 AI 做教学视频；你是公众号写手，想用 AI 提升写稿效率；你是上班族，想用 AI 处理每天堆积的材料——这个系列就是为你写的。

目标只有一个：如果某一篇刚好说到你的痛点，看完就能自己试。

为什么选 OpenCode

现在市面上的 AI Agent 工具已经不少了。OpenAI 有 Codex，Anthropic 有 Claude Code，国内也有通义灵码、Qodework 这类产品。它们各有各的优点，但有一个共同的问题：与特定模型或平台深度绑定。用 Codex，你就在 OpenAI 生态里；用 Claude Code，你离不开 Anthropic。工具本身的逻辑和背后厂商的利益很难完全剥离。

对于一个教学系列来说，这不是一个好的起点。

我希望这个系列的演示工具是中立的——它不替任何一家厂商站台，你用什么模型，它就接什么模型。这就是我选 OpenCode 的原因。它完全开源（MIT 协议），由社区驱动，没有任何商业立场。目前在 GitHub 上有超过 10 万个 star，700 多位贡献者参与开发。你可以随时查看它在做什么，也可以参与改进它。

OpenCode 是什么

一句话：一个开箱即用的 AI Agent，支持终端、桌面应用和 IDE 插件三种使用方式。

它最初是为写代码而生的。但在"从零构建"系列里，我们已经知道：一个具备 MCP、Skill 和 Shell 工具的 AI Agent，本质上是一个通用 Agent——它能做的事情远不止写代码。文件处理、网络请求、调用外部服务、自动化任务……只要能用命令行或工具描述的事，它都可以接手。写代码，很多时候只是它解决问题的一种途径，而不是目的本身。这个系列后续的文章里，你会不断看到这一点。

本系列用**桌面版（Desktop）**演示——界面直观，操作可见，截图也更友好。桌面版目前处于 Beta 阶段，支持 macOS、Windows 和 Linux，可以直接在 opencode.ai/download 下载。

打开之后，你会看到默认的三分布局：左侧是对话历史，中间是文件编辑器，右侧是文件浏览器。这个布局是为写代码设计的，方便边聊边看代码改动。

OpenCode 默认三分布局

如果你不需要写代码，右上角有个布局切换按钮，点一下就能切换到更简洁的对话模式——左侧是工作目录和会话列表，中间是对话区，右侧显示文件变更。这个系列大部分时候我们用这个布局演示。

切换后的简洁布局

左侧还有一个重要概念：工作目录。OpenCode 的每个会话都绑定一个目录，Agent 的所有操作——读文件、写文件、执行命令——都在这个目录里进行。做不同的任务时，切换到对应的目录就行。

关于 OpenCode 的更多用法，官方文档（opencode.ai/docs）写得很详细，网上也有不少教程，这里不再展开。

它不绑定任何一家 AI 厂商。Claude、ChatGPT、Gemini，甚至本地模型，都可以接入。如果你已经订阅了 ChatGPT Plus 或 GitHub Copilot，直接用你的账号登录就行，不用额外付费。

内置两个主要 Agent：Build（默认，可以读写文件、执行命令，适合真正干活）和 Plan（只读模式，适合分析和规划）。这个系列大部分场景用的是 Build。

从下一篇开始

下一篇，我们做一件具体的事——对一个和各种材料的打交道的文员，如何用 OpenCode 提高你的工作效率。

不是讲理论。是真的做一遍，把遇到的问题、踩过的坑，都写进去。

这个系列是关于什么的 ​

为什么选 OpenCode ​

OpenCode 是什么 ​

从下一篇开始 ​

这个系列是关于什么的

为什么选 OpenCode

OpenCode 是什么

从下一篇开始