Claude Code 团队是怎么工作的

跨国串门儿计划播客：最近听到的非常实用、信息不拖沓的 Claude Code / Anthropic 团队如何运营组织、如何工作的分享。非常适合身处或正在管理构建 AI Agent 产品的团队朋友听。里面有详实故事讲述团队分工、大家的做事方式以及变化，很实用。

这篇重点放在节目里那些能落到团队方法的细节，再用 Anthropic 后续公开资料补一层背景。

播客内容属于团队成员口述经验，不等同于 Anthropic 官方制度文件。

节目与公开资料

播客入口：https://www.xiaoyuzhoufm.com/episode/681f316cb7c8a9962c640438

小宇宙页显示，这一期是《跨国串门儿计划》第 115 期，发布时间是 2025 年 5 月 10 日，标题是《Claude Code 深度探秘：对话 Anthropic 核心团队成员》。节目说明也写明了它是对 Latent Space 那期 Claude Code: Anthropic's CLI Agent 的翻译克隆版本。

《跨国串门儿计划》第 115 期页面截图

播客与补充资料：

小宇宙页面（播客平台）：https://www.xiaoyuzhoufm.com/episode/681f316cb7c8a9962c640438
Latent Space 原始节目与转录（播客 / 社媒发布）：https://www.latent.space/p/claude-code
Claude Code 官方总览（官方文档）：https://docs.claude.com/en/docs/agents-and-tools/claude-code/overview
How Anthropic teams use Claude Code（官方案例）：https://www.anthropic.com/news/how-anthropic-teams-use-claude-code
Running an AI-native engineering org（Anthropic 活动页）：https://claude.com/code-with-claude/session/sf-running-an-ai-native-engineering-org
How Anthropic's product team moves faster than anyone else | Cat Wu（播客）：https://www.lennysnewsletter.com/p/how-anthropics-product-team-moves
对应的中文翻译播客页（Apple 播客页）：https://podcasts.apple.com/cn/podcast/claude-code-产品负责人-anthropic-产品团队如何快速迭代/id1831665175?i=1000763377762

如果只听小宇宙这一期，很容易把它当成一档"Claude Code 功能介绍"。几份材料放在一起看，文章更关心一件事：一个 AI 原生团队怎样把产品、工程、研究和内部使用者放进同一条反馈链里。

团队分工：需求入口不只 PM

按 Latent Space 这期转录，Claude Code 早期核心团队至少可以明确看到几层角色：

Boris Cherny：创始工程负责人，最早的原型推动者
Cat Wu：产品负责人，负责路线梳理、跨部门清障、对外发布配合
Sid、Ben 等早期成员：和 Boris 一起把内部实验推成正式团队
内部研究员与工程师：最早一批高频用户，也是最重要的反馈来源

播客里有个细节很能说明这支团队是怎么长出来的。团队并没有先把 org chart 画满再去招人。Boris 做了一个能在终端里跑的原型，内部使用数据迅速上涨，团队才逐步补齐 PM 和更多支持角色。Cat Wu 也是因为自己在用早期版本做数据可视化、持续给反馈，后来直接被拉进核心团队。

不少传统团队会由 PM 定义需求，再排期开发，上线后再收反馈。Claude Code 的起步顺序反过来了：工程师做出一个足够有用的原型，内部高密度使用者很快把问题和机会都暴露出来，PM 再把已经浮现的方向整理清楚，把发布、法务、营销、协同这些障碍清掉。很多新功能，本来就是团队成员给自己补工具时长出来的。

Cat Wu 在 Latent Space 那期里说自己是 "light touch PM"。她的工作重点不在把 roadmap 层层拆成任务、再逐项下派，而是做三件事：

观察需求有没有持续生命力；
判断哪些方向和模型未来几个月的能力曲线一致；
让工程团队别被非核心障碍拖慢。

这也是为什么她后来在 Lenny's Podcast 那期里继续强调，Claude Code 团队很多方向都来自最接近问题的人直接动手试出来，再由团队收束。

反馈入口：研究员、工程师、设计、法务都算"产品用户"

只看播客，你会觉得 Claude Code 主要是给工程师用的。Anthropic 2026 年那篇《How Anthropic teams use Claude Code》把这件事补完整了：在 Anthropic 内部，Claude Code 早就成了跨职能工作界面，不再只是工程团队工具。

官方案例里能看到的使用群体包括：

Product Engineering
Product Design
Security Engineering
Inference team
Data Infrastructure
Growth Marketing
Legal team
Data scientists

这意味着他们拿到的"用户反馈"已经不只局限于 bug 反馈，还包括不同职能的工作流反馈。

比如：

Product Engineering 把它当成排查 bug、定位改动入口的第一站；
Product Design 不只让它写测试，还会在设计阶段让它帮忙枚举错误状态、异常情况和逻辑流；
Security Engineering 用它处理 incident、写 runbook、推 TDD 流程；
Growth Marketing 拿它批量处理广告文案和自动化流程；
Legal team 甚至会用它做内部流程工具原型。

对 AI Agent 团队来说，这里有个很重要的点：高价值反馈，往往来自那些把产品接进自己真实工作流的人。

如果一个团队内部只有产品经理和工程师在试用，你拿到的反馈通常还是功能级的；但当设计、法务、营销、研究、数据团队都在用时，你拿到的就是工作方式级的反馈。这两种反馈的密度完全不同。

他们怎么决定做什么

自发使用跑出来后，团队才扩大投入

Boris 在原始播客里讲得很直白：Claude Code 一开始没有什么宏大总计划，就是一个实验。后来之所以逐步变成正式产品，是因为内部使用量涨得太快，已经很难忽视。

这背后是一种很克制的判断标准：真实采用跑出来，团队再扩编。

做法很直接：让一个足够小的东西先在真实环境里跑，等使用强度自己长出来，再加人、加支持、加发布节奏。

这条逻辑在 Cat Wu 后来的访谈里也能对上。她提到 Anthropic 内部很多产品迭代，不再按半年、一季度那种节奏去算，而是尽可能压到周、甚至天。推动节奏变快的，是减少了"先证明一切、再允许动手"的组织惯性。

围着模型三个月后的能力来想路线

Latent Space 里另一个很有意思的点，是 Cat Wu 说团队会一起想：模型在三个月后会更擅长什么？

这个问题对 AI 产品团队特别重要，因为很多功能如果只按今天的模型能力来设计，三个月后就会显得过度补丁化；反过来，如果完全等模型成熟再做，窗口可能已经过去了。

所以他们想的是基于近期能力跃迁仍能成立的最小设计，尽量少做只对今天有效的局部补丁。

这也解释了 Claude Code 为什么一直强调：

做简单的事；
做能工作的最小结构；
尽量让文本 I/O 成为核心接口；
不急着把一大堆复杂交互固化进 UI。

因为模型能力变化太快，结构越轻，越容易跟着模型进化；结构越重，越容易在下一轮能力变化里变成包袱。

优先级讨论，不只看用户想要什么

Cat Wu 在 2026 年那期产品访谈里还提到另一层判断：如果碰到冲突优先级，团队会看哪件事更符合 Anthropic 的总体使命。

这类判断在 AI 团队里很有用。常见情况是：

用户要的很多；
模型能做的越来越多；
团队每周都能冒出十几个"马上能做"的方向；
结果每件都沾一点，节奏却越来越散。

有一个更高层、能压住局部最优的判断标尺，会让很多拉扯少掉。Anthropic 这里用的是使命；小团队未必有这么大的叙事，但至少也该有一条比单次需求更高的取舍原则。

他们怎么推进：事情跑起来，流程再跟上

产品推进靠持续清障，不靠完美排期

Cat Wu 在播客里的角色，很像一个清障型 PM。她说自己更多是在确保 legal、marketing 这些事情不挡路。这个表述背后包含的是一套很成熟的协作观：

强产品感不只属于 PM；
工程师可以直接提出产品方向；
PM 的价值不一定在"提出更聪明的点子"，而在"让正确的人推进时不被流程卡住"。

对 AI Agent 团队来说，这种分工尤其重要。因为很多好功能不是在需求讨论会上想出来的，往往是工程师在真实使用中"顺手发现必须补一个东西"。

如果 PM 还把自己放在唯一需求入口的位置，速度通常会掉得很快。

并行、自动化、可组合，是他们默认的推进方式

无论是原始播客还是后续 Every 的访谈，Claude Code 团队都反复强调一件事：他们更愿意把它做成 Unix utility 那类可组合工具。

这个理念会直接影响团队自己的工作方式。

在他们眼里，产品是一组可组合的能力：

可以并行跑多个 session；
可以接进 tmux、GitHub Actions、CI、hooks；
可以通过 slash commands 把高频动作压成短命令；
可以让 subagents 分工，再互相挑错。

Every 那篇访谈里提到 Boris 会让多个 subagents 并行做 code review：有的查风格，有的看历史实现，有的找明显 bug，之后再开第二轮 agent 专门去质疑第一轮结论，尽量减少误报。

这说明"多 agent"在他们那里已经是日常工作结构的一部分：并行审阅、相互校验、自动初筛、人类最终把关。

这对很多 AI Agent 团队是很直接的提醒：别急着把 agent 当万能执行者，更稳的做法往往是把它放进一个有校验、有分工、有人工兜底的链路里。

团队会把共识写进环境

Every 那篇访谈里还有两个很实用的点：

用共享 settings.json 预先批准常见命令、拦掉高风险操作；
让 Claude 写 task diary，再蒸馏成可复用的经验。

这两件事都在做同一件事：把团队经验外化。

很多 AI 团队内部都有一些 tacit knowledge，比如：

哪些命令可以放行；
哪些路径不要碰；
什么样的日志有价值；
哪类任务适合并行拆；
哪些修改一定要人工过一遍。

问题是，如果这些经验只留在少数资深成员脑子里，团队规模一扩大，产出就会马上不稳定。

Claude Code 团队的思路，是尽量把这些东西变成：

配置；
slash commands；
hooks；
共享记忆文件；
自动 review 流程。

这比"写一篇大家都不看的 wiki"更有效，因为它直接进入了执行环境。

他们怎么处理变化

产品默认会变，所以接口要轻

Claude Code 的很多设计，都能看出他们默认"变化会非常频繁"。

例如播客里反复提到的几件事：

记忆用最简单的 Markdown 文件实现；
上下文压缩直接让 Claude 自己总结；
规划能力也尽量用文本接口承载；
工具尽量少而通用，能删就删。

这种做法是在主动给变化留空位。AI 产品和传统 SaaS 功能树不太一样，很多今天看起来必须存在的中间结构，下一代模型可能直接就吞掉了。

Apple 播客那页对 Cat Wu 访谈的中文摘要里，把这一点说得很清楚：有些功能在早期像"拐杖"，是为了补模型短板；一旦模型长出来，这些额外结构就该逐步移除。

他们看重的是功能能不能继续成立。早期可以拿临时结构补短板，模型长出来后就把这些结构撤掉。

用户的"误用"也是需求线索

Every 那篇访谈里，Boris 提到一个非常典型的产品判断：把产品做得足够可 hack、足够开放，让用户能拿去做原本没设计过的事情；然后观察这些"误用"，再判断里面有没有稳定需求。

这和 Claude Code 自己的成长路径是同一条线。最早它也是内部实验，后来因为大家用得越来越多、用法越来越野，才逐渐被认定为值得正式投入。

对 AI Agent 产品尤其如此。因为大家还在共同摸索工作界面，很多价值不是从设计图里推出来的，而是在使用中长出来的。

一个团队如果只统计"用户有没有完成既定流程"，往往会错过更大的机会。更应该看的还有：

用户把它接到了哪些本来没想到的地方；
哪些职能的人开始自学使用；
哪些功能起初不在主流程里，却高频出现在边缘工作流里。

工具变了，流程也得重写

Fiona Fung 在 Running an AI-native engineering org 那场分享里的简介写得很直接：当 agentic coding 从个人工具变成组织默认方式，流程会先被改写；被打碎的往往是 review、ownership、hiring 这些原本看似稳定的组织规则。

很多团队会以为"AI 提效"就是同样的人、同样的流程、只是写得更快。但如果产出速度、并行能力、跨角色协作方式都变了，原来的 review、职责边界、招聘标准，很可能就不再适配。

变化管理更该追问的是：

代码审查还该怎么分层；
谁对 agent 产出的结果负责；
交付周期缩短后，发布机制要不要改；
招人时到底更看重写代码能力、判断力，还是编排 agent 的能力。

对 AI Agent 团队的启发

如果要把上面的材料带回自己团队，可以从下面几件事试起。

1. 内部离不开的原型，比满编团队更重要

Claude Code 的起点是一个被内部高频采用的原型，组织设计是后补的。对小团队来说，更重要的是证明"有人离不开"，再讨论要不要扩编。

2. PM 的工作，很多时候是清障

当工程师、研究员、设计师都在用产品时，很多最好功能来自使用现场。PM 更该做的是提炼方向、处理依赖、协调对外发布，不必把自己卡成唯一需求入口。

3. 反馈体系要跨职能

如果你的 AI Agent 只在工程组内流转，你得到的只是工程反馈；如果它进入销售、运营、法务、设计、数据团队，你得到的才是工作流反馈。后者对产品演化更关键。

4. 用轻结构对冲模型变化

别太早把大量复杂机制焊死。模型还在快速进化，今天的补丁功能，明天可能会变成负担。能用简单文件、文本接口、可替换模块解决的问题，先别上过重结构。

5. 把团队经验写进环境

共享设置、自动 review、slash commands、hooks、任务日志，这些都在做同一件事：让团队能力可复制。AI Agent 团队越早把经验外化，越不容易在规模稍微变大时掉速。

6. 自动化要能稳定托付

Apple 播客页对 Cat Wu 访谈的摘要里有一句话很能说明问题：95% 的自动化，很多时候等于没有自动化。因为只要人还得时刻盯着最后那 5%，流程就没有真正交出去。

这句话是在提醒团队尽快做判断：如果它还只是辅助，就按辅助来设计；如果它要接管流程，就做到能被放心托付。最消耗人的，往往是长期停在中间状态。

引用说明：这是一组口述资料

小宇宙第 115 期是对外文播客的翻译克隆版；
Latent Space 与 Lenny's Podcast 的主体内容，都属于嘉宾口述；
Apple 播客页里的中文摘要，是二次翻译与整理；
Anthropic 官方文档、官方新闻稿、官方活动页，属于更容易核验的一手公开资料。

所以这篇文章适合拿来理解 Claude Code 团队的协作方式和产品推进习惯，不适合把某一句话直接上升成 Anthropic 的正式制度。

比较稳妥的读法是：用播客理解他们怎么想、怎么协作，再用官方资料核对哪些做法已经体现在正式产品与公开案例里；带回自己团队时，只保留那些确实能用的结构。

一个 AI Agent 团队复盘提纲

如果你想拿这篇去复盘自己的团队，可以直接照下面这组问题开会：

一、分工

我们现在的产品方向，主要是谁在提出？
工程、设计、研究、运营、销售里，谁是真正高频使用者？
哪些角色在给反馈，哪些角色其实还没被接进来？

二、优先级

我们现在决定做什么，靠的是老板判断、客户催促，还是实际使用强度？
有没有一条比单次需求更高的取舍原则？
我们做的功能，有多少是在为三个月后的模型能力做铺垫？

三、推进方式

哪些工作还在串行推进，本来可以并行？
哪些高频动作已经写成命令、脚本、模板、hook 或共享配置？
现在的 review 机制，适配 agent 产出了吗？

四、变化管理

我们有哪些"临时补丁"已经该撤掉了？
用户有没有把产品拿去做我们原本没设计过的事？
这些"误用"里，哪些会变成下一步产品机会？

五、团队能力

团队里哪些经验还只掌握在少数人脑子里？
哪些任务已经能放心托付给 agent，哪些还只是辅助？
如果今天团队规模翻倍，我们的工作方式会不会立刻失稳？

如果这些问题还没系统聊过，拿这五组问题开一次会，通常比继续补功能列表更有用。

Claude Code 团队是怎么工作的 ​

节目与公开资料 ​

团队分工：需求入口不只 PM ​

反馈入口：研究员、工程师、设计、法务都算"产品用户" ​

他们怎么决定做什么 ​

自发使用跑出来后，团队才扩大投入 ​

围着模型三个月后的能力来想路线 ​

优先级讨论，不只看用户想要什么 ​

他们怎么推进：事情跑起来，流程再跟上 ​

产品推进靠持续清障，不靠完美排期 ​

并行、自动化、可组合，是他们默认的推进方式 ​

团队会把共识写进环境 ​

他们怎么处理变化 ​

产品默认会变，所以接口要轻 ​

用户的"误用"也是需求线索 ​

工具变了，流程也得重写 ​

对 AI Agent 团队的启发 ​

1. 内部离不开的原型，比满编团队更重要 ​

2. PM 的工作，很多时候是清障 ​

3. 反馈体系要跨职能 ​

4. 用轻结构对冲模型变化 ​

5. 把团队经验写进环境 ​

6. 自动化要能稳定托付 ​

引用说明：这是一组口述资料 ​

一个 AI Agent 团队复盘提纲 ​

一、分工 ​

二、优先级 ​

三、推进方式 ​

四、变化管理 ​

五、团队能力 ​