“一个亿的小目标,和 AGI 的大目标。”
采访丨程曼祺
整理丨姚一楠
2025 年 6 月,Meta 以 143 亿美元收购 Scale AI 49% 股权,招募 28 岁的 Scale AI 创始人亚历山大·王(Alexander Wang);这之后,Meta 天价招募顶尖 AI 研究员,开出了最高 4 年 3 亿美元惊人薪资。
这些新血液和 Meta 原本的部分 AI 团队在 6 月底正式组成 Meta “超级智能实验室”(Meta Superintelligence Labs,MSL),由亚历山大·王和前 GitHub CEO 奈特·弗里德曼(Nat Friedman)共同担任负责人。
就在大家期待 Meta 一雪 Llama 4 的失利时,9 月,Meta AI 团队离职潮爆发:既有已在 Meta 工作了 12 年、参与 PyTorch 构建的 Bert Maher(加入了 Anthropic)等老员工离开;也有两位加入不足 2 个月的 OpenAI 研究员又重返 OpenAI(Avi Verma 和 Ethan Knight)。
本期节目,我们邀请了 Pokee AI 创始人朱哲清(Bill Zhu),他曾在 Meta 工作 7 年多,担任 Meta “应用强化学习” 部门的负责人,去年 10 月开始创业,做以强化学习为内核的 Agent。
Pokee AI 在今年 7 月完成了 1200 万美元的种子轮融资,前不久被美国知名科技投资机构 a16z 列入智能体工作流的标杆企业目录。
朱哲清分享了他观察到的/硅谷顶尖 AI 人才的流动趋势,Meta、Google、OpenAI、Anthropic 等美国核心 AI 公司的组织特点,和由此延伸的业务策略;以及,作为一个 AI 创始人,如何在今天打造原生于 AI(AI-Native) 的新组织。
以下是播客的文字整理,有部分精简。
Meta 曾是创业氛围最浓厚的硅谷大厂,但疫情期间变臃肿
晚点:Meta 近期经历了天价挖人到人才流失的戏剧性转折,甚至有 2 名刚被挖来不久的 OpenAI 研究员又回了 OpenAI 。你认为这是怎么发生的?
朱哲清:硅谷人员流动频繁,但三个月内就跳槽的不多,更何况他们在 Meta 拿到的薪资包比在 OpenAI 等公司更优厚。这次有人快速离开,可能是不习惯 Meta 的环境。
我 2017 年加入的前两年,Meta 是美国最有创业氛围的大公司:写代码、审批、上线到生产环境,整个流程只要几小时,非常高效。疫情后,流程没变,但 Meta 组织更臃肿了,VP 层级变多,每次迭代都要经过多个 VP 审批,可他们往往既不懂项目也没时间,只是形式化地审核一遍,留下一堆批示,搞得大家都很不爽,很多人因此离职。
同时,Meta 的内部 “政治斗争” 比较多。这次离职的员工很多来自 OpenAI 或 Google,他们往往不擅长在有政治斗争的环境里工作,会觉得在浪费时间。而这类高层级人才的选择很多,往往被十几家公司同时抢,他们会快速离开就不意外了。
晚点:扎克伯格现在让 28 岁的亚历山大·王来负责超级智能实验室,是不是在尝试改变,试图重新打造一个更扁平、更接近创业文化的组织?
朱哲清:我认为这是他的初心。但 Super Intelligence Lab 已有 5000 人,而现在一个 SOTA 模型(State Of The Art 模型,指在某一任务/数据集上,当前公开评测中表现最好的模型)的核心训练团队其实不超过 50 人,其中二十多人做模型设计和调优,二十多人负责基础设施和工程支持,还有一些产品经理思考功能方向,比如模型哪些部分重要、哪些不重要。剩下的组织都在做相对边缘化、不是主线的产品。
所以,如果 Meta 的目标是让 Llama 超过 GPT-5,它可能需要的是一个 150 到 250 人的核心团队,把事情做到极致,而不是一个 5000 人的大团队,那反而会互相掣肘。
我还怀疑内部存在 “赛马” 现象——不是被动,而是主动的。Meta 的文化非常 bottom-up,会启动类似的方向。产品有明确的 ownership,但模型训练没有。谁都能尝试,只要训练结果好就行。这种缺乏 ownership 的情况让管理和协调更难,因为多个团队可能同时做同样的事。
亚马逊就没有太多这种问题,因为他们的每个事业部都有自己的研究团队,资源和目标都绑定在具体产品上。即使两个团队做出类似模型,也能落到各自的产品里。
Google 更依赖在研究上公认有权威的人来定方向,其他人配合执行,相对 top-down。这减少了内部不服气、各自开工的问题。
OpenAI 和 Anthropic 则是使命驱动。他们会先设定清晰目标:模型需要达到什么能力,对哪些 benchmark 负责。然后全公司都围绕这个目标努力,不会出现多个团队重复做同样的事情。而且他们团队规模本来也不大,更需要集中力量。
晚点: Meta 也有很多产品,为什么它不能和亚马逊一样,每个产品线的研发落到自己的场景里?
朱哲清:核心原因在 Meta 的组织架构里,部门对产品掌控力不强。组织内所有代码库和基础设施完全开放,任何团队都能修改别人的代码,这导致团队对产品缺乏处置权。
其次,部门的财务自主权很弱。 VP 的预算很有限,无法做大规模的资源配置。例如他没法独立决定给谁多少奖金,花多少钱在数据中心,也没法裁掉部门一半人然后集中资源到算力。这导致 Meta 的团队只能在现有框架下行事,很难像创业公司那样做出战略性改变。
晚点:这种组织形态给 Meta 带来的好处是什么?
朱哲清:好处是速度很快。举个例子,我训模型时发现 Facebook Feed 的推荐模型有问题,可以直接找团队沟通,甚至自己改,最后不到半年就把模型完全替换了。在正常流程里,跨团队改模型早被 VP 卡死了。
它的缺点也很明显:2017 年到现在公司人数翻了数倍,扩张到七八万人。一件事原本一个人做,现在五个人做。绩效要分摊,利益分配不均,容易变成政治斗争,这在大公司很常见。
举个例子:假设 A 团队目标是把某模型推广到全公司所有产品线,B 团队目标是让某产品 DAU 提升 2%。如果 B 团队产品用了 A 团队的模型,结果 DAU 确实涨了 2%,那功劳算谁的?双方就会为 credit 争夺。因此 B 团队可能会自己重做模型,而不是直接用 A 团队的成果。
晚点:其实 OpenAI 和 Anthropic 都是上千人的团队,就不存在团队分工矛盾吗?
朱哲清:他们是所有人有一致目标,这是初创公司的关键。哪怕团队有几千人了,只要大家不在乎功劳分配,政治斗争就不存在。
晚点:怎么在千人规模的团队做到目标一致的?
朱哲清:有一个临界点,即是否所有员工都在做真正重要的工作。
所有公司事件中大致可以分为重要的 20% 和不重要的 80% 。如果所有人都在做重要的 20% ,还很忙,那没问题;但一旦有人在做 80% 的次要工作,他们就想变得重要。
大公司为了维持财报、营收和股价,会招人来做只能带来 1% 增长的事情,因为即使极小的营收增长也能覆盖人力成本。这些人也想做重要的事情,政治斗争就产生了。
晚点:以 “使命驱动” 看,怎么理解 Ilya 和 Sam Altman 的分裂?
朱哲清:当重要成员的个人使命出现差异时,使命驱动的公司容易分崩离析。因为唯一的纽带不是金钱,而是使命。成员使命不同,公司自然分裂;夸张点说利益绑定才最牢靠。
OpenAI 里 Sam Altman 和 Ilya 的根本分歧在于:Sam 关注用户增长;Ilya 则更关注模型安全性和可靠性。两条路都需要投入大量人力和资源,公司只能选一条,于是最后有人要离开。
晚点:关于 Meta 的人事动荡,除了刚才的深层原因,也有人提到亚历山大 · 王的风格过于强势。
朱哲清:我倒觉得不是个人风格,而是架构错配。在 AI 领域,CEO 不直接负责研究。比如在 OpenAI,Sam Altman 是 CEO,Mira 曾是 CTO,但也有其他人带研究团队—— Greg Brockman、John Schulman、Noam Brown 等,他们知道研究方向往哪里走。而现在 Meta 的情况像是让 Sam Altman 直接管研究团队。
还有个细节,这轮热潮之后才成长的年轻研究者很难真正服众;你需要的是德高望重又和公司路线一致的人才。但这种人很难找。
晚点:Ilya 离开之后,OpenAI 由谁来扮演这样的技术领军角色?
朱哲清:其实有好几个人。比如 Noam Brown 带多智能体方向;还有 Schulman ,他主要带 RLHF ( Reinforcement Learning with Human Feedback,人类反馈强化学习)以及 RL( Reinforcement Learning,强化学习);还有 Jan Leike 。他们过去做出重要成果,而且和公司的研究方向一致,所以大家愿意跟随;但如果让新人直接带大方向,就难服众。不过除了 Noam Brown,刚才提到的人都离开了。
科学家型 vs 工程型人才:工程型人才会决定公司未来 2-3 年的发展,科学家型人才会决定公司未来 10 年的发展,但是你有可能活不过 2-3 年
晚点:那些在 ChatGPT 有重要研究成果的人,他们普遍多少岁?
朱哲清:一般在 35-40 岁。常见情况是,这个人做了几个奠基性的研究,于是成了这个方向的领军人物。比如 David Silver 是 AlphaGo 第一篇论文的一作; Schulman 提出了 PPO 算法(Proximal Policy Optimization,强化学习中的策略优化算法,被广泛用在包括机器人控制、对话系统训练等任务中)。
现在 AI 研究很难有根本性的突破性研究,因为这需要算力,而算力掌握在大公司手里。博士只能找大公司没做的小方向发论文;或者进入大公司跟着公司的战船往 LLM(大语言模型)走。结果是,过去三四年毕业的博士生没人再写出像 PPO 这种影响深远的算法。问题是,如果 LLM 碰到瓶颈,要怎么突破?目前没人真正开辟出这条新路径。
晚点:这里有个错配,顶尖人才更有野心做原创性工作,但大公司更希望在收益明确的主线上取得进展。
朱哲清:我自己也想做开创性的研究,但过去 7-8 年更多专注在技术落地上。很多研究者一旦方向基本定型,剩下的就不做了,让别人跟进;但大公司真正需要把成果落地的人,纯研究五六个人就够。比较理想的领导架构是:5-6 个顶尖研究者,配上 5-6 个强执行力的落地型人才。
晚点:你刚才盘点硅谷重要的 AI 公司时没提到 xAI。这是为什么?
朱哲清:讨论顶尖研究科学家的去向时,我一般不会把 xAI 算进来。马斯克是工程师型人物的代表——用现有技术把落地做到极致,做出极其复杂、别人无法复制的工程项目,从而形成壁垒。这在 AI 上表现为扩大模型规模、叠加算力,把模型能力不断往上推。之前马斯克和杨立昆(Yann LeCun,图灵奖得主 )在推特上吵架时,还说 “根本不存在 research,一切都是 engineering”。
xAI 更偏工程驱动,Google 更偏科学驱动——通过科学飞跃带来革命性突破。
晚点:这是不是有点像中美差异?
朱哲清:我觉得不完全恰当,中美都有科学家型和工程型人才。我更倾向这样理解:工程型人才一般决定公司接下来 2-3 年的发展,而科学家型人才会决定公司未来 10 年的发展,但是你有可能活不过 3 年。
晚点:和国内技术人员交流时,大家普遍觉得中国难有最原创性的突破。
朱哲清:确实, ChatGPT 出现后,大家蜂拥做 LLM ,很少有中国研究机构或公司尝试挑战这条技术路径。中国研究者一直面临指标压力,高校、企业都去追逐最容易拿指标、出业绩、发表论文的方向。
很多美国和欧洲高校团队会挑战 Transformer (Transformer:一种以自注意力为核心的神经网络架构,已成为当代大模型的基础结构)这个共识,他们的研究体系允许几年都没有产出,不过这种环境也在变差,因为资金都流向了最容易落地的 LLM 项目。因为这届美国政府下,美国高校和研究机构的经费也在变少。
晚点:研究者的职业生涯是不是和科技周期相关呢?原创性突破每隔一阵才会集中出现?
朱哲清:我不太认同 “周期” 这个说法,做研究本质是选择问题。优秀研究员都会看到 3-5 个值得做的方向,有些方向或许能挑战顶尖模型。
关键在于怎么选:是去大厂拿高薪,做短期能落地的项目;还是留在高校,尽管经费拮据、算力短缺,但坚持做真正长期的事?每个人都有选择权。很多时候,科技创新往前溯源就是某个人或小团队,突然决定要挑战既有方向。
晚点:基础研究有没有类似超级富豪设立基金会的模式,投入巨额资金,且给研究团队足够的自由度?
朱哲清:已经有了,比如比尔·盖茨、扎克伯格、拉里·佩奇、谢尔盖·布林都设立了自己的研究基金会,资源非常宽裕。但基金会的难点在于招人,尤其是跟着顶尖人才干活的人。对具体干活和执行的人,同样的时间加入大厂,本可以按部就班晋升,但如果在这种研究机构做新方向,可能没有成果。
OpenAI 和 Anthropic 最有吸引力,最顶尖 AI 人才想成为促使 AGI 到来的一分子
晚点:前面聊了聊 Meta 内部导致人才流失的斥力,那顶级人才会被哪些公司吸引呢?
朱哲清:普遍最想去的是 OpenAI 和 Anthropic,接下来是 Google。其实 Google 研究实力是第一梯队,但人数太多,上升空间有限,所以排序在 OpenAI、Anthropic 之后。
晚点:最顶级的技术精英选工作时最看重什么?
朱哲清:能成为 AGI 出现的那个时刻的一分子,而且是核心的一分子。换言之,如果将来有一篇被称作 AGI 的论文或一个被认定为 AGI 的模型,他们希望自己的名字出现在作者里。
晚点:这里更底层的驱动力是什么?
朱哲清:“为爱发电”。
晚点:不是青史留名吗?
朱哲清:我觉得这两个不完全一样。“为爱发电” 是出于热爱,但同时也希望被世界看到——类似争诺贝尔奖或图灵奖的渴望。
晚点:中国目前最有人才吸引力的可能是字节等大公司,这一点好像和美国不同。
朱哲清:最终取决于资本市场。OpenAI 和 Anthropic 几乎有无限资本储备,因为它们要是倒了,整个美国 AI 投资圈都会受冲击。但国内模型创业公司没有这样的地位。
更关键的是,大公司还愿意和它们合作,因为它们的模型能力超过了大公司,例如 Adobe 、Azure 、Google Cloud 都主动去销售 Anthropic 的模型, AWS 也会主动卖 OpenAI 的模型。
晚点:这轮热潮之前,硅谷有没有过站位如此有利的创业公司?
朱哲清:之前的 Google 和 Facebook 就是。Google 虽然一度有点被撼动,但凭借自身的 AI 能力又补回来了, Google 技术依然超一流,更可能是自己颠覆自己。
Meta 的 Facebook 和 Instagram 则有无法撼动的社交网络护城河,因为用户很难脱离既有的社交圈。
晚点:2023 年的 Google 看起来有点被甩开了;但今年 Google 的 Gemini 和 Nano Banana 强势回归。Google 做对了什么?
朱哲清:这是初创公司和大公司的技术迭代区别。OpenAI 和 Anthropic 的打法是快速迭代,资源集中,力出一孔;Google 的打法是多点推进,利用自身技术积累在多个方向同时发力,虽然过程更慢,也受组织结构掣肘,但最终能端出一整批从文字到图像、视频、世界模型的顶尖模型把竞品打爆。
可以这样去设想: 2023 年,ChatGPT 特别火,Google 意识到必须加大投入;2023 年中到 2025 年中,Google 有二三十个团队同时开发各自最好的模型和能力,但大公司动作慢,OpenAI 发布了好几轮, Google 迟迟没声音。两年是大型产品发布的正常周期,两年后成果集中爆发。
晚点:你说 Anthropic 和 OpenAI 力出一孔,你怎么总结它们各自的战略聚焦点?
朱哲清:Anthropic 是把文字空间做到极致,其中最好的落地场景是 coding;OpenAI 则把面向 C 端的各种场景做得最好。
Google 则是平台策略:它做模型能力,在应用侧 “养蛊”——把模型开放给大量应用去尝试。如果比较残酷地去推测,Google 可以等市场筛选出某个方向明显成功的公司时,要么收购,要么直接自己做一个取代它。平台策略是确定的,后面的竞争方法只是我的推演。
晚点:今年早些时候 Sam Altman 确实曾说,相比 AGI ,他会优先选择 10 亿 DAU。到今年年中 ChatGPT 已经有 7-8 亿周活了。
朱哲清:换我也会选 10 亿 DAU, 因为 10 亿日活用户几乎覆盖了世界上所有职业和问题场景,那就是 AGI。但 Gemini 月活也已有 4 亿了,增长很快。
晚点:在 Chatbot(聊天机器人)这个形态上 OpenAI 并非高枕无忧?
朱哲清:对,我最想了解的是 ChatGPT 手机端的活跃度。桌面端的 Chrome 浏览器给了 Google 一个几乎坚不可摧的壁垒, ChatGPT 在桌面端的长期竞争中很难胜出。
但用户在手机端的选择多很多。如果用户习惯了在手机上打开 ChatGPT,Google 这块将无还手之力。但目前 ChatGPT 主要是效率工具,大家用手机普遍还是娱乐和社交沟通。
当 AI 让组织效率提升数十倍,网状结构会比金字塔层级更有效
晚点:你认为 AI 会催生出怎样的新型组织形态?尤其是从 0 开始做创业公司时,可以怎么建立组织?
朱哲清:第一点是能给 AI 的都给 AI。只有面临短期不能被 AI 解决的新岗位需求,我们才招人。
第二点是尽量去中心化,避免金字塔式层级结构。小组织使用网状结构更好,可以高效沟通协作。金字塔式组织的效率不高,因为管理者很难准确了解所有人的真实能力,从而做到人事匹配。AI 可以帮助创始人准确掌握每个人的优势、精力分配情况并随时调整任务。这时传统管理层几乎都可以省去。
第三点是任务不要过度细节化,看板式的细分任务管理在以 AI 为核心的工程团队里并不适用,因为执行频率太高。很多任务周期很短,任务分配要更抽象一些,让工程师发挥架构能力。企业不是让工程师单纯写代码,而是设计一个功能的整体结构和实现路径,再交给 AI 去具体执行。
晚点:这种新组织形态相比老的,有哪些没变?
朱哲清:我觉得团队信任更重要了。 AI 赋能下团队产出是过去 3-5 倍, CEO 没时间逐一检查所有人工作了,因此管理者需要判断哪些事情必须检查,哪些可以基于信任完全放手。
还有是团队能力需要保持互补。能力近似时,两个人容易同时做类似的事,不仅浪费时间,还容易起冲突。
晚点:Pokee AI 自己现在有多少人,怎么协作的?
朱哲清:我们全职员工八个,还有几个小岗位在招。
每天就一个简短的 stand-up,半小时能结束,流程很简单:先确认并调整现有优先级,再按照优先级任务检查负责人的进展,随后依据任务间的依赖关系协调进展,最后每个人把第二天要做的事情写成抽象化的任务。整体协作逻辑和过往产品开发流程相似,但速度成倍提升,过往 5-10 天的工作量现在可以一天做出来。
晚点:现在的协作中,你不太满意的是什么?
朱哲清:我最大的担忧是,人多后组织容易产生 overlap(重合)。因为每个人的能力范围都被 AI 工具放大了,原本做不了的活都能做,任务分配会出现重叠甚至踩踏。运营、设计这些职能可以独立出去,但技术领域牵扯度太高很难划分。
晚点:互相有职权重合一定是坏事吗?
朱哲清:我并不喜欢 overlap,曾经见过几个 “赛马型” 组织最后死得很惨,最后在公司层面被反噬。
晚点:Meta 的职能重叠挺多,你觉得 Meta 还能改吗?
朱哲清:扎克伯格因为 AB 股制度对 Meta 有完全控制权,可以按照自己的意愿塑造公司。关键看他想不想,以及想没想清楚每个动作的长期影响。
晚点:创始人作 CEO 和职业经理人作 CEO 的区别是什么?
朱哲清:职业经理人能预测职场环境下 2-3 步的人事与组织架构变化,并通过最优的市场和组织调整来完成管理,但一般不主动开疆拓土、创造新功能或新产品。很难想象 Google 或 Microsoft 会突然冒出一个 Reality Labs 或者 5000 人的 AI 团队。
晚点: Meta 里没有职业经理人的角色吗?
朱哲清:以前从 Google 过来的 Sheryl Sandberg 就是,她离开后就没有职业经理人了。目前公司内部的 CPO、CTO、COO 这些核心岗位都是创始团队担任;新进的 Super Intelligence Lab 大多是投资人背景,他们更偏向创始人式的管理风格。所以现在没有人会提醒小扎有哪些风险,让他慢一点。
晚点:接下来,你认为硅谷的人才竞争会如何发展?
朱哲清:目前资本市场和人才市场都很火热,但明年可能会降温。现在市场对 AI 的期望被抬得非常高,很多 VC 在年底会全面评估今年 AI 市场演进和各公司表现,明年三月出结果。如果结果不及预期,资本市场就可能逐渐冷却,人才市场也跟着冷却。
晚点:资本市场用什么指标衡量 AI 产品达到预期,广告营收吗?
朱哲清:最主要还是看 AI 产品的实际营收。
晚点:Meta 之前的财报提到广告业务因为引入 AI 有了显著提升,二级市场很认可。不过这其中到底有多少是 LLM 带来的,多少是过去的推荐系统优化的延续?
朱哲清:我认为绝大多数广告收入和目前的 LLM 和 GenAI 关系还没那么大。资本市场与实际技术进展之间有一些脱节,这种现象可能很危险。
晚点:更长期来看,你认为技术公司招揽顶尖 AI 人才的竞争会怎么影响研究者的职业发展?
朱哲清:现在氛围很浮躁。这容易导致博士阶段最重要的能力——批判性思维没能得到扎实培养,后来发展路径变窄。
我们公司在优秀的高校有人驻点,我经常去和那边的教授交流。普遍现象是,几乎所有博士生上来就希望切入大模型或者扩散模型,很少有人愿意做底层算法的改进,甚至很多人读博中途就辍学创业了。
一件搞笑的事是,今年在斯坦福 “CS231N”(大语言模型课程)的第一堂课,老师刚介绍完学期大纲,就有学生问:“上完这门课,我能不能带团队做出 SOTA 的大模型?” 全场都笑了。
斯坦福学生是比较自信,但以往还没到这种程度,这侧面反映了现在的环境。
题图来源:pexels
精彩评论