年末 AI 回顾:从模型到应用,从技术到商战,拽住洪流中的意义之线(中)
一份拓展中的 AI 地图。
文丨程曼祺
垂类 Agent:从卖服务到卖结果
垂直领域 Agent 是 25 年《晚点聊》多次深度探讨的核心话题。
Lovart 创始人陈冕在 136 期节目中,曾将 AI 应用划分为两大类、五小类:生产端的 Office 与 Adobe,以及消费端的 搜索、社交与泛娱乐。
目前市场上最受关注的 Agent 主要集中在生产端。其中,以 Coding 为核心通用 Agent 可被视为 “新时代的 Office”,旨在解决通用的办公流程自动化问题;而 Lovart 以及大量图像、视频、音频、动画等多媒体内容制作 Agent,则是 “新时代的 Adobe”。
陈冕认为,基础模型的目标是打造高智商的 “通用人”,而垂直产品则是在此基础上培养 “专业设计师”;应用型公司的生存空间在于,既能充分调用 “通用人” 的智力,又能解决通用能力无法直接触达的行业深层需求。这是他在创业时选 “Adobe” 方向的原因。
在第 110 期节目中,明势资本合伙人夏令分享了 Agent 与具体行业深度结合的案例。例如明势投资的法律领域的艾语智能,其核心场景是协助银行起诉小额坏账。以往此类案件的法律成本常高于账面收益,机构大多选择计提损失。Agent 的自主性与自动化显著提升了筛选高成功率案件、按模板生成法律文件等环节的效率。尽管目前出庭等线下流程仍需人工,但 Agent 已重塑了利润空间。
这种深度结合也带来新的商业模式:从 “卖席位” 转向 “为结果收费”。艾语智能本身也是个律所,所以它并非向其他律所售卖软件,而是直接承接金融机构的案件,按最终收回的款项获取服务费。这一洞察与 25 年 5 月美国红杉在 AI 峰会上的观点不谋而合——AI 软件要从卖服务到卖结果。
另一个典型案例是 AI 教育公司与爱为舞。尽管创始人张怀亭在和我们的专访中未直接提及 Agent 等术语,但其技术内核——利用 AI 辅助或替代人类助教,实现自主规划教学任务并与学生互动,本质上就是一个教育领域的 Agent。
与爱为舞的策略是将 AI 老师嵌入成熟的 “在线大班课” 商业模式中。曾联合创立高途(Gaotu)的张怀亭采取了先入场获客、再积累真实数据、最后迭代 AI 模型的路径。这种 “场景先行、数据驱动” 的商业化策略,是垂直领域 Agent 相比通用 Agent 的差异化落地方式。
Agent 工具链:Infra 层的细分与演进
随着 Agent 创业与创新的繁荣,围绕 Agent 的 Infra(基础设施) 或工具链正成为关键机会。在软件分工极其精细的硅谷,这一趋势尤为显著。
简单来说,基础模型与完整 Agent 产品之间的中间地带,皆属于工具链的范畴。这涵盖了 23 年至今轮番更迭的技术热点:从最初的 RAG(检索增强生成) 到 Prompt Engineering(提示工程)、Context Engineering(上下文工程),再到强化学习环境、Evaluation(测评) 及状态检验 等。
在《晚点聊》第 137 期中,MoE 资本的两位创始合伙人 Henry Yin 和 Naomi Xia 总结、梳理了 Agent 工具链至今的 6 轮重大进化,每一轮的起点都源于模型能力上了一个新台阶。
我们也梳理了当前工具链中的核心机会,包括:
- 语音与多模态交互:更低延迟、更具情感表达力的接入技术。
- 记忆(Memory)管理:如何让 Agent 具备跨 session 的长期记忆与精准的上下文调取。
- 评估(Evaluation):在黑盒化的模型之上,建立可量化的测评标准与运行状态监控。
令我印象深刻的是美国软件行业充分的水平分工。在硅谷,即使是极其细分的场景也有体量不小的公司:如专注系统可观测性的 Datadog,以及深耕身份认证领域的 Okta,年收入均已突破 20 亿美元。随着 AI 发展,这些成熟软件生态中的流程,都存在被 AI 重做一遍的机会。
Sora App:大 C 端场景的新机会
第二个关键词是 Sora App,它代表了 AI 在非提效 to C 方向的尝试,即集中于陪伴、社交、游戏与娱乐领域的产品。
这也不是 25 年的新现象:此前,Character.ai、Glow、Talkie 等产品已让用户习惯与虚拟角色互动;Pixverse 也于 24 年底推出移动端,主打视频特效的制作与分享。
而 25 年 10 月上线的 Sora App 备受瞩目,这不仅因为其出自 OpenAI 之手,更因其交互创新。其核心功能 Cameo 允许用户授权人脸后生成符合外貌的数字角色,进行单人创作或与好友 “合拍”。
在《晚点聊》的访谈中,业内对 Sora App 有两种不同的观察:
- Lovart 创始人陈冕(第 136 期)认为 Sora App 本质上是社交产品而非单纯的工具。Cameo 的裂变属性让他产生了强烈的分享欲。
- Sand.ai 创始人曹越(第 139 期)持保留意见。他认为新的 C 端平台需具备新内容形态与新传播链路。当时 Sora 仍更像一个工具,用户创作后仍倾向于分发至 TikTok、小红书等存量平台。
后来的发展是,Sora App 在发布初期热度极高,但留存挑战巨大。Sensor Tower 数据显示,其 30 天留存率低于 8%,远逊于 TikTok(42%)和 Instagram(38%)等主流社交应用(数据来源于 SQ Magazine 25 年 Q3 数据)。
尽管大众热度有所回落,但特定创作者群体正在沉淀。25 年 11 月,我在旧金山遇到了一位围绕 Sora App 做数据服务的创业者卢元,他做的产品 SoraStats 专门服务于 Sora 的活跃作者,想帮他们成为 “Sora 上的 Mr.Beast”。
卢元说,活跃作者并非是 AI 达人、专家,还包括教师、Uber 司机等跨行业人士。一个典型案例是日本创作者 Matsumaru(松丸慧吾)。他并不追求真人风格或社交合拍,而是利用 Sora 深度探索二次元与视觉特效。目前他的粉丝量已突破 10 万,而 Sam Altman 是 14 万。
Sam Altman 在 25 年 10 月的博客中特别致敬了日本用户的创造力("Remarkable creative output of Japan")。日本繁荣的 ACGN 文化与 AIGC 具有天然的亲和性,AI 工具极大放大了同人二创爱好者的想象力。
除了社交与短视频,一些传统 C 端场景也在 AI 驱动下焕发新生:
- 聊天软件:25 岁的陈春宇在旧金山创立了聊天应用 Intent。针对美国少数族裔跨语言交流的痛点,该产品利用大模型实现了 “默认全局翻译” 的丝滑体验,解决了过去通信工具门槛过高的问题。
- 语音输入:尽管系统自带功能普及,但 Typeless 等新产品凭借更精准的识别与语境理解脱颖而出。它能将语音内容一键转化为邮件、推文等多种风格,并支持通过语音指令局部修改文本,带来了远超传统工具的舒适感。
陈冕曾预言,26 年将是非效率类 AI C 端产品爆发的元年。工具属性之外,更具情感价值、娱乐价值与交互深度的新产品或许即将出现。
AI 科学家
应用的最后一部分,谈谈 AI for Science。
在《晚点聊》第 140 期中,深势科技(DP Technology)的两位创始人张林峰与孙伟杰完整讲述了他们亲历的、用 AI 加速科学发现的发展脉络。这是一个在大语言模型热潮之前便已开始的方向,深势的经历恰好涵盖了该领域的几种核心探索:
- 加速第一性原理计算、生成式 AI
2016 年前后,张林峰在普林斯顿读博期间的一个研究是,利用机器学习简化量子物理的第一性原理计算,这些计算有确定的物理公式:薛定谔方程(Schrödinger Equation)、密度泛函理论(DFT)和分子动力学方程等,对生化环材领域至关重要。但以往的难点在于计算复杂度极高,难以从微观尺度跨越到介观或宏观尺度(从单个分子到整体材料属性)。张林峰当时开发的 DeePMD,就是通过机器学习找到了一种在不损失精度的前提下大幅提升计算效率的方法。深势科技随后据此推出了药物研发计算平台 Hermite。
另一种路径,是利用深度学习与生成式 AI 解决特定科学问题,典型代表是获得诺贝尔奖、用于预测蛋白质结构的 AlphaFold,深势也有同一方向的模型 Uni-Fold。
- AI 发明家:技术的自我繁殖
随着大语言模型走向成熟,能够覆盖完整科研流程的科研 Agent 成为新趋势。这不仅包括针对物质科学的科研——支持从文献研究、提出假设、设计实验到验证假设的全流程自动化,还指向一个更特别的方向:用 AI 提升 AI,让 AI 承担人类研究员的工作。
这种 “左脚踩右脚” 的演进方式,契合了经济学家布莱恩·阿瑟(W. Brian Arthur)在《技术的本质》一书中的核心观点。阿瑟认为,技术具有自我繁殖的特性,由两股力量交织推动:
- 供给端: 现有技术通过新组合产生新技术。旧技术基数越大,组合的可能性就越多;同时,观测技术(如显微镜、传感器)的发展加速了对新物理现象的捕获。
- 需求端: 新技术的需求不仅来自人类,也来自技术本身。每种技术的出现都会伴随改进它、降低其成本或解决其衍生问题的需求。
《技术的本质》一书写于 2009 年,当时作者说:技术的自我进化是通过 “人类发明家” 这一中介实现的。而现在,我们可能正处于 “AI 发明家” 诞生的前夜。这将是一个信息广度、计算能力远超人类个体,且能不眠不休进行迭代的系统。
面对这种指数级的进化速度,一个问题是:我们做好准备了吗?如果技术即将脱离人类中介自主进化,我们该如何提前设计与之共处的方式?
3. 巨头的 AI 之战:字节、阿里、腾讯
关键词:人才和组织之战、To C 应用大战、即将到来的春节之战
从本轮 AI 热潮起点开始,《晚点》持续跟踪报道互联网大公司,尤其是中国大公司的 AI 动向,其中最有实力的是三家:字节、阿里、腾讯。
25 年,我们对这三家公司的 AI 动作有两轮集中报道:春节后陆续发布的四篇报道:《腾讯在 AI 拐点到来前的 700 天》(高洪浩)、《字节 AI 再创业:独立组织、全链条的饱和出击》(王与桐)、《重新认识阿里:大踏步迈向 AI》(管艺雯)、《字节、阿里、腾讯的 AI 人才竞赛:2330 个研究者背后的共识与分歧》(贺乾明、黄帧昕),以及前不久发布的《字节、阿里、腾讯 AI 大战全记录:一场影响命运的战争》(高洪浩)。这些报道涵盖我们观察科技巨头做 AI 的几个关键视角。
人才和组织之战
字节:创业方式做 AI,吸纳 AI 原生人才
首先是人才和组织,这直接关系各公司最底层的模型实力。
字节的 AI 部门相对独立,它试图通过营造一个小环境,以创业公司的方式运行,从而摆脱十几万人庞大组织的重力。
25 年之前,字节成立了三个相对独立的部门:负责产品的 Flow(豆包产品团队隶属于此)、负责模型研发的 Seed,以及提供后端研发支持的 Stone。这三块业务最初的负责人均为字节老将:Musical.ly 创始人朱骏负责 Flow;2015 年从百度加入的朱文佳负责 Seed;同样来自百度,2014 年入职的洪定坤负责 Stone。
今年,字节 Seed 迎来了新的研发一号位——Google DeepMind 前研究副总裁吴永辉。业内人士评价吴永辉是 “大佬级别的技术管理者”,能真正 “镇得住场子”。
“镇场” 能力之所以重要,与字节补充人才的顺序有关。在吴永辉于 25 年 2 月入职前,字节在整个 24 年都在疯狂吸纳年轻技术骨干。这件事的起点可追溯至 23 年夏天,当时字节本打算投资 MiniMax 和阶跃星辰,但在一次高层会议后,张一鸣明确表态:字节应该、也能做好自己的大模型,无需对外投资。
紧接着,字节高层及张一鸣本人从 23 年底开始密集招人。我们在《字节 VS 六小龙》那期节目里提到,24 年有投资人去拜访顶尖论文的作者时,发现不少人都刚和张一鸣聊过。最终,字节招募了来自 Google 的蒋路、来自面壁的秦禹佳、来自零一万物的黄文灏、智谱 AI 的丁铭,以及备受关注的阿里通义千问模型的前负责人 周畅。
当这些在业界有影响力、处于事业上升期的 Leader 汇聚一堂,吴永辉这样一位有多年 管理经验的资深人士就成了符合画像的领导者。这也让 Seed 团队中来自传统搜推广部门的人员比例降低,而像吴永辉、周畅这样的 AI-Native 人才比例显著上升。
不过,精兵强将也带来了激烈的内部竞争。以视频生成为例,内部有多个团队在同步推进,部分人才(如蒋路)的流失。
一位技术 Leader 对赛马机制做了有趣的总结:健康的赛马是多路探索,跑完这轮还有下轮,团队有翻盘机会;但如果演变成 “拳击”,败者就只能退场。
阿里:人员相对稳定、部分老人离场
自周畅离职加入字节后,阿里的 AI 团队进入了一个相对稳定的阶段。
阿里的 AI 一号位始终是已入职十年的周靖人。他是阿里云 CTO 兼通义实验室总负责人,也是阿里大模型开源的提议者和主导者。周靖人今年晋升为阿里合伙人,关键原因之一便是他带领通义实验室保证了 Qwen 系列模型的领先地位。
周靖人之下,通义实验室有三个核心团队:
- 负责主力模型 Qwen 研发的 “千问” 团队,由 90 后林俊旸负责。林俊旸是阿里内部培养的人才,2019 年从北大硕士毕业后即加入达摩院;
- 二是负责图像、视频生成的 “通义万相” 团队;
- 三是 25 年 2 月新加入的许主洪团队,负责多模态交互模型。
与 Seed 不同,通义实验室在此轮 AI 热潮前已经存在,由原达摩院多个实验室合并而成。这导致其最初在薪酬激励上没那么独立,但在 24 年底,通义对模型团队普遍调升了薪资和职级,可以理解为对一种对市场行情的回应。
这种并非 “高举高打” 的起步,也带来了意外之喜:研发 Qwen 的团队是从内部相对边缘的角落里自下而上生长的,规模精简,却通过开源大模型形成了极强的社区影响力,成为了一个自驱且强势的团队。目前,千问团队也在探索具身智能 VLA、多模态等前沿领域,并上线了面向普通用户的 Web 端产品 Qwen Chat(chat.qwen.ai)。
腾讯:总裁办来了年轻人
25 年秋天,前 OpenAI 研究员、ReAct 作者姚顺雨加入腾讯。12 月,腾讯官宣姚顺雨出任总裁办首席 AI 科学家,直接向总裁刘炽平汇报,并兼任 AI Infra 部和大语言模型部负责人。
1998 年出生的姚顺雨是典型的年轻 AI 原生人才,24 年博士毕业后即加入 OpenAI。
他的加入已带来了三个明显变化:
- 以极高的频率招揽新人(如从 DeepSeek 招募王炳宣);
- 重塑目标,指出此前混元模型太盯着 Benchmark 刷榜而忽视了实际体验;
- 组织调整,将 Infra 部门划归统一管理,强调协同设计。
相比字节先收骨干再引统帅,腾讯在招募姚顺雨之前并无太多 AI 明星,而姚顺雨本人也非常年轻,没有太多管理经验。对稳健的腾讯来说,这是一次激进的组织选择,姚顺雨更像是一条被引入的 “鲶鱼”。这或许受到了 DeepSeek 的启发:DeepSeek 证明了一群 95 后研究员同样能做出惊艳世界的模型。腾讯这一轮调整的效果,将在 26 年得到验证。
最后,一个中美差异是:在美国,OpenAI 等初创公司对人才的吸引力最大;而在中国,巨头依然是顶尖人才的首选。正如 MiniMax 创始人闫俊杰所言:“客观来说,字节的 AI 人才密度是最高的。”
To C 应用大战
对巨头之战的第二个观察视角是各公司的应用布局。
模型与产品团队间的协作:字节更紧密,腾讯、阿里分属两个事业群
在 Sora App 发布后不久,Sand.ai 创始人曹越有一个对组织的观察:Sora App 之所以能如此巧妙地利用模型特性开发新功能与交互,是因为 OpenAI 实现了从产业到模型的深度垂直整合,这是一种 “端到端” 的组织,产品需求可以高效地梯度回传给模型。
如果以这个视角看,中国三家大公司中,字节跳动的模型与产品协作最为紧密。
这一年,我们通过与多位 Seed 研发人员和 Flow 产品团队成员交流,综合感受是两个团队协作频次极高。Flow 的一些中层认为,Seed 的模型支持给力,有共同为产品服务的意识。
字节在 25 年初定下三个 AI 大目标:探索智能上限、探索新 UI 交互形式、加强规模效应。
其中 “加强规模效应” 值得细品。传统软件通过 “一次构建,多次售卖” 来实现规模效应,但大模型产品每次调用都消耗算力,更像是有 BOM 成本的制造业。字节的逻辑在于 25 年 1 月豆包 1.5 Pro 官博中提到的 “数据飞轮”:依托字节在推荐、搜索和广告领域的 AB Test 经验,构建了基于大规模用户反馈的闭环优化系统。
这里飞轮的两端是「大规模用户反馈」和 「模型实际使用体验」,而不是模型性能本身。因为现阶段,大量普通用户的反馈不能直接提升模型能力,要让模型变强,还是得靠研发人员的努力。
字节对规模效应的表述,可能反映了,他们在努力发挥过去积累的移动互联网经验和基础设施,而且从豆包的增长看,确实取得了效果。
腾讯与阿里在 25 年都经历了产品团队的重组。
腾讯方面,原本混元大模型与元宝 App 均隶属于 TEG(技术工程事业群)。25 年初,腾讯总办会决定整合分散的 AI 应用,最终由汤道生负责的 CSIG(云与智慧产业事业群) 接手。元宝与原本在 PCG 的 QQ 浏览器、搜狗输入法、ima 等应用汇聚到了 CSIG,而混元研发团队仍留在 TEG。这种模型与产品分属不同事业群的架构,考验着跨部门的协作效率。
同时,腾讯最大的底气——微信,始终是独立的事业群。就在上周三,微信封掉了元宝 App 为春节大战准备的 10 亿元红包分享链接,理由是 “整治过度营销”。这个小插曲引发了一个疑问:面对 10 亿级用户,微信能在多大程度上深度参与腾讯的 AI 布局?
阿里的路径更复杂。 23 年 10 月上线时,通义千问 App 与通义实验室均在阿里云旗下。到了 24 年底,通义 To C 产品团队被剥离,划归至吴嘉管理的智能信息事业群。这意味着产品与模型团队从 “同屋” 变成了 “邻居”。
字节是豆包、腾讯是元宝,阿里经历通义千问和夸克的双线轮换
这种调整也伴随着应用布局的变动。相比字节豆包与腾讯元宝的品牌稳定性,阿里经历了频繁的 “轮换”:
同时起步:
“通义千问”App 24 年 10 月上线;同期,早在 2016 年就上线的夸克浏览器加入 AI 搜索等新功能。
夸克替代通义,成为阿里主力 AI 产品:
24 年 5 月,通义千问 App 改名为 “通义”;25 年 3 月,阿里将夸克定为 AI 旗舰应用,提出 “AI 超级框” 概念。吴嘉曾说,希望夸克成为中国第一个日活过亿的 AI 产品,但这一目标最终被豆包率先实现。
通义改名千问,“熹妃回宫”:
到 25 年底,原先被冷落的通义 App 再次更名为 “千问 App” 卷土重来,接通了阿里生态里的外卖、购物等生活服务。
阿里的这番调整,有些 “头痛医头、脚痛医脚”。
最初的通义千问 App 功能堆砌严重,展示层级缺乏重点,在整个 24 年,相比豆包、Kimi 等更具辨识度的 Chatbot 产品,表现始终不温不火。
当时,管理该产品的阿里云,战略重心在拓展 AI 云业务、大模型研发以及构建模型生态。这或许解释了阿里为何随后将 To C 产品团队悉数划归至吴嘉管理的智能信息事业群。阿里当时的逻辑是:Chatbot 会最先颠覆搜索,而从夸克这款浏览器入手改造搜索体验,是通往 AI 产品最顺理成章的路径。
然而,当夸克在 25 年正式接棒后,表现却差强人意。它确实吸引了大量尝鲜者,但夸克庞大的老用户群依然习惯于网盘、搜题等传统功能。毕竟夸克已上线十年,承载了太多大模型时代之前的用户习惯,难以在短时间基因突变。
近期通义 App 再次更名为 “千问 App” 卷土重来后,深度接通了阿里生态内的生活服务,试图成为一个能点外卖、能购物的全能 AI 助手。与此同时,阿里一改往日在投放上的克制,千问 App 的单日投放峰值达 1500 万元。但一些阿里人士,对目前的打法持悲观态度。他们认为,刚改头换面的千问 App 尚不成熟,在产品力未打磨好的情况下大规模的投放,难以产生实质留存,尤其是面对强劲的对手豆包。
字节跳动目前的布局则是 “一超多强”。 豆包作为中国首个日活过亿的 AI 产品,不仅稳居第一,还推出了海外版 Dola(日活破千万)。在豆包之外,字节进行了饱和式攻击:AI Coding 工具 Trae、智能体平台 Coze、教育应用 豆包爱学 等。
豆包已发展出独特的 “人设”。它不像 ChatGPT 那样是 “办公室精英”,而是更亲切、生活化、好玩。在抖音上,“和豆包互怼”、“让豆包教穿搭” 的内容已形成广泛传播。目前豆包已开始尝试商业化,如 25 年 11 月上线 “商品卡” 功能。26 年,豆包如何平衡免费增长与变现将是核心看点。
腾讯的元宝则在 25 年春节迎来意外惊喜。 由于之前自研模型相对落后,腾讯成了大厂中接入 DeepSeek 最果断的公司。元宝日活因此在 2 月底快速增长了 10 倍。元宝最新的尝试是 “元宝派”,试图通过分享链接将微信、QQ 的社交关系引入 AI 社交群。
总结三巨头的 AI 策略:
- 腾讯:更重视应用落地,策略是 “后发制人”,等待模型能力成熟的拐点。
- 阿里:强调从算力、云到模型的全栈整合,在开发者生态上积淀深厚。
- 字节跳动:建立了一个相对独立的 “国中之国”,以创业公司的方式驱动模型与应用齐头并进。
春节之战展望
今年春节的竞争态势异常激烈:豆包已正式拿下春晚合作伙伴席位;元宝紧随其后推出 10 亿元红包;而千问则宣布发放 30 亿元红包。
与此同时,悬在所有人头上的最大变数是:DeepSeek-V4 究竟何时发布?效果又将如何?(补充:2 月 11 日,DeepSeek 网页端已更新了底层的新模型,应该就是 V4 的某一个版本。)
如果 DeepSeek-V4 选择在节前发布,对腾讯的春节攻势是个利好。虽然在现阶段,第一梯队模型之间的差异,大部分普通用户可能已难以直观感知,但 DeepSeek 有强大的品牌效应,而元宝又是大厂产品中与 DeepSeek 绑定最紧的一个。
这个春节,各大公司的 AI 从业者们大概率又无法享受一个完整、惬意的假期了。
4. AI 创业公司们
关键词:大模型第一股、5000 万美元年收、全球化与中美之间
关于 AI 应用的具体趋势,前文已有讨论。这一章会重点剖析 AI 创业的商业化进展,以及中国创业公司面临的一个特殊议题:全球化。
大模型第一股:IPO 不是奖赏,而是续命的安全网
25 年至今,中国 AI 创业市场迎来一个节点事件:26 年 1 月,智谱 AI 与 MiniMax 前后脚登陆二级市场。
两家公司上市,向公众揭开了大模型创业公司的财务底牌,也能看到资本市场的短期定价。此前业内的一种流行观点是:中国头部的模型能力并未被美国拉开代差,但估值却差了两个数量级——中国最贵的大模型公司估值在 30-40 亿美元,而 OpenAI 与 Anthropic 的估值已分别飙升至超 7000 亿和 3500 亿美元。
然而,从财务情况也可以有另一种解读,上周(2 月 9 日)收盘时,智谱市值约 114 亿美元,MiniMax 约 185 亿美元,与美方的差距缩小到了一个数量级。但看收入:智谱 25 年上半年收入约 2700 万美元,MiniMax 前三季度约 5300 万美元;对比之下,OpenAI 25 年营收远超 130 亿美元(Sam Altman 自称),Anthropic 则达到 45 亿美元(the Information 报道)。
题图来源:《少年派的奇幻漂流》
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。


