陈天桥发布新模型:靠“缩放”挑战AI幻觉

2026年3月12日。 在全行业竞逐“极速响应”和“毫秒级端到端交互”的浪潮中。 陈天桥在社交媒体上发布了一个产品。 那是一个极其“缓慢”的 AI 代理:MiroThinker-1.7。

这个被定位为“深度研究”的模型,在面对一个复杂的金融预测请求时,并没有秒回答案。 在用户端的交互界面上,它保持了长达三分钟的“思考”状态。

在这三分钟里,系统后台跳动的数据显示,它完成了 342 次工具调用。

这是一个足以让产品经理感到焦虑的数字。 在通行的 AI 产品逻辑中,过多的工具调用意味着冗余、成本失控和用户流失。

但当进度条走完,屏幕上弹出的 BrowseComp 基准测试分数为 88.2。 这个数字刷新了期在该榜单的记录。

表象:重回“慢时代”

“Conversation is easy for AI. Solving real problems is not.” ——陈天桥(2026年3月12日,社交平台)

大多数人对 AI 的认知停留在“对话”层面。 只要能流畅地接话,就被认为具备了智慧。 但在 MiroThinker 的逻辑里,这种流畅往往是幻觉的温床。

它被设计成一个“慢思考者”。 它宁愿在后台进行数百次的反复检索、代码运行和自我验证。 它绝不允许给出一个未经证实的直接推论。

在 MiroMind 的研发日记中,这种特性被称为“交互缩放(Interactive Scaling)”。 它将 AI 的性能提升从单纯的参数堆砌,转向了对交互深度的极致压榨。

在 MiroThinker 发布之前,AI 工业界的信条一直是:大就是好。 从 2023 年到 2025 年,主流厂商的选择是不断增加模型参数。 人们相信,只要 AI 一次性“记住”足够长的资料,智能就会涌现。

第一层真相:研究员的“缩放”

但陈天桥解剖出的真相是:单纯的“记忆”和“容量”正在触碰边际效应。 MiroThinker 的技术白皮书里提出了一个反直觉的公式。

性能 ∝ 交互深度 × 验证频率。

这就是交互缩放。 如果把传统大模型比作一个博闻强识但从不下地的“状元”。 那么 MiroThinker 更像是一个在实验室里不断动手操作、失败后再调整的“研究员”。

它并不试图在 256K 的窗口里塞进整个互联网。 而是利用有限的空间,记录下每一次“行动”与“观察”的反馈循环。 技术细节显示,MiroThinker-1.7-mini 仅拥有 30B 的参数量。

在 2026 年,这个体量甚至不足以进入大模型的第一梯队。 但在处理需要长链条推理的任务时,它通过多达数百次的工具调用跑赢了对手。 它不断地去搜索引擎验证、去跑代码、对比信源。

它最终赢过了那些参数量是它十倍以上的“巨无霸”模型。 这意味着,AI 的进化逻辑正在发生质变。 搜索不再只是为了寻找答案,而是成为了推理过程的一部分。

第二层真相:验证优于生成

如果说“交互缩放”给了 AI 动手的机会。 那么“验证中心架构”则是给它装上了一双审视自己的眼睛。 在解剖运作机制时,最令人意外的发现是它的“记忆管理”。

在处理超长链条推理时,传统的 AI 往往会产生“记忆漂移”。 这最终会导致逻辑崩塌。 MiroThinker 采取了一种近乎冷酷的过滤策略。

在它 256K 的有限窗口里,它被训练去保留所有的思维链(Chain of Thought)。 但它会果断地丢弃绝大部分工具返回的原始结果。

系统只保留最近的 5 步核心工具输出。

这意味着,AI 不再试图背下整个搜索结果。 它只记住“经过验证的结论”和“被排除的假设”。 这种机制在内部被称为“结构化内存(Structured Memory)”。

它将上下文分为三层:局部上下文、跨步上下文、全局上下文。 为了保证每一步的正确性,内部还运行着一个独立逻辑审核员。 这个组件名为 ChainChecker。

它不负责寻找答案,只负责纠错。 它会检测 AI 是否在“编造”代码修复。 或者是否在搜索过程中被某个网页的错误信息误导。

这种设计揭示了陈天桥对 AGI 的核心观点。 智能不等于生成(Generation),智能等同于验证(Verification)。 这种“验证优先”的逻辑,让模型在面对虚假信息或复杂数据时具备了免疫力。

它更像是一个经验老到的刑警。 在数百条线索中反复穿插、对质。 直到拼凑出唯一经得起推敲的真相。

最终逻辑:陈天桥的执念

从盛大退隐后,陈天桥向天桥脑科学研究院(TCCI)投入了数十亿美元。 这种对“大脑如何产生意识”的近乎执着的探索,找到了出口。 MiroThinker 与其他 Agent 最大的不同在于它对“主体性”的强调。

““AI 离真正的 Agent 还差一个‘主体意识’,它们只有计算逻辑,没有责任身份。” ——陈天桥(2025年9月)

在陈天桥看来,如果 AI 只是在进行统计学上的概率模拟,就无法产生科研突破。 科研需要的是“主体意识”。 即研究者在面对失败时,能够基于过往记忆调整策略。

在面对海量噪音时,能够坚守最初的目标。 这解释了为什么 MiroThinker 如此痴迷于“验证”。 验证不是为了让回答更漂亮,而是为了让 AI 拥有“对自己行为负责”的能力。

在内部测试中,被赋予了“长期研究员”身份的 AI 表现出了类似人类专家的韧性。 这不再是一场关于大模型参数的军备竞赛。 而是一场关于“硅基主体”的进化实验。

陈天桥并没有回归互联网。 他只是把当年的《传奇》战场,搬到了人类最深邃的思维迷宫之中。

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

举报

评论

  • 推荐
  • 最新
empty
暂无评论