陈天桥发布新模型：靠“缩放”挑战AI幻觉_老虎社区_美港股上老虎

陈天桥发布新模型：靠“缩放”挑战AI幻觉

2026年3月12日。在全行业竞逐“极速响应”和“毫秒级端到端交互”的浪潮中。陈天桥在社交媒体上发布了一个产品。那是一个极其“缓慢”的 AI 代理：MiroThinker-1.7。

这个被定位为“深度研究”的模型，在面对一个复杂的金融预测请求时，并没有秒回答案。在用户端的交互界面上，它保持了长达三分钟的“思考”状态。

在这三分钟里，系统后台跳动的数据显示，它完成了 342 次工具调用。

这是一个足以让产品经理感到焦虑的数字。在通行的 AI 产品逻辑中，过多的工具调用意味着冗余、成本失控和用户流失。

但当进度条走完，屏幕上弹出的 BrowseComp 基准测试分数为 88.2。这个数字刷新了期在该榜单的记录。

表象：重回“慢时代”

“Conversation is easy for AI. Solving real problems is not.” ——陈天桥（2026年3月12日，社交平台）

大多数人对 AI 的认知停留在“对话”层面。只要能流畅地接话，就被认为具备了智慧。但在 MiroThinker 的逻辑里，这种流畅往往是幻觉的温床。

它被设计成一个“慢思考者”。它宁愿在后台进行数百次的反复检索、代码运行和自我验证。它绝不允许给出一个未经证实的直接推论。

在 MiroMind 的研发日记中，这种特性被称为“交互缩放（Interactive Scaling）”。它将 AI 的性能提升从单纯的参数堆砌，转向了对交互深度的极致压榨。

在 MiroThinker 发布之前，AI 工业界的信条一直是：大就是好。从 2023 年到 2025 年，主流厂商的选择是不断增加模型参数。人们相信，只要 AI 一次性“记住”足够长的资料，智能就会涌现。

但陈天桥解剖出的真相是：单纯的“记忆”和“容量”正在触碰边际效应。 MiroThinker 的技术白皮书里提出了一个反直觉的公式。

性能 ∝ 交互深度 × 验证频率。

这就是交互缩放。如果把传统大模型比作一个博闻强识但从不下地的“状元”。那么 MiroThinker 更像是一个在实验室里不断动手操作、失败后再调整的“研究员”。

它并不试图在 256K 的窗口里塞进整个互联网。而是利用有限的空间，记录下每一次“行动”与“观察”的反馈循环。技术细节显示，MiroThinker-1.7-mini 仅拥有 30B 的参数量。

在 2026 年，这个体量甚至不足以进入大模型的第一梯队。但在处理需要长链条推理的任务时，它通过多达数百次的工具调用跑赢了对手。它不断地去搜索引擎验证、去跑代码、对比信源。

它最终赢过了那些参数量是它十倍以上的“巨无霸”模型。这意味着，AI 的进化逻辑正在发生质变。搜索不再只是为了寻找答案，而是成为了推理过程的一部分。

如果说“交互缩放”给了 AI 动手的机会。那么“验证中心架构”则是给它装上了一双审视自己的眼睛。在解剖运作机制时，最令人意外的发现是它的“记忆管理”。

在处理超长链条推理时，传统的 AI 往往会产生“记忆漂移”。这最终会导致逻辑崩塌。 MiroThinker 采取了一种近乎冷酷的过滤策略。

在它 256K 的有限窗口里，它被训练去保留所有的思维链（Chain of Thought）。但它会果断地丢弃绝大部分工具返回的原始结果。

系统只保留最近的 5 步核心工具输出。

这意味着，AI 不再试图背下整个搜索结果。它只记住“经过验证的结论”和“被排除的假设”。这种机制在内部被称为“结构化内存（Structured Memory）”。

它将上下文分为三层：局部上下文、跨步上下文、全局上下文。为了保证每一步的正确性，内部还运行着一个独立逻辑审核员。这个组件名为 ChainChecker。

它不负责寻找答案，只负责纠错。它会检测 AI 是否在“编造”代码修复。或者是否在搜索过程中被某个网页的错误信息误导。

这种设计揭示了陈天桥对 AGI 的核心观点。智能不等于生成（Generation），智能等同于验证（Verification）。这种“验证优先”的逻辑，让模型在面对虚假信息或复杂数据时具备了免疫力。

它更像是一个经验老到的刑警。在数百条线索中反复穿插、对质。直到拼凑出唯一经得起推敲的真相。

从盛大退隐后，陈天桥向天桥脑科学研究院（TCCI）投入了数十亿美元。这种对“大脑如何产生意识”的近乎执着的探索，找到了出口。 MiroThinker 与其他 Agent 最大的不同在于它对“主体性”的强调。

““AI 离真正的 Agent 还差一个‘主体意识’，它们只有计算逻辑，没有责任身份。” ——陈天桥（2025年9月）

在陈天桥看来，如果 AI 只是在进行统计学上的概率模拟，就无法产生科研突破。科研需要的是“主体意识”。即研究者在面对失败时，能够基于过往记忆调整策略。

在面对海量噪音时，能够坚守最初的目标。这解释了为什么 MiroThinker 如此痴迷于“验证”。验证不是为了让回答更漂亮，而是为了让 AI 拥有“对自己行为负责”的能力。

在内部测试中，被赋予了“长期研究员”身份的 AI 表现出了类似人类专家的韧性。这不再是一场关于大模型参数的军备竞赛。而是一场关于“硅基主体”的进化实验。

陈天桥并没有回归互联网。他只是把当年的《传奇》战场，搬到了人类最深邃的思维迷宫之中。

免责声明：上述内容仅代表发帖人个人观点，不构成本平台的任何投资建议。

暂无评论