AI超级入口的另一种可能

春节复工后的两周不到的时间里,就已经很少有人再谈论春节期间的AI入口大战,公众的注意力转移到了OpenClaw上,在一种难言的FOMO情绪下,各种“龙虾学习群”人满为患、OpenClaw的部署教程一卖就是几十万、甚至在线下上门安装OpenClaw居然成为一门生意。

这一次,手机端跟进也非常快,多家企业放出拟推出移动端 claw的消息;而3月11日,**终端BG首席执行官何刚正式晒出鸿蒙版小艺Claw Beta界面,体验数日后直言 “很惊喜,挺好用的”。

这不是单纯的追热点,而是反映了手机特别是能够自研操作系统的手机厂商,对于智能体这个关键词的高度敏感和及时卡位。

那么,AI原生的时代,就以这种出人意料的方式降临了吗?

我认为恰恰相反——OpenClaw的爆火,确实证明了人们对一个“系统级AI助手”的渴望,但实话实说,它的诞生方式,大概率不是通过Claw这种方式:它的确是低门槛,但绝不是无门槛。

OpenClaw只是证明了人们对“AI原生+本地部署”的渴望,但真正实现这种能力的,可能并不是OpenClaw这种形态,而是更先天的被内置在操作系统的底层能力里。

只有掌握了对操作系统的深度定义权,才最有可能在竞逐“AI第一入口”的长跑中,后来居上。

——导语

01

一场被忽视的发布会

2月25日是大年初九,一场在海外举行的发布会,在国内没有激起一点水花,几乎无人关注。

这天,是三星Galaxy S26系列新机的发布会,引起关注的是一段简单的演示——用户对着手机说“帮我叫个Uber去机场”,手机就在后台自动打开应用、读取当前位置、选择车型、估价,整个过程无需切换App,只需用户最后确认支付。

在海外用户高叫这次活动带来了“惊喜甚至惊吓”的时候,中国用户之所以付之以沉默,真实的原因仅有一个——我们对这种演示已经审美疲劳甚至深度怯魅了。

在国产手机2025年甚至2024年的发布会上,还有哪家国产手机厂商没有展示过这种“系统级能力”吗?

某种程度上讲,这从一个侧面证明了,中国AI在应用层面已经跑到了全球的前面,而非尾随。

但回归到这次发布会的时点,它和国内的春晚AI红包大战并非没有联系,而是基于一个同样的背景——AI在用户侧的第一入口之战,比我们想象的开始的更早、更隐秘、更底层。

虽然大家都叫“手机AI入口”,但严格说来,它们的底层逻辑并不相同,竞争走向也绝不相似。

因此,我将之分类为“超级外挂式入口”、“系统级外挂入口”和“系统原生级入口”。

第一种“超级外挂式入口”,也就是我们在春晚红包大战中看到的几大巨头的新APP。它们的特点是适配性最好——不挑机型、不挑配置、即下即用、界面友好;但它们较大的短板是——和系统之间是纯粹的操作系统-APP式的主从关系。这种外挂式的连接方式,决定了它们在调动手机的本地能力、本地应用、获得授权等方面是困难重重、壁垒无数的——特别是在强调数据安全,操作系统日益收紧系统权限的当下。

第二种我称之为“系统级外挂入口”,前一段时间引发广泛关注的豆包手机,就基本是这一核心路径的代表——端云协同GUI操作。

所谓端云协同GUI操作,通俗的说,是一种“模拟人类操作APP”的方式完成工作流——在你看似手机“自动”执行的每一步操作的背后,后台的工作逻辑是不断截图上传至云端让模型识别确认,然后完成一次次虚拟点击——也就是说,相当于让AI代替人来操作各个APP。

这就是此前豆包x努比亚的AI手机的工作方式,它自有先天的优点,就是普适性极强。理论上说,只要云端大模型能力足够,任何APP的界面交互,AI都能完成,尤其不需要对APP进行一对一的适配。

因此,这款手机在国内外刚发布时,吸引了大量关注,有媒体甚至称为“AI原生手机的先锋”,这并不是过誉。

但是,这种模式的缺点也是显而易见的——它的流畅运行,基于后台的无数次截图上传,因此高度依赖网络的稳定性,任务执行效率相对较低,时延明显。

之所以此后激发了一轮大厂的抵制,更不仅仅是出于对用户侧的安全隐患的考量,还在于大厂也的多重考虑。

从利益角度,读屏模式动了超级APP的商业根基——如果智能体执行任务时,用户无需操作APP就能完成全链路操作,就会导致最常见的开屏广告和APP内广告形同虚设,直接截流用户时长和广告曝光,颠覆了“入口=流量=收入”的移动互联网基本商业模式。

从安全角度说,一个APP如果无法管控用户数据流转,无法履行数据安全主体责任,目前仍是不可想象的,更重要的是,这种“拟人操作”如果在系统层没有得到监管,对用户隐私、数据安全性的保护上,是最容易受到质疑的。因为其调用的是系统底层权限,能截屏到安全窗口这种本应受高度保护的界面。

那么,还有直接点的办法吗?这就是第三种方案:“系统级原生调用”,这种方式不需要屏幕截图,AI助理甚至不需要打开APP,而是通过协议直接和APP交互数据,各APP之间(也是各Agen之间)也通过协议直接交互数据。

但事情的微妙之处也在这个层面,同为“系统级调用”,实现的路径大不相同。

对于安卓/IOS系统来说,它的基础设计是:用户明确打开某个 App,在那个 App 的 UI 内完成任务。

它的表层难度是,AI 要把“用户的模糊意图”翻译成“多 App 动作链”,属于典型的后加(外挂)能力,会天然和原来的默认路径发生摩擦。这就需要1:1的调优,因此它的尴尬特别鲜明的体现在——演示的时候无比丝滑,真实环境下则要么要求用户频繁确认、切换、跳转,要么就需要用户授以更深的系统权限和接口。

而它的底层难度更反映在,在 App 时代,OS 给 App 的是沙箱 + 权限,不是“把能力贡献给系统代理”的统一协议,所以,安卓/IOS不得不别辟蹊径,通过后天补强的方式给系统“外接”一个新的AI器官。

这也解释了,作为全球智能手机操作系统市占率最高的安卓的东家+拥有业界最强模型之一Gemini的谷歌,为什么在2026年的时候才展示较为初级的系统级AI能力;而另一家巨头苹果, 经过无数次的跳票和证伪,最后基本落定目前最大概率的方式也是直接集成Gemini。

安卓和IOS的尴尬,是历史的包袱在面临时代切换时的必然,但也可能是其落后于时代的开始。

以微软为例,在PC时代,它在全球计算设备上的覆盖率近90%(甚至更高),堪称操作系统的全球主导。但从2017年首次市占率低于安卓后,Windows的覆盖率如今已经降至约30%,相对损失超过60个百分点的市占率,实际上交出了除桌面计算市场之外的操作系统主导权……而这一切,未必不会在安卓和IOS身上重演。

图片

相对来说,身为全球第三大移动操作系统的鸿蒙,虽然绝对设备量仍然有限,但胜在没有任何互联网时代的包袱。

因此,在这场操作系统级的较量中,**的鸿蒙展现出了一种独特的、甚至是具有体系结构优势的“第三种可能”。它不同于安卓和iOS在旧架构上“打补丁”式的AI集成,从设计伊始就是为“原生智能”准备的。2026年MWC上展示的鸿蒙架构,通过微内核的垂直整合,实现了从硬件算力调度到端侧模型响应的极致优化。

也就是说,通过在理解用户意图上的底层意图框架(Intention Framework)和系统级 Intent 协议(这也是安卓和苹果目前补课的重点),这种架构上的领先,让鸿蒙在处理理解模糊意图、长任务、多设备协作、跨应用数据流转时,有着上一代操作系统很难弥补的结构性优势。

但要把结构性优势变成商业上的胜势,鸿蒙要走的路还很长。

02

传统大厂Agent前的三堵墙

如果遴选一个2025年的年度AI关键词,智能体(Agent)是无二的选择。

对话智能靠“推理”,行为智能靠“行动”,当我们的注意力从对话机器人开始转移到智能体身上时,我们也快速的从“对话智能”时代进入了“行动智能”时代。

图片

为什么我认为操作系统级内置的“行动智能调度模块”具有比“超级外挂式入口”有强得多的潜力,是因为从对话智能向行动智能转换的过程中,后者会遇到三堵厚墙。

把这三堵墙讲清楚,才能解释为什么“系统级天然入口”更可能成为AI应用的终局形态。

第一道墙是产品墙,简言之,人都是懒的——用户不愿意为了“更聪明”再多装一个入口。

外挂入口要成功,必须把“使用”变成“默认”。这意味着它不仅要回答得好,还要把“打开它”这件事变得像呼吸一样自然。而春节战役已经证明了,短期内拉新不难,难的是因为无法有效触达物理世界,很难把一次性尝鲜变成长期的路径依赖——至少,除了豆包手机初窥门径外,其它的对话式智能体虽然口号不同,但已展现出的行为智能能力,可以说乏善可陈。

第二堵墙,是技术墙——跨 App 的行动需要标准化接口、权限治理、可观测与回滚。

当 Agent 不是给你生成一堆文字,而是替你叫车、下单、改签、付款时,它必须进入更高权限、更高风险的领域:位置、支付、通讯录、电话、短信。

这里最难的从来不是“能不能接”,而是“出了事谁负责”。

谷歌在 Galaxy S26 上把“诈骗检测”这种高敏感能力直接集成到系统电话应用,搭载鸿蒙的mate80能够在检测到外界窥视时启动视觉模糊策略,这都是典型的“系统级治理思路”:高权限能力必须和 OS 的安全边界绑定。

而外挂式入口想获得同等信任,需要付出更高成本:既要技术可用,还要治理可信,而后者绝对比前者更难。

第三堵墙,我称为商业墙——超级 App,天然不愿把核心能力开放给“可能截流的友商”。

这是外挂入口最现实的难题:当你希望调用外卖、打车、支付、内容时,这些超级 App 会天然警惕:你是入口,也是竞争者;你掌握了路径,就掌握了流量。

这就造成了,即便“技术上能做,商业上也未必愿意配合”。所以你会看到,很多外挂式入口哪怕具备强大的智能体调度能力,但最终只能“调起一部分有限的合作方”。这不是能力不行,是“开放接口”几乎相当于整个移动互联网时代“私域化本质”的生态不正确。

但是我敢说,这种“头部APP拒止Agent调用”的时代已经快结束了。

无论是国际还是国内,由于智能体蕴含的巨大潜力,目前行业已形成云/智能企业倒逼通用协议诞生的状态。

目前,海外主流协议有Anthropic的MCP协议、谷歌的安卓AppFunctions框架;国内则有阶跃星辰的GUI-MCP协议;另外,国内的一部分头部手机厂商,据信也在联合推动国内安卓生态的AI Agent接口标准统一。

相对而言,鸿蒙在这方面的架构准备、生态准备和行业共识引导,更是做的相当有先见性的。

那么,也许你会问我一个问题,为什么鸿蒙生态目前还没有出现现象级的智能体生态爆发?

03

水到渠成

其实,关于鸿蒙生态里的智能体应用的案例,可以说是一直以一种“小火慢炖”的形式在逐渐推进——**天气、音乐、浏览器等自有应用,主动拥抱 Agent 形态,已形成示范效应;喜马拉雅、小红书、微博智搜等第三方场景,也开始通过系统入口触发推荐与问答闭环。

这其实是Agent落地的一个规律——优先落地的往往是高容错率、低风险级的业务,然后逐步走向高风险、高频业务。

而且,这些案例,虽然还不够丰富,但都共同指向一个趋势:未来用户对系统级 Agent 的期待,不是“你能不能回答”,而是“你能不能把服务编排得足够短、足够顺”。

另外,从最新放出的328beta版测试来看,鸿蒙新系统的一个很大卖点,除了底层重构外,端侧大模型4.0也第一次被放了出来,这个约10GB的本地大模型,主打一个“本地AI大脑”,完全离线可用。这不但是**第一次把完整的本地大模型直接部署到手机,让大量AI计算在手机里完成,速度更快、隐私更安全,也为逐步推进的端云协同,打下了更深的地基。

其实,稍早前的HDC2025 上,**就已经发布鸿蒙智能体框架 HMAF 与《Agent时代,鸿蒙应用 生而智能——鸿蒙智能体框架白皮书》,并推出小艺智能体开放平台,明确提出“系统、应用/元服务与智能体”的协同范式,目标是让智能体以更快速度渗透行业,形成协同网络。

如果说安卓的方向,还是有些“半外挂”色彩的“把 Gemini更深度的嵌入系统”,鸿蒙的表述则更具有整体的“框架感”:它试图定义一个多智能体协同的操作系统范式——系统级入口不是单个 Agent,而是调度中枢——也就是说,我们熟悉的小艺,未来不再是存在感略弱的“系统助手”,而是定位为系统级智能中枢(而不是一道门),它可拆解复杂任务并调度多智能体协作完成。

如果要用一句话总结鸿蒙在“行动智能”时代的准备,那就是——在全新的 HMAF 结构下,鸿蒙体验从“APP触控”转向“自然语言交互”,并通过小艺对话、导航条、chips 推荐等系统级分发入口理解意图、触达服务、完成闭环。

这段描述,其实已经直指“天然入口”的精髓:入口不是下载来的,而是系统原生长出来的——这就是天然入口相当于外挂入口的最大优势,它天然就在那里。

另外,如果说针对外挂入口的瓶颈,是在我们前面说的“三堵墙”,那么小艺这样的系统级天然入口的优势就在于:它天然穿过了这三堵墙——它并不是要消灭超级 App,而是要把App变成可编排的执行单元,把入口变成系统语法,把鸿蒙生态这个客观上的第三方,变成智能体爆发的最佳土壤。

一方面,为了方便APP的接入,小艺智能体开放平台强调“从开发到运行到运营”的全流程,并提供 50+ 鸿蒙系统插件、意图框架兼容 MCP 工具、支持 A2A 多智能体协同,甚至可通过自然语言创建工作流并自动优化提示词,现在甚至连鸿蒙版的OpenClaw——小艺Claw也被晒出来了。

可以说,从天然的预留架构、到友好的生态设置再到多元化的部署方式,鸿蒙应该是目前所有移动操作系统中“Agent亲和力”最好的一个,它的未来不可限量。

那么,也许你会追问,为什么还不爆发?

前面说过,行动智能时代的到来,既需要技术上的准备,也需要商业上的准备。

爆与不爆,一方面取决于前面说的微观技术准备,另一方面取决于大家都在等待的一个答案——AI时代,到底需要什么样的应用产品形态?

如果说,过去16年,移动互联网的主体叙事,就是微信、淘宝、美团、抖音等超级APP的成长史,那么,这些超级巨头的共同特点是:尽可能把用户的时间和注意力,都留在一个App里。

但智能体时代的底层逻辑变了,它不是要圈住你,而是想成为你和其他App之间的中介。

未来的小艺想承载的,可能是如此——我是天然入口,但我甚至不介意你是否认为我是不是入口,我是一个开放的、本地的、用户可控制的AI能力层,我足够第三方、足够开放,我既不是要搞一个封闭式的花园围墙,也不是要在你必经的路径上硬设一个收费站,而是类似于openClaw的逻辑——我是你的使能工具,我最大化的帮你实现一个梦想:“用自然交互的方式指挥我,让你想去哪就去哪,想完成什么任务就完成什么任务,想调用什么模型就调用什么,而且很安全、很本地,最后的数据管辖权还归你自己。”

如果所有人都意识到这才是未来,那么它火爆的那一天,可能就是明天。

结语:

超级入口的时代,可能要过去了。因为Agent天然是跨域运行的,它的能力上限和价值上限,不完全在于它本身能做什么,而在于它能连接到什么量级、多少数量的赋能客体。

在这个背景下,总会走到这一天——不再是超级APP放下身段“开放能力”,而是它们自己拆开私域的壁垒,只求得到同等的被调动、被唤起、被使用的机会。

这才是超级智能体存在的更大意义。

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

举报

评论

  • 推荐
  • 最新
empty
暂无评论