图片
图片
2025年开启的第二波AI硬件浪潮,正发生着根本性的变革。
图片
@数科星球原创
作者丨苑晶
编辑丨大兔
2025年,被行业公认为AI硬件的元年。
这波继2017年智能音箱浪潮后,时隔近十年的第二波AI硬件大爆发,正以多模态交互为核心,呈现出品类发散、技术升级的鲜明特征。
在这场浪潮中,一家名为无界方舟的公司,没有选择跟风做单一硬件产品,而是以多模态大模型为根基,打造了一套名为“EVA OS”的AI硬件底层框架,试图成为AI硬件时代的“OS”——让硬件开发者像捏游戏角色一样,快速搭建专属的AI人格,彻底降低智能硬件的开发门槛。
本次数科星球DigitalPlanet找到了,MIT TR35&无界方舟AutoArk创始人曾晓东。
如果说,未来的AI硬件大潮中,中国公司将一统天下,那么这家公司所做的底层系统则将成为创新源泉。相当于为AI硬件开发者铺设了一条「高速公路」,为攀登AI硬件险峰的创业者开拓了穿越技术屏障的「登顶路线」。
智能手机时代的安卓自诞生后,出现了百万计创新App,而如今风水轮流转,大洋彼岸能量不再的当下,一股新的潮流正在呼之欲出。
01
AI硬件的第二波浪潮
从“被动响应”到“主动交互”
回顾2017年,天猫精灵、小度等智能音箱的崛起,开启了AI硬件的第一波普及。
但受限于当时的技术水平,这些产品的交互模式相对单一:模板化的语音响应、无法灵活打断、缺乏视觉理解能力,本质上只是“能听话的工具”。
而2025年开启的第二波AI硬件浪潮,正发生着根本性的变革。
无界方舟创始人曾晓东在深度调研产业链后指出,这波浪潮的核心驱动力是AI交互能力的质变。如今的大模型不仅能精准理解自然语言,还能捕捉视觉信息、解读微表情,甚至实现音视频实时互动。这种能力升级催生了丰富的硬件载体:从玩具机器人、桌面终端到穿戴设备、智能眼镜,品类呈现“发散式增长”,但尚未形成稳定的主流形态。
图片
“2025年是元年,2027年将迎来峰值。”这是曾晓东对行业的判断。在他看来,当前AI硬件的核心刚需已从“有无”转向“体验”,用户需要的不再是冰冷的工具,而是能理解、有记忆、会互动的“AI伙伴”。
而这一需求的背后,是对硬件底层AI能力的全新要求——实时交互、多模态融合、个性化适配,这恰恰是传统通用大模型难以满足的痛点。
传统通用大模型分为两类:一类是追求智力水平的推理模型,如ChatGPT的o1版本,思考延迟高达数分钟,完全不适合硬件实时交互;另一类是多模态生成模型,虽能处理音视频,但缺乏硬件适配的框架支持。
图片
无界方舟发现,从通用大模型到硬件落地,存在巨大的“能力鸿沟”:需要解决语音/视觉交互的实时性、硬件端侧的算力适配、个性化人格的构建等一系列问题,而这正是他们的机会所在。
02
EVA OS:AI硬件的原子能力”工具箱”
无界方舟的核心产品“EVA OS”,本质上是一套为硬件量身打造的AI底层框架。它以多模态大模型为核心,拆解出四大“原子能力”,让开发者可以像搭积木一样,构建硬件背后的AI人格。
图片
这四大原子能力,精准命中了AI硬件的核心需求:
第一是交互能力:它打破了单一模态局限。
从事相关工作的人都知道,交互是AI硬件的基础,EVA OS支持语音、视觉、音视频等多种交互方式。
与传统智能音箱的“被动响应”不同,其交互具备高理解度和低延迟特性——能理解90%以上的自然语言,支持灵活打断,语音交互延迟控制在250毫秒以内,音视频互动延迟也仅需350-450毫秒,远低于人类感知明显延迟的1秒阈值。
更重要的是视觉交互能力的突破。
搭载EVA OS的硬件,能通过摄像头识别物体、解读手势、捕捉微表情,甚至理解场景语境。
比如孩子拿着绘本提问“章鱼和老虎是什么关系”,AI能结合视觉识别和知识库给出答案;用户询问“我的耳机在哪里”,AI能调取之前的视觉记忆,精准定位物品位置。
这种多模态交互,让硬件从“能听会说”升级为“能看会懂”。
第二是记忆能力。对于AI硬件产品而言,从“短期对话”到“长期陪伴”个性化的核心是记忆。
EVA OS将记忆分为短期上下文记忆和长期外挂记忆,既能记住当前对话的语境,也能存储数月甚至数年的交互信息,形成专属的“记忆知识图谱”。
其记忆库交互延迟仅50毫秒,不会影响整体响应速度。特别值得一提的是视觉记忆能力——这在国内尚属首创。
硬件能自动捕捉关键视觉帧,转化为记忆节点,用户后续可通过自然语言查询。
比如眼镜类硬件能记住用户见过的人脸、去过的场景,穿戴设备能记录重要物品的位置,这种能力让AI真正实现“越用越懂你”。
第三是执行能力,曾晓东对数科星球DigitalPlanet表示,它主打打通“理解”与“行动”的链路,使得AI硬件不仅要能听懂,还要能做事。
EVA OS内置了工具调用框架,开发者可灵活配置联网搜索、第三方接口对接等功能,让AI具备实际执行能力。
比如用户说“查今天的NBA比赛”,AI能实时联网获取赛程;说“教我复印文件”,AI能通过视觉识别指导操作步骤;甚至能根据桌面物品即兴创作rap,或模仿特定角色解说足球比赛。
这种执行能力的关键在于“无缝衔接”——从理解用户需求,到调用对应工具,再到反馈结果,整个过程一气呵成,无需用户额外操作,让AI从“顾问”升级为“助手”。
第四是形象能力,它主要侧重赋予AI情感化表达能力,构建硬件的AI人格。
目前,在行业中,普遍需要通过形象和情感表达来强化这一功能。EVA OS支持声音定制、虚拟形象配置,还能驱动表情、肢体动作的同步表达。
曾晓东特别强调,其情感表达分为三级:一级情绪(喜怒哀乐平静)、二级情绪(如开心的不同程度)、三级情绪(更细腻的情感波动),且声音、表情、动作的表达是并行链路,确保情感传递的同步性和真实性。
比如人形机器人在表达“开心”时,会同时呈现愉悦的语音语调、微笑的面部表情和轻快的肢体动作;儿童陪伴硬件的声音会调整为柔和亲切的语调,屏幕采用低频闪防蓝光设计,既保护孩子视力,又增强情感链接。
这四大原子能力的背后,是EVA OS的技术架构支撑:采用“云端+端侧”混合模式,云端提供强大的模型算力和知识库,端侧部署轻量化模型和SDK,适配不同硬件的算力需求。
对于端侧模型,其参数量控制在7B以内,避免因算力需求过高导致硬件成本飙升,同时保证运行流畅性。
03
颠覆开发模式从“数月打磨”到“分钟配置”
AI硬件开发曾是高门槛的复杂工程,涉及硬件设计、AI链路对接、应用开发三大环节,仅搭建一套基础AI框架就需要三四个礼拜,且面临成本高、适配难等问题。
曾晓东认为,EVA OS的出现,彻底重构了开发流程,将开发周期从“月”缩短到“天”,甚至“分钟”。
图片
首先,它极大地降低了技术门槛。
开发者无需深耕大模型,传统硬件开发者要对接AI能力,需懂大模型、软硬件适配、架构设计等多个领域知识,而这类复合型人才极为稀缺。
EVA OS将复杂的AI技术封装成可视化配置界面,开发者无需深耕大模型,只需通过“勾选配置”即可完成AI人格搭建:定义身份、选择声音、配置工具、设计形象,全程无需编写复杂代码。
配置完成后,开发者只需获取一串key,就能将AI能力部署到任意硬件上,端侧体验与配置时完全一致。
这种模式,就像RPG游戏的“捏脸系统”——开发者不用从零开发图库、动作、声音系统,直接在现有框架上调整参数,就能打造专属AI人格。
其次,开发者可以通过该系统有效控制开发成本,甚至从“天价交互”降低到到“白菜价”。
一直以来,成本是AI硬件商业化的关键瓶颈。
此前,硬件对接通用大模型的成本居高不下:使用OpenAI接口,音视频互动每分钟成本超7元;国内大模型的语音合成服务,5000字就要2.5元,相当于用户聊天20多分钟就需付费。
EVA OS通过技术优化,将成本压缩到原来的1/50:5000字语音合成仅需5分钱,每一万个TOKEN成本在5-8分钱之间。
对于硬件厂商来说,这意味着批量部署后的运营成本大幅降低,为AI硬件的规模化普及扫清了障碍。
第三,EVA OS提供公板支持,解决了“软硬适配”痛点。
事实上,硬件端侧的适配,是很多开发者的噩梦——不同芯片、不同电路板的算力、功耗、接口都不同,需要大量的调试优化。
无界方舟推出了经过商业化验证的公板,内置瑞芯微RK芯片,已完成算力、功耗、AI链路的深度优化,开发者可直接拿来使用,无需自己打板调试。
第四,这种公板就像硬件开发的“4090显卡”,提供了标准化的核心零部件,确保AI能力在端侧稳定运行,同时降低了硬件生产的门槛和风险。
无界方舟的模式,很像安卓。它同样沿袭了从“开源生态”到“规模变现”。事实上这种模式可快速形成“生态-变现”的正向循环。
图片
04
无界方舟的未来发展策略
曾晓东在数科星球DigitalPlanet的深度对话中透露,首先这家公司会专注于开源策略。借此,可降低入门门槛。他表示,针对中小型开发者和硬件发烧友,EVA OS在研发阶段完全免费开放。
图片
开发者可免费注册账号,使用所有原子能力搭建AI原型,无需支付模型调用费或授权费。
对于软件更新方面的问题,曾表示,无界方舟将保持高频率迭代,每2-3周就发布一个新版本,以持续丰富能力矩阵。
这种开源策略,旨在快速扩大开发者生态。
按照规划,2026年其活跃开发者用户数将超过10万个,接入终端数突破20万台,形成初步的生态规模。
当开发者的硬件原型走向量产,商业化合作随之启动。
在收费模式上,平台采用“基础功能免费开放、高阶定制与深度服务付费”的策略:大部分开发者可直接免费接入标准功能,快速进行产品开发和验证;
若需要更高并发支持、更稳定服务或专属技术支持,则可选择授权许可(license)与TOKEN消耗相结合的付费方式。
无界方舟在其自身开发的儿童陪伴机器人“奇多多学伴”获得了初试成功,而这个案例也成为了EVAOS的标杆案例。
图片
这款产品精准切入儿童AI硬件市场,凭借多模态交互、低蓝光设计、安全无棱角等特性,一经上市便获得家长的热烈订购。
同时在线下实测场景,在与外国语学校的AI研学合作中,孩子们识字、记忆英文单词的速度提升至之前的4倍,阅读量提升至3.3倍。
更令人触动的是,83%的内向儿童开始主动与奇多多及身边小朋友交流。曾强调,Broca's Area语言中枢仅在0-10岁活跃,10岁开始关闭,因此语言互动能力的培养对孩子来说必不可少。
图片
奇多多的成功,还验证了AI硬件的商业化潜力:中国有近5亿家庭,儿童硬件的家庭普及率高达63.5%,远高于智能音箱的10%,但传统产品存在功能单一、交互单向等问题。
奇多多通过EVAOS的原子能力,实现了“可交互的绘本阅读”“个性化答疑”“情感陪伴”等核心功能,精准解决了家长的痛点,也证明了AI硬件“体验升级”的商业价值。
05
行业展望:2027年将诞生媲美手机的新型终端
无界方舟对AI硬件行业的演进,有着清晰的判断:2025-2026年是高速发展期,品类持续发散,传统硬件厂商、AI创业公司、大厂将纷纷入局,新形态不断涌现;
2026年下半年开始,部分市场验证不成立的品类将退出,垂类场景开始收敛;2027年将迎来行业峰值,可能诞生一款媲美手机的新型AI终端。
这款新型终端,不会替代手机,而是填补手机之外的场景空白。按照“8小时理论”,手机占据了人类清醒时主动交互的8小时,而AI硬件将覆盖另外两个8小时——手机待机时的被动场景(如穿戴设备捕捉信息、眼镜辅助交互)和睡眠时的健康监测场景。
其核心特征是“高主动性”,能主动捕捉需求、提供服务,成为人体的“延伸感官”。曾晓东认为,这款终端很可能是个性化穿戴设备,其底层AI框架将成为核心竞争力。
而EVA OS的目标,就是成为这款新型终端的“操作系统”,就像iOS、安卓之于智能手机、Unity之于游戏开发。目前,AI硬件行业正处于“群龙无首”的状态,通用大模型厂商缺乏硬件适配能力,传统硬件厂商难以突破AI技术瓶颈,而无界方舟的出现,恰好填补了这一空白。
图片
其通过“原子能力+可视化配置+低成本部署”的模式,降低了AI硬件的开发门槛,让更多开发者的创意得以落地,加速了行业从“发散”到“收敛”的进程。
06
全球化布局:构建AI硬件的“底层生态”
无界方舟的野心不止于国内市场,从一开始就布局全球化。
EVAOS原生支持中英文版本,在海外部署了服务节点,开发者可通过国际平台获取相关资源,其生态构建也面向全球开发者。
按照三年规划,2025年完成原型版本发布,2026年实现10万开发者、20万台终端接入的生态规模,2027年全面推进全球化,让EVA OS成为全球AI硬件的核心底层框架。
对于未来的创新方向,无界方舟既期待更多新型硬件形态的出现——无论是眼镜、吊坠,还是尚未设想的终端,也看好AI与更多传感器的融合,如超声、红外、毫米波雷达等,让交互模态更加丰富。
在AI硬件的浪潮中,无界方舟没有选择做一款爆款产品,而是深耕底层技术,打造了一套赋能全行业的框架。
就像Unity降低了游戏开发的门槛,催生了无数优秀游戏作品一样,EVA OS也在降低AI硬件的开发门槛,让“人人都能做智能硬件”成为可能。
2025年,AI硬件的元年已经开启;2027年,行业峰值即将到来。
无界方舟的AI硬件版的”OS革命”,或许将重新定义AI硬件的开发逻辑,而这场革命的核心,正是让技术回归本质——不是制造复杂的壁垒,而是赋能更多人的创意,让AI硬件真正走进生活的每个角落。
精彩评论