声网公司
声网公司官方号
老虎认证: 声网成立于2014年,是全球实时音视频云服务开创者,为人与人和人与智能体的音视频互动提供最佳体验。
IP属地:上海
12关注
15221粉丝
声网成立于2014年,是全球实时音视频云服务开创者,为人与人和人与智能体的音视频互动提供最佳体验。
avatar声网公司
2024-02-28

声网母公司发布2023 Q4及全年财报,实现3年来首次盈利

北京时间2月27日,声网母公司 Agora, Inc.(NASDAQ: API) 公布了2023年第四季度及全年财报。财报显示,第四季度 Agora, Inc. 实现营收3604万美元,环比增长3%,全年总营收1.42亿美元。 其中,业务聚焦中国市场的声网第四季度实现营收1.48亿人民币,环比增长5%;聚焦非中国市场的 Agora 第四季度实现营收1530万美元,环比持平。 值得一提的是,得益于多元实时互动应用场景的增长和行业扩展,Agora, Inc. 2023年第四季度调整后净利润为140万美元,实现三年以来首次季度盈利。 对此,Agora, Inc.创始人兼CEO赵斌表示,“我们在2023年四季度取得了强劲的财务业绩,实现了连续的收入环比增长,并实现了140万美元调整后净利润,这是三年以来首次季度盈利。这反映了我们在极具挑战的经营环境下的业务韧性,以及我们不断优化成本结构的努力。” Agora, Inc.在2023年第四季度完成股票回购350万ADS,总金额1000万美元。赵斌表示,“在过去的两年中,我们通过回购方式向股东返还了超过1亿美元,我们的总股本也相应降低了约18%。我们非常高兴地宣布,董事会已经授权将2亿美元的股份回购计划延长12个月,这体现了董事会对我们的财务实力和长期增长前景的信心。” 在客户规模方面,截至2023年12月31日,声网活跃客户数量达4144个,同比增长12%,Agora活跃客户数量达1683个,同比增长18%。
声网母公司发布2023 Q4及全年财报,实现3年来首次盈利

声网联合海思推出无人机 4G 远遥图传解决方案,实现 200ms 端到端低延迟

在近期举办的 AWE(中国家电及消费电子博览会)上,声网与海思(Hisilicon)首次联合展示无人机 4G 远遥图传解决方案,携手深圳市纬胜智能科技有限公司完成无人机端产品落地。该方案以“全球实时互动云 + 核心影像芯片 + 垂直方案商”的合作模式,在 4G 网络下实现端到端延迟稳定低于 200ms,为消费级与行业级无人机打造标准化、低延迟、高可靠的远程控制与实时图传服务,完善无人机作业的通信技术支撑体系。 破解复杂网络作业痛点 实现实时感知、低时延操控、稳定执行 无人机能否真正实现远程可操控,取决于 “感知→控制→执行” 这一完整链路是否畅通: 感知:无人机需实时回传高清画面,让地面端“看得清”; 控制:地面需实时下发操控指令,让无人机“听得懂”; 执行:无人机需瞬间响应指令调整飞行,让任务“做得准”。 针对偏远地区、复杂地形下的网络作业难题,声网 SD-RTN™(声网自研的全球实时互动网络)提供了核心支撑: SD-RTN™ 全球覆盖:200+ 国家与地区实时接入,确保无人机无论在哪都有最优链路。 超低延迟:方案实现端到端延迟 稳定低于 200ms,全球延迟达标率高达 99.9%+,网络延时中位数仅 76ms,几乎消除操控延迟感。 抗丢包:凭借高效的抗丢包算法,30%丢包情况下保障画面流畅与指令实时响应,从此告别“飞丢”焦虑。 无论是城市高楼间的消费级穿越机,还是偏远地区执行巡检任务的工业级无人机,这套方案都能提供稳定流畅、双向实时的远遥图传体验。 软硬深度协同  构建稳定传输能力 方案以海思 Hi3519D 超高清智能 SoC 为硬件底座,深度融合声网 RTC(实时音视频)与 RTM(实时信令)技术,完成了从芯片指令集到云端调度的底层协同优化,同时保障视频流上行与控制指令下行的双向稳定。 (1)硬件底座:海思芯片 Hi3519D,专为极致影像而生 作为海思在
声网联合海思推出无人机 4G 远遥图传解决方案,实现 200ms 端到端低延迟
avatar声网公司
03-31 17:41

声网对话式AI ×ClawStage:让大模型成为你的专属家庭智能体

现在的智能家居能语音控制、能 App 远程、能场景联动,但本质仍是“你下指令,我执行”,这正是当前行业的痛点——功能种类虽多,却各自为战。随着多模态大模型进入家庭场景,交互逻辑正在发生根本性变化——人无需逐个控制设备,而是以 AI 中枢为核心,实现家庭设备的统一协同,人只需要与大模型对话即可。 这也推动了家庭运行方式从“被动触发”走向“主动服务”,《钢铁侠》里的贾维斯,或许就是下一代智能家居生态的雏形:一个能理解你、预判你、主动为你打理一切的家庭智能体。 全球首款 OpenClaw 桌面精灵:让大模型拥有物理身体 这款基于 OpenClaw 开源框架开发的具身 AI 终端 ,不仅是一个桌面上运行 LLM 的“盒子”,更是一个具备物理坐标系、支持 Thread/Matter 协议的 IoT 枢纽,未来可以大规模运用到家庭场景中。它解决了 Agent 长期「悬浮」在云端对话框、无法感知并干预真实物理世界的痛点。 从技术架构来看,一个完整的“家庭 AI 智能体”需要三个层面协同: · 大模型(大脑):负责理解意图、生成对话、规划任务 · 交互层(感官与神经):让大模型像真人一样自然流畅、有温度地对话 · ClawStage(身体):负责感知环境、执行动作、控制设备 大模型在家庭场景落地往往面临三方面限制:缺乏物理定位、缺少环境感知入口、不具备设备执行能力。ClawStage 作为硬件载体,为大模型提供了可定位、可感知、可执行的物理接口。 ClawStage 核心能力可以概括为四个层面: 1. 从「对话框」到「物理肉身」 ClawStage 为 AI Agent 提供真实坐标系统,通过旋转机构、摄像头与传感器感知用户动态,并做出主动侧身、变换姿态等物理反馈,实现从“被动执行指令”到“主动感知环境”的跨越。 2. 跨终端 AI 角色无缝流转 依托 HooRii Workshop ,A
声网对话式AI ×ClawStage:让大模型成为你的专属家庭智能体

声网泛IPC解决方案,为终端提供高可靠传输与端云协同AI能力

从今年春晚到 AWE 2026 ,智能科技产品成为当之无愧的主角。当摄像头、扫地机器人、3D 打印机、宠物喂食器……越来越多的设备进入大众视野,用户对它们的期待早已不是“能远程看一眼”这么简单。用户希望:在海外也能秒速打开家里的监控;在弱网环境下扫地机依然听指挥;在宠物异常时第一时间收到提醒;在 3D 打印过程中实时掌控进度。 这些期待的背后,是对实时交互能力与端云协同 AI 的双重考验。传统 P2P 方案建联成功率低、弱网卡顿、黑屏时间长、智能化门槛高,难以满足新一代 IoT 设备的全球化部署需求。 在 AWE 2026(中国家电及消费电子博览会)上,声网正式发布 “泛 IPC 实时交互+智能处理引擎” 。该解决方案集成全球覆盖、流畅互通、超低延迟、超快出图四大核心能力,并可自由加载海量 AI 识别算法,帮助设备厂商从“卖硬件”升级为“卖服务”,让设备从“看得见”进化为“能交互、会思考”。 为“高质量要求”客户打造的 泛 IPC 解决方案 在泛 IPC 领域,不同场景对音视频传输质量的要求差异巨大。普通的 P2P 方案在简单场景下勉强可用,但当设备出海、网络波动、多端交互、需要实时 AI 分析时,其局限性便暴露无遗。 该解决方案,正是为那些对质量有更高要求的客户量身打造,覆盖以下四类核心客户: · 国内 IPC 厂商:需要更高的连通率、更稳定的弱网表现、更快的出图速度。 · 出海 IPC 厂商:需要真正的全球覆盖,以及符合欧美严格合规要求的传输链路。 · 宠物类、观鸟类 IPC 创新场景:需要低成本快速上线,缩短产品开发周期。 · 3D 打印、扫地机、割草机、家庭机器人等厂商:需要双向实时控制与端云协同智能,支撑复杂场景下的远程操控与自动化作业。 依托声网自研的 SD-RTN™(全球实时互动网络) 与端侧深度优化能力,该解决方案提供从建联、传输、出图到
声网泛IPC解决方案,为终端提供高可靠传输与端云协同AI能力

AWE 2026|对话式 AI 正“卷”进每一个终端硬件

过去10年是移动互联网黄金时代,我们习惯于将生活、娱乐、办公乃至情感陪伴,统统装进那个几英寸的屏幕里。APP 成了万能入口,软件定义了一切服务。 而如今,站在2026年的人工智能拐点上,一场逆向迁徙正在发生。随着 AI 大模型和芯片的指数级进化,那些曾经被困在 APP 里的核心功能,正被逐一“释放”——不再甘于栖身于虚拟软件,而是以智能穿戴、桌面机器人、毛绒陪伴玩偶等实体形态,走进了我们的物理空间。 这是从“移动互联网”向“万物智联、软硬一体”的范式转移。而在这次转移中,基于人类自然语言交互的对话式 AI ,正在成为连接数字智能与物理实体的主线。 声网,作为这条主线的关键铺设者,正通过一系列开发套件与开源生态,悄然定义着下一代 AI 硬件的交互标准。 声网展台上的 AI 硬件 一年三迭代: 陆续发布 R1、R1-4G、R2 开发套件 要在物理世界实现真正的智能,硬件不仅需要云端或端侧的大模型作为“大脑”来思考、理解与规划,更需要一整套实时交互的“神经系统”和“感知器官”——让它能听见声音、看见环境、协调动作,在物理空间中做出自然流畅的实时反应。 2025年3月,声网发布对话式 AI 开发套件 R1 ,基于博通集成 BK7258 芯片,专注于解决实时全双工对话、背景降噪和智能打断,让 AI 硬件首次拥有了近乎真人的“对话节奏” 。发布至今,R1 套件出货已达百万量级,被广泛应用于各类 AI 玩具、陪伴机器人等产品中,成为行业内的标准参考方案之一。 2025年9月,声网洞察到场景的移动化需求,联合紫光展锐、谨讯推出了 R1-4G 开发套件。通过加入 4G 通信能力,AI 硬件具备了随时随地陪伴的属性,为智能穿戴和车载场景铺平了道路 。 而在本次 AWE 上,声网 R2 全场景 AI 机器人开发套件原型机首次亮相。R2 在继承全双工语音优势的基础上,新增了本地视觉识别与
AWE 2026|对话式 AI 正“卷”进每一个终端硬件

声网母公司2025 Q4及全年财报:营收增长10.7%,连续五季GAAP盈利

北京时间3月3日,声网母公司 Agora, Inc. (NASDAQ: API) 公布了2025年Q4及全年财报。财报显示,第四季度 Agora, Inc. 实现总营收3816万美元,同比增长10.7%。全年总营收 1.41亿美元,同比增长5.9%(若不含已终止的低毛利业务,增速为11.4%)。2026年Q1公司指引收入区间为3600至3700万美元,同比增长8.1%—11.1%。 在美国通用会计准则(GAAP)下,Agora, Inc. 全年净利润 953万美元,净利润率 6.8%,第四季度净利润为492万美元,净利润率12.9%,继2024年 Q4 同比扭亏为盈后,已连续五个季度实现 GAAP 盈利。对此,Agora, Inc. 创始人兼CEO赵斌表示,“我们欣然宣布,公司连续第五个季度实现美国通用会计准则(GAAP)下的盈利,也标志着自2018年以来我们首次达成全年盈利,这主要得益于持续的双位数营收增长。在一场备受瞩目的超级碗直播购物活动中,我们平台稳定可靠的扩展能力得到了充分验证——为全球近60万峰值并发观众提供全高清视频直播,并支持观众以毫秒级延迟进行实时互动。 与此同时,我们的对话式 AI 引擎产品正被加速采用,自2025年3月发布以来,季度使用量均实现超过翻番的环比增长。今年1月,我们在国际消费电子展(CES)上推出的赋能智能机器人的对话式AI解决方案反响热烈,领先的视觉与运动控制能力尤其成为亮点。2026年全年,我们将持续聚焦营收增长,并全力推进对话式 AI 技术的创新突破。” 在现金储备方面,截至2025年12月31日,Agora, Inc. 现金、现金等价物、银行存款及银行理财产品为3.75亿美元。 RTE+AI 产品能力实现突破 2025 Q4,声网在产品创新上持续发力,推出多项重磅产品,推动 AI 交互能力迭代升级: 精彩亮相 CES 20
声网母公司2025 Q4及全年财报:营收增长10.7%,连续五季GAAP盈利

声网实力再获印证:与头部社交平台Monkey合作十年,实现一亿用户零投诉

引言   RTE 超能力 跨洋视频的会心一笑、远程课堂的专注眼神、AI 设备的贴心关怀……实时互动(RTE)的"超能力"如空气浸润日常,消融距离,让人与人、人与 AI 的每次连接充满温度。这股力量正重塑商业与民生,成为企业增长的静默引擎——其价值,藏在声网与客户的每一次真实落地。 每则成功案例背后,都是技术"超能力"与企业需求的精准击掌,是双方并肩啃下硬骨头后的真实战果。声网【RTE 超能力】系列将聚焦双方的真实合作与落地价值,看 RTE 技术如何帮企业接住用户期待、实现增长破局。 诚邀您走进这些故事,解码" 超能力"内核,探寻合作赋能商业增长的深层力量。 在实时互动云服务的赛道上,声网服务过数千家企业,涵盖教育、IoT、社交等 20 多个行业。但要说最久的合作伙伴,HOLLA Group 旗下的全球实时视频社交平台 Monkey 一定排在前列。 从 2015 年开始,当视频社交还是个新物种时,Monkey 的整个业务就构建在声网的 RTC 能力之上。十年里,他们的用户从 0 增长到破亿,覆盖国家从几个到 190+ ,而我们的合作始终只有一行核心使命:共同保障全球用户的实时互动体验。 对声网来说,这是一段把"像水和空气一样自然"的技术理念,在上亿用户身上反复验证的十年。 01 用户在哪里,挑战就在哪里 在实时社交的世界里,一次卡顿,就可能永远失去一个用户。 如何在一个遍布世界各地、网络环境千差万别的舞台上,为全球用户提供持续稳定的实时视频互动? 网络抖动、设备性能参差、社交场景对卡顿的零容忍,每一环都是地狱级的考验。 HOLLA 业务中台负责人王广威在访谈中具体描述了当时的困境:“因为我们的平台要服务于全球用户,很多用户所在地区可能由于基础设施不完善,网络连接经常会卡顿,用户经常会反馈断流、黑屏等等这样的问题,导致了用户流失,这是我们当时急需要解决的。” 更麻烦的
声网实力再获印证:与头部社交平台Monkey合作十年,实现一亿用户零投诉

深耕出海与产品创新,声网斩获三项行业奖项

近日,声网在出海与产品、技术领域收获多项行业认可: 🏆声网荣获 InfoQ 2025年度「优秀出海服务商奖」 作为国内极具影响力的技术社区,InfoQ 评选聚焦企业技术实践与全球化布局。声网凭借长期深耕海外市场,以低延时、强降噪等 RTC 核心能力,赋能跨境电商、社交互动、在线教育等场景,助力企业打破地域壁垒,斩获该奖。 🏆声网对话式 AI 引擎获评2025 AI 产品大会「年度影响力 AI 产品」 该奖项由「人人都是产品经理」与腾讯大讲堂联合颁发,评审聚焦产品应用价值与行业带动作用。声网对话式 AI 引擎以轻量化部署、高适配性优势入选,可快速对接企业业务体系,落地 AI 硬件、AI 教育等多元场景,高效解决开发痛点。 🏆声网对话式 AI 引擎摘得大模型之家2025达摩奖「年度 AI 杰出创新成果」 该奖项关注行业关键技术突破,声网对话式 AI 引擎因底层技术创新获奖。引擎兼容全球主流大模型与语音合成技术,支持声纹识别、跨场景拓展,适配智能外呼、情感陪伴等复杂需求,赋能产业智能化升级。 每份荣誉都离不开行业与客户的信任。未来,声网将坚守技术初心,深耕实时互动与对话式 AI 领域,以更扎实的技术与服务,携手伙伴推动行业高质量发展。
深耕出海与产品创新,声网斩获三项行业奖项

芙崽、陆卡卡、糯宝、小匠物联,这些 AI 硬件都在用声网对话式 AI

🎊 CES 2026已经落幕,来自中国的各类创新 AI 硬件与具身机器人成为了本次 CES 的焦点,其中,Fuzozo 芙崽、陆卡卡、糯宝、Lookee 口语侠等 AI硬件凭借出色的对话交互体验,现场受到很多参会人群关注,一起来看看,这些 AI 硬件是如何利用声网对话式 AI 技术,来打造极致人机交互体验的吧! 🐻 AI 陪伴机器人 - Fuzozo 芙崽 借助声网的对话式 AI 能力,珞博旗下的口袋 Al 毛绒宠物 Fuzozo 大幅优化了 AI 交互的实时性和稳定性,使得这款 AI陪伴机器人能够进行自然流畅的对话,提供实时情感陪伴和个性化交互,从而为用户带来全新的陪伴体验。 🤖 桌面级情感陪伴机器人 - 陆卡卡 陆卡卡搭载了声网全新的 R2全场景 AI 机器人开发套件,该套件将复杂的本地视觉、运动控制与实时语音交互深度融合并封装为标准化模块,显著降低了开发门槛,使得陆吾将资源更聚焦于产品创新与体验打磨。 👨🏫 口袋 AI 外教 - Lookee 借助声网的对话式 AI 技术, Lookee 构建起稳定、低延迟且清晰的高质量对话环境,确保了每一次问答与情景对话都能如真人交流般自然流畅、即时响应,这为产品实现深度的引导式对话与沉浸式陪伴体验提供了可靠的技术基础。 🧸 AI陪伴机器人 - 糯宝 在声网对话式 AI 技术的助力下,糯宝的“活人感”进一步升级,不仅可以与人类进行自然、流畅的对话,还能准确识别用户的情绪并快速给予相应的反馈,成为贴心的情感陪伴者。同时,它还支持声纹识别与多人对话识别,不仅能在嘈杂环境中准确分辨交流对象,还能流畅应对多位用户的交流互动。 👓 对话式 AI 眼镜 - HeyCyan 在办公场景中,HeyCyan 可高效生成会议纪要,结合声网深度优化的对话式 AI 技术,实现“所问即所答”的即时反馈。配合新一代语音合成,AI 音色自然生动,听觉体验真实流畅
芙崽、陆卡卡、糯宝、小匠物联,这些 AI 硬件都在用声网对话式 AI

开年重磅丨声网与 MiniMax 深化全球战略合作

近期,MiniMax 在港交所成功上市,其与声网也进一步深化了战略合作关系。MiniMax 将领先的文本转语音(TTS)技术及多模态大模型,与声网对话式 AI 引擎以及全球超低延时实时传输网络(SD-RTN™)相结合。这一强强联手将助力全球开发者与企业,部署更具生命力、响应更灵敏、体验更拟人化的对话式 AI 产品。 早在2024年10月,声网就宣布与 MiniMax 联手发布国内首个 Realtime API,助力 AI 告别“机械感”,实现更低延时的自然交流。 从模型能力走向真实世界的交互 随着生成式 AI 的飞速发展,行业真正的挑战在于如何将高质量的 AI 转化为跨设备、跨复杂网络环境的自然实时交互体验。 MiniMax 的 TTS 模型具备表达丰富、可控且情感细腻的语音生成能力,支持多种语言、语调和说话风格。而声网则提供了互补的核心优势:将 AI 输出转化为实时交互体验,这使得 AI 的表现更贴近人类的沟通模式。 此次合作的独特之处不仅在于技术层面的集成,更在于双方全球化的视野: MiniMax 带来具备全球视野的前沿 AI 模型:其模型在设计之初就针对多语言、多文化及内容丰富的应用场景进行了优化。 声网提供经受过实战检验的全球实时网络:其自建的 SD-RTN™  网络覆盖 200 多个国家和地区,旨在提供毫秒级的超低延时、优秀的抖动控制以及大规模并发下的音视频质量保证。 双方共同填补了 AI 生态系统中的关键空白:即无论用户身处何地、使用何种设备,都能获得稳定、自然且富有表现力的 AI 语音交互体验 。 赋能下一代实时语音 AI 产品 声网与 MiniMax 的联合解决方案已在多个场景中落地,包括: · AI 陪伴与智能设备:需要实时语音反馈的交互场景  · 实时语音 Agents:用于客服和企业工作流的自动化交互 
开年重磅丨声网与 MiniMax 深化全球战略合作

CES 爆火!这款全球最小的 AI 教育产品,把“学习”设计成了“渴望”

在 CES 2026 现场,一款精致可爱的 AI 硬件旁始终围满体验者——这正是盒智科技新发布的 Lookee 口语侠。短短时间,这份业内的高度关注已悄然流入许多家庭的年货清单。它回应的不仅是教育开发者的思考,更是家长心底的柔软期待:能否让孩子自然而然地爱上说英语,让学习成为渴望陪伴时的自然发生? Lookee  亮相 CES 2026 声网展位 这份期待,指向了两个久未解决的教育痛点:“哑巴英语”的无效学习,与智能硬件常见的“迅速闲置”。Lookee 与背后提供 RTC 技术的声网,正在合力给出一个温暖的答案。 破解“哑巴英语”困局: 从“屏幕依赖”回归“真实对话” 中国孩子学习英语普遍面临“哑巴英语”的挑战。研究表明,当学习同时依赖屏幕文字和声音时,大脑会优先处理视觉信息,从而抑制听觉与口语表达能力的提升,这是导致很多孩子“能读不能说”现象的重要根源。 因此,盒智科技没有选择在屏幕上堆叠更丰富的多媒体内容,而是做出了一个反直觉的关键产品定义:彻底移除屏幕,让交互回归纯粹。这背后,是对真实语言交流环境的彻底模拟。 于是,我们看到了 Lookee 口语侠:外形轻巧如耳机盒,重量不足50克,支持独立 4G 联网。它生来就是为了被装进口袋,挂在胸前,陪伴在沙发、车内或公园长椅上——在任何孩子觉得放松的时刻,开启一场轻松的对话。这或许正是当下许多家庭所寻求的:一种不侵占孩子视力、不制造亲子摩擦、随时随地融入生活的学习方式。 然而,实现“无屏沉浸式对话”这一理念,首要前提是必须拥有堪比真人对话的实时语音交互质量。任何卡顿、延迟或杂音,都会打断孩子的表达思路与沉浸感。这正是声网技术发挥关键作用的地方: 通过自研的 SD-RTN™ 网络与高清晰、抗弱网、强降噪的音频解决方案,确保了孩子无论身处移动环境还是网络不稳的场景,与 Lookee 的对话都能始终保持清晰、流畅、稳定。
CES 爆火!这款全球最小的 AI 教育产品,把“学习”设计成了“渴望”

CES 2026丨声网联合博通集成发布 R2 全场景 AI 机器人开发套件

CES 2026 期间,声网联合中国领先的无线连接芯片设计企业博通集成正式发布基于 BK7259 芯片的“ R2 全场景 AI 机器人开发套件”。陆吾智能旗下“陆卡卡”作为该方案在桌面机器人场景的标杆产品,同步亮相展会。 陆卡卡在 CES 声网兄弟公司 Agora 展位 R1 到 R2 的升级: 从“能听会说”迈向“能看会动” 去年3月,声网 R1 开发套件一经发布,珞博智能的“芙崽Fuzozo”便成为声网首批客户。 在京东2025年6·18大促期间, Fuzozo 在 AI 玩具竞速榜中表现亮眼,旗下“金木水火土”五个款式占据当天竞速榜前六位。市场对 Fuzozo 的广泛认可,验证了 R1 套件出色的实力与市场潜力。 芙崽在 CES 声网兄弟公司 Agora 展位 本次推出的 R2 套件则是在 R1 基础上的技术、功能升级,并标志着声网端侧 AI 交互能力从“能听会说”到“能看会动”的正式跨越。 R2 完整继承了 R1 系列业界领先的全双工对话、背景降噪、流畅打断等实时 AI 语音交互能力。并新增以下突破性功能: 本地视觉识别与处理能力: 依托 BK7259 芯片强大的集成 NPU 与 ISP,R2 新增本地视觉识别与处理能力。这意味着机器人可以实现人脸跟踪、手势识别、物体跟随等复杂功能,让实时交互从“语音”扩展到“视觉”。 实现具身互动,让机器人更具“活人感”: R2 支持多自由度运动控制,结合视觉与语音功能,助力机器人实现“走到用户面前打招呼”、“转头注视说话者”等富有生命感的情感化肢体交互。 诸多合作伙伴产品联合参展: 陆卡卡、Lookee、Choochoo 、小匠、二白机器人等在现场 定义“全场景”: 一套基座,赋能多元硬件创新 R2 的能力边界不止于桌面机器人。其设计初衷是为需要融合“感知-决策-动作”的 AI 硬件提供标准化参考,为各类创新硬件提供一套经过验证
CES 2026丨声网联合博通集成发布 R2 全场景 AI 机器人开发套件

CES 2026 首发丨声网开源 AOSL ,构建 AI 硬件开放新生态

CES 2026 展会期间,声网宣布将其核心的硬件抽象层项目 AOSL (高级操作系统层)在 GitHub 全面开源。  图片 AOSL 能显著降低 AI 在硬件端落地的创新门槛,加速催生更繁荣的硬件创新生态。芯片原厂和设备开发者可以更便捷、快速地集成 Voice AI 等能力,推动产品化进程,从“一次性定制”走向“可复用、可扩展”的生态协作。 定义标准接口 消除适配碎片化 AOSL 是一个由声网发起并完全开源的标准项目,已在 GitHub 开放共享。 它通过定义操作系统、芯片与 RTC 传输层之间的通用接口,有效屏蔽了不同芯片和操作系统之间的底层差异,让开发者能够专注于应用层创新,而无需适配复杂的硬件与系统碎片化问题,尤其为 RTOS 等嵌入式场景提供了统一支持。 图片 这意味着,芯片厂商或硬件开发者可以依据这套标准接口,高效完成自身平台的驱动对接,从而大幅降低技术门槛、缩短周期并提升稳定性。 为了确保这一过程的可靠与高效,项目同步开源了经过设备验证的参考实现(支持 FreeRTOS 的 BK7258 和 ESP32 S3 及通用 Linux)以及一套完备的自动化测试用例。这使得任何新平台的实现都能在真正调试前验证其性能与稳定性,为生态协作提供了坚实的技术基准。 赋能芯片生态 加速 AI 硬件产品落地 AOSL 以开源开放的模式,显著降低了 AI 在硬件端落地的创新门槛,加速催生更繁荣的硬件创新生态。它帮助芯片原厂和设备开发者更便捷、快速地集成 Voice AI 等能力,推动产品化进程,从“一次性定制”走向“可复用、可扩展”的生态协作。 对于芯片厂商,实现与 AOSL 的对接并进入声网的“官方认证”矩阵,意味着其芯片能直接附加强大的“出厂即智能”属性,成为开拓市场的利器,并形成一个“芯片增强竞争力-吸引更多开发者-生态繁荣反哺芯片”的增强回路
CES 2026 首发丨声网开源 AOSL ,构建 AI 硬件开放新生态

从 “活人感” 缺失到体验基准打造:对话式智能体的进化之路

2024年的夏天,一场关于 WebRTC 与生成式 AI 的 PPT 任务,开启了45天的疯狂冲刺,最终诞生了第一款 To B 的 Realtime API 。这段经历不仅颠覆了对硅谷工作文化的认知,更揭示了 AI 时代产品开发的残酷法则:速度、稳定性和实验精神。本文将深入探讨对话式 AI 的生死线、技术路线选择背后的战略思考,以及在技术狂飙中如何保持人性的深刻洞察。 前段时间的2025 AI 产品大会中,声网 AI 产品线负责人姚光华认为,下一代AI助手必须具备“人格化”特征。 通过情感识别、多轮对话记忆,现代 AI 正在获得接近真人的“活人感”。但他同时强调,必须建立统一的体验基准,让这种“人味儿”质量可控、体验可预期。本文为姚光华现场分享精华内容,分享给大家: 2024年的夏天,上海热得反常,据说是90年来最热的一个夏天。 八月的一天中午,老板的电话来了。“ Colin,停下你手头所有的事,”他在电话那头说,“帮我写一个 PPT 。” 没有解释,只有紧迫。我推掉了下午和晚上所有的安排。那个通宵,我只写了三页 PPT :关于通信协议的三次迭代,关于开源 WebRTC 与商业 RTC 的系统性比较,以及一张产品架构大图——关于如何让一个大模型开始“说话”。 凌晨五点,会议结束,我回到家。这并非终点,而是接下来45天疯狂加班的起点。那45天的极限冲刺,换来的是国庆长假第一天,我们与 OpenAI 共同面向世界推出了第一款 To B 的 Realtime API。从那天起,开发者终于可以在自己的应用里,真正接上对话式智能体。 这次经历留给我最深的印记,不是技术参数,而是一种认知的崩塌与重建。站在2025年的路口,我意识到:地球是圆的,硅谷也可以是卷的。 01 硅谷没有“松弛感” 如果你在工作的强度上有 K 线图,会发现一个惊人的事实:所有 AI 时代的产品和研发,在2024年
从 “活人感” 缺失到体验基准打造:对话式智能体的进化之路
avatar声网公司
2025-12-24

声网×珞博智能斩获 OFweek 2025物联网行业优秀成功应用案例奖

近日,声网与珞博智能共同申报的“珞博 AI 陪伴宠物 Fuzozo(芙崽)”项目,荣获“维科杯· OFweek 2025物联网行业优秀成功应用案例奖”。该奖项在物联网领域以高度专业性与行业影响力著称,旨在表彰当年具备创新价值与落地成效的卓越案例。 获奖背后,是项目所依托的坚实技术基础。声网为 Fuzozo 提供对话式 AI 引擎,通过低延迟、高稳定的实时互动技术实现自然流畅的情感交互。 Fuzozo 在 MWC 、 AWE 获认可,"618"首轮预售10分钟破千单。声网底层技术支撑成为 AI 伴侣机器人规模化应用的关键基础设施。 此次获奖,不仅是对珞博智能产品创新与市场表现的认可,也印证了声网对话式 AI 赋能合作伙伴、携手推动行业进步的模式取得了积极成效。 在 AI 陪伴型产品的研发中,情感陪伴功能的实现高度依赖于实时、稳定且拟人化的交互体验。这类产品的核心,往往在于能否在对话中给予用户如真人般自然流畅的回应——这正是声网为“芙崽”所提供的技术内核。在该赛道,实时互动已不再是“加分项”,而是决定产品温度与用户黏性的“生命线”。一旦出现响应延迟或交互中断,陪伴感便极易被打断,情感连接也难以维系。 声网为这种用户核心体验提供了全面而深入的技术支持。在软件层面,声网提供了对话式 AI 开发套件,其中的智能打断处理技术赋予了芙崽灵活的对话能力,能够根据用户的表达实时调整,极大地提升了交互的适应性与流畅度,告别机械式应答。 在硬件适配与性能调优方面,声网团队基于在对话式 AI 与硬件生态领域的积累,与珞博智能在芯片选型参考、功耗优化设计及外设功能协同等环节紧密协作,确保对话式 AI 在硬件平台上稳定、高效运行,为用户提供一致且可靠的体验。 此次获奖是双方合作成果再次获得的行业肯定。早在今年6月,该案例就在爱分析举办的第三届 AI 大模型高峰论坛上获评“ AI  Agent
声网×珞博智能斩获 OFweek 2025物联网行业优秀成功应用案例奖
avatar声网公司
2025-12-18

声网视频 SDK 首批通过 GIIC 鸿蒙生态权威评测,获「 Harmony Trusted SDK 」标识认证

近日,为进一步推动行业规范化发展,鸿蒙生态服务公司作为全球智慧物联网联盟( GIIC )授权测试机构,与中国信息通信研究院标准所共同完成了首批“鸿蒙 SDK 用户权益保护与个人信息收集评测”。声网视频 SDK 凭借扎实的合规架构设计与卓越的安全隐私保护能力,在众多产品中脱颖而出,首批通过权威测评,获得「 Harmony Trusted SDK 」认证。  证书 此次评测不仅是鸿蒙生态对 SDK 产品安全与合规的“硬核大考”,作为首个聚焦“物联网+鸿蒙”的国际化产业组织,GIIC 的此次认证也为鸿蒙 SDK 生态建立了规范化标杆,更为行业筛选安全、可信、合规的软件开发工具包( SDK )提供了依据。 该认证是对声网在数据安全与隐私保护领域多年的技术积累和实践的高度认可,标志着声网视频 SDK 在“用户权益保护”与“个人信息收集”两大核心维度上完全符合 GIIC 的高标准要求,也为广大鸿蒙应用开发者提供了合规与安心的实时音视频 SDK 选择,大幅降低开发者应用上架鸿蒙应用市场的合规风险,缩短开发周期,使开发者能更专注于业务创新。 作为鸿蒙生态的重要合作伙伴,声网近年来持续领跑鸿蒙生态适配进程:2024年1月,率先完成对鸿蒙 HarmonyOS NEXT 系统的适配,并支持 1V1 音视频场景,也是业内首批适配鸿蒙 HarmonyOS NEXT 系统版本的实时音视频服务厂商;6月,紧跟系统迭代节奏,率先完成基于鸿蒙 HarmonyOS NEXT Beta 版的实时音视频 SDK 适配;10月,推出实时音视频 SDK 4.4.0 适配版本,进一步提升音视频的基础能力和性能体验;同年12月,受邀参加“同心聚力,共建共享鸿蒙新生态”为主题
声网视频 SDK 首批通过 GIIC 鸿蒙生态权威评测,获「 Harmony Trusted SDK 」标识认证
avatar声网公司
2025-12-11

声网联合中国信通院牵头发布实时音视频类 SDK 安全标准

近年来,工业和信息化部大力推动提升移动互联网应用服务质量,构建 App 与 SDK 全链条、闭环式管理体系。通过建立个人信息保护“双清单”、细化 SDK 服务运营规范、开展多批次侵害用户权益专项整治等系列举措,不断压实企业主体责任,切实筑牢用户合法权益保障防线。2025年3月,中央网信办、工业和信息化部、公安部、市场监管总局联合启动个人信息保护系列专项行动,将 SDK 违法违规收集使用个人信息列为重点治理环节,进一步强化行业合规监管力度,推动 SDK 安全治理向纵深发展。 为积极响应国家监管部门对 SDK 安全管理的系列要求,破解实时音视频领域个人信息保护与用户权益保障的行业痛点。近日,由声网与中国信息通信研究院(以下简称“中国信通院”)联合牵头、实时互动领域代表企业共同参与编制的《T/TAF 267.6—2025 软件开发工具包(SDK)用户权益和个人信息保护技术要求 第6部分:实时音视频类》团体标准,正式在电信终端产业协会 TAF 发布。 图片 该标准立足实时音视频 SDK 技术特点与应用场景,聚焦个人信息保护核心合规需求,明确了个人信息收集、存储、使用、传输、销毁等全生命周期处理要求,细化了用户权益保护机制与业务功能划分配置规范,填补了实时音视频细分领域 SDK 安全标准的空白。标准的出台,不仅为行业企业提供了清晰、可操作的合规管理指引,助力企业规范 SDK 开发运营合规行为,也为监管部门开展监督检查、第三方评估机构实施合规评估提供了参考依据。此前,中国信通院已在 TAF 发布广告类、推送类、地图类、支付类、统计类等 SDK 相关标准,本次实时音视频类 SDK 标准的落地,标志着我
声网联合中国信通院牵头发布实时音视频类 SDK 安全标准
avatar声网公司
2025-12-11

声网对话式 AI Studio 零代码也能快速开发对话式 Agent

在对话式 AI 应用场景爆发的当下,开发门槛高、模型参数调优复杂、多供应商资源整合繁琐等行业痛点,成为了很多企业与开发者的烦恼。在 RTE2025 实时互联网大会上,声网正式发布了对话式 AI Studio 1.0,以 “零代码生产级智能体工厂” 为定位,直击行业痛点,凭借可视化编排、全流程模块化设计与生态化资源整合,让不懂代码、不熟悉音频参数的使用者也能在 1 小时内打造专属智能体,打破技术与效率的双重壁垒。 作为声网对话式 AI 全栈产品矩阵的重要一环,对话式 AI Studio 深度依托声网对话式 AI 引擎的技术底座,聚焦 “零门槛、高自由度、快上线运营” 的核心需求,构建起覆盖智能体编排、测试、部署、监控的全生命周期支持体系。其核心突破在于将复杂的技术转化为可视化操作:开发者可在一站式可视化界面中,轻松完成 Prompt 编写、ASR 与 TTS 模型选型、音色配置、数字人设置等全流程开发,无需关注底层技术细节。针对开发者普遍困扰的参数调试问题,平台提供预设推荐值与完整模板参数配置,开发者自己选择想用的功能和模块,就能做成自己要的对话式 Agent。 对话式 AI Studio 还为开发者提供了场景化模板与插件商店。场景化模板中心的场景选择兼具前瞻性与实用性,目前已上线智能客服、情感陪伴、英语陪练等热门场景模板,这些模板均源自对话式 AI 落地一年来经市场验证的高价值场景;后续还将逐步上线招聘专员、智能客服-电话外呼-服务满意度回访、智能助教-作业批改等更多细分场景模板,支持一键克隆快速启动项目。 插件商店则实现了第三方资源的一键选购与集成,涵盖国内主流 ASR、LLM、TTS 供应商资源,用户无需挨个注册账号,通过声网即可完成一键选购,高效组装。同时支持自有资源导入,满足个性化需求。平台与声网对话式 AI 模型评测平台深度联动,可根据延迟、成本等核心指
声网对话式 AI Studio 零代码也能快速开发对话式 Agent
avatar声网公司
2025-12-11

2025爱分析·对话式AI市场厂商评估:声网

01 公司介绍 声网成立于 2014 年,是全球实时音视频云服务开创者,为人与人和人与智能体的音视频互动提供最佳体验。开发者只需简单调用声网 API,即可在应用内构建诸如对话式 AI、音视频通话、直播等多种实时互动场景。 2020 年 6 月 26 日,声网母公司 Agora, Inc. 成功登陆纳斯达克,股票代码为“API”。 02 产品服务介绍 声网的核心产品体系已从基础的实时音视频(RTC)延伸至“对话式 AI”全栈矩阵。其核心产品为“对话式 AI 引擎”,该引擎支持与全球主流的大语言模型集成,提供低至 650ms 的端到端响应延迟和智能打断功能。 围绕该引擎,声网推出了“对话式 AI 开发套件”,针对智能硬件提供软硬一体化方案,支持主流芯片与多模态交互。 此外,声网还发布了“对话式 AI Studio”低代码编排平台和“AI 模型评测平台”,前者用于快速搭建和编排智能体,后者帮助开发者科学评估和选择 ASR、LLM 及 TTS 模型。底层基础设施方面,声网依赖其自研的全球软件定义实时网 SD-RTN™ 保障高并发下的网络传输质量。 03 厂商评估 作为实时互动云服务领域的头部厂商,声网在生成式 AI 浪潮中迅速完成了从“传输管道”提供商向“智能交互”基础设施服务商的转型。不同于从模型层切入的 AI 初创公司,声网的核心竞争力在于利用过去十余年在实时网络传输和音频处理上的工程化积累,解决了大模型落地过程中最为棘手的延迟控制、即时打断及复杂网络环境下的稳定性问题。 通过构建开放、中立的生态位,声网将 ASR、LLM、TTS 等碎片化能力通过引擎进行标准化封装,并辅以开发套件和评测工具,极大地降低了企业集成对话式 AI 的技术门槛与试错成本。 随着政策对 AI 产业落地的推动以及电话、网页、智能硬件等场景需求的规模化爆发,声网的产品矩阵已具备支撑大规模商业化应用的能力,特
2025爱分析·对话式AI市场厂商评估:声网
avatar声网公司
2025-12-11

对话式 AI 引擎2.0 让 AI 更懂开口时机 支持预注册声纹识别与电话外呼

在今年的 RTE2025 实时互联网大会上,声网正式发布了对话式 AI 引擎2.0版本,该版本实现“优雅打断”的升级,支持过滤无语义附和词,让 AI 更懂开口的时机;支持预注册声纹识别,AI 能分辨是谁在讲话;新增 AI 电话外呼功能,支持 SIP/PSTN 电话,通过 AI Studio 编排或一行代码即可实现,稳定性高。同时新版本还支持国内外更丰富的 ASR 与 TTS 供应商,用户可根据自己需求选择想要的语种和音色。 对话式 AI 引擎最新产品架构图 优雅打断2.0 让 AI 更懂开口时机 在人与人对话中,经常为了表示认同会发出“嗯”、“啊”、“是的”等常见的语义附和词,但在 AI 对话中,用户并不希望因为自己无意中的一些语义附和词,让 AI 提前响应,这样会给对话体验造成比较割裂的体验感,在教育、会议等很多场景也有很多词需要提前过滤,不需要被 AI 响应。 基于此,对话式 AI 引擎2.0版对“优雅打断”功能进行了升级,不仅支持过滤对话中无语义的附和词,自动识别“嗯”、“啊”等对话附和词,避免误触发响应,还可以过滤自定义的文本,以适应不同业务场景需求。  预注册声纹识别 让 AI 知道是谁在说话 在对话式 AI 中,多人同时与 AI 互动的场景将会越来越多。家居场景中,父母与孩子都会与 AI 互动,孩子不希望聊的内容被爸爸妈妈发现,所以希望 AI 能够区分自己与父母的身份,在和 AI 对话时可以产出不同的内容。 针对这样的需求,声网对话式 AI 引擎2.0 上线了预注册声纹识别,用户仅需4-10秒钟的有效语音注册,可以快速建立声纹模型,对话的过程也是实时进行比对,基本没有任何体感延迟。且整个过程不存储任何声纹数据。通过提前注册不同人的声纹,不仅能让 AI 分辨出多说话人声纹,知道是谁在说话。还可以针对不同任务的标签输出不同的对话策略与内容推荐,无
对话式 AI 引擎2.0 让 AI 更懂开口时机 支持预注册声纹识别与电话外呼
avatar声网公司
2025-12-04

双奖印证路径:声网以“ RTE + AI ”驱动产业纵深与体验革新

近日,声网先后获得两项行业重要认可——获评头部媒体36氪 WISE 2025商业之王“2025年度 AI 应用场景突破企业”与芥末堆 GET 教育科技大会“教育科技创新尖峰奖”。这标志着,声网推动“ RTE + AI ”技术深入产业肌理、转化为切实价值的实践,获得了跨领域的双重验证。 横向破圈:定义产业生产力,入选36氪「年度AI应用场景突破企业」 入选36氪“ WISE 2025商业之王”的“年度 AI 应用场景突破企业”,其核心准绳在于 AI 能否跨越概念,转化为真实的产业生产力。这要求企业不仅是技术专家,更是深入行业的“行动派”,能将技术落地为可验证的商业效率。声网的此次入选,正是对我们以 “RTE+AI ”构建通用商业基座这一务实路径的权威肯定。 在 AI 硬件领域,注入“有记忆的对话灵魂”:从能够记住孩子的喜好、能讲述定制化睡前故事的口袋机器人,到能完成从设置闹铃到预定机票等多样化任务的家庭助手,其背后稳定、拟人且连贯的实时互动能力,正由声网对话式 AI 引擎支撑。这标志着智能硬件正从集成智能体,向具有情感交互能力的伙伴演进。 在 AI 客服场景,实现“从应答到解决”的跨越:搭载声网对话式 AI 引擎的智能客服系统正从成本中心转变为价值创造者。当用户来电咨询时,不仅能准确理解意图,更能针对业务给出个性化建议或引导办理。这不仅将平均通话处理时长缩短了40%,更将大量人工座席从重复性查询中解放出来,专注于高价值服务,实现了效率与体验的双重升级。 在 AI 陪伴场景中,提供“深度的情绪共鸣”:在情感陪伴与社交应用中,通过对语音语调、语速及内容的实时多维分析,搭载声网解决方案的虚拟伴侣可以更细腻地感知用户情绪状态,并提供陪伴式倾听或舒缓引导,让技术成为可靠的情感连接器。 纵向深耕:重塑教学体验,荣膺芥末堆 GET「教育科技创新尖峰奖」 在作为行业风向标
双奖印证路径:声网以“ RTE + AI ”驱动产业纵深与体验革新

去老虎APP查看更多动态