商汤科技的个人主页

商汤科技官方号

老虎认证：商汤科技是一家赋能百业、行业领先的人工智能软件公司

IP属地：北京

0关注

1304粉丝

商汤科技是一家赋能百业、行业领先的人工智能软件公司

商汤科技

12-20 11:45

DAY6 | Kapi相机：千万用户首选摄影APP，小白也能拍出电影感

今天是商汤科技「产品发布周」第六天，我们再来谈谈手机里的那些事儿—— 还在感叹手机拍照“风格不够多”“数码感太强”，或者想用手机拍出“电影般的叙事感”？今天在商汤科技产品发布周上，有一款“最懂你的AI拍照助手”——Kapi相机，能帮你终结这个难题。今年以来，Kapi相机不断加速增长，目前已是千万用户的首选摄影App，12月18日在中国区App Store摄影榜位列TOP2。近期更是风靡全球、屡次登顶多国APP Store榜单。（相关信息：火到全球！商汤「Kapi相机」接连登顶多国APP Store榜单）它还是行业首个真正的“AI拍照助手”，融合了商汤日日新多模态大模型能力，与专业摄影技术和艺术理解，让你无需专业技巧也能“随手拍大片”，记录生活最本真的温度与色彩。下面就来具体看一看，Kapi相机到底有何不同？懂用户的AI摄影导师 3大核心亮点，随手一拍即大片电影级质感直出：复刻Apple Log曲线，告别“数码感” 如今的手机拍照技术越来越先进，画面解析度越来越高，但过于“干净”、“锐利”的效果，反而让照片失去了胶片或电影般的松弛感与叙事感。很多用户想要追求电影级的光影层次，却苦于没有专业的后期技术。左右滑动查看更多↓↓为了让普通用户无需后期也能拍出电影质感，Kapi相机在技术上搭建了专业的图像处理工作流，通过复刻Apple Log曲线，从拍摄源头模仿电影的记录方式，最大程度保留画面的原始光影信息，让照片的动态范围更大、色彩层次更丰富，同时去除原生锐化，呈现出柔和细腻的质感。无需复杂的后期调色，直出就能获得有叙事感的大片，普通用户也能轻松变身生活Vlog导演。左右滑动查看更多↓↓ 40+款复古滤镜：AI还原经典，唤醒用户的“记忆色” 富士的清透、柯达的暖意、诺基亚的千禧风、CCD的通透感……每个人心中的“复古”都有专属模样，单一设备根本无法满足多

DAY6 | Kapi相机：千万用户首选摄影APP，小白也能拍出电影感

商汤科技

12-19 14:48

商汤咔皮记账焕新！秒记账、会省钱、懂规划的新一代AI财务助手上线

今天是商汤科技「产品发布周」第五天，让我们来谈谈日常生活里的刚需痛点—— 我们生活里和“钱”相关的烦恼总是五花八门：线下消费小票丢三落四、线上支付账单分散各处难统计，月底复盘总陷入“钱花哪了”的困惑；想存钱却不会做预算，计划总被意外支出打乱；消费没提醒，各种订阅自动扣费，不知不觉中就月光、超支。年轻人对美好生活的向往，与个人财务管理的粗放现状，形成了一道普遍存在的鸿沟。针对这些痛点，商汤科技发布了全新升级的“咔皮记账APP”，融合日日新多模态大模型与日常消费记账等场景，成为年轻人的首个“新一代AI财务助手”。作为一款AI原生财务Agent工具，咔皮记账坚信“生活很复杂，财务应该简单化”！从AI自动记账到智能预算规划，从AI消费提醒到复盘洞察分析，咔皮记账的目标，就是帮助广大用户以最新潮、最AI的记账方式，“掌控消费、改善财务，找回生活的松弛感”。四大AI技能开启无痛财务管理新体验咔皮记账深入洞察年轻人在财务管理中的各种核心痛点，不做简单的功能堆砌，而是以AI为核心驱动力，系统性提供从记录、规划到洞察的全流程解决方案。下面看看咔皮如何带你告别手工记账的过去，拥抱AI时代财务管理的新方式记账还靠手？OUT了！AI 自动记账，拍一拍、说一说就搞定繁琐的操作是记账的最大敌人。手动输入金额太麻烦、线下开的小票容易丢、线上账单又分散在微信、支付宝、外卖、电商等多个平台，让记账变成“负担”，长期很难坚持。咔皮记账彻底重构了记账方式。线下消费只需“拍一下”小票，线上消费“点一下”账单截图，甚至直接语音“说一下”消费详情，咔皮记账就能自动、准确地识别出消费金额、类别以及资产账户，告别所有手动输入的麻烦，让记账真正成为一件轻松可持续的日常。左滑看如何实现"说一下"记账存钱计划总泡汤？AI 智能预算规划，一键生成个性化方案 “月初定预算，月中就花超”是许多人的常态。预

商汤咔皮记账焕新！秒记账、会省钱、懂规划的新一代AI财务助手上线

商汤科技

12-19 10:56

商汤日日新Seko系列模型与寒武纪成功适配，国产算力&多模态AI实现关键跨越

12月15日，商汤科技基于在生成式AI与多模态交互领域的技术积累，正式发布Seko2.0——行业首个多剧集生成智能体。该智能体在多剧集视频生成的一致性方面展现出显著优势，其背后依托的是商汤自研的日日新Seko系列模型，包括SekoIDX、SekoTalk等图像与视频生成多模态模型所构建的技术底座。商汤日日新Seko系列模型已完成对国产AI芯片寒武纪的适配，国产算力对AIGC核心场景的支持实现了从语言到多模态的关键跨越。这不仅是技术协同的深化，更是国产AI生态的重要完善，为视觉内容的创新开发提供了更坚实、自主的底层支撑。其中，商汤LightX2V框架设计了强兼容的国产化适配插件模式，可快速完成各类国产硬件的适配，目前已支持寒武纪等多款国产芯片；为了更好释放国产算力优势，Seko系列模型与LightX2V框架在设计之初即引入了低比特量化、压缩通信、稀疏注意力等硬件友好创新机制，将推理性能提升3倍以上。今年10月，商汤科技与寒武纪已达成战略合作，重点推进软硬件的联合优化，并共同构建开放共赢的产业生态。此次与寒武纪在多模态生成模型的适配，是国产大模型与国产算力底座协同创新的重要实践，让更多开发者和企业能够以更低成本享受到顶尖的多模态AI能力。适配完成后，商汤科技与寒武纪还将在多个方向共同进一步展开深度优化： • 持续优化模型核心能力：将在长序列处理、低比特计算等方向持续优化，在确保模型效果的基础上进一步提升多模态生成的整体效率与响应速度。 • 提升算力利用率与成本效率：通过算子融合、算子自动调优等，推进更高效的计算与存储方式，降低模型运行所需的资源占用，让更多企业能够以更低成本获得高性能的多模态能力。 • 强化大规模并行处理能力：基于计算与通信并行等优化技术，优化跨硬件的调度与通信策略，提升复杂任务在大规模集群中的运行效率与稳定性。 •&nbs

商汤日日新Seko系列模型与寒武纪成功适配，国产算力&多模态AI实现关键跨越

商汤科技

12-19 10:56

DAY1 | 商汤Seko2.0重磅发布，合作短剧登顶抖音AI短剧榜No.1

今天，Seko2.0重磅发布！作为行业首个创编一体、多剧集生成智能体，Seko2.0专为当下炙手可热的短剧、漫剧行业的个人创作者与工作室量身打造，让“一人剧组”变成可能。自2025年7月上线以来，Seko仅用两个月用户量即突破10万，不到半年已聚集超20万创作者，其中30%为短剧创作者、20%为漫剧创作者，成为高浓度的创作者社区。如何让创意落地更高效、创作门槛再降低？今天，全新Seko 2.0的功能升级给出答案：全新UI升级，突出视觉效果呈现，沉浸式创意体验；多剧集生成功能，超长上下文管理，支持100集以内剧本的连续创作； Agent智能调度，不同剧集中，人物场景道具灵活关联，人物妆造可随场景改变。想象力为产品插上翅膀，产品力为想象落下锚点。正如商汤科技董事长兼CEO徐立所言：“Seko将打开一扇门，让原本不具备创作能力但是具有创作想象力的人，真正意义上走入到创作生态中，去释放他们的想象力。” 短剧很热，制作很难？ Seko2.0让“一人剧组”成为可能当下AI漫剧、短剧赛道呈爆发式增长态势。巨量引擎数据显示，今年上半年漫剧供给量以83%的复合增长率持续扩容，对外输出超3000部作品，流水规模更是翻了12倍。大量个人创作者与小团队涌入，甚至将其视为“第二职业”。市场火热的背后，是创作者对高效创作工具的强烈渴求。目前，市面上大部分AI视频生成产品仅支持单集短片或片段素材生产。创作者若想完成多集连续剧，不得不面对多工具切换、复杂工作流搭建、角色与场景一致性难以保持等核心痛点。对于广泛的个人或小团队而言，“一人剧组”的规模化、高质量内容生产依然遥不可及。此前，Seko 1.0已成功帮助大批创作者摆脱了在多工具间疲于切换、为复杂提示词耗费心力的困扰。为更好地满足创作者对高质量、规模化多剧集创作的迫切需求，全新的Seko 2.0带来两项核心技术突破： SekoID

DAY1 | 商汤Seko2.0重磅发布，合作短剧登顶抖音AI短剧榜No.1

商汤科技

12-19 10:40

大晓机器人重磅发布ACE具身研发范式，构建具身智能开放新生态

12月18日，大晓机器人正式发布行业首创的ACE具身研发范式、首个开源且商业应用的开悟世界模型3.0（Kairos 3.0）、让具身本体拥有自主空间智能的具身超级大脑模组A1，与行业伙伴共同构建全链自主可控、开放共赢的产业级生态体系。大晓机器人源于“大千世界，晓识万象”，“大千世界”是广阔、复杂、多样、充满细节的；“晓识万象”是在浩瀚世界中知晓、洞察规律。让机器人真正洞察并理解万象规律，才能使其学会与世界精准交互。这正是大晓机器人的使命——让每个机器人拥有“聪明的大脑”。商汤科技联合创始人、执行董事、大晓机器人董事长王晓刚表示「大晓机器人秉持持续创新的技术理念，携手产业链伙伴共建开放协同的产业生态，通过ACE具身研发范式、开悟世界模型及具身超级大脑等突破性成果，推动具身智能实现规模化商业落地与产业蓬勃发展，为中国在全球智能技术竞争中构建自主可控、引领未来的发展路径。」大晓机器人汇集来自南洋理工大学、香港大学和香港中文大学的全球稀缺的AI领域前沿科学家，他们是环境智能、世界模型、具身模型领域的开拓者，其持续创新能力将助力大晓机器人抢占技术制高点。作为全球顶尖AI实验室MMLab的核心成员，他们传承的创新精神正引领人工智能打破数字世界和物理世界的边界，开启具身智能自主探索新时代。 ▎“以人为中心”的ACE范式根本性革新具身智能研发路径，开悟世界模型3.0为机器人装上“超级大脑” 人类的智能蕴藏于数据之中，数据始终是AI 进化的核心支撑。AI 1.0的人工标注时代，包含1400万张图像、覆盖数万个类别ImageNet 数据集，若由单人全职完成全部标注，需长达10.5年。进入AI 2.0大语言模型时代，数据规模实现指数级跃升，以Common Crawl为代表的互联网文本数据集，让单人全职进行原创撰写需超过12万年才能完成。迈入具身智能时代，行业面临数据量

大晓机器人重磅发布ACE具身研发范式，构建具身智能开放新生态

商汤科技

12-18 16:29

商汤科技×大晓机器人×中科曙光，携手共建国产化“算力基础设施+世界模型+具身智能 ”生态

2025年12月18日，在首届光合组织人工智能创新大会（HAIC2025）主论坛上，商汤科技、大晓机器人与中科曙光正式达成战略合作。三方将围绕国产化人工智能基础设施与具身智能关键技术方向，依托各自技术与产业优势，协同推动软硬一体的“算力基础设施+世界模型+具身智能”生态建设，进一步加速AI能力向物理世界延展。当前，具身智能正成为人工智能技术演进的重要方向。随着机器人本体能力持续提升，行业对模型在三维空间理解、动态环境建模与长期时序推理等方面的能力提出了更高要求。如何构建能够理解并作用于真实世界的基础模型，成为AI从数字世界迈向物理世界过程中亟待突破的关键课题。围绕这一核心挑战，商汤科技持续推进多模态模型与空间智能能力建设，近期正式发布并开源了全新多模态模型架构NEO。通过原生一体化架构设计，重新定义多模态模型的效能边界。NEO在显著提升数据效率的同时，支持任意分辨率与长序列输入，可自然扩展至视频、3D与具身智能等前沿场景，为机器人具身交互等应用提供了更加稳固、可扩展的技术底座。在多模态与空间智能能力持续成熟的背景下，大晓机器人亦发布了新一代“开悟”世界模型（Kairos 3.0），面向具身智能场景构建“多模态理解—生成—预测”一体化能力，支持多视角、长时序、复杂动态环境下的场景建模与交互生成。通过开放模型能力与工具链，大晓机器人持续推动世界模型在具身智能领域的工程化落地与应用扩展。本次战略合作中，三方将聚焦具身智能领域的全栈国产化能力打造：以商汤科技多模态基模型及空间智能技术为核心基础，结合大晓机器人在世界模型领域的工程积累，依托中科曙光在国产算力与“超节点+超集群”系统方面的能力，共同推进世界模型在国产算力平台上的高效训练与推理，支撑具身智能实现从感知到行动的关键跨越。目前，“开悟”世界模型已与中科曙光scaleX万卡超集群等产品完成深度适配。通过芯片与模型的

商汤科技×大晓机器人×中科曙光，携手共建国产化“算力基础设施+世界模型+具身智能 ”生态

商汤科技

12-18 11:57

【商汤圆桌】具身智能最先进入使用的场景是这些↓↓↓

2025商汤科技AI论坛“模型智未来”于近期顺利举行，「从“数字世界”到物理世界：具身世界模型如何重塑人机交互」圆桌论坛在期间召开。商汤科技联合创始人、执行董事，大晓机器人董事长王晓刚担任论坛主持人，邀请到香港大学罗平教授、香港大学李弘扬教授、鹿明机器人创始人喻超三位嘉宾，共话如何用大模型赋予机器人强大的大脑。以下为圆桌论坛完整记录：王晓刚：我们知道大模型起源于数字世界。今天的讨论旨在将大模型从数字世界引向与环境交互的物理世界，让机器人拥有强大的大脑，用大模型重塑具身智能。我们非常荣幸邀请到香港大学的罗平教授和李弘扬教授，他们深耕人工智能研究多年。罗平教授是香港大学数据学院的副院长，李弘扬教授是上海创智学院自动驾驶实验室的负责人。同时，还有我们的好朋友，鹿明机器人的创始人喻超总，他在机器人产业的产品化硬件方面有多年积累。我们将共同探讨模型与硬件如何协同，赋予具身机器人一个强大的大脑。” ▎三位嘉宾分别研究什么领域？王晓刚：罗平是优秀的AI研究者，现在也在探索具身智能，先请罗平介绍自己的研究领域以及当前工作？罗平：本人从事具身智能研究已经很长时间了，从2019年回到香港大学当老师时就开始专注于这一领域。我的团队一直关注具身AI的范式变化，从最早的VQA到原模型，再到让机器人大脑具备理解世界知识的语言驱动能力。目前，我的工作是将大语言模型的范式引入具身AI，目标是实现视觉、语言和动作等所有模态的同时生成。” 王晓刚：鹿明机器人现在发展得很好，也想请喻超介绍一下当前工作以及发展情况？喻超：鹿明机器人成立于2024年，自我定位是一家拥有最强数据能力的全栈智能公司。在过去一年多时间里，我们完成了四款整机和七款零部件的硬件开发，并建立了月产100台以上的产能。我们构建了像巴优米一样的数据采集方式，解耦了数据采集和本体驱动，旨在解决行业中的数据孤岛问题。我们计划在明年采集

【商汤圆桌】具身智能最先进入使用的场景是这些↓↓↓

商汤科技

12-17

商汤如影营销智能体发布，打造新一代电商AI增长引擎

周三好！商汤科技「产品发布周」第三天，我们来谈谈商业世界最沸腾的赛道——电商直播。今天，商汤正式推出如影营销智能体——面向电商运营场景的营销智能体，新一代电商 AI 增长引擎！这个看似最需要人的赛道，其实更需要AI来赋能。近年来直播电商迈入发展快车道，预计2025年中国直播电商市场规模将突破6万亿。直播电商爆发增长的背后，离不开主播、场控、直播运营、店铺运营、投流、内容制作等多种岗位紧密配合。然而，随着人力效率逐步见顶，运营成本却不断攀升，如何打破“靠人堆增长”的困境？以四个电商Agent+数字人组成“五大智能体矩阵”，商汤如影营销智能体覆盖从店铺、直播运营、场控、投放，再到店铺的端到端全链路，推动电商增长从“人力驱动”全面走向“智能驱动”。商汤科技数字文娱事业部总监许亲亲表示：“如影营销智能体存在的根本意义，不是辅助人做事，而是由AI承担完整链路，真正把结果跑出来，让运营自动联动，增长自动滚动”。五大智能体协作击破电商直播全链路核心痛点电商人的痛，繁琐又沉重。如今电商行业节奏加速，直播更密集、投放更实时、内容更碎片、渠道更分散。无数从业者正被海量的重复劳动、繁杂的数据报表所困扰。加之直播中各岗位分工明确，工作节奏靠人工对齐，很容易导致数据不同步、响应不及时，错过最佳时机。如影营销智能体的最大突破，在于打破了单点工具的局限，以五大智能体实现“店铺→直播运营→场控→投放→店铺”的端到端全链路协同。各智能体自动同步数据、联动响应，无需人工介入，让运营节奏自动联动，打造自动化增长飞轮。店铺运营Agent：20倍提效，专注“做规划、谋策略” 店铺运营需要结合库存、活动、竞品等多维度数据进行整体策略规划，但数据分散在不同平台后台，下载、整理耗时耗力，真正用于思考策略的时间被严重挤压。店铺运营Agent实现了流程的全面自动化。用户只需通过自然语言下达指令，Ag

商汤如影营销智能体发布，打造新一代电商AI增长引擎

商汤科技

12-16

商汤小浣熊3.0来了，AI办公智能体一键生成高质量PPT

周二好！商汤科技「产品发布周」第二天，我们把目光投向更广泛的日常：你的办公软件—— 我们期待的AI是否是这样的：提一个模糊的想法，它就能还我们一个完整的方案？然而现实的AI大多只给“草稿”不交“成果”、只懂“指令”不解“任务”、只存“单点”不融“工作流”……如今不一样了！今天，商汤科技正式发布AI办公智能体「小浣熊3.0」，三大跃迁让AI从冰冷的工具，变成主动跑通结果的“AI办公搭子”：交付的跃迁：从生成“草稿”到交付“成果”，一键生成高质量PPT，实现“辅助排版”到“自主创作”，云端+本地均支持图表、图片、文字等元素快速编辑；理解的跃迁：从响应“指令”到理解“任务”，具备长链条思考能力，支持百万级数据量级秒级处理，支持多模态、多源关联分析；工作流的跃迁：从“单点”工具到融入“工作流”，任务跨平台处理，移动端正式上线，95%+精度落地企业级场景。可扫码体验体验全新小浣熊3.0↑↑↑，也可点击阅读原文跳转： https://office.xiaohuanxiong.com/home 诞生2年以来，商汤小浣熊已拥有 300万+注册用户，广泛服务1500万+个人用户与数千家企业用户，坚持“不炫技做Demo，而是扎根真实场景解决真问题”。商汤科技董事长兼CEO徐立表示，“小浣熊3.0的发布，标志着产品从‘可用’到‘好用’的关键跨越，重新定义‘AI原生办公’范式。” 从“冰冷工具”到“办公搭子” 三大跃迁的本质进化 i.从“草稿”到“成果”：一键成片高质量PPT，端到端交付不用改从文本、表格到PPT制作，AI给出的往往只是半成品，其呈现效果与用户需求往往存在理解断层，还需要大量时间进行整理、排版、美化与逻辑梳理，距离可用总差一步。小浣熊3.0创新构建“多模态智能体创作引擎”，实现从“辅助排版”到“自主创作”的全面升级，交付的不再是“草稿”，而是一个能直接用于汇报或讨

商汤小浣熊3.0来了，AI办公智能体一键生成高质量PPT

商汤科技

12-12

火到全球！商汤「Kapi相机」接连登顶多国APP Store榜单

火到东南亚，火到欧洲，火到全球！是谁家AI相机如此火出圈？商汤科技旗下AI相机产品「Kapi相机」（海外版本名称：Kapi Cam），正以出色的AI影像能力在全球范围内收获喜爱，接连在多个海外市场取得榜单突破。来看Kapi相机的全球“出圈”之旅。首先在东南亚，Kapi相机于12月8日强势登顶菲律宾App Store免费应用总榜第一，目前稳居“照片与视频”(photos&videos)类应用榜首，总榜位列第三，在安卓平台同样表现亮眼，位居同类应用第一，总榜第四。2025年12月8日登顶菲律宾App Store免费应用总榜第一数据来源：全球数据分析网站SimilarWeb随后在欧洲，Kapi相机的热度迅速蔓延，在英国、意大利、法国、德国等国的App Store“照片与视频”应用排行榜中，近期均成功跻身前五名。从东南亚到欧洲，连续的榜单佳绩意味着Kapi相机正凭借其出色的AI影像实力在海外市场强势出圈，其“AI拍照助手”的独特价值正获得全球不同地区用户的广泛认可。Kapi相机不仅仅是一款相机应用，更是一位“真正懂用户的AI拍照助手”。它依托商汤领先的多模态大模型技术，能够智能分析画面并进行比对，轻松模拟各类经典相机色彩与成像风格，让用户无需购置多种设备，也能实现多元化的摄影梦想，获得电影级的拍摄画质，让每个人都能成为自己生活的“导演”。对于摄影新手而言，Kapi相机贴心地提供了“AI辅助拍照”功能。面对不同场景，它能实时提供构图灵感、滤镜推荐与简单指导，帮助用户一键捕捉更富美感的瞬间，轻松拍出“大片”效果。此次在全球多国榜单的卓越表现，是Kapi相机产品实力与全球化潜力的集中展现。而这股热潮，预示着更多精彩即将到来——在12月15日-19日举行的商汤产品发布周上，Kapi相机还将带来更多重磅信息与更新。更多惊喜，即将揭晓，让AI持续助力每个人的影像创作，记录

火到全球！商汤「Kapi相机」接连登顶多国APP Store榜单

商汤科技

12-12

商汤科技×香港科技园，汇聚顶尖专家共议智慧未来 | 2025商汤科技AI论坛

近日，“2025商汤科技AI论坛”于香港科学园圆满举行，该活动以“模型智未来”为主题，由商汤科技与香港科技园公司联合举办，论坛汇聚业界领袖及人工智能专家，一同就AI大模型发展、商业应用、未来机遇与挑战等多方面交流及分享真知灼见，携手为大模型时代注入新思维，共建香港创科生态圈。商汤科技董事长兼CEO徐立博士表示：“过去十年，是人工智能认知变化最快的十年, 我们正在经历可能是史上最大的技术浪潮。AI从感知到生成、从云端到端侧，再到现在的具身智能与世界模型，正重塑每一个行业的工作方式。作为一家在香港成立并在香港上市的AI企业，商汤受惠于香港有利的科创环境和政策，我们对香港创科行业前景充满信心。未来，商汤也会持续立足于香港，连接‘国家AI战略’和’全球创新网络’，既服务本地与内地产业，又持续面向全球市场讲好中国AI的故事。” 香港科技园公司CEO黄秉修表示：“香港科技园公司与商汤合作多年，我们见证了商汤科技从一家初创企业，成长为独角兽企业，如今更在全球人工智能领域保持领先地位。商汤科技的发展，正是我们支持科创企业做大做强的最佳例子，也让我们更有信心推动创新成果落地。” 多模态大模型与具身智能的双重突破 AI迈入价值落地爆发期在“从能力涌现到价值闭环，多模态大模型价值与创新之路”的主题演讲环节中，商汤科技联合创始人、首席科学家林达华教授指出，经过三年“烈火烹油”式的发展，“我们再次走到了关键十字路口”，接下来行业发展有两条重要路径：一是AI需要真正落地应用，以价值驱动技术和应用的发展；二是需要回归实验室，探索下一次技术范式的原始创新。 “每一次突破背后都来自技术的原始创新，今天我们再一次需要用创新来打破当前的技术发展瓶颈。” 林达华教授还分享了商汤在多模态等领域的多项原创性的底层创新成果：包括原生多模态融合架构NEO、跨视角预测训练范式，以及高效率推理系统SekoTalk，突破现

商汤科技×香港科技园，汇聚顶尖专家共议智慧未来 | 2025商汤科技AI论坛

商汤科技

12-11

视觉AI 2.0启幕，商汤方舟融合视觉及大模型能力赋能产业

12月9日，商汤科技与香港科技园公司联合主办的“2025商汤科技AI论坛”于香港科学园圆满落幕。本届论坛以“模型智未来”为主题，汇聚学术界权威专家、产业领军人物及投资界精英，围绕中国AI大模型技术研发、落地实践与产业机遇展开深入交流。论坛期间，商汤正式发布旗舰平台“商汤方舟”在大模型时代的全面升级路径，为视觉 AI 2.0的规模化落地指明了清晰方向。作为视觉 AI 领域的长期领跑者，商汤科技历经十余年深耕，凭借深厚的计算机视觉技术积累，借力多模态大模型技术浪潮实现业务二次增长。论坛上，商汤科技香港及澳门业务总经理冯愈、商汤科技智慧城市与商业事业群高级总监朴元奎发表主题演讲，系统解读“大模型赋能视觉AI 2.0时代”的行业变革与实践路径。商汤方舟全面升级：通专融合+智训闭环构建视觉智能体平台视觉AI已成为智慧城市与产业智能化升级的核心驱动力。然而，传统视觉 AI 的算法生产方式高度依赖专业算法专家，普遍面临研发周期长、成本高、上手门槛高的三大痛点。随着长尾场景不断涌现，传统算法模式难以满足规模化应用的需求。商汤科技智慧城市与商业事业群高级总监朴元奎表示，大模型时代的到来正在加速行业范式重构——算法设计不再只依赖专家，而是向现场工程师开放，模型应用也从“定制开发”转向“智能生产”。行业迫切需要一种全新的视觉 AI 生产模式，推动模型能力更快适配业务、更高效部署落地。为破解行业瓶颈，商汤打造了视觉AI 2.0“商汤方舟”升级版，并通过“通专融合”和“智训闭环”两大体系全面革新视觉算法的生产方式。在“通专”模型编排层面，方舟通过轻量小模型与通用大模型的多级协同，实现长尾视觉任务的渐进式推理，既保障识别精度，又显著降低算力消耗；在“智训”体系方面，方舟以 Age

视觉AI 2.0启幕，商汤方舟融合视觉及大模型能力赋能产业

商汤科技

12-10

推理速度25fps，首帧延迟3.5s！商汤SekoTalk：让实时语音数字人更近一步

在数字人技术蓬勃发展的今天，生成效率仍是行业面临的核心挑战。商汤科技凭借在生成式 AI 与多模态交互领域的深厚积累，推出了实时语音驱动数字人技术——SekoTalk。通过多方面的创新技术，SekoTalk显著提升了数字人视频的生成效率，在8卡服务器上可以达到25 fps的生成速度，首帧延迟低至3.5s，在业内率先实现了实时生成。同时，SekoTalk还能支持多人、多语言的口型精准匹配，和超长时的稳定生成。这一技术突破了数字人发展的性能瓶颈，为数字人的大规模、实时应用打开更多可能。 SekoTalk今年8月上线，应用在商汤Seko、如影数字人等产品中，已助力用户创作出数十万部作品，并诞生了全网播放量超2000万播放的爆款作品。 1.png 该作品全网播放量超过2000万来源@AI制片人Webb 算法系统协同：实现极致性价比突破生成效率是数字人走向实用化的关键，而实时性又是生成效率的北极星。SekoTalk通过模型蒸馏，模型结构优化，以及模型与系统的协同设计，在保证生成质量的前提下，实现推理效率的跨越式提升。与其它方案相比，SekoTalk展现出卓越的性价比优势：开源模型生成一段5s视频通常超过十分钟，商用闭源模型生成5s的视频通常也需1至10分钟不等。相比之下，SekoTalk在8卡服务器上可以达到25 fps的生成速度，即便将SekoTalk与多模态模型相结合，整体系统的首帧延迟也可低至3.5s。 2.png Phased DMD分布匹配蒸馏技术，无限逼近base模型效果：以往的扩散模型蒸馏经验发现，扩散模型低步数生成的质量受到等效模型容量的制约。而主流的SOTA视频生成模型已经证明混合专家(MoE)技术在扩散模型领域的巨大潜力：不增加推理开销的同时，增大等效模型容量，进而导致更强的性能表现。然而，MoE技术在扩散模型蒸馏中的应用尚未得到探索。商汤科技

推理速度25fps，首帧延迟3.5s！商汤SekoTalk：让实时语音数字人更近一步

商汤科技

12-04

商汤“1+X” 再添新成员：王晓刚担任“大晓机器人”董事长

大晓机器人将于12月18日正式亮相，重磅发布多项全球领先的技术与产品阵列，并将推出首个国内开源且实现商业应用的“开悟”世界模型3.0，与行业伙伴一同构建自主可控、开放共赢的产业体系。商汤科技联合创始人、执行董事王晓刚出任大晓机器人董事长。当前具身智能赛道正迎来技术爆发与范式重构的关键窗口期，研究范式尚未收敛的行业现状，既带来了路径探索的挑战，更催生了需要核心技术破局的颠覆机遇。与此同时，机器人本体技术的长足进步，已让市场对“具身超级大脑”的需求进入爆发临界点，商业落地的迫切性与潜力同步凸显。面对技术方向未定、落地需求迫切的行业痛点，持续的底层创新能力与对具身智能场景的深度理解，成为穿越周期、抢占先机的核心关键。而这正是大晓机器人的核心优势所在。大晓机器人汇聚来自AI、互联网、机器人、智能驾驶等领域的全球顶尖AI科学家与产业专家，构建了深厚的具身智能前沿技术库和产业化及工程化落地能力。这些专家拥有十余年行业实战经验，对千行百业的智能化场景有着深刻洞察，亲历过从技术原型到规模化商用的全链路过程，熟稔工程化开发的核心痛点与落地逻辑，深刻理解商业场景智能化落地，构建了核心竞争力。大晓机器人以全新研发范式、全新数据采集范式、性能全球领先的开悟世界模型（Kairos 3.0），精准回应行业技术突破与商业落地的双重诉求，将前沿技术转化为可落地、可复用的解决方案，与行业伙伴共筑具身智能新生态，为行业发展注入确定性动能，共同成为具身智能领域极具潜力的中国创新力量。多项首创技术将亮相推动具身智能智慧跃迁加速场景化商业应用大晓机器人将发布全球首创ACE技术范式，构建以视觉为基础的“环境式采集+世界模型+具身基模型”的全链路技术体系。目前包括特斯拉、Figure AI在内的头部企业，均正从真机遥操转向以视觉为基础的数据采集技术路线，而ACE技术范式将有全新突破。目前大晓机器

商汤“1+X” 再添新成员：王晓刚担任“大晓机器人”董事长

商汤科技

12-01

从“数据融合”迈向“原生架构”：商汤发布 NEO 架构，重新定义多模态模型效能边界

商汤科技正式发布并开源了与南洋理工大学S-Lab合作研发的全新多模态模型架构 —— NEO，为日日新SenseNova 多模态模型奠定了新一代架构的基石。作为行业首个可用的、实现深层次融合的原生多模态架构（Native VLM），NEO 从底层原理出发，打破了传统“模块化”范式的桎梏，以“专为多模态而生”的创新设计，通过核心架构层面的多模态深层融合，实现了性能、效率和通用性的整体突破，重新定义了多模态模型的效能边界，标志着人工智能多模态技术正式迈入“原生架构”的新时代。论文网址：https://arxiv.org/abs/2510.14979 Github 开源网址：https://github.com/EvolvingLMMs-Lab/NEO 打破瓶颈告别“拼凑”，拥抱“原生” 当前，业内主流的多模态模型大多遵循“视觉编码器+投影器+语言模型”的模块化范式。这种基于大语言模型（LLM）的扩展方式，虽然实现了图像输入的兼容，但本质上仍以语言为中心，图像与语言的融合仅停留在数据层面。这种“拼凑”式的设计不仅学习效率低下，更限制了模型在复杂多模态场景下（比如涉及图像细节捕捉或复杂空间结构理解）的处理能力。商汤NEO 架构正是为了解决这一痛点而生。早在2024 年下半年，商汤便在国内率先突破多模态原生融合训练技术，以单一模型在 SuperCLUE 语言评测和 OpenCompass 多模态评测中夺冠，并基于这一核心技术打造了日日新 SenseNova 6.0，实现多模态推理能力领先。之后，在2025 年 7 月发布日日新 SenseNova 6.5 通过实现编码器层面的早期融合，把多模态模型性价比提升

从“数据融合”迈向“原生架构”：商汤发布 NEO 架构，重新定义多模态模型效能边界

商汤科技

11-24

穿越周期继续前行，商汤集团获多项权威肯定

近日，多项商业、金融、科技领域大奖陆续公示，商汤科技喜报连连！福布斯中国：2025出海全球化旗舰品牌该奖项遴选中国出海全球化中流砥柱力量，突出体量大、运营成熟、全球化深入等特征，同时获奖的还有泡泡玛特、美图、美的、携程、小鹏、荣盛石化、晶科能源等。福布斯表示，这三十家旗舰出海企业正从“规模出海”到“价值出海”，从“中国制造”到“中国智造并全球运营”的战略升级，其稳健的全球网络为整个中国出海生态系统提供了宝贵的稳定性和基础设施支持。如商汤科技等企业更是在各自细分领域做到顶尖。《财经》杂志： 2025·「鼎革奖」数智化先锋榜年度卓越企业奖「鼎革奖」由《财经》杂志主办，《哈佛商业评论》中文版作为核心支持媒体，多所中国双一流高校商学院及研究机构提供学术支持，是国内权威的数智化转型奖项。商汤凭借跨越AI产业两个发展周期的优秀实践，从众多参评企业中脱颖而出，成功斩获殊荣。此外，商汤人力资源团队近期获评《财经》2025高能人才团队奖。中国证券报：2025年度科技创新金牛奖 “金牛奖”是中国证券报鼎力打造的金融品牌，是中国资本市场最具影响力的奖项之一。上市公司（港股）金牛奖旨在遴选高质量发展、高水平对外开放的历史进程中，在制度创新和产业变革等方面展现出强大综合实力与前瞻性发展战略的港股上市公司。财联社：2025致远奖ESG先锋企业 “致远奖”由上海报业集团指导、财联社主办，评选过去一年内在ESG领域展现商业价值和社会价值影响力、为促进可持续发展增添ESG动力的优质企业。从商业运营、技术与产品布局，到扬帆出海、拓展更广阔的舞台，到科技向善、技术可控，商汤的成长受到多方关注与认可。历经十余年发展，商汤是极少数从早期专注计算机视觉领域、成功穿越周期来到生成式人工智能时代的企业。得益于商汤对技术及发展的超前判断与积累，商汤在AI 2.0阶段也实现了巨大突破

穿越周期继续前行，商汤集团获多项权威肯定

商汤科技

11-20

空间智能再突破！商汤最新研究，迈向机器深度认知新阶段

空间智能是推动AI实现从“看懂世界”到“影响世界”的关键进阶能力。近日，商汤团队联合大晓机器人团队、南洋理工大学等权威学术机构发布论文《与相机共思》，其中提出名为“Puffin”的AI模型，通过“将相机理解为语言”并引入“与相机共思”的理念，消除了视觉-语言-“相机”模态间的鸿沟，从而使AI能够更全面、更交互地进行空间推理。作为垂直细分的AI模型，“Puffin”可以与具身世界模型相结合，同时通过SenseNova-SI模型加强空间能力，从而使具身智能进行更全面、更交互地进行空间推理，并可以灵活扩展至多种跨视角任务等。这种统一的模型为稳健的空间智能奠定了基础，并促进了更具灵活性和创造性的3D应用发展。例如“Puffin”能从单张图像精确推断相机参数，并通过“思考”模式生成可解释的空间推理，这让具身智能不仅知道“看到了什么物体”，还知道“机器当前以何种姿态观察世界”。同时，“Puffin”不仅能理解视角，还能根据任务目标生成具体的相机动作参数，使机器人能够主动寻找最佳视角，而不是被动依赖当前画面。相关负责人王飞表示：“‘Puffin’提供了能够从任意视角和方向理解并创造场景，并能灵活拓展至复杂的跨视角理解与生成任务的能力。上述能力将应用于我们正打造的具身世界模型，进一步提升具身智能空间智能性能。” 具体来看，“Puffin”模型首次让“理解”和“生成联动”，通过统一框架让AI能“先算准相机角度（理解），再按这个角度生成新场景（生成）”，而且两个任务共享一套“空间逻辑”，不会出现算的角度和画的场景对不上的问题。通过“Puffin”模型可以有效提升世界模型对物理世界的时空结构进行深度感知、推理与预测，从而提升具身智能和自动驾驶的全局协同、感知精度和场景训练效率‌。 “Puffin”打造的不只是一个工具型 AI，而是让AI像人一样用相机的视角思考，实现“与相机共思”能力。

空间智能再突破！商汤最新研究，迈向机器深度认知新阶段

商汤科技

11-19

市场份额NO.1！商汤大装置位列中国原生AI云厂商榜首

近日，权威研究机构弗若斯特沙利文（Frost & Sullivan）联合头豹研究院发布《2025年H1中国全栈AI云服务市场报告》。报告显示，商汤科技凭整体市场份额位列中国全栈AI云服务市场第四，原生AI云厂商首位，持续引领原生AI云厂商阵营。沙利文指出，AI原生正在重塑云服务，并对“原生AI云（AI Native Cloud）”作出明确定义，即专为支持人工智能工作负载而设计和优化的云计算服务模式，核心是将AI技术深度融合到云服务的每一个层面，而非传统云服务对AI需求的简单适配。在AI原生趋势下，沙利文将全栈AI云厂商划分为两类玩家，一类是云计算厂商全面AI化，另一类是以商汤为代表的原生AI云厂商，从成立之初便与AI深度绑定，具备AI基因，逐步发展为全栈AI云厂商。 “商汤大装置作为‘从AI中生长出的云’，自成立之初便以AI为基因，从底层架构开始就为AI原生应用而设计”，报告认为，商汤大装置通过在算力资源调度、软硬协同、异构训练等底层能力上的持续突破，构建形成“更懂AI、更懂模型、更懂行业”的全栈AI云能力体系，打造了面向企业与产业的原生AI云服务，推动产业生态与应用场景系统化落地。端到端AI基础设施技术突破赋能模型全流程沙利文报告强调，原生AI厂商的核心优势在于“从模型层的精准调优，到推理层的效能提升，再到基础设施的适配打磨，形成端到端的技术闭环”。算电协同，实现底层硬件到用户任务的全链路联动：商汤大装置通过算电协同平台创新地将AI平台运行数据、算力性能指标与电力侧基础设施数据贯通，显著提升每单位算力的利用率，可实现单位电力指标内支撑算力集群规模翻倍。超大规模训练集群稳定运行：商汤大装置通过断点续训、自动容错、任务迁移和拓扑感知调度等机制，使集群能够在节点波动、资源切换和动态扩容场景下依然保持稳定运行。同时借助 SRE-Agent 智能运维代理，能在

市场份额NO.1！商汤大装置位列中国原生AI云厂商榜首

商汤科技

11-18

首个数字人国家标准，商汤牵头定义，正式发布！

商汤科技作为牵头单位，主导完成了我国虚拟数字人领域首项国家标准——《信息技术客服型虚拟数字人通用技术要求》（GB/T 46483-2025）的起草与制定工作。在该标准的形成过程中，商汤科技联合三十余家产学研用单位，共同完成了标准框架的搭建与细节的完善。该项国家标准历经两年立项筹备，已于近期正式发布，为客服型虚拟数字人系统的设计、开发、测试、应用及维护等环节提供了统一的技术规范与参考指南。凭借在数字人领域超过六年的技术积累与商业落地实践，以及扎实的产业研究、成熟的AI运营能力和多模态技术优势，商汤科技深度参与了该标准的制定，成为推动行业规范化发展的关键定义者。从定义行业标准到定义国家标准商汤多项数字人技术为行业发展打破瓶颈该项数字人国家标准，首次对客服型数字人产品形态、功能边界和性能指标进行了明确定义，标志着我国客服型虚拟数字人产业迈入规范化、高质量发展新阶段。作为标准核心牵头方与工作组副组长单位，商汤科技将积极推动中国标准走向全球，助力构建全球数字人技术规范体系，将推动在金融、通信、教育、电商等行业全面落实，成为企业开展数字人产品设计、开发、应用的刚性遵循。这并非是商汤科技第一次担任AI数字人技术和实施标准的定义者。早在2023年，商汤“如影SenseAvatar”AI数字人生成平台通过中国信通院首批“可信虚拟人生成内容管理系统”测评，并荣获“L3卓越级”证书，以技术防伪、内容可追溯等能力筑牢行业安全底线，标志着商汤如影在功能完备程度、系统可信能力、产业化能力方面，已达到行业标杆级水平。持续释放数字人商业与社会价值成熟应用于电商、金融、教育等行业本次公布的客服型虚拟数字人国家标准系统规定了2D/3D数字人形象生成及形象驱动、视觉交互、语音交互、情感交互、运营维护等方面的功能要求和性能要求，明确了数字人在客服场景应用的量化标准。目前，商汤如影数字人已全面

首个数字人国家标准，商汤牵头定义，正式发布！

商汤科技

11-17

商汤医疗获数亿元新一轮融资，加速AI应用规模化落地

近日，商汤医疗完成数亿元新一轮战略融资，本轮投资方包括联想创投、联创资本、九弦资本、申冉投资等多家知名投资机构。这一融资进展印证了市场对商汤医疗领先技术实力、成熟商业模式及价值增长潜力的高度认可。今年年初，商汤医疗已获得美的系盈峰控股、人民卫生出版社集团旗下人卫科技发展公司等机构的上亿元投资。产业方的联合赋能，正推动商汤医疗AI技术在真实医疗场景中加速融合迭代，成功搭建起从技术研发到产业落地的关键桥梁。目前，商汤医疗已同步启动A轮融资，融资规模与市场影响力稳步攀升。一系列融资进展，为商汤医疗蓄力加码，资金将用于医疗大模型的持续迭代、核心产品矩阵的拓展升级以及重点区域市场的布局深化。为庆贺本轮融资圆满礼成及A轮融资正式开启，商汤医疗将于11月28日举办“智启新生，医领未来——商汤医疗新征程启航盛典”。本次盛典采用定向邀请制，将通过战略合作签约、未来蓝图发布、高管团队集体亮相等重要环节，全面展现商汤医疗新阶段的战略布局与发展愿景。

商汤医疗获数亿元新一轮融资，加速AI应用规模化落地

去老虎APP查看更多动态