Alter聊科技
Alter聊科技
暂无个人介绍
IP属地:浙江
0关注
144粉丝
0主题
0勋章

单卡推理吞吐2300Tokens/s,**AI云服务正在改写算力法则

半个月前的HDC 2025上,**云全面上线了基于CloudMatrix384超节点的**AI云服务,在行业内外掀起了不小的轰动。 让我们印象最为深刻的是一组数据:与非超节点相比,CloudMatrix384超节点的单卡吞吐量从600Tokens/s提升到了2300Tokens/s;增量Token的输出时延,也从原来的100ms降低到了50ms以下。 为了探究指标背后的技术密码,我们找到了**联合硅基流动发表的一篇论文,详细介绍了CloudMatrix的架构创新和CloudMatrix384的生产级实践,并在测试结果中写道——运行DeepSeek-R1时的单卡吞吐,已经超过英伟达H100。 在大模型的产业叙事从训练转向推理局面下,新一代**AI云服务刷新纪录的单卡吞吐能力,对整个算力行业意味着什么? 01 怎么做到的?一场“系统工程的胜利” 需要回答的第一个问题是:单卡吞吐量近乎4倍的性能跃升,CloudMatrix384超节点到底是怎么做到的? 答案在于工程创新。 为了提高大模型的推理性能,传统的做法集中在单点优化:增加更多的节点数量,通过堆叠算力来提升推理能力;对模型进行量化与剪枝,减少不必要的计算量;对KV Cache进行优化,加速增量推理;以及利用自动图优化工具将多个算子融合为一个高效核函数,减少中间内存拷贝…… 可大模型的参数量仍在增长、MoE架构被广泛采用、上下文长度急剧扩展,单点优化暴露出了越来越多的局限性:比如多卡并行推理的通信瓶颈、芯片与内存之间的耦合差、“整卡”调度的资源浪费等等,无论是吞吐性能,还是推理成本,均已经满足不了快速增长的应用部署需求。 CloudMatrix384超节点提出了新的设计架构,不同于简单的“算力叠加”,进一步实现了一切可池化、一切皆对等、一切可组合。 理解了三个“一切”,也就读懂了工程创新的价值。 一切可池化:通过统一的、超高性
单卡推理吞吐2300Tokens/s,**AI云服务正在改写算力法则

产业的尽头是AI,云南交投智算中心让智慧交通跑出加速度

道路通,百业兴。 这句流传已久的民间谚语,道出了一个朴素而深刻的道理:交通是激活区域经济、带动产业兴旺的引擎。 纵观中国的经济版图,每一次跨越式发展背后,都离不开交通基础设施“先行”,高速公路织密到高铁网络成网,港口航运到空中通道,正是这些看似平凡的“路”,打通了经济发展的堵点,重塑了一座座城市的增长逻辑。 其中最有“话语权”的省份正是云南。 作为一个典型的高原山区省份,云南的山地面积超过了90%,地势起伏大、地形复杂,曾长期阻碍云南和外界的联系,制约了经济的发展。一条条穿山越岭的高速公路,改变的不只是地理格局,还有云南和外部世界的连通,为旅游产业、跨境贸易的繁荣奠定了坚实的交通基础。 但道路的“通”只是第一步,终极目标是“高效”。在千行万业都在向数智化转型的时候,传统的高速公路暴露出了不少问题: 比如早期的信息化设计中,不同业务部门的业务系统数据存在重复建设,造成了一个个孤立的数据孤岛;数据无法互联互通,导致高速的自动化作业程度不高,一个小事故就可能让一整段路堵塞;再加上指挥决策平台的滞后,在交通治理上常常处于被动适应的局面,在节假日、雨雪天等高压场景中,缺乏灵活高效的应急响应能力。 交通数智化要怎么转、怎么建、怎么用,运营着云南省70%以上高速公路的“云南交投”,通过云南交投智算中心给出了“示范答卷”。 01 怎么建?算力、数据、算法等“多管齐下” 时间回到2023年8月,云南交投集团被认定为云南省交通行业级大数据中心的建设主体,担纲了交通数智化转型的使命。 当时云南交投已经在智慧高速建设上深耕了10年时间,解决了基础设施薄弱、管理模式落后、业务平台“多、乱、杂”等问题,并在高速公路感知网、智慧服务区、智能化应急指挥平台等方面实现了破题。 面对呼啸而至的人工智能浪潮,深谙交通行业需求和痛点的云南交投,迅速厘清了智算中心的建设思路。 首先,填补算力上的缺口。 交通系统有着
产业的尽头是AI,云南交投智算中心让智慧交通跑出加速度

大模型“造梦”,推理引擎“还债”,CTO们正在还AI的“应用账单”

站在2025年中,回顾半年来大模型的发展,以年初DeepSeek爆火为标志,大模型快速蜕变角色,走出实验室,真正融入企业核心业务系统,在政务、金融、医疗、能源等领域加速落地。 随着大模型走向深度应用,CTO从关注基础模型转向推理引擎,推理过程中的资源消耗,每一度电、每一块钱、每一分钟所能产出的Token数量,正在成为衡量一家公司在AI时代先进性的关键指标。 怎么用推理引擎提升推理效率、榨干每一块算力的价值、尽可能降低推理成本,已经成为CTO们必须解决的问题。 01 大模型跑不动,是因为推理引擎不给力 什么是推理引擎? 简单来说就是一套专门负责让大模型“跑”起来的系统,既负责“怎么算”,又负责“在哪算”和“算得多快”,尽可能提高大模型推理的响应速度、并发能力和算力资源利用率。 如果说大模型是发动机,推理引擎就是动力总成,决定了发动机在不同道路、不同油品、不同气候下是否能高效运转。调校得当,就能低延迟、高吞吐、低成本;调校不佳,再强的模型也可能“烧油多、输出低”。 大约从2023年开始,推理引擎开始作为一个独立赛道兴起,陆续出现了TGI、vLLM、TensorRT、SGLang等面向推理效率优化的开源项目。彼时业界的注意力还停留在“大炼模型”上,对推理引擎的需要求不高——能用就行。 2025年初是一个分水岭。 DeepSeek为代表的一批大模型开源后,企业对AI的态度由观望转向行动,纷纷采购算力、治理数据、微调模型,落地部署时却发现:推理响应慢、吞吐跟不上、成本高昂。 90%的算力花在了推理上,结果又贵又慢,连“谢谢”都不敢多说一句,几乎谈不上性价比。 大模型推理到底难在哪里呢?答案是效果、性能、成本的“不可能三角”。 想要效果好,就得用更大的模型、更高的精度、更长的上下文,但算力开销就上去了;想要跑得快、响应快,就要用缓存、做批处理、图优化,可能影响模型输出的质量;想要成本低
大模型“造梦”,推理引擎“还债”,CTO们正在还AI的“应用账单”

透过三个核心能力,解构**Wi-Fi通感一体的“空间魔法”

什么是通感一体? 单从字面上理解,通信和感知似乎是两个不同的领域,但6G、Wi-Fi 802.11BF等新标准,都已明确了通感一体的演进方向。 打个比方的话,将感知与通信融入到一套系统中,就像是赋予了无线电波“观察”物理世界的能力,曾经无法实现或者不敢想象的愿景,都将成为现实。直接的例子,就是**的Wi-Fi通感一体技术。 和传统方案相比,**Wi-Fi通感一体技术有两个关键创新。 一是单AP感知,不同于市面上“一发一收”两个AP参与感知的解决方案,**直接在单AP上完成“自发自收”,实现了类似“声呐”的功能,可以感知空间中小至厘米级的运动。 二是算法创新,通过工程突破与算法创新,使能载波聚合干扰消除能力,实现了对“呼吸时胸腔起伏”等微弱信号的检测,哪怕是静态用户,也能通过单个AP进行精准检测。 厘清了技术上的创新点,到底有哪些过去不敢想的应用呢?我们找到了三个标志性的落地场景。 第一个是人员感知。 通过AP进行感知的原理和雷达相似,电磁波在空间中传播时,如果有物体移动,Wi-Fi信道状态信息就会发生变化:AP以毫秒级周期采集信道变化,通过检测算法实时识别“无人-有人”及“有人-无人”的状态切换。 比如在节能场景中,有了**Wi-Fi通感一体技术,无需监测人员流动的摄像头,无需重新布线,通过AP就能联动节能系统:检测到人员离开后,自动关闭空调、照明等设备;检测到人员进入后,3秒内即可自动开启照明与空调。几乎零成本新增,即可实现智能化的绿色节能。 人员感知能力的落地场景,显然不只适用于绿色节能。 在机密区域,和摄像头联动做入侵检测,实现全天候、零死角的安全防护;在会议场景中,与会议管理平台协同,实现无人自动释放会议室,提升会议室利用率;在宿舍等场景下,可联动电力设备,在长时间无人状态下自动断电,保障假期期间的用电安全......原本需要多个传感器才能实现的系统性方案,现在只需
透过三个核心能力,解构**Wi-Fi通感一体的“空间魔法”

“边缘化”的机顶盒,被**云CloudDevice拉回了客厅C位

《黑神话·悟空》刚发售时,有网友在微博上晒了在家里玩游戏的照片,并特意写道:没有PS5,直接在电视上玩的。 被“扒出”是用电视打开的云游戏后,有不少网友跟风体验,又纷纷吐槽操作延迟、画面卡顿、分辨率低……同时掀起了一场理性的讨论:有没有可能解决掉带宽和延迟瓶颈,让家里的机顶盒也能玩3A游戏呢? 刚刚结束的HDC 2025上,**云CloudDevice给出了确定的答案,深度融合云网端边芯的全栈协同技术,首发7大云终端产品,其中就包括作为智慧家庭云平台的云机顶盒。 $中国移动(00941)$ $中国电信(00728)$ $中国联通(00762)$ 01 机顶盒为何必须“云化”? 电视机顶盒的发展史,也是一部用户体验的进化史。 大约在2012年前后,机顶盒开始作为一种新兴互联网终端出现,打破了传统电视不能联网的局面,可以看视频、听音乐、玩游戏,甚至是视频通话,迅速成为家庭娱乐场景下的“新宠”。 经过十几年的演变,曾经的“新物种”成了亿万家庭的标配,但用户对体验的需求似乎超出了机顶盒的承载能力。 过去的需求是“能看视频”,现在是4K视频、云游戏、K歌、健身等多元诉求,机顶盒的角色不再只是一个“播放终端”,而是家庭里的“智能娱乐中心”,性能、存储、系统兼容性等方面的短板不断暴露。 比如机顶盒的CPU、GPU性能有限,只能安装低质的小游戏;应用兼容性差,经常出现闪退、卡顿、加载缓慢等问题;用户已经习惯在手机上秒开视频,电视上播放4K内容要加载几十秒的时间……“今天的需求”被困在了“昨天的硬件”里,用户的“逃离”几乎只是时间问题。 同样被困住手
“边缘化”的机顶盒,被**云CloudDevice拉回了客厅C位

从工厂车间到海上油田,在产业实践里探寻中国AI落地的锚点

在这一轮AI浪潮中,“技术为先”和“产业为先”的争论一直存在:前者以通用人工智能为终极目标,追求构建更大、更强、更通用的模型;后者认为AI的价值在于解决实际问题,技术是为场景服务的工具。 “技术为先”与“产业为先”并非绝对对立,更像是螺旋式上升的关系:技术拓展应用边界,产业校准创新方向。 中国拥有全球唯一的全工业门类、全球最大规模的金融消费人群以及最大规模的政务和城市体系,产生了丰富的场景和私有数据,大模型又恰恰遵循着“吃什么行业的数据,就更懂什么行业的知识”的逻辑。 所以,不同于欧美对“技术为先”的推崇,最适合中国企业的是“产业为先”的差异化路线。 01 中国的产业土壤,为AI提供了天然试炼场 人工智能的发展路径,从来都不是单一技术逻辑的自然延伸,而是结合战略定位、产业结构与资源禀赋的系统性选择。之所以不应照搬欧美的“技术为先”模式,在于国内有两个特殊的产业背景。 第一个是产业“全、多、广、深”,为AI训练和部署提供了最真实的环境。 比如在工业领域,国内拥有联合国产业分类中的全部工业门类,500多个工业品种中,中国有四成以上的产量位居全球第一。只有经历过足够复杂、足够真实、足够有价值的场景淬炼,AI才能走出实验室走向生产一线。 比如在金融行业,银行、保险、证券等机构拥有全国最全、最及时的个人与企业交易数据,在风控、反欺诈、投资组合、客户画像等方面,对模型的准确性、响应速度、安全性要求极高,是锤炼工程能力的天然试验场。 再比如政府数字化改革不断深入,交通、医保、社保、应急、教育等业务系统加速智能化,高复杂度的公共治理场景,对大模型的泛化能力、决策准确性、安全性提出了严苛要求,是AI走向“可用、可管、可信”的关键落点。 第二个是海量数据的天然优势,构成了AI落地不可替代的基础资源。 作为全球数字化发展最活跃的国家之一,中国长期积累了海量、多源、高价值的数据资源,形成了独特的“
从工厂车间到海上油田,在产业实践里探寻中国AI落地的锚点

广汽丰田与**、Momenta组建“AI生态圈”,智能汽车的“信任标识”已经形成

造车的逻辑变了! 一个礼拜前的广汽丰田2025科技日上,有别于集中展示自研成果、宣誓智能化转型决心的叙事方式,广汽丰田把话筒递给了生态伙伴,Momenta、**和小米占了不小的篇幅。 甚至一改合资品牌保守、谨慎的刻板印象,在现场喊出了“广汽丰田铂智空间足够大 **Momenta小米都装得下”的口号,释放出了和中国科技伙伴一起构建汽车AI生态圈的强烈信号。 图:广汽丰田汽车有限公司执行副总经理 文大力 在智能化的浪潮下,合资车企一度被吐槽“跟不上节奏”。主动求变的 $广汽集团(601238)$ 丰田,用行动打破了固有的框架思维:不再是“重复造轮子”,而是和中国的科技力量深度融合,走在了“生态造车”的最前列。 01 从甲乙方到“AI生态盟友” 汽车工业的百年演变,让车企和零部件厂商形成了层级分明的金字塔式配套关系:车企处于金字塔顶部,往下分别是Tier 1(一级供应商)、Tier 2(二级供应商)和Tier 3(三级供应商)。 从层级上就不难发现,车企是整个产业链的主导者,供应商按要求进行供货,即使参与了某款车型的定点开发,乃至和车企一起开发了某个关键零部件,也只是“幕后英雄”,仍然是标准的甲乙方关系。 广汽丰田在2025科技日上,首次提到了“顶配朋友圈”的概念,不再以“甲方”的身份自居,而是作为AI生态圈的一员,整合了Momenta的智能辅助驾驶、**的鸿蒙座舱和小米的“人车家”生态。 这样的一幕,让人想起了PC时代的“Intel Inside”,车企不再避讳伙伴们的创新和贡献,预示着传统的Tier模式正在加速瓦解,“AI生态圈”模式正式走上历史舞台:通过技术融合的方式,整合“盟友”们最擅长的能力,实现生态圈成员间的相互赋能、相互成就。 这种转变并非一蹴而就,而是有迹可循。 时间回到2025年
广汽丰田与**、Momenta组建“AI生态圈”,智能汽车的“信任标识”已经形成

在劲牌工厂,探寻一瓶草本酒的科技之旅

传统如果不能与时代对话,就注定被时代遗忘。 就像许多人对酒行业的印象,品控靠的是“手摸、脚踢、眼观、嘴尝”等感官判断,老师傅的“本事”决定了品质的好坏。不少行业已经在迎接呼啸而至的智能革命,酒类似乎还停留在手工业阶段。 直到我们走进劲牌,飘着酒香味儿的生产车间里,没有挥汗如雨的工人,映入眼帘的是一条条信息化、智能化生产线;劲牌研究院的实验室里,呈现出的是研究员们忙着做微生物分离、菌株鉴定、药材样品检测、药理研究等实验的“热闹”景象。 有别于祖传技艺、百年传承、泥池窖藏之类的营销叙事,我们在劲牌见证了一瓶草本酒的科技之旅。 01 创新草本科技,需要闯过“三道关” 草本和酒的结合,可以追溯到3500年前。 早在殷商时期,人们就以酒曲、黑粟米、郁金草、小米为原料酿酒,被认为是最早的露酒雏形;到了汉代,出现了椒酒、桂酒、柏酒、菊花酒等不同“香型”的露酒;蒸馏酒在元代普及后,以滋补药材入酒渐成风潮。 遗憾的是,露酒并未像白酒那样走出一条上扬的增长曲线。原因其实不难理解,如果说酿酒是一门手艺的话,草本则有着深厚科技含量。诚如我们在劲牌看到的答案,创新草本科技需要闯过“三道关”。 第一道是“研发关”:探索机理。 世界上的草本品种数以万计,搞清楚草本的活性成分和作用机理,可以说是创新不可或缺的一环。 早在1978年,劲牌就开始研制滋补酒,将酒与传统中医药方相融合,走上了传承千年养生草本酒之路。 劲牌每年将销售额的3%作为研发投入,先后和北京大学、复旦大学、华中科技大学、武汉大学、哈佛大学、查尔斯河实验室等国内外20多家科研院校或机构合作,在中药工程技术和质量控制、中药药理分析、微生物研究等领域联合攻关,研发出了中药指纹图谱技术、中药科学提取技术两大核心技术,以及“抗酒精性肝损伤的护肝白酒及其生产工艺”“一种具有降血脂功能苦荞酒的制备方法”等核心专利。 正是传统中医药理论与现代生命科学技术相
在劲牌工厂,探寻一瓶草本酒的科技之旅

场上显眼包!海信100吋电视世界第一霸屏世俱杯

“海信100吋,世界第一” 6月15日开幕的2025FIFA世俱杯赛场上, $海信家电(000921)$ 电视醒目的广告语又又又抢镜了。 从2016年法国欧洲杯、2022年卡塔尔世界杯,再到2024年德国欧洲杯,球迷对于海信频频刷屏顶级足球盛会的反应,已经由最初不可思议的“眼前一亮”逐渐变为习以为常的“会心一笑”。 正是在这看似寻常的“广告时间”里,海信完成了不寻常的跃级生长——全球营收实现了翻番,海外收入增长3倍,自主品牌占比从51.8%提升到85.6%。本届世俱杯上,海信更是以首个VAR显示官方合作伙伴的身份,在全球瞩目的体育舞台上展现中国技术的独特魅力。 我们常说,只有透过海面上的冰山一角,方能看到海面下巍峨磅礴的冰川。 $海信视像(600060)$ 在国际顶级赛事中越来越高的出镜率,不仅传递出中国品牌愈发自信的硬实力,也让外界看到海信逐渐蜕变为全球显示规则制定者的底气。 百吋WALL时代来临,重新定义“现场感” 对于海信而言,体育营销是推动品牌全球化进程的窗口,但随着海信在行业中不断拉大技术代差,高调亮出广告语正在变成其展示创新实力的显性表达。 今年初,海信在CES全球首发RGB-Mini LED技术,凭借画面色彩、亮度、对比度以及节能性的全方位突破,在行业内掀起一场技术革新浪潮。然而面对该技术极为亮眼的参数表现,业内却普遍持观望态度,认为产品离量产尚远,即便量产也只是用来建立技术壁垒的超高端“样机”,不会对市场格局产生太多影响。 毕竟在“原创者”索尼二十多年尝试量产未果的情况下,如何在电视屏幕上完美呈现三原色背光,已经成为公认的行业性难题。 当时间来到3月的AWE展会,海信用阵容强大的百吋大屏矩阵重
场上显眼包!海信100吋电视世界第一霸屏世俱杯

一根膜丝到一杯好水:方太NSP给出了健康水的中国解法

许多人都听过“每天8杯水”的说法,但很少有人思考:我们每天喝的水是否有利于健康? 世界卫生组织在《饮用水水质准则》中明确提到:80%的疾病与饮水有关,水质不良可引起多种疾病,并对饮用水中的微生物、重金属等含量给出了准则值。 在《饮用纯净水的健康风险》中,世界卫生组织进一步提出“纯净水没有或大量缺乏必需的矿物质,长期摄入这类水会导致有益元素供应不足,不是理想的饮用水。” 对于大多数人来说,自来水是最主要的用水来源。而国内的市政供水,大多是从水源地进行沉降、过滤和消毒后进入供水管网,水质本身并没有什么问题。可由于输水管网的老化,可能出现微生物二次污染、重金属残留、含有氯消毒副产物等风险。 看似简单的“喝水”问题,却成了健康生活的短板。想要喝一杯“健康好水”,背后是一场技术上的“硬仗”。 01 “健康好水”的中国解法 健康生活的演变史,也是一部净水技术的进化史。 早在19世纪20年代,就出现了活性炭净化技术,过滤水中的泥沙、铁锈等杂质;1925年出现了MF微滤技术,主要用来过滤大颗粒的杂质;1950年代出现的UF超滤技术,可以过滤细菌、病毒和胶体等颗粒物;1960年代的RO反渗透技术,实现了通过压力驱动分离净化水…… 一直到现在,市面上的净水机大多使用的还是UF超滤和RO反渗透技术。问题是,60年前的技术能否满足当下的需求呢? 先来回顾下两个主流技术的原理: UF超滤是利用压力活性膜分离水中的颗粒物,孔径通常在0.01到0.1微米之间,可以有效阻止较大的颗粒通过,包括细菌、病毒、有机物和大分子溶质,但无法去除水中的铅镉铬砷等重金属。 RO反渗透膜的孔径更小,通常在0.0001微米的范围。在外部压力的作用下,只有水分子能够通过,消除了以往过滤方式无法解决的重金属问题,同时也过滤掉了钙、钾、镁、钠等天然矿物质。 答案已经很明显,采用RO反渗透技术的净水机,过滤出来的是安全的纯净水,和
一根膜丝到一杯好水:方太NSP给出了健康水的中国解法

真金白银扶持新质商家,拼多多在为下一个十年布局

距离拼多多2025年Q1财报的发布已经过去了半个月,但坊间的各种讨论还在继续。 其中最不被理解的是,拼多多在Q1财报电话会上再次重申要反哺和扶持商家,先后推出了百亿减免、新质商家扶持计划、千亿扶持等惠商举措,不惜牺牲短期利润帮助中小商家降佣减负。 为什么拼多多要大力补贴商家,以至于让“激进”的营销支出摊薄了利润率?不少媒体、分析师从商业模式、经营战略、产业结构等维度进行了解读,给出了不同角度的结论。 但消费者的需求,才是一切问题的原点。想要理解拼多多补贴商家背后的深意,势必要回到消费者的立场上思考:我们到底需要什么样的电商生态,蕴藏着什么样的机会? 01 电商的模式创新,只解决了标准化的需求 中国的电商产业已经有20多年的历史,按时间线进行简单划分的话,大致可以梳理为三个阶段: 第一个阶段是2013年前,解决的是“有得买”的问题; 第二个阶段是2018年前,解决的是“怎么买”的问题; 第三个阶段是当前,解决的是“怎么买得更好”的问题。 不夸张地说,电商是过去20多年里最成功的商业创新。因为物流效率的提升、商品供给的丰富、消费链路的优化,许多人已经养成了新的购物习惯:哪怕是一包纸巾、一袋大米、一支牙膏,都倾向于到电商平台购买。 消费者的需求也在悄然变化。 被称为“日本消费研究第一人”的三浦展,在新书《第五消费时代》提出了一个观点:2021年到2043年,日本和中国将进入“第五消费时代”,越来越多人希望从消费当中寻找一种内在愉悦。 听起来可能有些“玄乎”,所揭示的现象却在生活中随处可见: 比如一个人居住的年轻人,对锅具的需求早已不同于父辈,越来越讲究在不同的场景下使用不同的锅具,专门煮牛奶的小奶锅、分区烹饪的早餐锅、微压快炖的珐琅汤锅......“小而精”的厨具,为做饭赋予了一种特殊的仪式感。 《德勤中国消费品和零售行业纵览2025》中给出了更贴合当下的洞察:中青年消费者正在逐
真金白银扶持新质商家,拼多多在为下一个十年布局

三类不同身份的“开发者”,在**CANN的土壤上种下了繁荣之花

开发者苦“封闭生态”久矣。 在大模型行业快速演进的当下,一些厂商仍在继续搞围墙之内的“封闭游戏”,看似提升了用户体验,却在技术、数据和生态协同上筑起了高墙,不断抬高创新门槛,为开发者套上了隐形的枷锁。 同一时间,一场开放对抗封闭的运动也进入了高潮期。 就在鲲鹏**开发者大会2025期间,坚持深度开放的**异构计算架构CANN,向外界公布了一组新数据: 深度贡献的开发者数量已经从1000多人迅速增长到6000多人,涉及操作系统、算子算法、整图优化、加速库等各个层面的创新;来自互联网、运营商、金融等领域的30多个伙伴,开发了260多个高性能算子,大幅提升了大模型在业务场景中的性能表现...... 为何在宣布深度开放的短短两年时间里,**CANN即已成为中国AI创新的新阵地?我们从三类开发者的故事中找到了答案。 01 以需求牵引生态:科大讯飞把业务问题变成生态能力 检验一个开放生态的价值,场景落地永远是最直观的指标。 身处创新第一线的企业开发者,起到了不可或缺的作用,他们从开放生态中汲取养分,又不断用实践经验反哺生态,通过深度融入生态、与场景紧密结合,赋予了**CANN生态自我生长、自我造血的能力。 其中的代表就有 $科大讯飞(002230)$ 。 科大讯飞副总裁、AI工程院院长潘青华,将科大讯飞与**平台的深度合作总结成了四个阶段: 第一个阶段是敢用,2023年国内还没有超大规模集群的成熟方案时,科大讯飞和**联合打造了国内首个自主创新的超大规模集群; 第二个阶段是真用,2023年到2024年的一年时间里,科大讯飞在**超大规模集群上训练了星火大模型,性能从开箱只有业界的30%提升到了90%,印证了自主创新算力完全可以支撑大模型研发达到世界领先水平; 第三个阶段是会用,科大讯飞和**的联合攻关团
三类不同身份的“开发者”,在**CANN的土壤上种下了繁荣之花

下一代入口之战:大厂为何纷纷押注智能体?

随着Deepseek、Manus火遍全网,科技圈的热点过半和大模型、智能体有关。 4月22日的 $创维集团(00751)$ 酷开春季发布会上,由影音、健康、生活、设备、创作、教育六大智能体构成的超级智能体正式亮相; 3天后的 $百度集团-SW(09888)$ AI开发者大会,李彦宏连发通用超级智能体心响APP、内容操作系统沧舟OS等多款AI应用; 5月中旬举办的红杉AI峰会,意料之中地将“智能体”列为核心议题,坦言AI有着“10倍于云计算”的市场潜力; 以及接踵而至的谷歌I/O 2025、微软 Build 2025等开发者大会,无不提到了智能体,涵盖编程、医疗、金融等多个行业……无论是微软、谷歌、OpenAI等海外巨头, $阿里巴巴-W(09988)$ 、腾讯、百度、酷开等国内企业,还是红杉代表的资本机构,无不开始大力推进智能体。 与之对应的问题是:到底什么是智能体,为什么“大厂”都在竞逐智能体,又将会带来哪些改变? 01 智能体的“魔力”:下一个交互入口 开始讨论前,不妨先花点时间了解下“智能体”的概念。 智能体是英文AI Agent,其中Agent的含义中有“代理人”的意思,让智能体和对话式AI产生了质的差别:不再局限于问答,而是一种能够深度思考、自主规划、作出决策并深度执行的智能应用。 场景不可谓不诱人。可想要解开智能体爆红的原因,还需要找到另一个视角——企业和消费者为什么需要智能体? 任何一项技术的普及,最关键的可能不是能力的上限有多高,而是应用的门槛有多低。倘若只有工程师才能调用、专家才能配置、少数人才能用明白,即使再强大
下一代入口之战:大厂为何纷纷押注智能体?

穿越AI周期,卫浴新场景的九牧答卷

两年前,时任 $阿里巴巴(BABA)$ CEO张勇在演讲中提出了一个颠覆性的观点:所有行业都值得基于AI重做一遍。 原以为只是一句时髦的口号,毕竟有不少人给出过类似的断言,用互联网重新做一遍、用云计算重新做一遍、用区块链重新做一遍的说法层出不穷。但在过去两年里,我们亲眼见证了AI对多个行业的重构。 AIPC重新定义了生产力工具的边界,AI电商重塑了供需匹配的效率,AI搜索正从“关键词匹配”跃升为“语义理解”与“决策辅助”……数据流、算法流、算力流悄然主导了数字世界的创新方向。 一个新的问题随之而来:在数字世界里搅动风云的AI,能否走出屏幕,对物理空间产生现实影响? 第29届上海厨卫展前夕,九牧举办了一场以“AI唤醒 场景新生”为主题的科技创新发布会,行业首发了九牧AI BATH场景品牌,通过全链路的AI主动式卫浴解决方案,让卫浴成为又一个被AI重构的生活空间。 过去几年时间里,关于空间智能化的讨论此起彼伏,酝酿出了N种实现路径,但一直缺少可以落地复制的样本。 这次会有不同吗? 01 是时候和反人性的“伪智能”说再见了 消费者苦“伪智能”久矣! 让许多人没有想到的是,进化了30年的智能家居,最终被消费者贴上了“鸡肋”的标签。 家里买了5台智能家电,被迫下载了4个APP;想要营造个看电影的氛围,在手机上捣鼓了半天才关上电动窗帘、调节好智能灯、连接上智能音箱;新买的扫地机器人动不动就卡在角落,常常要趴在地上去捞...... 为什么会出现这样的局面?症结在于“伪智能”。 不少品牌对“智能”的理解还停留在单品思维,不同的产品间无法联动,需要下载多个APP进行控制,而且数据不连通、场景不联动,呈现出了一个个“功能孤岛”,让用户体验高度碎片化。 还有一些品牌习惯将“创新”挂在嘴边,产品上却脱离用户需求谈“智能
穿越AI周期,卫浴新场景的九牧答卷

“以光惠算”走进校园,湖北大学用F5G-A全光网赋能智慧校园

SUN的联合创始人约翰·盖奇,曾在1984年提出过一个大胆的猜想——“网络就是计算机”。 到了大模型时代,40多年前的猜想被赋予了新的内涵。大模型训练和推理所需的资源,远超单台计算机的承载能力,涌现出了新的网络范式:大模型和AI应用部署在云端,用户在终端调用。网络不再只是数据传输的通道,而是计算体系的一部分,担纲了连接云端应用和用户需求的“枢纽”。 在这样的趋势下,越来越多的企业和园区开始部署万兆全光网络,以满足智能化对大带宽、低时延、高吞吐的需求。 比如**在5月16日举办了园区网络“以光惠算”先锋行动发布会,深度聚焦AI时代园区网络建设需求,推出了基于F5G-A技术架构的万兆全光园区解决方案,向外界示范了AI时代智慧园区网络的标杆。 其中湖北大学作为全球首个部署超万兆光网的高校,直观呈现了万兆全光在教育场景下的创造力。 01 智能化浪潮来了,园区网络还停留在上个时代 早在十几年前,全球的运营商就开始用光网络替代铜线网络,2020年中国光纤用户的渗透率已经达到93%。然而不少园区的网络架构,至今还依赖铜线,带宽低、布线杂乱、可扩展性差等痛点频频被提及。 两年前的湖北大学,也曾为园区网络的一连串痛点苦恼,网络能力和业务需求间出现了严重断层。 一个典型现象就是网络带宽无法满足新兴场景的连接需求。 高清视频教学、大规模在线课程以及冷冻电镜、虚拟仿真等科研数据的传输,早已成为湖北大学日常教学的常态。过去的网络架构受限于铜缆部署、设备性能、架构层级多等问题,已经无法满足师生们高密度、高速率、低时延的网络接入要求。 在集中上课、数据密集传输等高峰时段,网络拥堵频发,卡顿、延迟、掉线等问题时常发生。 因为不同网络的建设时间不同,湖北大学还面临“多网并存”的挑战。 校园网最初是用以太网技术建的多媒体教室,后面建了一张多媒体教学网,再加上安防网、财务网、医疗网,不同的物理网络相互独立、烟囱
“以光惠算”走进校园,湖北大学用F5G-A全光网赋能智慧校园

从概念走向落地,深圳率先给出新质互联网城市建设路线图

2024年7月的第三届中国IPv6创新发展大会上,中国工程院院士邬贺铨在演讲中提出了一个新概念——新质互联网,认为超大带宽、低时延、确定性、泛在安全等能力,将是下一代网络演进的方向。 时间来到2025年4月,深圳市工信局在《深圳市极速宽带先锋城市2025年行动计划》的目标中明确提出“建设具有深圳优势的新质互联网,推动网络向超高速、大容量、智能化升级演进”。 按照技术扩散的规律,从概念到共识再到产业落地,往往需要几年乃至十几年的时间。让外界没想到的是,不到一年的时间,“新质互联网”就已经开始在城市级场景中落地。 作为一个擅长创造奇迹的城市,深圳一直走在智能化的最前沿,一次次为外界指明了产业创新的方向。在新质互联网的建设中,深圳做了什么样的示范,背后蕴藏着什么样的产业逻辑? 01 互联网的代际演变,应用模式不断被重构 从1994年中国接入互联网算起,几乎每隔10年,互联网就会出现一轮代际演变,不断重构应用模式。 最早是门户网站和论坛,打开了连接人与信息的窗口;2005年后进入PC互联网的黄金时代,涌现出了博客、SNS等创新应用;2015年是移动互联网的里程碑时刻,购物、社交、娱乐等需求不断向互联网转移......潜移默化地改变了亿万用户的生活方式与消费习惯。 以此类推的话,2025年前后互联网将进入新的代际,又将对生活和生产方式产生什么样的影响?邬贺铨院士已经给出了答案——未来十年是新质互联网阶段,将走向四大重构。 1、终端形态向新重构。大模型的下沉和智能体的落地,不断让AI嵌入到终端和边缘计算中,重新定义了手机、PC、眼镜、AR等可穿戴设备以及工业模组,从过去信息获取和呈现的工具,演变为自主感知、理解和决策的智能协作节点,更依赖低延迟、高可靠、边云协同的网络架构。 2、网络设施向智重构。AI不仅仅被嵌入到终端,还嵌入到了网络层,驱动网络“自学习、自调度、自演进”,比如通过大模
从概念走向落地,深圳率先给出新质互联网城市建设路线图

SID 2025上的天马,用“好屏”技术重构产业叙事

作为全球最具影响力的显示行业盛会,SID国际显示周不仅是技术比拼的舞台,更是未来产业方向的风向标。SID 2025上的技术密度与产业动态,再一次验证了这一定律。 Micro-LED、柔性OLED、裸眼3D、量子点、透明显示等新技术在SID 2025集中亮相,进一步重构了视觉体验的边界和人机交互方式,为智能手机、智能座舱、可穿戴、空间计算等应用场景提供了更多可能性。 同时也揭示了全球显示产业的深层次重构——从功能驱动转向体验驱动,从单点突破走向多模态融合。 在这场全球创新竞逐中,深耕显示领域40余年的 $深天马A(000050)$ ,全方位展示了车载、手机、IT、专业显示、智能穿戴等领域的技术方案,再一次成为SID国际显示周上的焦点,并用一项项首发创新技术诠释了天马的硬核实力,诠释了“一块好屏”的多元内涵。 01 新技术百花齐放,天马用“好屏”引领创新风向标 一场延续了60余年的行业盛会,最大的魅力正是新技术亮相,在光影交织间预演了未来的显示格局。 身为显示行业的“尖子生”,天马在SID 2025上展示了哪些“好屏”技术,将对全球显示行业产生什么样的影响?不妨让我们“走进”天马的展会现场,从每一块屏幕的创新细节中寻找答案。 首先是手机“好屏”,在极致边框、通透显示、健康护眼、环保省电的天马“好屏”标准下重构视觉体验。 天马自研的SLOD技术,开创性设计了具有高效的载流子产生和分离能力的电荷产生层结构,可将90%的横向电流转换成器件的发光电流,功耗比常规单层OLED器件降低了30%,寿命提升了300%,而且更少的横向漏电使得屏幕具有优异的低灰阶显示效果。 在我们看来,SLOD技术的价值不仅仅是技术上的创新,还在于对用户痛点的精准回应:屏幕的功耗降低了,不再为频繁充电焦虑;屏幕的寿命提高了,进一步
SID 2025上的天马,用“好屏”技术重构产业叙事

MoE大模型迎来“原生战友”:**超节点重构AI基础设施

对AI比较关注的话,大概率会听到下面两个“时髦”的概念: 一个是Scaling Law,通常被翻译为“规模定律”,得出了一个通俗易懂的结论——“模型越大,性能越好。” 另一个是MoE架构,中文名称是混合专家模型,相对应的概念是稠密(Dense)模型。如果说稠密模型一个“通才”,由一个“专家”处理多种不同的任务,MoE则是将任务分门别类,分给多个“专家”进行解决。 Scaling Law和MoE的出镜率越来越高,意味着大模型的参数量将越来越大,同时开始提升“能力密度”。直接相关的就是大模型的训练和推理,正在从粗放烧钱到精细调优,从堆算力转向算力利用率最大化。 站在大模型工程化创新的十字路口,恰逢鲲鹏**开发者大会2025前夕,“**超节点”迅速成为技术圈的热门话题。 由此产生的一个问题是:MoE架构大模型的训练都遇到了哪些挑战,**给出了什么新解法? 01 MoE架构成主流,大模型训练遇到“三座大山” Mixtral、DeepSeek R1、Llama 4、Qwen3……近一年现象级刷屏的大模型,清一色地采用了MoE架构。 原因离不开MoE的架构创新。 每个专家负责任务的一部分,极大地提升了模型的可扩展性;每个专家都能针对整个问题的特定方面进行微调,进一步提升了模型的专业化和准确性;每次请求只激活部分专家,显著减少了每次推理的计算负荷…… 当MoE架构演变为大模型的主流范式,由服务器、存储、网络等设备堆叠而成的传统集群,在大模型训练上遇到了“三座大山”。 一是资源利用率低。 MoE架构对负载均衡非常敏感,路由机制如果分布不均,某些专家会频繁被调用,而其他专家几乎闲置。 传统AI集群部署MoE模型时,每台服务器只部署部分专家,缺乏全局调度能力。由于路由机制无法感知底层资源状态,可能导致部分服务器的使用率大于90%,部分服务器几乎不参与计算。结果就是,GPU的利用率远低于理论峰值
MoE大模型迎来“原生战友”:**超节点重构AI基础设施

越来越多企业为AI焦虑,联想的“超级智能体”来得正是时候

《快看!!!AI时代,你的工作会消失吗?》 每隔一段时间,家庭群里就会有长辈分享这样的文章,隔着屏幕都能感受到他们的焦虑情绪,生怕子女的工作被AI替代。 即使是对AI认知稍深的年轻人,也不可避免地被“焦虑”裹挟。毕竟DeepSeek只需半分钟就能写一篇不错的新闻稿、AI主播全天24小时直播带货、“大模型取代脑力劳动”的讨论层出不穷,越来越多人开始焦虑怎么才能学会使用AI,以至于社交媒体上充斥着“XX天学会使用XX”的课程。 身处“智能文明的前夜”,许多企业也没能逃出焦虑和担忧的氛围:购买了一体机、建立了知识库、不断向AI投喂语料,结果却不及预期。不少CEO开始焦虑,到底是哪个环节出了错,大模型的落地究竟要从何处开始? 在5月7日的2025联想创新科技大会展会上,我就看到有一名“硅基员工”现场指点迷津,消除打工人的职场内耗,为企业应对AI焦虑出谋划策。虽然场面轻松,但却反映了企业等普遍的AI焦虑。 IDC和 $联想集团(00992)$ 共同发布的《全球CIO报告:迈入全新AI经济时代》对企业的“AI焦虑”现象进行了深入调研:2025年企业AI支出同比增长2倍,超四成资金涌向生成式AI;近3000调研企业中有一半已部署AI,但大多数仍处应用早期,遇到了ROI不明确、数据不足、内部AI专业经验缺口等“绊脚石”。 相对乐观的是,这场AI焦虑有着鲜明的“时间差”,对新技术更加敏感的大厂,早在七八年前就在尝试驾驭AI,他们摸索出的经验和教训,为后来者提供了一份“避坑指南”,可以站在巨人的肩膀上少走些弯路。 比如在这届联想创新科技大会上,联想的“超级智能体”体系正式揭开面纱。 01 企业的AI焦虑,到底在焦虑什么? 个人的焦虑,似乎并不难解释,归结为一句话——“我的工作会不会被越来越聪明的AI所取代呢?”
越来越多企业为AI焦虑,联想的“超级智能体”来得正是时候

昆仑万维财报解读:AI商业化卷王

过去一年多时间里,几乎所有和AI相关的企业都会被问到这样一个问题:AI何时才能够商业化变现? 经过了早期的“概念红利”,资本的热情逐步冷却,行业内外形成了新的共识:单纯的技术演示,已经无法支撑可持续的商业故事。特别是“非大厂玩家”,想要在洗牌赛中脱颖而出,不仅要能“炼出好模型”,还要“让模型赚钱”。 典型“非大厂玩家”的代表昆仑万维,陆续发布了2024年财报和2025年一季度业绩报告,向外界诠释了一家中型AI企业的生存策略——出海第一。 2024年实现营业收入56.6亿元,同比增长15.2%,整体毛利率达到73.6%;2025年第一季度,公司实现营业收入17.6亿元,同比增长46%,海外业务收入占比提升至94%,这份成绩单让昆仑万维成为海外增速最快的中国企业,为AI出海商业化打响了第一枪。 值得一提的是,近期由于小马智行在美股的脱颖而出,让去年投资亏损的8亿的昆仑万维直接回血,资本市场的波动让人唏嘘,同时也体现了一定的包容弹性。 在AI商业化的课题上,“All in AGI 与AIGC”的昆仑万维,交出了一份兼具规模增长、生态协同和技术破局的多维答卷。 01 AI应用矩阵开花结果,商业化“增长飞轮”初具雏形 不管是国内还是海外,大多数AI企业仍处于技术展示或小范围试点的阶段,能否跑通商业化路径的可谓凤毛麟角。 原因并非是技术过于新颖,而是商业路径上的“守旧”。 比如很多AI厂商都有一个“平台梦”,不断呼吁开发者来打造应用,并未脱离“做操作系统”的路径依赖;一些做AI应用的团队,仍在照搬移动互联网只盯着“打造超级APP”的打法,结局注定是很残酷的。 相比之下,昆仑万维的商业化布局有着典型的“矩阵”思维,在AI大模型、AI搜索、AI短剧、AI音乐、AI游戏、AI社交等领域“多点开花”,同时避开大厂的火力中心,将海外市场作为增长主阵地。 昆仑万维一季度营收的高速增长,和AI应用矩
昆仑万维财报解读:AI商业化卷王

去老虎APP查看更多动态