社区
首页
集团介绍
社区
资讯
行情
学堂
TigerAI
登录
注册
光锥智能
关注AI产业,关注千行百业的智能化
IP属地:未知
+关注
帖子 · 481
帖子 · 481
关注 · 0
关注 · 0
粉丝 · 0
粉丝 · 0
光锥智能
光锥智能
·
08-13 18:28
昆仑万维UniPic 2.0“小钢炮”模型炸场,一个模型搞定理解+生成+编辑
文|魏琳华 编|王一粟 大模型又迎来新一波的迭代周期。 近日,从Open AI发布GPT-5,到国内的昆仑万维、商汤、百川智能、智谱等都陆续发布了自己的新模型。其中昆仑万维更是一口气开启了技术周,连续5天每天发布一个新模型,而8月13日发布的,正是其本周发布的第三款模型——多模态统一模型UniPic 2.0。 UniPic 2.0主打的是,在单一模型中深度融合图像理解、文本到图像生成、图像编辑三大核心能力,这正是今年多模态技术攻克的热门方向——理解、生成、编辑一体化。 目前多数AI生图,生成之后就很难修改,经常出现对二次指令理解不充分,让图片越改越离谱的情况。 然而我们在测试UniPic 2.0的修改图片能力时,却看到了惊喜。 最近流行的“基础款不要搭基础款,上身基础,下身不基础”的玩梗,我们让UniPic 2.0给下身换一个同色系但夸张的穿搭,它就把下身的裤子改成了一条红色蓬蓬裙。 此模型在7月30日已经开源,这次上线的2.0版本,延续了之前1.0版本的优势——“又快又好”。 图片几秒生成、一句话编辑,小身材高表现 当其他大模型需要花几十秒生成一张图片时,UniPic 2.0只用几秒就画了一张复杂的“玻璃猫”出来。 不同于市面上其他开源的统一架构多模态模型动辄百亿参数的大规格,UniPic 2.0的参数规格只有2B,这让它响应生成的速度比起其他模型快了一个数量级。 虽然尺寸小,但UniPic 2.0在图片生成、理解和编辑三个方面的表现力也依然在线,甚至在图片编辑部分的部分指标分数打败了多个规模在10B以上开源模型。 先从图片生成说起,在生成能力方面,UniPic 2.0的统一架构版本在GenEval(测试生成图像和文本匹配程度)取得0.90,超过了一众开源模型和闭源的GPT-4o(0.84)。可以看到,UniPic 2.0在小模型体量下依然能保持高性能的优势。 为了测试U
看
67
回复
评论
点赞
1
编组 21备份 2
分享
举报
昆仑万维UniPic 2.0“小钢炮”模型炸场,一个模型搞定理解+生成+编辑
光锥智能
光锥智能
·
08-13 10:14
百川开源最新医疗大模型,中国力量领跑医疗AI赛道
文|白 鸽 编|王一粟 专注医疗后,百川智能交出第一份答卷!8月11日,百川智能发布第二款开源医疗增强推理大模型Baichuan-M2,其以32B的参数量,在OpenAI的Healthbench评测集上,超越其刚刚发布5天的开源模型gpt-oss-120b。 除gpt-oss-120b外,Baichuan-M2还领先GPT-5以外所有开源与闭源前沿模型,以更小尺寸模型实现医疗能力反超,在所有开源模型中登顶世界第一。 同时,在落地应用浪潮下,大模型所追求的,不再只是效果好,还要能低成本落地。 尤其是在医疗健康领域,模型涉及更多敏感隐私信息,医疗健康机构对私有化部署有着强烈的需求,而私有化部署往往意味着高昂的部署成本。 Baichuan-M2的落地门槛则非常低,其支持RTX4090单卡部署,进一步提升了模型在真实医疗场景中的落地可能性与可扩展性。 这短短5天 “攻防战”,不仅改写了全球医疗大模型的实力排名,更重要的一点在于,在中美通用大模型差距持续扩大的背景下,中国团队可以在AI垂直行业大模型赛道中,实现弯道超车。 当前,医疗是大模型最重要、最有潜力的应用领域之一,正在逐渐成为全球共识。不过,作为应用底座的医疗大模型,现阶段行业中并未有特别突出的产品。 即使是OpenAI最新发布的GPT-5,其数学能力满分,代码、写作、知识能力的成绩也都很高,但医疗领域的得分依旧很低。 这也说明,医疗大模型仍有很长的路要走。 而中美垂直行业大模型的能力差距并不大,作为中国头部大模型企业代表,百川智能此次在医疗大模型上,已实现与OpenAI的并驾齐驱。 那么,作为国内最早全力押注医疗AI赛道的大模型创企,百川智能又是如何做到弯道超车的? 力压全球医疗大模型,拆解Baichuan-M2硬实力 长期以来,模型在医学考试(如 USMLE)上的表现被视为衡量其医疗能力的重要指标,但随着相关题库的饱和,这
看
61
回复
评论
点赞
1
编组 21备份 2
分享
举报
百川开源最新医疗大模型,中国力量领跑医疗AI赛道
光锥智能
光锥智能
·
08-12 17:49
2025年,具身智能终于来到爆发前夜
文|刘俊宏 编|王一粟 “新老”机器人之间的悲欢并不相通。 当新一代机器人用人形机器人搏击、遛狗的时候,传统机器人公司还在用机械臂搬运货物。一个是人声鼎沸,一个是冷冷清清。 8月9日,又是一届世界机器人大会(WRC)在北京开幕。作为历届最大的一次展会,本次展览有200多家国内外机器人企业出席,人形机器人整机企业有50多家。本次展会上共计展出1500多件展品、100多款首发新品,多的一面墙都“简介”不完。 “大模型解决了机器人操作的问题,现在机器人能够干活,能真正与物理世界交互了。” 对于机器人这一年间的进化,智澄AI创始人、CEO胡鲁辉向光锥智能如此总结说。 冒着北京当天的大雨和水泄不通的人群,光锥智能在现场有三个最直观的感受。 首先,今年人形机器人是大会的绝对主角。之前大会的A馆一般着重展示机器人工业场景应用。今年主办方特意将宇树和加速进化两家人形机器人厂商安排进来“吸引流量”。用于演示新技术的B馆,直接被人形机器人占领。会场没有人形机器人的展台,观众密度肉眼可见的“稀疏”。 其次,今年的人形机器人演示主打“可交互”。去年机器人展会上,不少机器人周围还“拉着隔离带”,今年机器人厂商希望消费者上手“摸一摸”。在小人形机器人、机器狗、机器人小玩具的展区,光锥智能看到不少消费者询价,想要当场下单带走。 最后,今年大多数机器人厂商的演示着重展现实用价值。机器人已经实现了在工厂、科研教育、医疗养老等场景中的初步探索。 最接地气的是街头摆摊场景。大会现场随处可见各种机器人现制咖啡小摊,还有机器人小酒吧、机器人煎饼果子、机器人零售小店等变种场景。 在工业场景上,率先落地的机器人厂商已经开始强调集群协作的概念。相比去年单薄的“能干活”标签,今年的机器人开始更多强调机器人与自动化产线结合、电池续航、连续工作时长、回报周期等更落地的数据指标。 实际的落地应用,让机器人开始进入到量产阶段。当光
看
17
回复
评论
点赞
1
编组 21备份 2
分享
举报
2025年,具身智能终于来到爆发前夜
光锥智能
光锥智能
·
08-08
GPT-5王座难坐稳,OpenAI想靠价格赢过一切
文|魏琳华 编|王一粟 从2023年底OpenAI CEO Sam Altman第一次提到GPT-5,到今天模型的正式发布,时间过去了一年半。 如今,人们仍然熬夜围观OpenAI的发布会,但彻夜讨论的呼声中少了惊呼,多了质疑。 值得欣慰的是,从模型性能上来说,OpenAI成功扳回了之前下滑的口碑。在发布会上拿出的GPT-5,依然做到了多方面能力SOTA,更是靠GPT-5直言“世界最强编程模型”,狙击Claude的领先地位。 但绕不开的一些固有印象是,OpenAI拉开同行的差距,远远不及GPT-3、GPT-4的断崖式领先。 OpenAI的同行者也虎视眈眈。不说Anthropic本周官宣要在当月发布大版本更新的模型,马斯克更是刷屏一晚,强调自家模型Grok-4在部分测试上已经超过了OpenAI的新模型。 OpenAI又能在这个新“王座”上坐多久?Altman不语,只是一味地讲起了大模型便宜落地的故事。 盯上最强代码模型 GPT-5全面升级 刷新的性能分数、极高的性价比、针对性优化的幻觉问题和超长上下文,方方面面的优化,都是为了让GPT-5成为一个更适合干活的大模型。 首先在架构上,GPT-5是一个统一架构版本的模型,由三个部分组成:一个基础模型、一个具有深度推理能力的GPT-5 thinking模型,加上一个实时路由器。 这样设计的好处是,实时路由器能根据对话类型、问题复杂性、工具需求以及用户意图快速决定使用哪个模型。比如当用户的提示词包括“帮我认真思考一下”这类话术,它就会调用深度推理模型。 在发布会前一天就大肆预热的Altman,就在X上发图暗示GPT-5的性能优势,在发布会上,他也强调了对GPT-5的信心。 “如果说和GPT-4的聊天像跟高中生对话,和O3像是跟大学生聊天,那么跟GPT-5的交流就相当于对话博士生。”Altman这样定义GPT-5的体验感受。
看
134
回复
评论
点赞
1
编组 21备份 2
分享
举报
GPT-5王座难坐稳,OpenAI想靠价格赢过一切
光锥智能
光锥智能
·
08-06
靠NPU当中国英伟达?云天励飞还需努力
文|刘俊宏 编|王一粟 AI应用的落地,正在推动AI芯片的战场从训练切换至推理。 7月30日,云天励飞发布公告称,公司已向港交所提交了上市申请。若上市成功,云天励飞将继2023年登陆科创板之后实现“A+H” 双重上市。 随着云天励飞此次交表,国产NPU和AI推理芯片的行业发展路径和底色也被一并揭开。 招股书显示,云天励飞目前产品主要跟AI芯片相关,业务涉及企业级、消费级和行业级三个赛道。分别主要对应销售AI推理芯片、AI玩具及消费电子芯片和智慧城市解决方案三个赛道。 基本财务情况显示,云天励飞近几年实现营收较大幅度增长。2022年、2023年、2024年及2025年前3个月,云天励飞的收入分别为5.46亿元、5.06亿元、9.17亿元、2.64亿元。 作为一家科技公司,云天励飞还处于投入期。对应营收同期,云天励飞亏损分别为4.47亿元、3.84亿元、5.85亿元、0.86亿元,研发费用分别为3.47亿元、2.95亿元、4.00亿元、0.84亿元,亏损暂时没有呈现收窄趋势。 最亮眼的成绩,来源于云天励飞在AI芯片相关领域位居前列的市占率排名。 根据灼识咨询报告显示,以2024年中国市场相关收入统计,云天励飞是排名前三的中国全场景AI推理相关产品及服务提供商;在NPU驱动的AI推理芯片相关产品及服务提供商中排名中国前二。在2025上半年,云天励飞的AI玩具销量在中国主流电商平台排名第一。 在2025年的WAIC上,光锥智能也看到了云天励飞展台上放着的宣称“算力积木”架构打造的深界DeepEdge系列芯片。云天励飞的AI推理加速卡,也与在场其他国产AI芯片厂商一样“熠熠生辉”。 但以具体出货情况看,云天励飞的业务似乎又没有像描述的那般“风光”。 营收质量层面看,云天励飞的毛利率整体不到30%。由于云天励飞的AI芯片不涉及芯片制造,公司整体定位是Fabless厂商。以国内同类型公司
看
155
回复
评论
点赞
1
编组 21备份 2
分享
举报
靠NPU当中国英伟达?云天励飞还需努力
光锥智能
光锥智能
·
08-02
理想的中场战事
文|刘俊宏 编|王一粟 一家账上有千亿*现金的车企,在公司楼下搭了个台子就办了自己的十周年庆典。 在活动现场,理想主打一个科技公司的朴实低调,完全不像车企的奢侈豪华。最“撑场面”的节目,是理想汽车创始人李想带着总裁马东辉、CFO李铁、CTO谢炎,四个公司“大Boss”唱了一首《朋友》。相比其他三个人的“腼腆”,领唱的李想借着唱歌释放了不少“压力”。 2025年的理想,正在经历一个全新的阶段。 作为中国汽车新势力中年销量最高,并且首家盈利的车企,理想在2024年底自信满满:一度对2025年的销量充满了乐观。 2025上半年,理想合计交付20.4万辆车,同比增长7.9%。这个成绩,理想显然并不是很满意。今年年初,理想定下的年度排产目标是70万辆。有接近理想人士还曾告诉光锥智能,称今年理想内部曾想“冲一冲”年销百万。面对实际的销量,据媒体报道,理想在今年5月底,选择将年度排产目标下调至64万辆。 但在理想i8发布会之后,市场似乎仍然不满意理想的表现,股价甚至一度大跌10%。 那么,理想真的要跌落神坛了吗? 在浮躁的市场中,人们往往只看到表面的动态来追涨杀跌,却忽略水下更深层的变化。 理想这一年最大的变化,并不在销量上,而是对技术内功的夯实,更是对未来战略空间的拓展。 “我们最终一定不是标准的汽车企业,我们是一个空间机器人的企业”。 正如李想在7月央视《对话》节目上所说。今年李想在各种场合不停提到AI投入、AI目标、“汽车机器人”等概念,并将AI定义为公司的“一号战略”。 基于这些思考,理想决定在首款纯电SUV汽车——理想i8上首发最新的智驾系统VLA(Vision Language Action Model视觉语言行动模型)。 对于这辆主打6座的家用SUV,理想认为AI是产品最重要的卖点之一。 一年时间,理想的智驾从“端到端”又完成了升级“VLA”的跳跃。 在发布会前,光锥智能受
看
1.04万
回复
评论
点赞
8
编组 21备份 2
分享
举报
理想的中场战事
光锥智能
光锥智能
·
07-31
AI+金融,如何跨越大模型和场景鸿沟?
文|白 鸽 编|王一粟 当AI大模型已开始走向千行百业之时,备受看好的金融行业,却似乎陷入了落地瓶颈。 打开手机银行想查下贷款额度,对着屏幕说了半天,AI客服却只回复 “请点击首页贷款按钮”; 客户经理想用大模型生成一份客户资产配置方案,结果推荐的产品与客户风险等级完全不符; 风控团队测试的AI模型,在审批中小企业贷款时频频给出“幻觉答案”...... 这些看似荒诞的场景,却是当前AI落地金融行业时的真实困境。 当金融机构满怀期待地将AI请进门,却发现它既读不懂复杂的信贷政策,算不清理财产品的费率结构,更搞不懂不同银行的“行话体系”。 通用大模型的“聪明”,在严肃的金融场景里似乎失灵了,大模型与金融场景之间,也仿佛横亘着一道看不见的鸿沟。 “企业和产业需要的不是实验室的技术,而是真正能够解决真实问题的可信生产力。”蚂蚁数科CEO赵闻飙在2025WAIC智能体驱动产业变革论坛上如此说道。 也正因此,面向AI大模型在具体行业中的落地,想要真正释放AI价值,关键就在于要从水平通用转向垂直专用,只有深度理解行业的大模型,才能懂行话,做行活儿,创造真实的业务价值。 金融行业的AI落地,更是如此。 因此,构建专业的金融大模型是推进金融与AI深度融合的必然路径,未来,金融大模型的应用深度将成为金融机构竞争力的关键要素。 大会上,蚂蚁数科正式发布了一款专为金融领域打造的金融推理大模型Agentar-Fin-R1,其基于Qwen3研发的垂直行业大模型,包括32B和8B参数两个版本,在FinEval1.0、FinanceIQ等权威金融大模型评测基准上表现出色,超越DeepSeek-R1等同尺寸开源通用大模型及金融大模型。 同时,蚂蚁数科还推出基于百灵大模型的MOE架构模型,获得更优推理速度。此外,还有非推理版本的14B和72B参数大模型,以满足金融机构在多样化场景下的部署需求。 “蚂蚁数科主要
看
221
回复
评论
点赞
1
编组 21备份 2
分享
举报
AI+金融,如何跨越大模型和场景鸿沟?
光锥智能
光锥智能
·
07-30
AI办公的效率革命,金山办公从未被颠覆
文|白 鸽 编|王一粟 三年前,微软发布Office Copilot,掀起AI办公革命的第一波浪潮。 然而,这场变革止步于简单的智能助手或聊天工具栏的辅助层面,受限于AI本身能力,Copilot式插件未能从根本上重构办公逻辑。 原生AI平台Manus、Genspark等可以为用户提供轻量级办公体验,一句话生成文档、PPT等,但也受限于整体协作功能,及编辑器不灵活等多重因素,距离真正效率质变仍有距离。 三年后的WAIC上,国产办公软件厂商金山办公正式迈入WPS AI 3.0阶段,让AI办公的效率革命再次提速。 这个AI 3.0阶段,是要将用户、AI和软件真正地深度融合在一起。 “基于用户最原始需求,把软件和AI能力打碎,并将各自所擅长能力组合在一起,这样的产品才是最终形态。”金山办公助理总裁田然在世界人工智能大会2025金山办公AI生产力论坛上说道。 金山办公助理总裁田然 同时,金山办公还提出了“Software Agent”的概念,强调AI应该服务于人,放大人的能力而非取代人的角色。 而WPS AI3.0所展现的产品形态,就是WPS灵犀智能体,基于该智能体,用户只需通过自然语言、多轮对话即可完成文档创作、演示文稿生成及语音助手等功能,全程无需复杂操作和外部跳转,是真正意义上的原生Office办公智能体。与此同时,WPS知识库也随着WPS AI 3.0的推出正式亮相。 WPS灵犀智能体并非单独存在,而是内嵌到整个WPS三大组件的工作流程中,让用户办公中,随时用上文档撰写、AIGC生图等功能。 以用户实际需求为出发点,不盲目追求一句话生成内容,而是可以实现AI和人在办公场景中的协作共生,这才是真正的为AI办公带来了更实质性的效率提升。 可以看出,WPS AI 3.0不再是一个集成了AI的工具,而是成为一个体系化AI产品。 从AI浪潮之初,金山办公就押注AI办公赛道,始终处于行业
看
578
回复
评论
点赞
2
编组 21备份 2
分享
举报
AI办公的效率革命,金山办公从未被颠覆
光锥智能
光锥智能
·
07-28
人在WAIC,和大模型一起“狂奔”
文|魏琳华 编|王一粟 “人已经多到炸馆,逛展堪比庙会。” 2025年,WAIC的火爆程度已经不用多说:闲鱼上炒到2000元一张的门票;现场随处可见的老外;各个展区被人流挤得水泄不通...... 光是外围的火爆就已经说明——今年,AI大模型在应用上已经势如破竹。 前所未有的参展产品数量,是AI应用遍地开花的佐证:创纪录的800家企业参展,带来3000余产品及100+首发新品参展,涵盖40+大模型、50+AI终端产品、60+智能机器人,和去年相比,产品数量整整翻了一番,不少观众散会纷纷戏称“逛到断腿”。 在一个展区中,你能看到各个品类下不同厂商演绎的多种玩法:机器人1:1复刻人类动作、给人类调酒、搬东西;Agent写代码、作文、当理财助手;AI+教育不仅有AI学习机、还搬上了AI黑板...... 比起看得见摸不着的Agent“数字员工”,能看到实体的智能机器人成为了会场的“顶流”。 H3展馆中,大片机器人“整活”的场景相当壮观:和真人对打的宇树机器人、练习摞百事可乐的智元机器人、魔法原子的机器狗绕着场馆跑来跑去...... 除了面向C端用户的产品爆发,在B端,AI也已经在企业中应用起来。 “就在我们公司内部,员工每天需要写很多代码,做很多研究型实验,这里边大概有 70% 的代码是 AI 来写,90% 数据分析是靠 AI 来做。”在MiniMax CEO闫俊杰的分享中,Agent构建的智能系统已经真正帮上了员工的忙。 随着年初大模型进入深度推理阶段,性能进入高可用的程度,加上训练和推理成本进一步降低。经过三年的一路狂奔,厂商们终于高调地秀起了肌肉。 推理模型的“爆发年” 从模仿学习到强化学习,大模型已经进化到2.0时代。 以OpenAI的o1模型为分水岭,2025年成了推理模型的“爆发年”。区别于以往靠大量监督数据提升性能,通过RL(强化学习)算法的训练模式,让大模型的能力迈上
看
80
回复
评论
点赞
1
编组 21备份 2
分享
举报
人在WAIC,和大模型一起“狂奔”
光锥智能
光锥智能
·
07-25
字节、腾讯、阿里,AI 编码“三国杀”
文|魏琳华 编|王一粟 大厂正在集火最具PMF(产品市场契合度)价值的赛道——AI编码。 从7月21日开始,字节、腾讯、阿里轮番更新AI编码产品和模型:字节已有的AI编码产品Trae放出Solo版本,加入上下文工程,让平台变得更“聪明”;腾讯则把一整套用来部署产品的工具放到其中,做了个“全栈工程师”;阿里更是发布编程大模型Qwen3-Coder剑指Claude 4,直接从模型层下功夫。 在Cursor面向中国市场取消了Anthropic、OpenAI和Google等多家的模型使用后,国内大厂们不仅想做Cursor的平替,更是升级开发体验。它们不再满足于让AI仅仅充当程序员的“副驾驶”,而是想让AI包揽起“产设研”一条龙,直接做成品。 和上半年还在让AI当助手、打酱油相比,这一次,AI 编码已经实现了从辅助程序员生成代码,到AI自主完成生成的飞跃。 AI编码“三国杀”,从编码生成到软件交付 接连三天的发布中,字节、阿里、腾讯三家大厂先后拿出了能让AI一口气干完从编码到成品的工具/模型。 这一次的集中更新,AI开始接管起写编码的工作:不仅要写得质量过关,更是把成品都部署好了。 其中,腾讯和字节对自家编码产品的更新,重点还是在产品侧,毕竟从工程队到样板间,中间还隔着很远,需要靠产品能力补齐。 7月21日,字节宣布更新Trae Solo版本,比起聚焦“编码生成”的1.0阶段,新版本跨向了能让AI自主完成“软件交付”的2.0阶段。 在旧的版本中,Trae在IDE界面中编程,其中编程模式有两种,分别是Build模式和Chat模式,前者相当于一个传统编程的IDE界面,只需要用户在右侧输入提示词,AI就能自动拆解,按照需求生成大段编码。相比之下,Chat模式则更多适用于用户和AI通过聊天的方式,修改编码、找问题等等,更适用于精细调整上。 2.0版本的Trae,在左上角加入了一个模式切换,可
看
171
回复
评论
点赞
1
编组 21备份 2
分享
举报
字节、腾讯、阿里,AI 编码“三国杀”
加载更多
热议股票
{"i18n":{"language":"zh_CN"},"isCurrentUser":false,"userPageInfo":{"id":"3577088745112674","uuid":"3577088745112674","gmtCreate":1613994721352,"gmtModify":1732170609065,"name":"光锥智能","pinyin":"gzznguangzhuizhineng","introduction":"前沿科技,数智经济,投资人都在关注的前沿科技新媒体。","introductionEn":"","signature":"关注AI产业,关注千行百业的智能化","avatar":"https://static.tigerbbs.com/651ae7b585f9b2ec556d1945190a5bfe","hat":null,"hatId":null,"hatName":null,"vip":1,"status":2,"fanSize":143,"headSize":0,"tweetSize":481,"questionSize":0,"limitLevel":999,"accountStatus":2,"level":{"id":3,"name":"书生虎","nameTw":"書生虎","represent":"努力向上","factor":"发布10条非转发主帖,其中5条获得他人回复或点赞","iconColor":"3C9E83","bgColor":"A2F1D9"},"themeCounts":0,"badgeCounts":0,"badges":[],"moderator":false,"superModerator":false,"manageSymbols":null,"badgeLevel":null,"boolIsFan":false,"boolIsHead":false,"favoriteSize":0,"symbols":null,"coverImage":null,"realNameVerified":null,"userBadges":[{"badgeId":"3f8f4b8c193b4343a88817ce07587dbd-1","templateUuid":"3f8f4b8c193b4343a88817ce07587dbd","name":"星级创作者","description":"累计发表精华帖>=3(或有料帖>=10),且30天内发表过至少一篇精华帖(或4篇有料帖)并参与过评论","bigImgUrl":"https://static.tigerbbs.com/1866dcf97a73be1c330f85862546aedc","smallImgUrl":"https://static.tigerbbs.com/4f5c5fa8e2c7683bb5a7fce8753ee456","grayImgUrl":null,"redirectLinkEnabled":1,"redirectLink":"https://www.laohu8.com/activity/market/2023/star-contributors/","hasAllocated":1,"isWearing":0,"stamp":null,"stampPosition":0,"hasStamp":0,"allocationCount":1,"allocatedDate":"2023.07.31","exceedPercentage":null,"individualDisplayEnabled":0,"backgroundColor":null,"fontColor":null,"individualDisplaySort":0,"categoryType":2007},{"badgeId":"e50ce593bb40487ebfb542ca54f6a561-1","templateUuid":"e50ce593bb40487ebfb542ca54f6a561","name":"出道虎友","description":"加入老虎社区500天","bigImgUrl":"https://static.tigerbbs.com/0e4d0ca1da0456dc7894c946d44bf9ab","smallImgUrl":"https://static.tigerbbs.com/0f2f65e8ce4cfaae8db2bea9b127f58b","grayImgUrl":"https://static.tigerbbs.com/c5948a31b6edf154422335b265235809","redirectLinkEnabled":0,"redirectLink":null,"hasAllocated":1,"isWearing":0,"stamp":null,"stampPosition":0,"hasStamp":0,"allocationCount":1,"allocatedDate":"2022.07.08","exceedPercentage":null,"individualDisplayEnabled":0,"backgroundColor":null,"fontColor":null,"individualDisplaySort":0,"categoryType":1001}],"userBadgeCount":2,"currentWearingBadge":null,"individualDisplayBadges":null,"crmLevel":1,"crmLevelSwitch":0,"location":"未知","starInvestorFollowerNum":0,"starInvestorFlag":false,"starInvestorOrderShareNum":0,"subscribeStarInvestorNum":0,"ror":null,"winRationPercentage":null,"showRor":false,"investmentPhilosophy":null,"starInvestorSubscribeFlag":false},"page":1,"watchlist":null,"tweetList":[{"id":467205210308664,"gmtCreate":1755080936691,"gmtModify":1755090621983,"author":{"id":"3577088745112674","authorId":"3577088745112674","name":"光锥智能","avatar":"https://static.tigerbbs.com/651ae7b585f9b2ec556d1945190a5bfe","crmLevel":1,"crmLevelSwitch":0,"followedFlag":false,"idStr":"3577088745112674","authorIdStr":"3577088745112674"},"themes":[],"title":"昆仑万维UniPic 2.0“小钢炮”模型炸场,一个模型搞定理解+生成+编辑","htmlText":"文|魏琳华 编|王一粟 大模型又迎来新一波的迭代周期。 近日,从Open AI发布GPT-5,到国内的昆仑万维、商汤、百川智能、智谱等都陆续发布了自己的新模型。其中昆仑万维更是一口气开启了技术周,连续5天每天发布一个新模型,而8月13日发布的,正是其本周发布的第三款模型——多模态统一模型UniPic 2.0。 UniPic 2.0主打的是,在单一模型中深度融合图像理解、文本到图像生成、图像编辑三大核心能力,这正是今年多模态技术攻克的热门方向——理解、生成、编辑一体化。 目前多数AI生图,生成之后就很难修改,经常出现对二次指令理解不充分,让图片越改越离谱的情况。 然而我们在测试UniPic 2.0的修改图片能力时,却看到了惊喜。 最近流行的“基础款不要搭基础款,上身基础,下身不基础”的玩梗,我们让UniPic 2.0给下身换一个同色系但夸张的穿搭,它就把下身的裤子改成了一条红色蓬蓬裙。 此模型在7月30日已经开源,这次上线的2.0版本,延续了之前1.0版本的优势——“又快又好”。 图片几秒生成、一句话编辑,小身材高表现 当其他大模型需要花几十秒生成一张图片时,UniPic 2.0只用几秒就画了一张复杂的“玻璃猫”出来。 不同于市面上其他开源的统一架构多模态模型动辄百亿参数的大规格,UniPic 2.0的参数规格只有2B,这让它响应生成的速度比起其他模型快了一个数量级。 虽然尺寸小,但UniPic 2.0在图片生成、理解和编辑三个方面的表现力也依然在线,甚至在图片编辑部分的部分指标分数打败了多个规模在10B以上开源模型。 先从图片生成说起,在生成能力方面,UniPic 2.0的统一架构版本在GenEval(测试生成图像和文本匹配程度)取得0.90,超过了一众开源模型和闭源的GPT-4o(0.84)。可以看到,UniPic 2.0在小模型体量下依然能保持高性能的优势。 为了测试U","listText":"文|魏琳华 编|王一粟 大模型又迎来新一波的迭代周期。 近日,从Open AI发布GPT-5,到国内的昆仑万维、商汤、百川智能、智谱等都陆续发布了自己的新模型。其中昆仑万维更是一口气开启了技术周,连续5天每天发布一个新模型,而8月13日发布的,正是其本周发布的第三款模型——多模态统一模型UniPic 2.0。 UniPic 2.0主打的是,在单一模型中深度融合图像理解、文本到图像生成、图像编辑三大核心能力,这正是今年多模态技术攻克的热门方向——理解、生成、编辑一体化。 目前多数AI生图,生成之后就很难修改,经常出现对二次指令理解不充分,让图片越改越离谱的情况。 然而我们在测试UniPic 2.0的修改图片能力时,却看到了惊喜。 最近流行的“基础款不要搭基础款,上身基础,下身不基础”的玩梗,我们让UniPic 2.0给下身换一个同色系但夸张的穿搭,它就把下身的裤子改成了一条红色蓬蓬裙。 此模型在7月30日已经开源,这次上线的2.0版本,延续了之前1.0版本的优势——“又快又好”。 图片几秒生成、一句话编辑,小身材高表现 当其他大模型需要花几十秒生成一张图片时,UniPic 2.0只用几秒就画了一张复杂的“玻璃猫”出来。 不同于市面上其他开源的统一架构多模态模型动辄百亿参数的大规格,UniPic 2.0的参数规格只有2B,这让它响应生成的速度比起其他模型快了一个数量级。 虽然尺寸小,但UniPic 2.0在图片生成、理解和编辑三个方面的表现力也依然在线,甚至在图片编辑部分的部分指标分数打败了多个规模在10B以上开源模型。 先从图片生成说起,在生成能力方面,UniPic 2.0的统一架构版本在GenEval(测试生成图像和文本匹配程度)取得0.90,超过了一众开源模型和闭源的GPT-4o(0.84)。可以看到,UniPic 2.0在小模型体量下依然能保持高性能的优势。 为了测试U","text":"文|魏琳华 编|王一粟 大模型又迎来新一波的迭代周期。 近日,从Open AI发布GPT-5,到国内的昆仑万维、商汤、百川智能、智谱等都陆续发布了自己的新模型。其中昆仑万维更是一口气开启了技术周,连续5天每天发布一个新模型,而8月13日发布的,正是其本周发布的第三款模型——多模态统一模型UniPic 2.0。 UniPic 2.0主打的是,在单一模型中深度融合图像理解、文本到图像生成、图像编辑三大核心能力,这正是今年多模态技术攻克的热门方向——理解、生成、编辑一体化。 目前多数AI生图,生成之后就很难修改,经常出现对二次指令理解不充分,让图片越改越离谱的情况。 然而我们在测试UniPic 2.0的修改图片能力时,却看到了惊喜。 最近流行的“基础款不要搭基础款,上身基础,下身不基础”的玩梗,我们让UniPic 2.0给下身换一个同色系但夸张的穿搭,它就把下身的裤子改成了一条红色蓬蓬裙。 此模型在7月30日已经开源,这次上线的2.0版本,延续了之前1.0版本的优势——“又快又好”。 图片几秒生成、一句话编辑,小身材高表现 当其他大模型需要花几十秒生成一张图片时,UniPic 2.0只用几秒就画了一张复杂的“玻璃猫”出来。 不同于市面上其他开源的统一架构多模态模型动辄百亿参数的大规格,UniPic 2.0的参数规格只有2B,这让它响应生成的速度比起其他模型快了一个数量级。 虽然尺寸小,但UniPic 2.0在图片生成、理解和编辑三个方面的表现力也依然在线,甚至在图片编辑部分的部分指标分数打败了多个规模在10B以上开源模型。 先从图片生成说起,在生成能力方面,UniPic 2.0的统一架构版本在GenEval(测试生成图像和文本匹配程度)取得0.90,超过了一众开源模型和闭源的GPT-4o(0.84)。可以看到,UniPic 2.0在小模型体量下依然能保持高性能的优势。 为了测试U","images":[{"img":"https://static.tigerbbs.com/3cd46852b3c07e6a10af8e017508ae94","width":"1080","height":"613"},{"img":"https://static.tigerbbs.com/2b20b05ca31d52edaf9b47b4f5fd9065","width":"1024","height":"512"},{"img":"https://static.tigerbbs.com/cc1a4de577713edd13153a61d146a7d8","width":"1024","height":"1024"}],"top":1,"highlighted":1,"essential":1,"paper":2,"likeSize":1,"commentSize":0,"repostSize":0,"link":"https://laohu8.com/post/467205210308664","isVote":1,"tweetType":1,"viewCount":67,"authorTweetTopStatus":1,"verified":2,"comments":[],"imageCount":12,"langContent":"CN","totalScore":0},{"id":467084389040136,"gmtCreate":1755051290927,"gmtModify":1755051442304,"author":{"id":"3577088745112674","authorId":"3577088745112674","name":"光锥智能","avatar":"https://static.tigerbbs.com/651ae7b585f9b2ec556d1945190a5bfe","crmLevel":1,"crmLevelSwitch":0,"followedFlag":false,"idStr":"3577088745112674","authorIdStr":"3577088745112674"},"themes":[],"title":"百川开源最新医疗大模型,中国力量领跑医疗AI赛道 ","htmlText":"文|白 鸽 编|王一粟 专注医疗后,百川智能交出第一份答卷!8月11日,百川智能发布第二款开源医疗增强推理大模型Baichuan-M2,其以32B的参数量,在OpenAI的Healthbench评测集上,超越其刚刚发布5天的开源模型gpt-oss-120b。 除gpt-oss-120b外,Baichuan-M2还领先GPT-5以外所有开源与闭源前沿模型,以更小尺寸模型实现医疗能力反超,在所有开源模型中登顶世界第一。 同时,在落地应用浪潮下,大模型所追求的,不再只是效果好,还要能低成本落地。 尤其是在医疗健康领域,模型涉及更多敏感隐私信息,医疗健康机构对私有化部署有着强烈的需求,而私有化部署往往意味着高昂的部署成本。 Baichuan-M2的落地门槛则非常低,其支持RTX4090单卡部署,进一步提升了模型在真实医疗场景中的落地可能性与可扩展性。 这短短5天 “攻防战”,不仅改写了全球医疗大模型的实力排名,更重要的一点在于,在中美通用大模型差距持续扩大的背景下,中国团队可以在AI垂直行业大模型赛道中,实现弯道超车。 当前,医疗是大模型最重要、最有潜力的应用领域之一,正在逐渐成为全球共识。不过,作为应用底座的医疗大模型,现阶段行业中并未有特别突出的产品。 即使是OpenAI最新发布的GPT-5,其数学能力满分,代码、写作、知识能力的成绩也都很高,但医疗领域的得分依旧很低。 这也说明,医疗大模型仍有很长的路要走。 而中美垂直行业大模型的能力差距并不大,作为中国头部大模型企业代表,百川智能此次在医疗大模型上,已实现与OpenAI的并驾齐驱。 那么,作为国内最早全力押注医疗AI赛道的大模型创企,百川智能又是如何做到弯道超车的? 力压全球医疗大模型,拆解Baichuan-M2硬实力 长期以来,模型在医学考试(如 USMLE)上的表现被视为衡量其医疗能力的重要指标,但随着相关题库的饱和,这","listText":"文|白 鸽 编|王一粟 专注医疗后,百川智能交出第一份答卷!8月11日,百川智能发布第二款开源医疗增强推理大模型Baichuan-M2,其以32B的参数量,在OpenAI的Healthbench评测集上,超越其刚刚发布5天的开源模型gpt-oss-120b。 除gpt-oss-120b外,Baichuan-M2还领先GPT-5以外所有开源与闭源前沿模型,以更小尺寸模型实现医疗能力反超,在所有开源模型中登顶世界第一。 同时,在落地应用浪潮下,大模型所追求的,不再只是效果好,还要能低成本落地。 尤其是在医疗健康领域,模型涉及更多敏感隐私信息,医疗健康机构对私有化部署有着强烈的需求,而私有化部署往往意味着高昂的部署成本。 Baichuan-M2的落地门槛则非常低,其支持RTX4090单卡部署,进一步提升了模型在真实医疗场景中的落地可能性与可扩展性。 这短短5天 “攻防战”,不仅改写了全球医疗大模型的实力排名,更重要的一点在于,在中美通用大模型差距持续扩大的背景下,中国团队可以在AI垂直行业大模型赛道中,实现弯道超车。 当前,医疗是大模型最重要、最有潜力的应用领域之一,正在逐渐成为全球共识。不过,作为应用底座的医疗大模型,现阶段行业中并未有特别突出的产品。 即使是OpenAI最新发布的GPT-5,其数学能力满分,代码、写作、知识能力的成绩也都很高,但医疗领域的得分依旧很低。 这也说明,医疗大模型仍有很长的路要走。 而中美垂直行业大模型的能力差距并不大,作为中国头部大模型企业代表,百川智能此次在医疗大模型上,已实现与OpenAI的并驾齐驱。 那么,作为国内最早全力押注医疗AI赛道的大模型创企,百川智能又是如何做到弯道超车的? 力压全球医疗大模型,拆解Baichuan-M2硬实力 长期以来,模型在医学考试(如 USMLE)上的表现被视为衡量其医疗能力的重要指标,但随着相关题库的饱和,这","text":"文|白 鸽 编|王一粟 专注医疗后,百川智能交出第一份答卷!8月11日,百川智能发布第二款开源医疗增强推理大模型Baichuan-M2,其以32B的参数量,在OpenAI的Healthbench评测集上,超越其刚刚发布5天的开源模型gpt-oss-120b。 除gpt-oss-120b外,Baichuan-M2还领先GPT-5以外所有开源与闭源前沿模型,以更小尺寸模型实现医疗能力反超,在所有开源模型中登顶世界第一。 同时,在落地应用浪潮下,大模型所追求的,不再只是效果好,还要能低成本落地。 尤其是在医疗健康领域,模型涉及更多敏感隐私信息,医疗健康机构对私有化部署有着强烈的需求,而私有化部署往往意味着高昂的部署成本。 Baichuan-M2的落地门槛则非常低,其支持RTX4090单卡部署,进一步提升了模型在真实医疗场景中的落地可能性与可扩展性。 这短短5天 “攻防战”,不仅改写了全球医疗大模型的实力排名,更重要的一点在于,在中美通用大模型差距持续扩大的背景下,中国团队可以在AI垂直行业大模型赛道中,实现弯道超车。 当前,医疗是大模型最重要、最有潜力的应用领域之一,正在逐渐成为全球共识。不过,作为应用底座的医疗大模型,现阶段行业中并未有特别突出的产品。 即使是OpenAI最新发布的GPT-5,其数学能力满分,代码、写作、知识能力的成绩也都很高,但医疗领域的得分依旧很低。 这也说明,医疗大模型仍有很长的路要走。 而中美垂直行业大模型的能力差距并不大,作为中国头部大模型企业代表,百川智能此次在医疗大模型上,已实现与OpenAI的并驾齐驱。 那么,作为国内最早全力押注医疗AI赛道的大模型创企,百川智能又是如何做到弯道超车的? 力压全球医疗大模型,拆解Baichuan-M2硬实力 长期以来,模型在医学考试(如 USMLE)上的表现被视为衡量其医疗能力的重要指标,但随着相关题库的饱和,这","images":[{"img":"https://static.tigerbbs.com/63399ebe2eeb797282c67e95e3b9bf0d","width":"1500","height":"851"},{"img":"https://static.tigerbbs.com/bea6b42f05532d25219a0e80a4889269","width":"1080","height":"891"},{"img":"https://static.tigerbbs.com/4f90029c113abb1703ea4deba020a89a","width":"1080","height":"932"}],"top":1,"highlighted":1,"essential":1,"paper":2,"likeSize":1,"commentSize":0,"repostSize":0,"link":"https://laohu8.com/post/467084389040136","isVote":1,"tweetType":1,"viewCount":61,"authorTweetTopStatus":1,"verified":2,"comments":[],"imageCount":6,"langContent":"CN","totalScore":0},{"id":466841934127528,"gmtCreate":1754992189666,"gmtModify":1754992920128,"author":{"id":"3577088745112674","authorId":"3577088745112674","name":"光锥智能","avatar":"https://static.tigerbbs.com/651ae7b585f9b2ec556d1945190a5bfe","crmLevel":1,"crmLevelSwitch":0,"followedFlag":false,"idStr":"3577088745112674","authorIdStr":"3577088745112674"},"themes":[],"title":"2025年,具身智能终于来到爆发前夜","htmlText":"文|刘俊宏 编|王一粟 “新老”机器人之间的悲欢并不相通。 当新一代机器人用人形机器人搏击、遛狗的时候,传统机器人公司还在用机械臂搬运货物。一个是人声鼎沸,一个是冷冷清清。 8月9日,又是一届世界机器人大会(WRC)在北京开幕。作为历届最大的一次展会,本次展览有200多家国内外机器人企业出席,人形机器人整机企业有50多家。本次展会上共计展出1500多件展品、100多款首发新品,多的一面墙都“简介”不完。 “大模型解决了机器人操作的问题,现在机器人能够干活,能真正与物理世界交互了。” 对于机器人这一年间的进化,智澄AI创始人、CEO胡鲁辉向光锥智能如此总结说。 冒着北京当天的大雨和水泄不通的人群,光锥智能在现场有三个最直观的感受。 首先,今年人形机器人是大会的绝对主角。之前大会的A馆一般着重展示机器人工业场景应用。今年主办方特意将宇树和加速进化两家人形机器人厂商安排进来“吸引流量”。用于演示新技术的B馆,直接被人形机器人占领。会场没有人形机器人的展台,观众密度肉眼可见的“稀疏”。 其次,今年的人形机器人演示主打“可交互”。去年机器人展会上,不少机器人周围还“拉着隔离带”,今年机器人厂商希望消费者上手“摸一摸”。在小人形机器人、机器狗、机器人小玩具的展区,光锥智能看到不少消费者询价,想要当场下单带走。 最后,今年大多数机器人厂商的演示着重展现实用价值。机器人已经实现了在工厂、科研教育、医疗养老等场景中的初步探索。 最接地气的是街头摆摊场景。大会现场随处可见各种机器人现制咖啡小摊,还有机器人小酒吧、机器人煎饼果子、机器人零售小店等变种场景。 在工业场景上,率先落地的机器人厂商已经开始强调集群协作的概念。相比去年单薄的“能干活”标签,今年的机器人开始更多强调机器人与自动化产线结合、电池续航、连续工作时长、回报周期等更落地的数据指标。 实际的落地应用,让机器人开始进入到量产阶段。当光","listText":"文|刘俊宏 编|王一粟 “新老”机器人之间的悲欢并不相通。 当新一代机器人用人形机器人搏击、遛狗的时候,传统机器人公司还在用机械臂搬运货物。一个是人声鼎沸,一个是冷冷清清。 8月9日,又是一届世界机器人大会(WRC)在北京开幕。作为历届最大的一次展会,本次展览有200多家国内外机器人企业出席,人形机器人整机企业有50多家。本次展会上共计展出1500多件展品、100多款首发新品,多的一面墙都“简介”不完。 “大模型解决了机器人操作的问题,现在机器人能够干活,能真正与物理世界交互了。” 对于机器人这一年间的进化,智澄AI创始人、CEO胡鲁辉向光锥智能如此总结说。 冒着北京当天的大雨和水泄不通的人群,光锥智能在现场有三个最直观的感受。 首先,今年人形机器人是大会的绝对主角。之前大会的A馆一般着重展示机器人工业场景应用。今年主办方特意将宇树和加速进化两家人形机器人厂商安排进来“吸引流量”。用于演示新技术的B馆,直接被人形机器人占领。会场没有人形机器人的展台,观众密度肉眼可见的“稀疏”。 其次,今年的人形机器人演示主打“可交互”。去年机器人展会上,不少机器人周围还“拉着隔离带”,今年机器人厂商希望消费者上手“摸一摸”。在小人形机器人、机器狗、机器人小玩具的展区,光锥智能看到不少消费者询价,想要当场下单带走。 最后,今年大多数机器人厂商的演示着重展现实用价值。机器人已经实现了在工厂、科研教育、医疗养老等场景中的初步探索。 最接地气的是街头摆摊场景。大会现场随处可见各种机器人现制咖啡小摊,还有机器人小酒吧、机器人煎饼果子、机器人零售小店等变种场景。 在工业场景上,率先落地的机器人厂商已经开始强调集群协作的概念。相比去年单薄的“能干活”标签,今年的机器人开始更多强调机器人与自动化产线结合、电池续航、连续工作时长、回报周期等更落地的数据指标。 实际的落地应用,让机器人开始进入到量产阶段。当光","text":"文|刘俊宏 编|王一粟 “新老”机器人之间的悲欢并不相通。 当新一代机器人用人形机器人搏击、遛狗的时候,传统机器人公司还在用机械臂搬运货物。一个是人声鼎沸,一个是冷冷清清。 8月9日,又是一届世界机器人大会(WRC)在北京开幕。作为历届最大的一次展会,本次展览有200多家国内外机器人企业出席,人形机器人整机企业有50多家。本次展会上共计展出1500多件展品、100多款首发新品,多的一面墙都“简介”不完。 “大模型解决了机器人操作的问题,现在机器人能够干活,能真正与物理世界交互了。” 对于机器人这一年间的进化,智澄AI创始人、CEO胡鲁辉向光锥智能如此总结说。 冒着北京当天的大雨和水泄不通的人群,光锥智能在现场有三个最直观的感受。 首先,今年人形机器人是大会的绝对主角。之前大会的A馆一般着重展示机器人工业场景应用。今年主办方特意将宇树和加速进化两家人形机器人厂商安排进来“吸引流量”。用于演示新技术的B馆,直接被人形机器人占领。会场没有人形机器人的展台,观众密度肉眼可见的“稀疏”。 其次,今年的人形机器人演示主打“可交互”。去年机器人展会上,不少机器人周围还“拉着隔离带”,今年机器人厂商希望消费者上手“摸一摸”。在小人形机器人、机器狗、机器人小玩具的展区,光锥智能看到不少消费者询价,想要当场下单带走。 最后,今年大多数机器人厂商的演示着重展现实用价值。机器人已经实现了在工厂、科研教育、医疗养老等场景中的初步探索。 最接地气的是街头摆摊场景。大会现场随处可见各种机器人现制咖啡小摊,还有机器人小酒吧、机器人煎饼果子、机器人零售小店等变种场景。 在工业场景上,率先落地的机器人厂商已经开始强调集群协作的概念。相比去年单薄的“能干活”标签,今年的机器人开始更多强调机器人与自动化产线结合、电池续航、连续工作时长、回报周期等更落地的数据指标。 实际的落地应用,让机器人开始进入到量产阶段。当光","images":[{"img":"https://static.tigerbbs.com/ede2f74b3809e2aac2d7501ef09e2e80","width":"1080","height":"613"},{"img":"https://static.tigerbbs.com/0bc7a8c86d217bf5cb56de1300cf7a9a","width":"1080","height":"607"},{"img":"https://static.tigerbbs.com/d898327ced4065b8916d3779f8f309ae","width":"1080","height":"1261"}],"top":1,"highlighted":1,"essential":1,"paper":2,"likeSize":1,"commentSize":0,"repostSize":0,"link":"https://laohu8.com/post/466841934127528","isVote":1,"tweetType":1,"viewCount":17,"authorTweetTopStatus":1,"verified":2,"comments":[],"imageCount":17,"langContent":"CN","totalScore":0},{"id":465350946464200,"gmtCreate":1754636632616,"gmtModify":1754637332228,"author":{"id":"3577088745112674","authorId":"3577088745112674","name":"光锥智能","avatar":"https://static.tigerbbs.com/651ae7b585f9b2ec556d1945190a5bfe","crmLevel":1,"crmLevelSwitch":0,"followedFlag":false,"idStr":"3577088745112674","authorIdStr":"3577088745112674"},"themes":[],"title":"GPT-5王座难坐稳,OpenAI想靠价格赢过一切","htmlText":"文|魏琳华 编|王一粟 从2023年底OpenAI CEO Sam Altman第一次提到GPT-5,到今天模型的正式发布,时间过去了一年半。 如今,人们仍然熬夜围观OpenAI的发布会,但彻夜讨论的呼声中少了惊呼,多了质疑。 值得欣慰的是,从模型性能上来说,OpenAI成功扳回了之前下滑的口碑。在发布会上拿出的GPT-5,依然做到了多方面能力SOTA,更是靠GPT-5直言“世界最强编程模型”,狙击Claude的领先地位。 但绕不开的一些固有印象是,OpenAI拉开同行的差距,远远不及GPT-3、GPT-4的断崖式领先。 OpenAI的同行者也虎视眈眈。不说Anthropic本周官宣要在当月发布大版本更新的模型,马斯克更是刷屏一晚,强调自家模型Grok-4在部分测试上已经超过了OpenAI的新模型。 OpenAI又能在这个新“王座”上坐多久?Altman不语,只是一味地讲起了大模型便宜落地的故事。 盯上最强代码模型 GPT-5全面升级 刷新的性能分数、极高的性价比、针对性优化的幻觉问题和超长上下文,方方面面的优化,都是为了让GPT-5成为一个更适合干活的大模型。 首先在架构上,GPT-5是一个统一架构版本的模型,由三个部分组成:一个基础模型、一个具有深度推理能力的GPT-5 thinking模型,加上一个实时路由器。 这样设计的好处是,实时路由器能根据对话类型、问题复杂性、工具需求以及用户意图快速决定使用哪个模型。比如当用户的提示词包括“帮我认真思考一下”这类话术,它就会调用深度推理模型。 在发布会前一天就大肆预热的Altman,就在X上发图暗示GPT-5的性能优势,在发布会上,他也强调了对GPT-5的信心。 “如果说和GPT-4的聊天像跟高中生对话,和O3像是跟大学生聊天,那么跟GPT-5的交流就相当于对话博士生。”Altman这样定义GPT-5的体验感受。","listText":"文|魏琳华 编|王一粟 从2023年底OpenAI CEO Sam Altman第一次提到GPT-5,到今天模型的正式发布,时间过去了一年半。 如今,人们仍然熬夜围观OpenAI的发布会,但彻夜讨论的呼声中少了惊呼,多了质疑。 值得欣慰的是,从模型性能上来说,OpenAI成功扳回了之前下滑的口碑。在发布会上拿出的GPT-5,依然做到了多方面能力SOTA,更是靠GPT-5直言“世界最强编程模型”,狙击Claude的领先地位。 但绕不开的一些固有印象是,OpenAI拉开同行的差距,远远不及GPT-3、GPT-4的断崖式领先。 OpenAI的同行者也虎视眈眈。不说Anthropic本周官宣要在当月发布大版本更新的模型,马斯克更是刷屏一晚,强调自家模型Grok-4在部分测试上已经超过了OpenAI的新模型。 OpenAI又能在这个新“王座”上坐多久?Altman不语,只是一味地讲起了大模型便宜落地的故事。 盯上最强代码模型 GPT-5全面升级 刷新的性能分数、极高的性价比、针对性优化的幻觉问题和超长上下文,方方面面的优化,都是为了让GPT-5成为一个更适合干活的大模型。 首先在架构上,GPT-5是一个统一架构版本的模型,由三个部分组成:一个基础模型、一个具有深度推理能力的GPT-5 thinking模型,加上一个实时路由器。 这样设计的好处是,实时路由器能根据对话类型、问题复杂性、工具需求以及用户意图快速决定使用哪个模型。比如当用户的提示词包括“帮我认真思考一下”这类话术,它就会调用深度推理模型。 在发布会前一天就大肆预热的Altman,就在X上发图暗示GPT-5的性能优势,在发布会上,他也强调了对GPT-5的信心。 “如果说和GPT-4的聊天像跟高中生对话,和O3像是跟大学生聊天,那么跟GPT-5的交流就相当于对话博士生。”Altman这样定义GPT-5的体验感受。","text":"文|魏琳华 编|王一粟 从2023年底OpenAI CEO Sam Altman第一次提到GPT-5,到今天模型的正式发布,时间过去了一年半。 如今,人们仍然熬夜围观OpenAI的发布会,但彻夜讨论的呼声中少了惊呼,多了质疑。 值得欣慰的是,从模型性能上来说,OpenAI成功扳回了之前下滑的口碑。在发布会上拿出的GPT-5,依然做到了多方面能力SOTA,更是靠GPT-5直言“世界最强编程模型”,狙击Claude的领先地位。 但绕不开的一些固有印象是,OpenAI拉开同行的差距,远远不及GPT-3、GPT-4的断崖式领先。 OpenAI的同行者也虎视眈眈。不说Anthropic本周官宣要在当月发布大版本更新的模型,马斯克更是刷屏一晚,强调自家模型Grok-4在部分测试上已经超过了OpenAI的新模型。 OpenAI又能在这个新“王座”上坐多久?Altman不语,只是一味地讲起了大模型便宜落地的故事。 盯上最强代码模型 GPT-5全面升级 刷新的性能分数、极高的性价比、针对性优化的幻觉问题和超长上下文,方方面面的优化,都是为了让GPT-5成为一个更适合干活的大模型。 首先在架构上,GPT-5是一个统一架构版本的模型,由三个部分组成:一个基础模型、一个具有深度推理能力的GPT-5 thinking模型,加上一个实时路由器。 这样设计的好处是,实时路由器能根据对话类型、问题复杂性、工具需求以及用户意图快速决定使用哪个模型。比如当用户的提示词包括“帮我认真思考一下”这类话术,它就会调用深度推理模型。 在发布会前一天就大肆预热的Altman,就在X上发图暗示GPT-5的性能优势,在发布会上,他也强调了对GPT-5的信心。 “如果说和GPT-4的聊天像跟高中生对话,和O3像是跟大学生聊天,那么跟GPT-5的交流就相当于对话博士生。”Altman这样定义GPT-5的体验感受。","images":[{"img":"https://static.tigerbbs.com/7fb3c5bb6abafcfb037eb7a0bcf8f14f","width":"853","height":"480"},{"img":"https://static.tigerbbs.com/03907f296d47e20e4a58d98d36621d9a","width":"1080","height":"607"},{"img":"https://static.tigerbbs.com/4969649f80e7531d013e99202eb8c781","width":"1080","height":"662"}],"top":1,"highlighted":1,"essential":1,"paper":2,"likeSize":1,"commentSize":0,"repostSize":0,"link":"https://laohu8.com/post/465350946464200","isVote":1,"tweetType":1,"viewCount":134,"authorTweetTopStatus":1,"verified":2,"comments":[],"imageCount":12,"langContent":"CN","totalScore":0},{"id":464560756834464,"gmtCreate":1754443479726,"gmtModify":1754445621817,"author":{"id":"3577088745112674","authorId":"3577088745112674","name":"光锥智能","avatar":"https://static.tigerbbs.com/651ae7b585f9b2ec556d1945190a5bfe","crmLevel":1,"crmLevelSwitch":0,"followedFlag":false,"idStr":"3577088745112674","authorIdStr":"3577088745112674"},"themes":[],"title":"靠NPU当中国英伟达?云天励飞还需努力","htmlText":"文|刘俊宏 编|王一粟 AI应用的落地,正在推动AI芯片的战场从训练切换至推理。 7月30日,云天励飞发布公告称,公司已向港交所提交了上市申请。若上市成功,云天励飞将继2023年登陆科创板之后实现“A+H” 双重上市。 随着云天励飞此次交表,国产NPU和AI推理芯片的行业发展路径和底色也被一并揭开。 招股书显示,云天励飞目前产品主要跟AI芯片相关,业务涉及企业级、消费级和行业级三个赛道。分别主要对应销售AI推理芯片、AI玩具及消费电子芯片和智慧城市解决方案三个赛道。 基本财务情况显示,云天励飞近几年实现营收较大幅度增长。2022年、2023年、2024年及2025年前3个月,云天励飞的收入分别为5.46亿元、5.06亿元、9.17亿元、2.64亿元。 作为一家科技公司,云天励飞还处于投入期。对应营收同期,云天励飞亏损分别为4.47亿元、3.84亿元、5.85亿元、0.86亿元,研发费用分别为3.47亿元、2.95亿元、4.00亿元、0.84亿元,亏损暂时没有呈现收窄趋势。 最亮眼的成绩,来源于云天励飞在AI芯片相关领域位居前列的市占率排名。 根据灼识咨询报告显示,以2024年中国市场相关收入统计,云天励飞是排名前三的中国全场景AI推理相关产品及服务提供商;在NPU驱动的AI推理芯片相关产品及服务提供商中排名中国前二。在2025上半年,云天励飞的AI玩具销量在中国主流电商平台排名第一。 在2025年的WAIC上,光锥智能也看到了云天励飞展台上放着的宣称“算力积木”架构打造的深界DeepEdge系列芯片。云天励飞的AI推理加速卡,也与在场其他国产AI芯片厂商一样“熠熠生辉”。 但以具体出货情况看,云天励飞的业务似乎又没有像描述的那般“风光”。 营收质量层面看,云天励飞的毛利率整体不到30%。由于云天励飞的AI芯片不涉及芯片制造,公司整体定位是Fabless厂商。以国内同类型公司","listText":"文|刘俊宏 编|王一粟 AI应用的落地,正在推动AI芯片的战场从训练切换至推理。 7月30日,云天励飞发布公告称,公司已向港交所提交了上市申请。若上市成功,云天励飞将继2023年登陆科创板之后实现“A+H” 双重上市。 随着云天励飞此次交表,国产NPU和AI推理芯片的行业发展路径和底色也被一并揭开。 招股书显示,云天励飞目前产品主要跟AI芯片相关,业务涉及企业级、消费级和行业级三个赛道。分别主要对应销售AI推理芯片、AI玩具及消费电子芯片和智慧城市解决方案三个赛道。 基本财务情况显示,云天励飞近几年实现营收较大幅度增长。2022年、2023年、2024年及2025年前3个月,云天励飞的收入分别为5.46亿元、5.06亿元、9.17亿元、2.64亿元。 作为一家科技公司,云天励飞还处于投入期。对应营收同期,云天励飞亏损分别为4.47亿元、3.84亿元、5.85亿元、0.86亿元,研发费用分别为3.47亿元、2.95亿元、4.00亿元、0.84亿元,亏损暂时没有呈现收窄趋势。 最亮眼的成绩,来源于云天励飞在AI芯片相关领域位居前列的市占率排名。 根据灼识咨询报告显示,以2024年中国市场相关收入统计,云天励飞是排名前三的中国全场景AI推理相关产品及服务提供商;在NPU驱动的AI推理芯片相关产品及服务提供商中排名中国前二。在2025上半年,云天励飞的AI玩具销量在中国主流电商平台排名第一。 在2025年的WAIC上,光锥智能也看到了云天励飞展台上放着的宣称“算力积木”架构打造的深界DeepEdge系列芯片。云天励飞的AI推理加速卡,也与在场其他国产AI芯片厂商一样“熠熠生辉”。 但以具体出货情况看,云天励飞的业务似乎又没有像描述的那般“风光”。 营收质量层面看,云天励飞的毛利率整体不到30%。由于云天励飞的AI芯片不涉及芯片制造,公司整体定位是Fabless厂商。以国内同类型公司","text":"文|刘俊宏 编|王一粟 AI应用的落地,正在推动AI芯片的战场从训练切换至推理。 7月30日,云天励飞发布公告称,公司已向港交所提交了上市申请。若上市成功,云天励飞将继2023年登陆科创板之后实现“A+H” 双重上市。 随着云天励飞此次交表,国产NPU和AI推理芯片的行业发展路径和底色也被一并揭开。 招股书显示,云天励飞目前产品主要跟AI芯片相关,业务涉及企业级、消费级和行业级三个赛道。分别主要对应销售AI推理芯片、AI玩具及消费电子芯片和智慧城市解决方案三个赛道。 基本财务情况显示,云天励飞近几年实现营收较大幅度增长。2022年、2023年、2024年及2025年前3个月,云天励飞的收入分别为5.46亿元、5.06亿元、9.17亿元、2.64亿元。 作为一家科技公司,云天励飞还处于投入期。对应营收同期,云天励飞亏损分别为4.47亿元、3.84亿元、5.85亿元、0.86亿元,研发费用分别为3.47亿元、2.95亿元、4.00亿元、0.84亿元,亏损暂时没有呈现收窄趋势。 最亮眼的成绩,来源于云天励飞在AI芯片相关领域位居前列的市占率排名。 根据灼识咨询报告显示,以2024年中国市场相关收入统计,云天励飞是排名前三的中国全场景AI推理相关产品及服务提供商;在NPU驱动的AI推理芯片相关产品及服务提供商中排名中国前二。在2025上半年,云天励飞的AI玩具销量在中国主流电商平台排名第一。 在2025年的WAIC上,光锥智能也看到了云天励飞展台上放着的宣称“算力积木”架构打造的深界DeepEdge系列芯片。云天励飞的AI推理加速卡,也与在场其他国产AI芯片厂商一样“熠熠生辉”。 但以具体出货情况看,云天励飞的业务似乎又没有像描述的那般“风光”。 营收质量层面看,云天励飞的毛利率整体不到30%。由于云天励飞的AI芯片不涉及芯片制造,公司整体定位是Fabless厂商。以国内同类型公司","images":[{"img":"https://static.tigerbbs.com/83c600896cf4d25d3b0f9c15e16d7a64","width":"1080","height":"613"},{"img":"https://static.tigerbbs.com/303e4b17f447a14c9c17f7e493bd65c8","width":"745","height":"750"},{"img":"https://static.tigerbbs.com/db06b648cf0317de4015a8bf8a8b6dca","width":"1080","height":"218"}],"top":1,"highlighted":1,"essential":1,"paper":2,"likeSize":1,"commentSize":0,"repostSize":0,"link":"https://laohu8.com/post/464560756834464","isVote":1,"tweetType":1,"viewCount":155,"authorTweetTopStatus":1,"verified":2,"comments":[],"imageCount":16,"langContent":"CN","totalScore":0},{"id":463230887236096,"gmtCreate":1754098862281,"gmtModify":1754102055969,"author":{"id":"3577088745112674","authorId":"3577088745112674","name":"光锥智能","avatar":"https://static.tigerbbs.com/651ae7b585f9b2ec556d1945190a5bfe","crmLevel":1,"crmLevelSwitch":0,"followedFlag":false,"idStr":"3577088745112674","authorIdStr":"3577088745112674"},"themes":[],"title":"理想的中场战事","htmlText":"文|刘俊宏 编|王一粟 一家账上有千亿*现金的车企,在公司楼下搭了个台子就办了自己的十周年庆典。 在活动现场,理想主打一个科技公司的朴实低调,完全不像车企的奢侈豪华。最“撑场面”的节目,是理想汽车创始人李想带着总裁马东辉、CFO李铁、CTO谢炎,四个公司“大Boss”唱了一首《朋友》。相比其他三个人的“腼腆”,领唱的李想借着唱歌释放了不少“压力”。 2025年的理想,正在经历一个全新的阶段。 作为中国汽车新势力中年销量最高,并且首家盈利的车企,理想在2024年底自信满满:一度对2025年的销量充满了乐观。 2025上半年,理想合计交付20.4万辆车,同比增长7.9%。这个成绩,理想显然并不是很满意。今年年初,理想定下的年度排产目标是70万辆。有接近理想人士还曾告诉光锥智能,称今年理想内部曾想“冲一冲”年销百万。面对实际的销量,据媒体报道,理想在今年5月底,选择将年度排产目标下调至64万辆。 但在理想i8发布会之后,市场似乎仍然不满意理想的表现,股价甚至一度大跌10%。 那么,理想真的要跌落神坛了吗? 在浮躁的市场中,人们往往只看到表面的动态来追涨杀跌,却忽略水下更深层的变化。 理想这一年最大的变化,并不在销量上,而是对技术内功的夯实,更是对未来战略空间的拓展。 “我们最终一定不是标准的汽车企业,我们是一个空间机器人的企业”。 正如李想在7月央视《对话》节目上所说。今年李想在各种场合不停提到AI投入、AI目标、“汽车机器人”等概念,并将AI定义为公司的“一号战略”。 基于这些思考,理想决定在首款纯电SUV汽车——理想i8上首发最新的智驾系统VLA(Vision Language Action Model视觉语言行动模型)。 对于这辆主打6座的家用SUV,理想认为AI是产品最重要的卖点之一。 一年时间,理想的智驾从“端到端”又完成了升级“VLA”的跳跃。 在发布会前,光锥智能受","listText":"文|刘俊宏 编|王一粟 一家账上有千亿*现金的车企,在公司楼下搭了个台子就办了自己的十周年庆典。 在活动现场,理想主打一个科技公司的朴实低调,完全不像车企的奢侈豪华。最“撑场面”的节目,是理想汽车创始人李想带着总裁马东辉、CFO李铁、CTO谢炎,四个公司“大Boss”唱了一首《朋友》。相比其他三个人的“腼腆”,领唱的李想借着唱歌释放了不少“压力”。 2025年的理想,正在经历一个全新的阶段。 作为中国汽车新势力中年销量最高,并且首家盈利的车企,理想在2024年底自信满满:一度对2025年的销量充满了乐观。 2025上半年,理想合计交付20.4万辆车,同比增长7.9%。这个成绩,理想显然并不是很满意。今年年初,理想定下的年度排产目标是70万辆。有接近理想人士还曾告诉光锥智能,称今年理想内部曾想“冲一冲”年销百万。面对实际的销量,据媒体报道,理想在今年5月底,选择将年度排产目标下调至64万辆。 但在理想i8发布会之后,市场似乎仍然不满意理想的表现,股价甚至一度大跌10%。 那么,理想真的要跌落神坛了吗? 在浮躁的市场中,人们往往只看到表面的动态来追涨杀跌,却忽略水下更深层的变化。 理想这一年最大的变化,并不在销量上,而是对技术内功的夯实,更是对未来战略空间的拓展。 “我们最终一定不是标准的汽车企业,我们是一个空间机器人的企业”。 正如李想在7月央视《对话》节目上所说。今年李想在各种场合不停提到AI投入、AI目标、“汽车机器人”等概念,并将AI定义为公司的“一号战略”。 基于这些思考,理想决定在首款纯电SUV汽车——理想i8上首发最新的智驾系统VLA(Vision Language Action Model视觉语言行动模型)。 对于这辆主打6座的家用SUV,理想认为AI是产品最重要的卖点之一。 一年时间,理想的智驾从“端到端”又完成了升级“VLA”的跳跃。 在发布会前,光锥智能受","text":"文|刘俊宏 编|王一粟 一家账上有千亿*现金的车企,在公司楼下搭了个台子就办了自己的十周年庆典。 在活动现场,理想主打一个科技公司的朴实低调,完全不像车企的奢侈豪华。最“撑场面”的节目,是理想汽车创始人李想带着总裁马东辉、CFO李铁、CTO谢炎,四个公司“大Boss”唱了一首《朋友》。相比其他三个人的“腼腆”,领唱的李想借着唱歌释放了不少“压力”。 2025年的理想,正在经历一个全新的阶段。 作为中国汽车新势力中年销量最高,并且首家盈利的车企,理想在2024年底自信满满:一度对2025年的销量充满了乐观。 2025上半年,理想合计交付20.4万辆车,同比增长7.9%。这个成绩,理想显然并不是很满意。今年年初,理想定下的年度排产目标是70万辆。有接近理想人士还曾告诉光锥智能,称今年理想内部曾想“冲一冲”年销百万。面对实际的销量,据媒体报道,理想在今年5月底,选择将年度排产目标下调至64万辆。 但在理想i8发布会之后,市场似乎仍然不满意理想的表现,股价甚至一度大跌10%。 那么,理想真的要跌落神坛了吗? 在浮躁的市场中,人们往往只看到表面的动态来追涨杀跌,却忽略水下更深层的变化。 理想这一年最大的变化,并不在销量上,而是对技术内功的夯实,更是对未来战略空间的拓展。 “我们最终一定不是标准的汽车企业,我们是一个空间机器人的企业”。 正如李想在7月央视《对话》节目上所说。今年李想在各种场合不停提到AI投入、AI目标、“汽车机器人”等概念,并将AI定义为公司的“一号战略”。 基于这些思考,理想决定在首款纯电SUV汽车——理想i8上首发最新的智驾系统VLA(Vision Language Action Model视觉语言行动模型)。 对于这辆主打6座的家用SUV,理想认为AI是产品最重要的卖点之一。 一年时间,理想的智驾从“端到端”又完成了升级“VLA”的跳跃。 在发布会前,光锥智能受","images":[{"img":"https://static.tigerbbs.com/8a3f9343d86e000bea96b3398cc00844","width":"1080","height":"613"},{"img":"https://static.tigerbbs.com/24df5cc769aafba5c5b162ea1bdd9ffa","width":"1202","height":"1168"},{"img":"https://static.tigerbbs.com/adb906efeab173763ccd734bdd7f0504","width":"640","height":"311"}],"top":1,"highlighted":1,"essential":2,"paper":2,"likeSize":8,"commentSize":0,"repostSize":0,"link":"https://laohu8.com/post/463230887236096","isVote":1,"tweetType":1,"viewCount":10377,"authorTweetTopStatus":1,"verified":2,"comments":[],"imageCount":9,"langContent":"CN","totalScore":0},{"id":462615563141168,"gmtCreate":1753949377231,"gmtModify":1753953241839,"author":{"id":"3577088745112674","authorId":"3577088745112674","name":"光锥智能","avatar":"https://static.tigerbbs.com/651ae7b585f9b2ec556d1945190a5bfe","crmLevel":1,"crmLevelSwitch":0,"followedFlag":false,"idStr":"3577088745112674","authorIdStr":"3577088745112674"},"themes":[],"title":"AI+金融,如何跨越大模型和场景鸿沟?","htmlText":"文|白 鸽 编|王一粟 当AI大模型已开始走向千行百业之时,备受看好的金融行业,却似乎陷入了落地瓶颈。 打开手机银行想查下贷款额度,对着屏幕说了半天,AI客服却只回复 “请点击首页贷款按钮”; 客户经理想用大模型生成一份客户资产配置方案,结果推荐的产品与客户风险等级完全不符; 风控团队测试的AI模型,在审批中小企业贷款时频频给出“幻觉答案”...... 这些看似荒诞的场景,却是当前AI落地金融行业时的真实困境。 当金融机构满怀期待地将AI请进门,却发现它既读不懂复杂的信贷政策,算不清理财产品的费率结构,更搞不懂不同银行的“行话体系”。 通用大模型的“聪明”,在严肃的金融场景里似乎失灵了,大模型与金融场景之间,也仿佛横亘着一道看不见的鸿沟。 “企业和产业需要的不是实验室的技术,而是真正能够解决真实问题的可信生产力。”蚂蚁数科CEO赵闻飙在2025WAIC智能体驱动产业变革论坛上如此说道。 也正因此,面向AI大模型在具体行业中的落地,想要真正释放AI价值,关键就在于要从水平通用转向垂直专用,只有深度理解行业的大模型,才能懂行话,做行活儿,创造真实的业务价值。 金融行业的AI落地,更是如此。 因此,构建专业的金融大模型是推进金融与AI深度融合的必然路径,未来,金融大模型的应用深度将成为金融机构竞争力的关键要素。 大会上,蚂蚁数科正式发布了一款专为金融领域打造的金融推理大模型Agentar-Fin-R1,其基于Qwen3研发的垂直行业大模型,包括32B和8B参数两个版本,在FinEval1.0、FinanceIQ等权威金融大模型评测基准上表现出色,超越DeepSeek-R1等同尺寸开源通用大模型及金融大模型。 同时,蚂蚁数科还推出基于百灵大模型的MOE架构模型,获得更优推理速度。此外,还有非推理版本的14B和72B参数大模型,以满足金融机构在多样化场景下的部署需求。 “蚂蚁数科主要","listText":"文|白 鸽 编|王一粟 当AI大模型已开始走向千行百业之时,备受看好的金融行业,却似乎陷入了落地瓶颈。 打开手机银行想查下贷款额度,对着屏幕说了半天,AI客服却只回复 “请点击首页贷款按钮”; 客户经理想用大模型生成一份客户资产配置方案,结果推荐的产品与客户风险等级完全不符; 风控团队测试的AI模型,在审批中小企业贷款时频频给出“幻觉答案”...... 这些看似荒诞的场景,却是当前AI落地金融行业时的真实困境。 当金融机构满怀期待地将AI请进门,却发现它既读不懂复杂的信贷政策,算不清理财产品的费率结构,更搞不懂不同银行的“行话体系”。 通用大模型的“聪明”,在严肃的金融场景里似乎失灵了,大模型与金融场景之间,也仿佛横亘着一道看不见的鸿沟。 “企业和产业需要的不是实验室的技术,而是真正能够解决真实问题的可信生产力。”蚂蚁数科CEO赵闻飙在2025WAIC智能体驱动产业变革论坛上如此说道。 也正因此,面向AI大模型在具体行业中的落地,想要真正释放AI价值,关键就在于要从水平通用转向垂直专用,只有深度理解行业的大模型,才能懂行话,做行活儿,创造真实的业务价值。 金融行业的AI落地,更是如此。 因此,构建专业的金融大模型是推进金融与AI深度融合的必然路径,未来,金融大模型的应用深度将成为金融机构竞争力的关键要素。 大会上,蚂蚁数科正式发布了一款专为金融领域打造的金融推理大模型Agentar-Fin-R1,其基于Qwen3研发的垂直行业大模型,包括32B和8B参数两个版本,在FinEval1.0、FinanceIQ等权威金融大模型评测基准上表现出色,超越DeepSeek-R1等同尺寸开源通用大模型及金融大模型。 同时,蚂蚁数科还推出基于百灵大模型的MOE架构模型,获得更优推理速度。此外,还有非推理版本的14B和72B参数大模型,以满足金融机构在多样化场景下的部署需求。 “蚂蚁数科主要","text":"文|白 鸽 编|王一粟 当AI大模型已开始走向千行百业之时,备受看好的金融行业,却似乎陷入了落地瓶颈。 打开手机银行想查下贷款额度,对着屏幕说了半天,AI客服却只回复 “请点击首页贷款按钮”; 客户经理想用大模型生成一份客户资产配置方案,结果推荐的产品与客户风险等级完全不符; 风控团队测试的AI模型,在审批中小企业贷款时频频给出“幻觉答案”...... 这些看似荒诞的场景,却是当前AI落地金融行业时的真实困境。 当金融机构满怀期待地将AI请进门,却发现它既读不懂复杂的信贷政策,算不清理财产品的费率结构,更搞不懂不同银行的“行话体系”。 通用大模型的“聪明”,在严肃的金融场景里似乎失灵了,大模型与金融场景之间,也仿佛横亘着一道看不见的鸿沟。 “企业和产业需要的不是实验室的技术,而是真正能够解决真实问题的可信生产力。”蚂蚁数科CEO赵闻飙在2025WAIC智能体驱动产业变革论坛上如此说道。 也正因此,面向AI大模型在具体行业中的落地,想要真正释放AI价值,关键就在于要从水平通用转向垂直专用,只有深度理解行业的大模型,才能懂行话,做行活儿,创造真实的业务价值。 金融行业的AI落地,更是如此。 因此,构建专业的金融大模型是推进金融与AI深度融合的必然路径,未来,金融大模型的应用深度将成为金融机构竞争力的关键要素。 大会上,蚂蚁数科正式发布了一款专为金融领域打造的金融推理大模型Agentar-Fin-R1,其基于Qwen3研发的垂直行业大模型,包括32B和8B参数两个版本,在FinEval1.0、FinanceIQ等权威金融大模型评测基准上表现出色,超越DeepSeek-R1等同尺寸开源通用大模型及金融大模型。 同时,蚂蚁数科还推出基于百灵大模型的MOE架构模型,获得更优推理速度。此外,还有非推理版本的14B和72B参数大模型,以满足金融机构在多样化场景下的部署需求。 “蚂蚁数科主要","images":[{"img":"https://static.tigerbbs.com/b624a3d84220b99e7d6b863fae6917ec","width":"1080","height":"613"},{"img":"https://static.tigerbbs.com/eaf147aa47dba6658d563fd0073ef570","width":"1080","height":"720"},{"img":"https://static.tigerbbs.com/d3dfea1a9be5a85abffc76f860d0ccf9","width":"1080","height":"608"}],"top":1,"highlighted":1,"essential":1,"paper":2,"likeSize":1,"commentSize":0,"repostSize":0,"link":"https://laohu8.com/post/462615563141168","isVote":1,"tweetType":1,"viewCount":221,"authorTweetTopStatus":1,"verified":2,"comments":[],"imageCount":4,"langContent":"CN","totalScore":0},{"id":462170114400552,"gmtCreate":1753853134419,"gmtModify":1754012347475,"author":{"id":"3577088745112674","authorId":"3577088745112674","name":"光锥智能","avatar":"https://static.tigerbbs.com/651ae7b585f9b2ec556d1945190a5bfe","crmLevel":1,"crmLevelSwitch":0,"followedFlag":false,"idStr":"3577088745112674","authorIdStr":"3577088745112674"},"themes":[],"title":"AI办公的效率革命,金山办公从未被颠覆 ","htmlText":"文|白 鸽 编|王一粟 三年前,微软发布Office Copilot,掀起AI办公革命的第一波浪潮。 然而,这场变革止步于简单的智能助手或聊天工具栏的辅助层面,受限于AI本身能力,Copilot式插件未能从根本上重构办公逻辑。 原生AI平台Manus、Genspark等可以为用户提供轻量级办公体验,一句话生成文档、PPT等,但也受限于整体协作功能,及编辑器不灵活等多重因素,距离真正效率质变仍有距离。 三年后的WAIC上,国产办公软件厂商金山办公正式迈入WPS AI 3.0阶段,让AI办公的效率革命再次提速。 这个AI 3.0阶段,是要将用户、AI和软件真正地深度融合在一起。 “基于用户最原始需求,把软件和AI能力打碎,并将各自所擅长能力组合在一起,这样的产品才是最终形态。”金山办公助理总裁田然在世界人工智能大会2025金山办公AI生产力论坛上说道。 金山办公助理总裁田然 同时,金山办公还提出了“Software Agent”的概念,强调AI应该服务于人,放大人的能力而非取代人的角色。 而WPS AI3.0所展现的产品形态,就是WPS灵犀智能体,基于该智能体,用户只需通过自然语言、多轮对话即可完成文档创作、演示文稿生成及语音助手等功能,全程无需复杂操作和外部跳转,是真正意义上的原生Office办公智能体。与此同时,WPS知识库也随着WPS AI 3.0的推出正式亮相。 WPS灵犀智能体并非单独存在,而是内嵌到整个WPS三大组件的工作流程中,让用户办公中,随时用上文档撰写、AIGC生图等功能。 以用户实际需求为出发点,不盲目追求一句话生成内容,而是可以实现AI和人在办公场景中的协作共生,这才是真正的为AI办公带来了更实质性的效率提升。 可以看出,WPS AI 3.0不再是一个集成了AI的工具,而是成为一个体系化AI产品。 从AI浪潮之初,金山办公就押注AI办公赛道,始终处于行业","listText":"文|白 鸽 编|王一粟 三年前,微软发布Office Copilot,掀起AI办公革命的第一波浪潮。 然而,这场变革止步于简单的智能助手或聊天工具栏的辅助层面,受限于AI本身能力,Copilot式插件未能从根本上重构办公逻辑。 原生AI平台Manus、Genspark等可以为用户提供轻量级办公体验,一句话生成文档、PPT等,但也受限于整体协作功能,及编辑器不灵活等多重因素,距离真正效率质变仍有距离。 三年后的WAIC上,国产办公软件厂商金山办公正式迈入WPS AI 3.0阶段,让AI办公的效率革命再次提速。 这个AI 3.0阶段,是要将用户、AI和软件真正地深度融合在一起。 “基于用户最原始需求,把软件和AI能力打碎,并将各自所擅长能力组合在一起,这样的产品才是最终形态。”金山办公助理总裁田然在世界人工智能大会2025金山办公AI生产力论坛上说道。 金山办公助理总裁田然 同时,金山办公还提出了“Software Agent”的概念,强调AI应该服务于人,放大人的能力而非取代人的角色。 而WPS AI3.0所展现的产品形态,就是WPS灵犀智能体,基于该智能体,用户只需通过自然语言、多轮对话即可完成文档创作、演示文稿生成及语音助手等功能,全程无需复杂操作和外部跳转,是真正意义上的原生Office办公智能体。与此同时,WPS知识库也随着WPS AI 3.0的推出正式亮相。 WPS灵犀智能体并非单独存在,而是内嵌到整个WPS三大组件的工作流程中,让用户办公中,随时用上文档撰写、AIGC生图等功能。 以用户实际需求为出发点,不盲目追求一句话生成内容,而是可以实现AI和人在办公场景中的协作共生,这才是真正的为AI办公带来了更实质性的效率提升。 可以看出,WPS AI 3.0不再是一个集成了AI的工具,而是成为一个体系化AI产品。 从AI浪潮之初,金山办公就押注AI办公赛道,始终处于行业","text":"文|白 鸽 编|王一粟 三年前,微软发布Office Copilot,掀起AI办公革命的第一波浪潮。 然而,这场变革止步于简单的智能助手或聊天工具栏的辅助层面,受限于AI本身能力,Copilot式插件未能从根本上重构办公逻辑。 原生AI平台Manus、Genspark等可以为用户提供轻量级办公体验,一句话生成文档、PPT等,但也受限于整体协作功能,及编辑器不灵活等多重因素,距离真正效率质变仍有距离。 三年后的WAIC上,国产办公软件厂商金山办公正式迈入WPS AI 3.0阶段,让AI办公的效率革命再次提速。 这个AI 3.0阶段,是要将用户、AI和软件真正地深度融合在一起。 “基于用户最原始需求,把软件和AI能力打碎,并将各自所擅长能力组合在一起,这样的产品才是最终形态。”金山办公助理总裁田然在世界人工智能大会2025金山办公AI生产力论坛上说道。 金山办公助理总裁田然 同时,金山办公还提出了“Software Agent”的概念,强调AI应该服务于人,放大人的能力而非取代人的角色。 而WPS AI3.0所展现的产品形态,就是WPS灵犀智能体,基于该智能体,用户只需通过自然语言、多轮对话即可完成文档创作、演示文稿生成及语音助手等功能,全程无需复杂操作和外部跳转,是真正意义上的原生Office办公智能体。与此同时,WPS知识库也随着WPS AI 3.0的推出正式亮相。 WPS灵犀智能体并非单独存在,而是内嵌到整个WPS三大组件的工作流程中,让用户办公中,随时用上文档撰写、AIGC生图等功能。 以用户实际需求为出发点,不盲目追求一句话生成内容,而是可以实现AI和人在办公场景中的协作共生,这才是真正的为AI办公带来了更实质性的效率提升。 可以看出,WPS AI 3.0不再是一个集成了AI的工具,而是成为一个体系化AI产品。 从AI浪潮之初,金山办公就押注AI办公赛道,始终处于行业","images":[{"img":"https://static.tigerbbs.com/f9893050fcf4639f0d970960d3ef0a75","width":"1080","height":"613"}],"top":1,"highlighted":1,"essential":1,"paper":2,"likeSize":2,"commentSize":0,"repostSize":0,"link":"https://laohu8.com/post/462170114400552","isVote":1,"tweetType":1,"viewCount":578,"authorTweetTopStatus":1,"verified":2,"comments":[],"imageCount":4,"langContent":"CN","totalScore":0},{"id":461493110096016,"gmtCreate":1753687597224,"gmtModify":1753688426544,"author":{"id":"3577088745112674","authorId":"3577088745112674","name":"光锥智能","avatar":"https://static.tigerbbs.com/651ae7b585f9b2ec556d1945190a5bfe","crmLevel":1,"crmLevelSwitch":0,"followedFlag":false,"idStr":"3577088745112674","authorIdStr":"3577088745112674"},"themes":[],"title":"人在WAIC,和大模型一起“狂奔”","htmlText":"文|魏琳华 编|王一粟 “人已经多到炸馆,逛展堪比庙会。” 2025年,WAIC的火爆程度已经不用多说:闲鱼上炒到2000元一张的门票;现场随处可见的老外;各个展区被人流挤得水泄不通...... 光是外围的火爆就已经说明——今年,AI大模型在应用上已经势如破竹。 前所未有的参展产品数量,是AI应用遍地开花的佐证:创纪录的800家企业参展,带来3000余产品及100+首发新品参展,涵盖40+大模型、50+AI终端产品、60+智能机器人,和去年相比,产品数量整整翻了一番,不少观众散会纷纷戏称“逛到断腿”。 在一个展区中,你能看到各个品类下不同厂商演绎的多种玩法:机器人1:1复刻人类动作、给人类调酒、搬东西;Agent写代码、作文、当理财助手;AI+教育不仅有AI学习机、还搬上了AI黑板...... 比起看得见摸不着的Agent“数字员工”,能看到实体的智能机器人成为了会场的“顶流”。 H3展馆中,大片机器人“整活”的场景相当壮观:和真人对打的宇树机器人、练习摞百事可乐的智元机器人、魔法原子的机器狗绕着场馆跑来跑去...... 除了面向C端用户的产品爆发,在B端,AI也已经在企业中应用起来。 “就在我们公司内部,员工每天需要写很多代码,做很多研究型实验,这里边大概有 70% 的代码是 AI 来写,90% 数据分析是靠 AI 来做。”在MiniMax CEO闫俊杰的分享中,Agent构建的智能系统已经真正帮上了员工的忙。 随着年初大模型进入深度推理阶段,性能进入高可用的程度,加上训练和推理成本进一步降低。经过三年的一路狂奔,厂商们终于高调地秀起了肌肉。 推理模型的“爆发年” 从模仿学习到强化学习,大模型已经进化到2.0时代。 以OpenAI的o1模型为分水岭,2025年成了推理模型的“爆发年”。区别于以往靠大量监督数据提升性能,通过RL(强化学习)算法的训练模式,让大模型的能力迈上","listText":"文|魏琳华 编|王一粟 “人已经多到炸馆,逛展堪比庙会。” 2025年,WAIC的火爆程度已经不用多说:闲鱼上炒到2000元一张的门票;现场随处可见的老外;各个展区被人流挤得水泄不通...... 光是外围的火爆就已经说明——今年,AI大模型在应用上已经势如破竹。 前所未有的参展产品数量,是AI应用遍地开花的佐证:创纪录的800家企业参展,带来3000余产品及100+首发新品参展,涵盖40+大模型、50+AI终端产品、60+智能机器人,和去年相比,产品数量整整翻了一番,不少观众散会纷纷戏称“逛到断腿”。 在一个展区中,你能看到各个品类下不同厂商演绎的多种玩法:机器人1:1复刻人类动作、给人类调酒、搬东西;Agent写代码、作文、当理财助手;AI+教育不仅有AI学习机、还搬上了AI黑板...... 比起看得见摸不着的Agent“数字员工”,能看到实体的智能机器人成为了会场的“顶流”。 H3展馆中,大片机器人“整活”的场景相当壮观:和真人对打的宇树机器人、练习摞百事可乐的智元机器人、魔法原子的机器狗绕着场馆跑来跑去...... 除了面向C端用户的产品爆发,在B端,AI也已经在企业中应用起来。 “就在我们公司内部,员工每天需要写很多代码,做很多研究型实验,这里边大概有 70% 的代码是 AI 来写,90% 数据分析是靠 AI 来做。”在MiniMax CEO闫俊杰的分享中,Agent构建的智能系统已经真正帮上了员工的忙。 随着年初大模型进入深度推理阶段,性能进入高可用的程度,加上训练和推理成本进一步降低。经过三年的一路狂奔,厂商们终于高调地秀起了肌肉。 推理模型的“爆发年” 从模仿学习到强化学习,大模型已经进化到2.0时代。 以OpenAI的o1模型为分水岭,2025年成了推理模型的“爆发年”。区别于以往靠大量监督数据提升性能,通过RL(强化学习)算法的训练模式,让大模型的能力迈上","text":"文|魏琳华 编|王一粟 “人已经多到炸馆,逛展堪比庙会。” 2025年,WAIC的火爆程度已经不用多说:闲鱼上炒到2000元一张的门票;现场随处可见的老外;各个展区被人流挤得水泄不通...... 光是外围的火爆就已经说明——今年,AI大模型在应用上已经势如破竹。 前所未有的参展产品数量,是AI应用遍地开花的佐证:创纪录的800家企业参展,带来3000余产品及100+首发新品参展,涵盖40+大模型、50+AI终端产品、60+智能机器人,和去年相比,产品数量整整翻了一番,不少观众散会纷纷戏称“逛到断腿”。 在一个展区中,你能看到各个品类下不同厂商演绎的多种玩法:机器人1:1复刻人类动作、给人类调酒、搬东西;Agent写代码、作文、当理财助手;AI+教育不仅有AI学习机、还搬上了AI黑板...... 比起看得见摸不着的Agent“数字员工”,能看到实体的智能机器人成为了会场的“顶流”。 H3展馆中,大片机器人“整活”的场景相当壮观:和真人对打的宇树机器人、练习摞百事可乐的智元机器人、魔法原子的机器狗绕着场馆跑来跑去...... 除了面向C端用户的产品爆发,在B端,AI也已经在企业中应用起来。 “就在我们公司内部,员工每天需要写很多代码,做很多研究型实验,这里边大概有 70% 的代码是 AI 来写,90% 数据分析是靠 AI 来做。”在MiniMax CEO闫俊杰的分享中,Agent构建的智能系统已经真正帮上了员工的忙。 随着年初大模型进入深度推理阶段,性能进入高可用的程度,加上训练和推理成本进一步降低。经过三年的一路狂奔,厂商们终于高调地秀起了肌肉。 推理模型的“爆发年” 从模仿学习到强化学习,大模型已经进化到2.0时代。 以OpenAI的o1模型为分水岭,2025年成了推理模型的“爆发年”。区别于以往靠大量监督数据提升性能,通过RL(强化学习)算法的训练模式,让大模型的能力迈上","images":[{"img":"https://static.tigerbbs.com/b8e1d972935008cdd2b7ac35f81ea401","width":"1000","height":"513"},{"img":"https://static.tigerbbs.com/ac10090d7e98905aecfc1ea482d2922f","width":"838","height":"501"},{"img":"https://static.tigerbbs.com/e3d6807808d6b6175a9cf38070829209","width":"642","height":"360"}],"top":1,"highlighted":1,"essential":1,"paper":2,"likeSize":1,"commentSize":0,"repostSize":0,"link":"https://laohu8.com/post/461493110096016","isVote":1,"tweetType":1,"viewCount":80,"authorTweetTopStatus":1,"verified":2,"comments":[],"imageCount":7,"langContent":"CN","totalScore":0},{"id":460437816558064,"gmtCreate":1753420535733,"gmtModify":1753421180466,"author":{"id":"3577088745112674","authorId":"3577088745112674","name":"光锥智能","avatar":"https://static.tigerbbs.com/651ae7b585f9b2ec556d1945190a5bfe","crmLevel":1,"crmLevelSwitch":0,"followedFlag":false,"idStr":"3577088745112674","authorIdStr":"3577088745112674"},"themes":[],"title":" 字节、腾讯、阿里,AI 编码“三国杀”","htmlText":"文|魏琳华 编|王一粟 大厂正在集火最具PMF(产品市场契合度)价值的赛道——AI编码。 从7月21日开始,字节、腾讯、阿里轮番更新AI编码产品和模型:字节已有的AI编码产品Trae放出Solo版本,加入上下文工程,让平台变得更“聪明”;腾讯则把一整套用来部署产品的工具放到其中,做了个“全栈工程师”;阿里更是发布编程大模型Qwen3-Coder剑指Claude 4,直接从模型层下功夫。 在Cursor面向中国市场取消了Anthropic、OpenAI和Google等多家的模型使用后,国内大厂们不仅想做Cursor的平替,更是升级开发体验。它们不再满足于让AI仅仅充当程序员的“副驾驶”,而是想让AI包揽起“产设研”一条龙,直接做成品。 和上半年还在让AI当助手、打酱油相比,这一次,AI 编码已经实现了从辅助程序员生成代码,到AI自主完成生成的飞跃。 AI编码“三国杀”,从编码生成到软件交付 接连三天的发布中,字节、阿里、腾讯三家大厂先后拿出了能让AI一口气干完从编码到成品的工具/模型。 这一次的集中更新,AI开始接管起写编码的工作:不仅要写得质量过关,更是把成品都部署好了。 其中,腾讯和字节对自家编码产品的更新,重点还是在产品侧,毕竟从工程队到样板间,中间还隔着很远,需要靠产品能力补齐。 7月21日,字节宣布更新Trae Solo版本,比起聚焦“编码生成”的1.0阶段,新版本跨向了能让AI自主完成“软件交付”的2.0阶段。 在旧的版本中,Trae在IDE界面中编程,其中编程模式有两种,分别是Build模式和Chat模式,前者相当于一个传统编程的IDE界面,只需要用户在右侧输入提示词,AI就能自动拆解,按照需求生成大段编码。相比之下,Chat模式则更多适用于用户和AI通过聊天的方式,修改编码、找问题等等,更适用于精细调整上。 2.0版本的Trae,在左上角加入了一个模式切换,可","listText":"文|魏琳华 编|王一粟 大厂正在集火最具PMF(产品市场契合度)价值的赛道——AI编码。 从7月21日开始,字节、腾讯、阿里轮番更新AI编码产品和模型:字节已有的AI编码产品Trae放出Solo版本,加入上下文工程,让平台变得更“聪明”;腾讯则把一整套用来部署产品的工具放到其中,做了个“全栈工程师”;阿里更是发布编程大模型Qwen3-Coder剑指Claude 4,直接从模型层下功夫。 在Cursor面向中国市场取消了Anthropic、OpenAI和Google等多家的模型使用后,国内大厂们不仅想做Cursor的平替,更是升级开发体验。它们不再满足于让AI仅仅充当程序员的“副驾驶”,而是想让AI包揽起“产设研”一条龙,直接做成品。 和上半年还在让AI当助手、打酱油相比,这一次,AI 编码已经实现了从辅助程序员生成代码,到AI自主完成生成的飞跃。 AI编码“三国杀”,从编码生成到软件交付 接连三天的发布中,字节、阿里、腾讯三家大厂先后拿出了能让AI一口气干完从编码到成品的工具/模型。 这一次的集中更新,AI开始接管起写编码的工作:不仅要写得质量过关,更是把成品都部署好了。 其中,腾讯和字节对自家编码产品的更新,重点还是在产品侧,毕竟从工程队到样板间,中间还隔着很远,需要靠产品能力补齐。 7月21日,字节宣布更新Trae Solo版本,比起聚焦“编码生成”的1.0阶段,新版本跨向了能让AI自主完成“软件交付”的2.0阶段。 在旧的版本中,Trae在IDE界面中编程,其中编程模式有两种,分别是Build模式和Chat模式,前者相当于一个传统编程的IDE界面,只需要用户在右侧输入提示词,AI就能自动拆解,按照需求生成大段编码。相比之下,Chat模式则更多适用于用户和AI通过聊天的方式,修改编码、找问题等等,更适用于精细调整上。 2.0版本的Trae,在左上角加入了一个模式切换,可","text":"文|魏琳华 编|王一粟 大厂正在集火最具PMF(产品市场契合度)价值的赛道——AI编码。 从7月21日开始,字节、腾讯、阿里轮番更新AI编码产品和模型:字节已有的AI编码产品Trae放出Solo版本,加入上下文工程,让平台变得更“聪明”;腾讯则把一整套用来部署产品的工具放到其中,做了个“全栈工程师”;阿里更是发布编程大模型Qwen3-Coder剑指Claude 4,直接从模型层下功夫。 在Cursor面向中国市场取消了Anthropic、OpenAI和Google等多家的模型使用后,国内大厂们不仅想做Cursor的平替,更是升级开发体验。它们不再满足于让AI仅仅充当程序员的“副驾驶”,而是想让AI包揽起“产设研”一条龙,直接做成品。 和上半年还在让AI当助手、打酱油相比,这一次,AI 编码已经实现了从辅助程序员生成代码,到AI自主完成生成的飞跃。 AI编码“三国杀”,从编码生成到软件交付 接连三天的发布中,字节、阿里、腾讯三家大厂先后拿出了能让AI一口气干完从编码到成品的工具/模型。 这一次的集中更新,AI开始接管起写编码的工作:不仅要写得质量过关,更是把成品都部署好了。 其中,腾讯和字节对自家编码产品的更新,重点还是在产品侧,毕竟从工程队到样板间,中间还隔着很远,需要靠产品能力补齐。 7月21日,字节宣布更新Trae Solo版本,比起聚焦“编码生成”的1.0阶段,新版本跨向了能让AI自主完成“软件交付”的2.0阶段。 在旧的版本中,Trae在IDE界面中编程,其中编程模式有两种,分别是Build模式和Chat模式,前者相当于一个传统编程的IDE界面,只需要用户在右侧输入提示词,AI就能自动拆解,按照需求生成大段编码。相比之下,Chat模式则更多适用于用户和AI通过聊天的方式,修改编码、找问题等等,更适用于精细调整上。 2.0版本的Trae,在左上角加入了一个模式切换,可","images":[{"img":"https://static.tigerbbs.com/2a2610acef2a2584986dce7e6509ae33","width":"1920","height":"1084"},{"img":"https://static.tigerbbs.com/64db23bf1ea0868c7da4e0f949c60d21","width":"1080","height":"609"},{"img":"https://static.tigerbbs.com/d3eacd2102fc7145667861e88a74244f","width":"1080","height":"681"}],"top":1,"highlighted":1,"essential":1,"paper":2,"likeSize":1,"commentSize":0,"repostSize":0,"link":"https://laohu8.com/post/460437816558064","isVote":1,"tweetType":1,"viewCount":171,"authorTweetTopStatus":1,"verified":2,"comments":[],"imageCount":6,"langContent":"CN","totalScore":0}],"defaultTab":"posts","isTTM":false}