乌鸦智能说

人工智能新时代的商业智库和价值灯塔

IP属地:未知
    • 乌鸦智能说乌鸦智能说
      ·08-11 19:05

      被低估的AI语音,AI商业化的下一张船票已来

      在科技行业,有一句常被引用的话:“我们总是高估一项技术的短期效应,却低估它的长期影响。” 这用来形容AI语音技术的发展,再贴切不过。人们往往惊叹于它的声音表现力,却容易忽视它背后正在酝酿的商业变革。 这场变革正从两个方向展开。 第一,在交互方式上,GUI(图形界面)主导的软件,正在向GUI与LUI(语言界面)融合的混合模式演进。AI语音的升级,是这一转变的关键推手——它正从过去的“附属功能”,跃升为流畅、自然、高效的核心交互方式。 第二,在内容生产上,AI语音技术正在改写教育、营销和有声书等行业的生产逻辑。比如,AI营销公司Icon借助语音生成能力,批量生成定制化广告音频,把单条广告的成本压到不足1美元,让“千人千音”的个性化投放成为现实。 技术的进步,正在不断推高这场商业变革的上限,而迭代速度正是最直观的体现。AI 语音几乎是“上一代刚封神,下一代就已登场”。 今年 4 月,MiniMax 推出了 Speech-02 系列语音模型。仅仅三个月后,8 月 7 日,便再次发布全新一代 Speech 2.5,其在多语种表现力、音色复刻精度以及 40 种语言覆盖上实现跃升,让跨语言、跨文化的沉浸式体验首次具备可规模化落地的可行性。 这类进化,意味着 AI 语音正在从“好用”走向“不可替代”,不再只是一个功能点,而是成为下一代人机交互和内容生产的底层基础设施。MiniMax,也正站在改写全球 AI 语音版图的关键节点上。 / 01 / 打破天花板,最强语音模型模型来了 今年 5 月,MiniMax 的 Speech 02 在全球权威双榜单上同时夺冠,被认为开启了“语音个性化时代”——机器第一次能像人一样,带着情绪、节奏和性格去“说话”。 ▲Artificial Analysis Speech Arena 评测榜单 没想到,短短几个月,这个天花板又被推高。 8 月 7 日发布的 Sp
      140评论
      举报
      被低估的AI语音,AI商业化的下一张船票已来
    • 乌鸦智能说乌鸦智能说
      ·08-08

      OpenAI一年收入都1400亿了,国内AI为啥还是不赚钱?

      过去一年,Meta在AI上的出手堪称疯狂:斥资百亿收购Scale AI 49%股份、砸下上亿美元挖人补强团队,还任命年仅26岁的Alexandr Wang为Meta首任“首席AI官”。 按今年的预测,Meta的资本支出强度达到了惊人的35%收入占比。也就是说,每100美元收入,就要拿出35美元砸进AI,几乎压上了自己的大部分家底。 像Meta这样“豪赌AI”的公司,在美国还有三家:微软、谷歌、亚马逊。 根据这四大科技巨头公布的财报预测,今年它们在AI相关的资本支出将高达4000亿美元,主要投向AI基础设施建设。 这个数字,比整个欧盟2023年一整年的国防开支还多,也正在彻底甩开我们。 即使考虑未上市公司如字节等等,加上承担基础任务的运营商AI资本开支,根据中金估计,2025年国内AI整体资本开支也不会超过5000亿人民币。 很多人把两者差距归因于“算力瓶颈”。但问题的根本,不只是有没有GPU,而是:有没有一个足够明确的商业逻辑,能撑起万亿级别的投入。 美国已经快速找到了这个逻辑。 从数据上看,美国AI赚钱速度越来越快了。OpenAI+Anthropic的年化营收将在今年底突破290亿美元,投行预计到2026年底,这一数字或将上升至600-1000亿美元。初创公司主导的AI应用也在C端、B端全面开花。 反观国内,AI商业化始终没有找到合适的答案。哪怕是可灵AI这样跑出来的产品,70%以上的营收也来自海外。 更严峻的是,在地缘政治的不确定性下,原本诞生于中国的AI创新正加速“外溢”。Manus、Lovart、Heygen等公司,或将总部迁往新加坡、美国,或干脆在海外成立公司。 这些外迁的动作,并不只是为了“更接近海外市场”,更深层的原因在于——国内难以跑通的商业路径,正在压低资本开支的回报预期。 在全球科技竞争中,国内的科技公司正面临日益增长的结构性壁垒。即便撇开芯片限制不谈,
      153评论
      举报
      OpenAI一年收入都1400亿了,国内AI为啥还是不赚钱?
    • 乌鸦智能说乌鸦智能说
      ·08-06

      马斯克出手,打车费爆砍84%!Robotaxi要革Uber的命

      马斯克又放狠话了:今年底,特斯拉的Robotaxi要覆盖美国一半人口。 很多人第一反应是:又在画饼? 但一位网友在德州奥斯汀做了个实测,结果很快传疯了。他连续打了15次Tesla Robotaxi,并逐单和Uber对比价格,结果太惊人了。 几乎每一单,特斯拉都赢了,而且赢得离谱。 一段快9英里的中程路,Uber收30.38美元,特斯拉只要9.92美元,便宜了67%;一段不到1英里的短途,Uber开价12.36美元,特斯拉只收1.97美元——价格差距高达84%。 你可能以为特斯拉是在疯狂烧钱补贴,但真相恰恰相反:这不是一场价格战,而是一场成本结构的碾压。 Uber的每一单背后,是司机工资、油费、抽成和小费;而在特斯拉的设想里,打车不再有司机、没有中间商、没有额外分润,整条链路从造车、接单、调度到驾驶,全部自己搞定。 当技术创新到一定程度,连“撮合平台”这种商业模式,也可能被连根拔起。 / 01 / 最多便宜84%,特斯拉赢麻了 8月1日,一位名叫Tsla Chan的网友在德州奥斯汀做了个有趣的测试:他打了9次Tesla Robotaxi,并把每一次的价格和Uber做了对比。 结论很直接——特斯拉全胜,且平均便宜幅度超过50%。最离谱的一单,一段将近9英里的路,特斯拉只收9.92美元,而Uber要价高达30.38美元,价格差高达67%。 第二天,他又继续测试了6条新路线。这一次,特斯拉和Uber的差价被进一步拉开。 在一段只有0.97英里的超短程行程中,特斯拉收了1.97美元,而Uber却标出了12.36美元的高价——差价高达84%。 看到这里,你可能要问了,为什么同样一段路,Uber要贵一倍甚至更多?关键在于两家公司定价机制的完全不同。 特斯拉的Robotaxi早期实行的是“一口价”策略:每次打车统一收4.20美元,管你远近都一样。 今年7月开始,特斯拉在奥斯汀地区
      7421
      举报
      马斯克出手,打车费爆砍84%!Robotaxi要革Uber的命
    • 乌鸦智能说乌鸦智能说
      ·08-05

      未来不是“谁有AI”,而是“谁能用好AI”

      过去的AI办公工具,更像是外挂插件:能帮你写点东西,但不懂格式;能生成内容,却改不好细节。简单来说一句话,中看不中用。 这次,WPS灵犀干了一件更彻底的事: 不是在WPS旁边加个AI按钮,而是让AI“住进”Office系统本身,变成一个真正懂内容结构、能连续协作、听得懂人话的原生办公智能体。它就是,WPS灵犀。 乌鸦君用下来最直观的感受是,写稿不累了,做PPT也不烦了,甚至一边聊天一边指挥AI干活的感觉,还真的有点东西。 / 01 / 不是挂个AI这么简单,WPS灵犀是真的“长”进去了 有时候,写文档、做PPT、找资料这些事儿,不是你不愿干,是实在太费劲、太碎、太烦。 而WPS灵犀,就是在这些最容易头大的办公场景里,给出了让人舒一口气的解法。 1)AI做PPT,不是一句话生成,而是“边聊边改” 许多AI工具都在宣传“一句话生成PPT”,看似省事,结果是:几十页PPT生成了,却不能改。 举个例子,乌鸦君用把一份演讲稿上传到ChatGPT和国内某个大模型产品,并要求按这个文稿做个PPT,得到的结果如下: ChatGPT固然能生成PPT,但点击去发现,基本就是“毛坯房”,完全用不了。 ▲ChatGPT生成PPT演示 而国内大模型产品交付的是HTML PPT,供用户调整的选择也很有限,只有模版替换、编辑大纲、插入图文表格等选项。这意味着,无论是ChatGPT还是国内相关产品做出的PPT,距离真正能用还有很长的距离。 ▲国内某大模型产品演示 而上述这些产品不同,WPS灵犀的做法是:多轮对话生成PPTX格式的文档,且为你提供了足够的微操空间。 当乌鸦君直接把刚刚那份演讲稿上传进去,并在模板库里选了个科技感十足的样式,点击生成后,大约30秒,一个排版美观、配图贴切的19页PPT就出来了。 不仅出来的快,细节更是打动人: 首先,PPT的所有内容可控极强,不仅可以实时修改模板、配色
      212评论
      举报
      未来不是“谁有AI”,而是“谁能用好AI”
    • 乌鸦智能说乌鸦智能说
      ·07-29

      ChatGPT一天回答25亿次,品牌如何抢占“新入口”?这9招你必须掌握

      AI搜索正在快速取代传统搜索。 仅ChatGPT一家,月活超10亿,每日使用量达25亿次,正在逼近谷歌的140亿搜索量。与此同时,Google AI搜索已占搜索结果的13%。 用户的消费行为正在根本性改变——他们不再自己逐条检索和比对产品,而是直接向AI提问:“我该买什么?”、“该信谁?”、“怎么做最好?” 这意味着:如果你的产品没出现在AI的答案里,它可能在用户心中根本不存在;一旦被提及,AI搜索就有可能成为你增长最快的渠道。 如何掌握AEO(答案引擎优化),让品牌在AI答案中占据一席之地,成为一个至关重要的问题。 关于这个问题,不久前Kyle Poyar特地请教了Profound的AEO负责人Josh Blyskal。 Profound是一个面向企业的AI可见度监测与优化平台,帮助品牌在新兴的AI问答与生成式搜索中被频繁引用,目前已经拿到2350万美元融资,估值超1亿美元。。 对于企业如何提高AI搜索中的可见度,Josh Blyskal给出了9条建议。 / 01 / 决定你想“赢下”的提示词 AI正在主动推荐产品和内容(甚至是订阅的Newsletter)。和SEO一样,AEO也要明确目标提示词,基于两个核心:查询量&与产品差异化的相关性。 比如我自己,可能会争取像“最适合初创公司创始人的新闻通讯”、“初创公司定价推荐”这样的提示;鞋类品牌可能关注“最好的跑鞋”、“最舒适的鞋子”等等。 Josh建议,把你的目标提示词分为三类: 1)必须赢下的核心提示词(约占33%); 2)竞争激烈但有机会的关键词(约33%); 3)具有实验性的新提示**(约33%); 工具推荐:Profound的Conversational Explorer可辅助发现这些提示。 / 02 / 理解不同答案引擎行为差异巨大 Josh对ChatGPT和Perplexity的10万
      132评论
      举报
      ChatGPT一天回答25亿次,品牌如何抢占“新入口”?这9招你必须掌握
    • 乌鸦智能说乌鸦智能说
      ·07-28

      金山云携具身智能等多个AI创新解决方案亮相WAIC

      7月26日,“智能时代 同球共济”为主题的2025世界人工智能大会(WAIC)在上海开幕。今年是世界人工智能大会举办的第8年,作为全球AI领域的重要盛会,本届展会规模创新高,且形式与往年相比更加“硬核”,全球AI成果集中亮相。国内知名云厂商金山云携星流平台、 智算云、具身智能、政务AI一体机、行业大模型等六大AI解决方案亮相,全面展现AI创新技术及行业落地实践。 尽管当前AI算力需求呈现爆发式增长,但行业普遍面临“算力碎片化”与“调度低效”的矛盾。金山云高级副总裁刘涛在WAIC接受记者专访时表示,“作为定位‘大模型助力者’的平台型公司,我们通过持续优化帮助大模型客户将平均算力利用率(MFU)提升至60%以上。针对碎片化算力,我们的自有平台能实现轻便部署,并进行集中纳管和统筹调度。” 伴随大模型的快速迭代,其与机器人融合应用,激发了AI与机器人行业对具身智能的关注和投入。具身智能进入以AI技术强融合为特征的新阶段,市场潜力巨大。刘涛表示:“当前大模型文本、多模态语料丰富,但机器人语料稀缺,主要依赖仿真生成或人工通过机器人采集。多数企业正开展动作控制(小脑)训练,头部企业尝试端到端OpenVLA模型的‘大脑’训练,但受限于语料规模与端侧运行需求,其模型参数及训练集群规模仍较小。尽管具身智能行业在快速成熟,但算力需求的爆发期尚未到达。” 在谈及金山云在具身智能领域的布局时,刘涛表示,金山云在2023年就开始关注这个行业,目前已经实现了突破。“我们依然坚定做‘助力者’,在早期就规划从算力、平台到应用,去全方位助力客户解决工程上的难题。目前,数据对具身智能行业的发展至关重要,我们希望能在数据清洗、数据标注等全流程帮助客户。待技术成熟后,我们将协同客户推进多行业场景落地,以实际应用反哺技术迭代。”他表示。 在WAIC金山云展台,以行业大模型为中心的一站式瀚海大模型开发应用平台和金山政务
      791评论
      举报
      金山云携具身智能等多个AI创新解决方案亮相WAIC
    • 乌鸦智能说乌鸦智能说
      ·07-28

      原生Office办公智能体WPS灵犀发布,引领中国AI办公最佳实践

      7月27日下午,世界人工智能大会“2025金山办公AI生产力论坛——看见:AI办公穹顶之上”在上海世博中心举行。会上,金山办公发布了WPS AI 3.0版本——WPS灵犀,用户只需通过自然语言、多轮对话即可完成文档创作、演示文稿生成及语音助手等功能,全程无需复杂操作和外部跳转,是真正意义上的原生Office办公智能体。除WPS灵犀外,WPS知识库也随着WPS AI 3.0的推出正式亮相。 “WPS AI 3.0的发布预示着办公AI的能力已从工具升级为AI助理。我们希望WPS用户都能拥有好用的AI助理,以低使用门槛的人机交互模式,轻松地完成各项工作。”金山办公助理总裁田然认为,办公正在走向人人都有AI助理的时代。 值得一提的是,WPS灵犀已获评2025世界人工智能大会(WAIC)“镇馆之宝”奖项,并在金山办公展区展示。 (图为WPS灵犀获评世界人工智能大会“镇馆之宝") WPS灵犀发布,让人人都拥有AI助理 WPS灵犀与WPS Office深度协同。目前在WPS Office的部分组件中已经形成了左侧Office套件、右侧WPS灵犀的同屏交互形态。用户直接在右侧的对话框中用自然语言提出需求,AI在识别用户意图后,即可对左侧文档区域进行修改,全程无需跳转其他应用。相比于其他产品,灵犀具备多轮对话、修改可控、格式保留等优势,能控制AI生成用户真实可用的成果。 (图为金山办公助理总裁田然分享WPS AI 3.0的理念) 现场展示的案例中,用户通过与WPS灵犀多轮对话,完成了装修合同从新建、修改到优化的全过程。灵犀能将口语化的姓名、地址、金额等信息自动补充进合同,再智能化地将装修合同中提到的项目信息按表格形式呈现,并为用户提示合同条款中潜在的风险。在新建文档的过程中,灵犀既能帮助用户写好文档,还能协助审核文档的规范性。 现场还展示了AI PPT、语音助手、WPS知识库等办公服务。 A
      130评论
      举报
      原生Office办公智能体WPS灵犀发布,引领中国AI办公最佳实践
    • 乌鸦智能说乌鸦智能说
      ·07-23

      真正像医生那样思考,夸克把“临床感”做进了AI里

      “我们不是在训练一个会答题的AI,而是在训练它学会‘先想清楚’。” 这是夸克健康团队在产品交流会上反复提到的一句话。听起来像句玩笑话,却点出了医疗AI最关键的能力:不是谁答得快,而是谁更像医生,愿意慢下来、想清楚、问明白。 在医疗这个最需要“可信判断”的场景里,AI真正的挑战不止是记住多少知识,更在于能不能像医生一样思考、推理、做判断。 举个例子,有人问AI:“宝宝为什么反复发烧?” 如果AI把这当成一次普通的“问答请求”,它可能只会列出一堆标准答案:病毒感染、细菌感染、免疫系统异常…… 但如果它把这当成一次真正的“问诊对话”,它就该像一位有经验的儿科医生那样,从安抚情绪开始,再主动发起多轮追问:有没有出现高烧?持续多长时间了?宝宝多大了?然后再根据具体情况,做出合理判断与建议。 从“回答问题”进化到“理解病情”,从“提供信息”走向“辅助判断”,这正是夸克健康大模型正在做的事。 那么,它到底做到了什么程度?我们一起来看看这个产品。 / 01 / 打造AI医生的“临床思维”:先问清楚,边想边搜 如果说“像医生一样思考”是一个终极目标,那考试成绩,或许是最直接的检验方式。这是夸克在医学考试中的成绩单: 题越难,夸克越强;问题越开放,推理越出色。 一个有趣的现象是:医学生成为了夸克的第一批高黏性用户。夸克健康运营负责人赵存忠介绍,目前平台在全国医学生中月活用户已突破200万,覆盖了全国大约一半医学生。 他们用它查资料、做题、训练思维逻辑,把它当成更靠谱的“医学作业帮”。支撑这份信任的,不是一个个准确答案,而是夸克能够“像医生一样在思考” 同样是答题,夸克有什么不一样?我们随机做了一道测试: 一位70岁男性,吸烟50年,咳嗽咳痰40年,近一个月症状加重,伴有胸闷气短、尿量减少,查体提示肺部啰音、双下肢水肿。问:还有哪些体征可能出现? 通用大模型常见的思路是,先阅读提干,在
      390评论
      举报
      真正像医生那样思考,夸克把“临床感”做进了AI里
    • 乌鸦智能说乌鸦智能说
      ·07-23

      再次拔高上限!夸克健康大模型通过12门主任医师考试

      7月23日消息,夸克健康大模型成功通过中国 12 门核心学科的主任医师笔试评测,成为国内首个完成这一挑战的大模型。目前,“主任级 AI 医生”能力已全面集成至夸克的AI搜索中,用户在查询健康问题时,选择深度搜索即可调用。 这是继 5 月通过副主任医师职称考试后,夸克健康大模型能力的又一次跃升。在垂类模型与通用模型对比中,夸克健康大模型呈现出难度越高、领先优势越明显的性能曲线,展现出在复杂医学推理任务中的突破。 这揭示了在医学领域研发垂类模型的巨大潜力。夸克健康大模型以通义千问为基础,走出了一条面向垂直场景的深度工程化路线。“我们不是在训练AI回答医学问题,而是在训练它学会医学思维”,夸克健康算法负责人徐健说。 夸克健康大模型的核心突破之一,是构建出“慢思考能力”。该能力融合了链式推理与多阶段临床演绎路径建模,驱动模型在面对复杂医疗问题时,能够分阶段、层层深入地推导出最终回答。 构建慢思考能力的前提,是拥有高质量推理训练数据。为此,夸克构建了“双数据产线 + 双奖励机制”的工程体系。一方面,将医学数据划分为“可验证”和“不可验证”两类,分别对应诊断类任务和健康建议类任务;另一方面,在训练方法上引入“过程奖励模型”和“结果奖励模型”,分别评估模型推理链的合理性与最终结论的准确性,显著提升模型的临床可解释性和推理一致性。 该体系还设计了多阶段强化学习流程,包括冷启动数据的严格人工校验、多轮样本筛选与难度递进训练策略,以及用于防止“高分投机”的作弊识别机制。通过真实医生标注、“问—思—答”整组数据驱动强化学习,夸克健康大模型不仅学会了医学知识,更掌握了医学思维的路径选择、证据整合与多解平衡能力。底层的权威医学知识库确保了模型输出内容专业、及时。 安贞医院心脏外科主任医师谢进生认为,夸克在一些问题上回答专业度比专业医生还要强。这一成果背后是专业医师团队的深度参与。目前,夸克健康大模型
      188评论
      举报
      再次拔高上限!夸克健康大模型通过12门主任医师考试
    • 乌鸦智能说乌鸦智能说
      ·07-22

      零一万物“超级员工”登场,企业级Agent迈入“价值交付”时代

      7月22日,零一万物于北京举办产品发布会。零一万物CEO李开复博士与零一万物联合创始人马杰、黄蕙雯一起,共同发布万智企业大模型一站式平台(下文简称万智平台)2.0版本,并推出零一万物企业级 Agent 智能体。 作为万智平台的核心功能模块,该企业级Agent以“超级员工”为核心定位,具备深度思考和任务规划能力。基于安全沙盒与MCP,零一万物企业级Agent能够访问手机和Web端,连接各类企业服务。同时,零一万物万智平台还提供开发工具与配置平台,企业可以随时随地基于自身业务场景,定制最懂客户需求、解决真实问题的“超级员工”。 这是零一万物产业大模型落地实践的关键布局。在当前基座模型与产业应用仍存在显著落地断层的背景下,零一万物正积极协同产业生态伙伴,致力于打造安全好用、互联互通的企业级Agent,推动中国大模型产业从“交付服务”迈向“交付结果”的产业AI时代。 万智2.0推出企业级Agent,让AI成为能干靠谱的“超级员工” 在审视大模型的发展路径时,不妨以人类演进为参照——人类的独到之处在于创造和使用工具,从而拓展自身解决复杂问题的能力。 业界在技术探索中逐渐形成共识是,AI Agent的能力跃升,也遵循着这一逻辑,有两个关键影响因子:一是AI Agent之下的基座模型具备的深度思考与任务规划能力,二是Agent经过场景锤炼和工程优化之后可调用执行工具的数量与精度,影响着其能力边界,人工智能开始逐步展现“手脑并用”的能力。这两个因素的深度媒合,未来AI Agent才有望衍生出各行各业的“超级员工”。 然而现实是,受限于当前基座模型对垂直产业的理解深度与工具调用能力的成熟度,市面上多数Agent方案仍无法满足企业在复杂业务场景下的实际需求。 目前AI Agent的发展路径,预计会经历三个演进层级: L1:工作流Agent 这一阶段由人类主导任务的规划与决策流程,Agent仅按
      193评论
      举报
      零一万物“超级员工”登场,企业级Agent迈入“价值交付”时代
     
     
     
     

    热议股票