对谈高德&理想:Agent 如何改变汽车的未来
AI Agent 上车后,汽车开始从 “响应指令” 走向 “理解意图”。
文丨郭海惟
2025 年圣诞节,特斯拉在美国进行了一次大规模系统更新。通过将 Grok 与导航能力结合,特斯拉推出了 “对话式导航”:用户不再需要输入精确指令,只要用自然语言表达出行意图,车辆就可以理解上下文并最终完成路径规划。
一些媒体与资深用户把这次更新称为智能汽车行业的一个 “GameChanger”。当对话交互开始与驾驶和出行场景深度结合,一些人认为,智能汽车或将进入一个新的阶段——车机不再只是信息界面,而更像一个能够理解用户意图的 Agent。
与特斯拉的更新不谋而合的是,“对话式导航” 这类能力的迭代,已被一些中国企业写进产品规划。
今年 5 月,高德正式推出高德汽车出行 AI Agent,并在理想 L9 Livis 上首发落地。与此同时,红旗、长城、赛力斯、奔驰、宝马、广汽等汽车品牌也将陆续接入高德汽车出行 AI Agent。
汽车开始真正听懂用户的 “模糊意图”。你说 “去老地方”,它知道是去你常去的那家咖啡馆,而不是地图上任意一个叫 “老地方” 的餐厅。
对于高德来说,Agent 上车是一项战略级选择。未来车载 AI 的发展关键词或许是 “生态协同”。主机厂的操作系统之上将运行多个不同能力的 Agent,各自负责不同场景。而高德希望成为其中负责出行服务的重要 Agent。
这也是高德汽车业务经历的第三次重要的技术与商业模式转型:从卖软件包(APK),到卖开发工具(SDK),再到卖按调用计费的服务(Agent);从 HD 地图到 HQ 地图,再到今天的 SD Pro。每一次转型,都意味着放下过去成功的模式,重新拥抱新的技术浪潮。
“忘掉自己,甚至忘掉成功的自己。” 高德副总裁江睿这样总结高德汽车业务多次成功转型的经验。
今天,无论是公司、组织还是个人,都在面对 AI 带来的巨大不确定性。野望与恐惧并存,愿景与现实拉扯。但在这场浪潮里,无论是高德,还是理想及其他一些车厂,都选择了一种更务实的态度:无论什么样的技术创新,最终都服务于当下的用户价值。
或许终点会是什么,并不那么重要,因为有一点是确定的:Agent 会改变出行,AI 会改变生活,而人们对价值的理解,总有一些共识可以穿越周期。
《晚点 LatePost》与江睿、理想汽车产品部高级副总裁范皓宇,理想汽车空间智能产品负责人胡含进行了总计超过五个小时的谈话,我们讨论了 Agent 为什么要上车?在这场新的智能座舱革命中,中国厂商如何找到自己的技术路径?车企与 AI 公司的合作关系会如何变化?以及他们各自看到的未来。”
以下为对话内容,在不改变原意的前提下,内容作部分精简和重排。
“特斯拉不会让我们焦虑”
晚点:特斯拉 12 月发布更新的时候,各位在干嘛?
江睿:我们当时有两条线。一条是 AI,就是用多条件或者模糊意图的方式做搜索,让体验更智能,比如说我去机场,想走一条 “海岸边”(随机意图)的路,这在以前是没办法实现的。
这条路其实都是在解决一个问题:如何让各种各样点状的信息拼接在一起。所以 Grok 的 demo 效果出来以后,我们内部立刻开始研究。我当时的反应是,汽车行业的 AI 浪潮将会相当迅猛,而且会加速。第二条线是,我们在做出海业务,在引擎服务、地图数据等方面做了大量优化。
范皓宇:我记得当时挺晚的,好多人给我发 demo 的视频。其实这个事儿一直在我们的 pipeline 里,当时我就猜想哥(李想)什么时候会转发到产品群里,结果不到两个小时就发了。
没过几天我跟江睿聊,说得折腾起来。他们数据是 ready 的,我们也是 ready 的。
晚点:特斯拉先上车,你们会有焦虑吗?
范皓宇:没啥焦虑,因为本来就在 pipeline 里。我们国内很多功能特斯拉其实也是没有的。我觉得大洋彼岸说不定也会做一个访谈,说理想上了这个功能,你们准备什么时候上。
胡含:我们去年其实做了很多 Agent 的尝试,比如 “小同桌”。当时用户天然就会问:除了聊天,能不能也去干点活?
所以我们一直在想,怎么把导航、娱乐、控车这些功能都结合起来。Grok 是第一个把导航这个方向做出来的。对我们来说,可能不光是导航,完整座舱里的所有工具未来都可能要接进去。
晚点:但为什么 Grok 能先推出这个产品,这件事情的难点在哪里?
江睿:特斯拉我只能推测,它是端到端一体化的体系,好处就是速度非常快。相比之下,中国更多是开放性的生态,讲究多方合作。
高德 Agent 的工程难度,我觉得有几层:
第一,用户在车机里的表达其实是没法连贯的,中间往往是断断续续的,还会加一些语气助词;
第二,要把点状的智能体验串联在一起,是一个相当复杂的异步构建过程。背后其实是一个个不同的工具和接口,如何去编排,编排完了再验证,这个过程难度非常高;
第三,高德不喜欢做 demo,我们要做就是做量产。那量产如何保证产品交互体验的一致性。高频的简单问题是下限,复杂的 query 可能是上限,都需要处理好。这背后还有如何处理性能的问题,车机的性能场景和手机、PC 是完全不一样的。
胡含:我觉得当我们确认这是一个以量产为目标的产品时,难度就非常大了。我自己在使用过程中,有两个印象比较深的点:
一个是我家孩子最近正好在打一个中青赛。我就直接跟高德说,“给我导航到中青赛 U10 的比赛场地”,它自己就检索出来了。这肯定不是在高德数据库里已经存储的检索,而是提取了互联网内容。
另一个是 “多目的地” 的顺序编排。比如我要去 A、B、C 等多个地方,过去系统给出的顺序大概率是不对的,需要用户自己不断拖动调整。但高德现在能比较准确地完成自主编排。
“给智能一个严丝合缝的轨道”
晚点:“更强的自主编排能力,会带来什么变化?”
江睿:用户今天规划路线,习惯在 GUI 上拖动;但所谓的 VUI(VoiceUI),是没法拖拽的。这背后有一个长期趋势:交互方式会从系统 “被动响应用户需求” 变成 “大量运算在后台自动发生”。
比如你在车里的状态、周围环境,其实都可以被集合起来做计算。如果车需要补能,它也可以自动跳出来提示你去附近找充电桩。
范皓宇:说白了,(主动)特别难。因为过去十年所有人都想做一些 “主动”,但我觉得很多都是脑残的 “主动”。比如我一上车,它突然告诉我说今天这个天气怎么样——我能不知道现在是什么天气吗?
真正的主动是什么,它会有时间轴的预判,像世界模型,next token prediction,我能够判断和预测到未来。
我觉得高德本身就是一个时空网络,任何路线其实都是空间的转移,变量会非常多。
江睿:我们有团队一直在研究世界模型。
范皓宇:高德有个 case 很棒,就是前方道路出现事故车辆会提前报告。我们测了一下,发现准确度 99.9% 以上,这意味着它可以被辅助驾驶更好用到。
江睿:我们还有一个更大规模的系统,没有直接用于辅助驾驶,是和应急管理部中国安全生产科学研究院一起做的,叫 “鹰眼守护预警系统”。应急管理部在每一次大型的节假日都会推荐公众去用,可以减少重大交通事故。上一次国庆,这个系统被调起了 17.4 亿次。
晚点:过程中如何解决幻觉的问题?
江睿:我们做了一个架构,叫 “意图和事实分离架构”。
地图是唯一连接真实世界和虚拟世界的超大规模的平台,所以在整个事实世界里,我们不能给它提供虚假的信息。特别是关乎在端上执行 action 的部分,一旦出现幻觉,这个体验是灾难性的。所以我们强制让系统必须一一对应到高德底层的工具。
范皓宇:你给了一个严丝合缝的轨道,水必须在这里面流。
江睿:对,没错。
胡含:听上去是说,如果大模型是 “语言的大脑”,高德是一个 “空间的大脑”。语言的大脑还能容忍幻觉,但空间大脑是绝对不能容忍幻觉。
晚点:你们未来还会有其他 agent 上车吗?
江睿:就只有出行领域的 “子 agent”。
第一,它的重要性足够高;第二,它对专业性的要求也非常高。并不是说我们很快就用 AI 解决了所有的 corner case,然后就可以进军下一个领域了。
胡含:从 Agent 能力上讲,我觉得这是一个生态问题——优质数据在哪里,能力的上限就在哪里。优质的出行数据,一定是在高德那里。
所以我也认为合作伙伴不要只服务我一家,而是要服务整个场景。只有服务整个场景,才会积累整个场景最优质的数据。如果你是这个场景里的老大,我们肯定会用你。
晚点:那高德作为 “子 agent” 和 OS 的关系是什么?
范皓宇:我们从来没讲过 OS,我们没有那么大的概念。你可以理解 OS 是发布 JD(job descripsion),它能收集用户所有的诉求,但它本身不完成任务。它的功能是准确描述和理解需求,然后推理出一条最佳路径,最后实现业务闭环。
胡含:从技术角度来讲,肯定是尽可能用一个 Agent 来做最好。但真正落地的时候会发现很多问题。
最符合 “Agent” 的其实是基于 ReAct(推理-动作)的技术。但在这之前可能还有 workflow 的方式。有些场景如果全部扔给一个 Harness 的 ReAct 技术,可能会变慢,不一定值得。
范皓宇:上下文特别多的时候,也可能又慢又差。
胡含:Harness 这个东西我们认为是 “build to delete”。它是脚手架,甚至可以理解为补丁。未来如果模型更快了、缓存更好了、工程架构更优化了,就会把它拆掉。所以我们现在做 Harness,其实是为了以后把它拆掉。
江睿:最早我们为了杜绝幻觉也用 workflow,它有点类似最 “顶级” 的 Harness,因为把约束条件全部写上,只在部分环节用模型。我觉得这两条路至少在一段时间内会并行。
我们现在把流量导向三个模块。一个是慢思考,就是标准的 ReAct,时间比较长;第二个是快速思考,参数会往性能和速度方向优化;第三个是极快速思考。我们有对应的小模型,还有一些向量匹配机制,确保最简单的 query 能用最快的方式响应。
但随着算力和模型能力逐步变强,后面的架构可能还会继续变化。我觉得最重要的一件事情是,在某一个时间点想清楚:效果、效率、性能和成本之间的平衡。我们很多产品其实都在这四个关键词之间反复平衡。
晚点:那怎么去评价 Agent 呢?
江睿:我们自己在构建自动化的评测体系——持续抽简单和复杂的 query 去测评。但人力太贵,所以我们需要训练一个模型来当裁判,再用人去检查这个当裁判的模型。现在这件事情已经在高频运转。
范皓宇:我建议你的评测体系应该开放出来,让大家一起来试试。
胡含:从技术角度讲,切分其实有一个原则,就是上下文是否共享。任何主 Agent 和 sub-Agent 之间,上下文互通都是一个基石。过去我也遇到过大家互相防范、数据不通的情况,那肯定会带来用户体验问题。但这里不光是技术问题,也涉及企业之间的互信问题。
江睿:如果把 Agent 分成三类:PC 端、手机端、车端,其实差别很大。
PC 面向的人基本不动,它的最高任务是提升产出效率;手机承载的是生活中的你,本质上还是三个流:信息流、服务流、消费流,跟经典互联网没有太大区别。
车是最复杂的场景。第一,因为它在高速运动中,是空间智能体,所以对物理空间的感知能力要求很高;第二,在车里的体验里,司机和乘客的身份不同、速度不同,体验也完全不同。
晚点:刚才有提到 OpenClaw,也提到很多关键词,比如从被动到主动、信息流和服务流的打通、Harness 等等,好像会让人想起 OpenClaw。你觉得高德 Agent 可以从 OpenClaw 里借鉴什么思路?
江睿:其实本质上都是个人助理。它会产出 token,也会把知识变成 token。它可以用工程化的思维去完成目标,比如心跳机制、循环机制,这在车载的主动服务场景里是很重要的触发机制。比如我们在 20 分钟后要到一个地方,系统其实可以提前触发相关计算。
“云 + 端会长期存在”
晚点:手机、PC、车机,有什么思路理念上是相似的吗?
江睿:Longmemory。而且只能是在云端的。因为你面向的用户是一个人,所以可以把他在不同生活场景、工作场景里的行为融会贯通,形成一个独特的 profile。每个人的 AI Agent 要做什么事情、核心目的是什么,肯定都是完全不一样的。
晚点:那云和端,未来场景会如何划分?
江睿:云 + 端的架构未来一定会长期存在。我们刚刚一直在说 reasoning and acting(ReAct)。Reasoning 这件事情,大部分是 “云” 完成的;但 acting 对响应时效性要求非常高,是要在 “端” 进行强交互的。
未来 reasoning 也有可能往端迁移,比如把 70B 的大模型移植到车上。
范皓宇:我也能给你跑起来,但占内存,内存好贵。
江睿:对,我理解现在 7B、10B 还能在车上跑起来。“端” 也能节约一些服务器上的成本。从长期演进的角度来看,厂家还是在思考效果、效率、性能和成本之间的平衡。
胡含:这次合作,以后可能会成为终端型公司和 AI 生态公司之间的一种范式。
你看收费模式,我们最开始其实很保守,想用 license 或者 NRE。后来皓宇跟江睿聊,既然是 AI,那可以用 AI 的收费方式,用 token 来结算。
这背后代表了一个 belief。如果你觉得这个东西只是 “秀”,那你最好这笔钱赶紧收完;但如果你觉得大家会一直使用它,雪球会越滚越大。
晚点:但你们对客户是不会按 token 收费的,所以你们来承担 token 的成本。
胡含:我们对用户不收费,用户每次使用 token,都是理想向高德支付费用。
江睿:我是坚信 token 的。AI 时代,token 是一个新货币。
汽车过去是一次性的支付物,很少再去支付更多的增值服务。但过去汽车领域的工作者,都在用最大的努力,把汽车变成一个智能的产品体验。而体验是需要持续构建的。
我们的目标是用高性价比的产品,持续给用户提升体验。只要有体验,就会有用户付费,就会有新的商业模式形成——就像今天很多人会买视频会员,因为里面有你喜欢的节目综艺,体验更好了。
未来一定会有人愿意支付极致的价格,来获得更极致的体验,让汽车更高频地为自己服务。可能我也会去设置一个 token 消耗量(额度),就像大家在用 OpenClaw 一样。
我们目前还是支持 license 的。因为高德要支持整个行业,必须适配每一家的采购体系。但我坚信未来会变成 token。
“打碎过去的自己”
晚点:在座舱发展中,高德经历了 APP、SDK 再到 Agent 的很多形态。这其中发生了哪些变化?
江睿:我其实经历了完整周期。最开始叫 Amap Portal,是一个 APK。我记得 2015 年,当时还叫 “SOP 保卫战”。那个阶段更偏向于移植的逻辑——把 Amap 核心能力封装,再去适配不同屏幕,移植到车机上。
但很快我们发现,车厂之间其实不能接受所有人的导航都长一样。所以很快在 2018 年,我们推出了 AutoSDK。
SDK 的逻辑就是把产品乐高化,最后拼成客户想要的形状。高德提供算路、搜索、定位、引导等一系列底层能力,上面的 UI、UE 开放给客户定制。我还挺自豪的,因为很多海外的大型科技公司后来也开始学这种产品形态。
到了 2025 年,我们开始考虑 AI 作为下一个产品形态。因为 AI 浪潮是不可逆的,而且技术曲线比互联网时代更陡峭。我们当时思考 AI 时代的产品范式,有三个关键词。
第一是准确的意图识别。
第二是主动服务。这个在 AutoSDK 时代其实也尝试过,但更多是代码式的,泛化能力没有那么强。现在是 GUI 为主、VUI 为辅;未来智舱发展得更好,也可能是 VUI 为主、GUI 为辅。
第三是生态协同。我们坚信在车载场景里,最终会是系统级的 OS 去对接不同的子 Agent,以生态协作的方式长期演进。每一个 Agent 各司其职,尽量把自己的事情做到最好。因为任何一个 Agent 都不可能把所有场景细化到极致,工作量实在太恐怖了。
晚点:从 PC 到移动互联网,再到 AI,高德是如何穿越时间周期的?做了哪些调整,让你们更适应 AI 时代变化?
江睿:本质还是认知问题——你如何忘记过去的自己。所谓过去的 “自己”,其实是那个成功的自己、成功的经验和模式。穿越周期里很核心的一点,是要对抗自己过去的成功认知。我们阿里有一个价值观,叫 “拥抱变化”。
刚才说了 AutoSDK 到 Agent,我再举一个地图的例子。最早高级辅助驾驶用的 HD 数据是我们做的。
面对后来行业的巨大变化,一般企业会有两种选择:一种是我已经花了这么大成本做出来高精度产品,那就继续推进业务;另一种是打碎自己,承认市场变化太快。
我们做的是后者——我们做了 HQ 地图。要素减少了、精度降低了、鲜度上升了、成本下降了。我们以为这次成功了,但时代跑得比我们更快。后来又出现了两条岔路,我们再次打碎自己,于是出现了基于 AI 的新地图,现在的 SDK Pro。
第二,高德一直在押注数据采集。最早用的是特别昂贵的采集车,一台车一年的成本接近千万。到了 HQ 时代,这种车成本太高,我们就开始自研设备,也研究中包设备。再到今天,我们和车厂合作做采集项目,同时积极使用 AI 技术。
所以高德不仅积累了大量地图资产,还有在出行领域的认知资产,最终都可以被 token 化,再转移给客户。
第三,高德其实是一个连接虚拟世界和真实世界的、时空覆盖非常广的智能平台。在这个平台里,有大量商家和业务产生了紧密连接。
我们一直在思考不确定性。有三个不确定性我一直记在心里:一个是环境的不确定性,比如商业环境;第二是竞争的不确定性,而且不能只看直接竞争者,还要看会不会有横空出世的对手;第三是技术的不确定性。这个反而是最容易掌控的,因为阿里有很强的 AI 生态体系可以支撑我们。
晚点:所以你觉得地图可以成为 AI Native 的产品吗?
江睿:完全有可能,我们也在往这个方向走。我们一直在把 AI 融入产品和底层框架里,但在系统里你会发现还有大量非 AI 的产品设计。但到了真正 AI Native 的时代,当用户规模起来之后,需求会源源不断回传到以 AI 为中枢的产品体系。如果这个体系足够智能化,可以直接承接这些需求,那 AI Native 就完成了。
范皓宇:base 在数据上的公司,转型 AI Native 其实是最容易、也最快的。我对高德的数据是非常钦佩的。这么大的数据体系,AI 进来是乘法效应;一旦 plus 出好的结果,就会形成飞轮。
晚点:高德能穿越周期,跟数据也有很强的关系。
江睿:其实我刚才举的例子,本质也是以数据为载体的小案例。网络发展规律里有一个概念叫 “强连接” 和 “弱连接”。高德在出行领域绝对是强连接,很多生态都会连接到高德,成为一个关键节点。
过去我们会用比较传统的方式演化自己,速度不够快。现在我们希望用 AI Native 的方式,再次革自己的命。
晚点:怎么看待阿里的 AI 生态能力?
江睿:阿里的生态位其实和 Google 很像。Google 有 Gemini,有 Google Maps;在阿里内部,就是千问和高德,这是一个融合互补的关系。
高德今天已经接入了千问。不仅是模型层,在底层基础设施上,我们所有服务也都是架构在阿里云上,而阿里云和千问之间也是紧密联系的。
未来我们和千问的关系更像是:千问是一个通用智能,而我们是一个领域里的专业智能。
晚点:你们自己的 AI 能力怎么搭建呢?
江睿:我们有非常专业的 AI 团队,绝大部分在做 AI Agent 建设。其中也包括内部工具协同——以前是 API,现在变成 MCP,中间加入了大量出行领域的经验和认知。
“Taste 就是理解和判断”
晚点:当高德提供了 Agent 能力之后,不同的主机厂如何做出差异化?
范皓宇:脑子要聪明。脑子不够聪明,跟这么好的产品合作会很困难,可能跟不上节奏。
江睿:差异来自变量。今天的车都有品牌使命。驾驶员本身的状态、车的状态、周围环境的状态等等,这些状态叠加在一起,其实是一个参数量非常大的变量系统。
晚点:AI 最后的竞争是 taste,不同品牌的座舱有自己的 taste。
胡含:像理想 AI 既是用户的个人助理,也承载品牌使命。主机厂的目标用户和场景不同,会影响产品设计的方方面面。比如你会发现,我们的形象好像更毛绒一点。
晚点:高德的 taste 是什么?
江睿:我觉得 taste 的核心就是理解和判断。
比如 iPhone 刚出来的时候,苹果在 SKU 的生产上是非常克制的。少 SKU 和多 SKU 之间,其实很难说谁绝对更好。
再比如互联网很多产品是靠广告变现的,我们也做过很长时间。但我当时一个很坚定的判断是:在车载场景里,高德的地图导航里一定不能出现广告,一丁点都不行。后来某个竞品放了广告,我们也看到,最终用户是非常厌恶的。
范皓宇:是愤怒。
江睿:我们团队做产品的时候,我一直很关注一点,可能听起来有点哲学——少就是多,慢就是快。因为做产品的时候,特别容易陷入 feature 堆叠。但到了 AI 时代,AI 本身就是一个超级大的 feature,可以把很多体验细化出来。
晚点:如何看待最近挺热的 “舱驾一体”?
范皓宇:我不太想扯技术名词。先翻译成用户需求:舱驾一体之后,用户到底能获得什么更好的体验?今天辅助驾驶的能力在扩大,座舱模型的能力也在扩大。当两个能力都扩大之后,会产生交集。而这个交集,就是新的用户体验产生的地方。
江睿:趋势其实已经发生了。你看芯片领域,高通在往智驾走,英伟达在往智舱走。
这两者一定会有交集,因为它们都发生在同一个空间里。未来导航其实就是高级辅助驾驶过程的一部分,是一体两面。从业务角度来看,我们一直在做双域互联之间的信息拉通,目的就是提供更好的用户体验。
范皓宇:用户场景和体验其实不会分离,趋势一定是融合的。但芯片分离其实也有好处,否则一开始就不会分开做了。
舱驾融合的代价是什么?比如行业里在推动座舱算力升级,如果做了舱驾融合,六年之后座舱可能就无法升级了;但如果分开,六年后换一颗芯片,可能还能有接近新车的体验。
从成本角度看,如果分开,每颗芯片都有更高的出货量,成本也会更低。即便是旗舰算力芯片,可以兼容一个中等级的智驾和智舱需求,但总会有公司把旗舰芯片的算力用满。
“智能竞争,是我们的种族天赋”
晚点:高德和理想都在出海,当 AI 能力上车后,我们如何在海外竞争?尤其是像特斯拉这样的对手竞争?
范皓宇:有没有 AI 都会出海,都要把好产品带到全世界,而且是跟高德一起出去。
晚点:智能竞争会成为出海竞争中重要一环吗?
范皓宇:我不知道这段会不会被剪掉(笑)。我觉得这是我们的 “种族天赋”。中国已经卷成这样了,但凡外国朋友来中国考察,坐进车里都会问:what is happening?我开着 Mega 在美国的时候,对方会说,这是 UFO 吗?所以我说这是我们的种族天赋,是我们出去竞争非常核心的手段。
江睿:从用户体验角度来看,智能化一定会逐渐拉高整个座舱体验的天花板。国外整体的平均智能化水平和中国还是有比较大的差距。
但如果真的要把整套 AI Agent 体验输出到海外,复杂度也会很高。
今天全球化其实有两种策略:一种是统一标准,比如 Google、Facebook、Twitter,很多美国公司都是这样;另一种是本土化或者区域化策略。
如果要本地化,要做出当地人更容易接受的体验,就意味着很多模块要重新拆开、重新做。所以产品的天花板会提高,困难也会提高。
晚点:所以你们会看好什么路?
江睿:首先还是选业务主题。从汽车业务的角度来说,肯定会跟主机厂一起走。但高德的 To C 业务也在出海,比如在日韩、泰国都可以打车了。所以路径其实是由业务本质决定的。
晚点:AI 会让座舱出海更难还是更容易?
范皓宇:挺难的,光合规就很难。但回头看又很有意思,全世界又都在买中国 token,因为性价比很高、速度也快。但我们不会因为困难就不去做。这里有个坎,就翻过去。困难在产品人心里是默认值。
江睿:困难的事情才能建立壁垒,简单的事情不可能。
题图来源:晚点 LatePost
修改于 2026-05-18 19:10
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。


