上海车展,夸克都能跑会了

过去的互联网时代,如果说是一个主动寻找信息的时代,那么未来极有可能会是一个AI替你思考执行的时代,搜索是在海量信息中自己寻找答案,而思考则是直接给你答案。

今年上海车展,两组数字最抢眼,193和500,前面是发布会的数量,后面是自媒体人们失去的车马费。

很多人类在面对AI时,保有的最后自信是,AI不能像人类一样去探索世界,它没有眼睛、耳朵、鼻子、舌头和身体,所以AI只能在信息存量的时间里处理信息,增量信息还是要靠人类。

但是,今天的AI公司们很显然不满足于这样的限制,他们在试图让AI通过手机拥有眼睛和耳朵,比如这届上海车展,大量的参会展商和媒体以及尤其海外的,大量开始借助AI逛展,他们用夸克的AI相机扫描所有新的车型以及展馆资料,快速掌握需要信息。

该说不说,在全世界的车展都式微的时候,中国属于少数还在逆势增长的市场,上海车展193场发布会,如果你是一个带着学习心态来参会的国外参展商和媒体,你需要提前做多少功课,才能完成学习和信息采集的工作?

现在职场很流行一句话:你再不努力,就要被AI干掉了。

在现场,一位来自德国的车企员工告诉我,用夸克,他逛展的时间提高了一倍以上,他的主要任务,就是把此次车展所有的车型做一下统计,但是根据场馆人流进行一下热度分析,另外就是需要收集各家车企的营销材料和分析营销策略。

事实上,在今天的大公司,无论是互联网大厂,还是新能源车企,员工使用AI工具协同自己工作,已经是家常便饭,这就像当年office进入办公室一样,只要你最终交付的东西足够满足使用,并没有人关心你的过程如何实现,当然,去AI味儿,是一个很重要的工作。

事实上,早在十多年前,谷歌就推出了基于搜索的智能镜头,手机拍照后,然后搜索告诉你,这是哪里,可以干什么,但是如今的AI时代,搜索已经不是目的,能看懂图,能基于图片思考,才是最核心的目的。

以车展为例,你来到一个站台前,想要了解一款车,你只需要镜头对准它,然后拍照,你就可以了解到所有的相关信息,但是重要的是,你可以继续提问,让夸克告诉你,这款车的竞品是哪些,如何预判这款车的未来市场潜力,以及上市之前的口碑情况,连续对话思考能力,让你收集信息的过程便捷很多。

另外,现场很多资料,用夸克的AI相机可以快速扫描成PDF,以及实现跨语种翻译,甚至可以让10张图形成推理,在其他场景,还可以帮你看体检报告、修图、做导游等等。

我跟很多大厂员工聊过一个话题,你们对未来AI的期待是什么,纯文字的推理AI能不能满足使用,最终的答案很有意思,技术性码农会跟你扯一堆技术问题,然后跟你强调实现很多功能的困难,但是普通人就很简单了,他们希望拥有一个可以万能的接收器,可以接收各种资料,音频、视频、文字、图片、程序包、各种格式的文件,然后下达指令,完成任务。

毫无疑问,多模态大模型,一定才是未来AI助手的方向。

比如说,你现在用kimi、deepseek这种推理模型,文字处理能力可能非常强,但是如果你需要它帮你修一张图,整理一个录音,生成一个视频,这个时候,他们就解决不了。

多模态中,视觉一定是最重要的一环,因为AI有了眼睛,才可以帮助用户更好的了解周边环境,更加精准的知道用户后续自然语言的需求,比如你在车展,想知道整个展会的布局,然后自己所处的位置,以及怎么去下一个展馆,如果没有夸克AI相机来辅助你,你就很难实现,上一个在地图中实现了这个功能的是谷歌地图。

最后有一个逻辑是需要我们注意的,上一个时代,摄像头是服务于搜索,这个时代,摄像头是服务于思考。

搜索和思考的差异在哪里?这是需要我们看明白的核心。

除了上述所说的连续对话能力,然后就是图片分析、二次创意、动态引导,真正实现所见即所思,像人类一样使用双眼。

现在夸克很大一部分用户是学生和老师,这一点我在去年就发现了,大学生用夸克帮忙解题,只需要手机对着题目,然后就给你解题思路,还能给你讲题目,老师可以用夸克扫描试卷,帮你批改试卷,这都是基于图片理解分析基础之上实现的。

我们所处的广告传媒行业,平时大量遇到内容创意的问题,必须一张图需要一个文案,你可以让夸克帮你写,然后再修改,如果涉及到版权问题,还可以让夸克帮你二创一下,比如生成一个卡通风格的,或者修改掉一些图片元素。

动态引导,其实在未来的使用场景会非常丰富,我直接认为,这个功能会让这个世界从此不再有陌生的城市,你去往哪里,只需要用摄像头看一下周边,然后你需要什么,就可以一一给你罗列出来,今天的地图、点评、社交等等功能会被打通。

过去的互联网时代,如果说是一个主动寻找信息的时代,那么未来极有可能会是一个AI替你思考执行的时代,搜索是在海量信息中自己寻找答案,而思考则是直接给你答案。

一个框,可以有眼睛、耳朵和嘴巴,人类未来的AI助手时代正在一步步走向我们,巨头们正在这个赛道里你争我抢,很显然夸克、豆包、元宝已经组成了多模态在应用层面的第一梯队。

这里面,最让人意外的其实就是夸克,犹如一匹黑马,从最开始定位AI搜索,到围绕这一核心功能衍生出的网盘、扫描等等更加多元垂类应用,再到入主大模型之后,通过AI对问答、图文识别、推理、甚至是基于当前交互语境的二创的改造,众多场景中,这种反馈已经可以被视为人类的脑子代理。

今天的夸克,以及其所强调的“超级框”“超级Agent”等产品认知,于内,其实也应了事业群总裁吴嘉的那句“人用AI,AI用工具”;而于外,一句“大模型心高气傲,没有AI Agents生死难料”,足以证明业务背后对于趋势的押中。

有着较多的用户基础,让夸克能掌握最逼真的用户需求,多年的产品市场验证,确保了每一个功能的调用量足够大,甚至付费意愿比较强,Qwen的模型能力,确保了夸克在业内一直可以维持一流的产品与技术能力。

需求和能力的相互加持,实现产品的最终交付,这是目前市面上,时间、需求、技术三要素配合的最好的一款产品,而且在阿里内部属于最年轻的项目,没有历史负担,身轻如燕,未来可期。

学生、打工人,这才是AI调用量最大的人,他们才是刚需,其实想知道,未来在应用层面谁会赢,问问用户,答案自然明了。

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

举报

评论

  • 推荐
  • 最新
empty
暂无评论