【智能前线】第23期:Manus特辑,全球首款通用AI Agent,开启AI应用新范式
2025年3月6日,中国AI创业公司Monica,发布全球首款通用AI Agent产品Manus,作为首个实现全流程自动化执行的智能体,能独立完成从任务拆解,到成果交付的闭环操作,覆盖金融分析、旅行规划等复杂场景。
Manus凭借云端自主执行、多智能体协同、持续学习与记忆等核心能力,在GAIA基准测试中,全面超越OpenAI Deep Research功能,验证在复杂任务处理上技术领先性,迅速引发行业关注。
Manus出现,代表大模型能力,进一步转化为可落地的商业应用,通过技术架构创新,为行业提供可复用的工程化模板,体现中国团队在AI应用层创新突破能力。
本期智能前线,选择Manus系列分析文章,包括产品分析、性能表现、用户测评、团队介绍等,极客公园、甲子光年、APPSO、数字生命卡兹克、赛博禅心发布,六合商业研选精校,分享给大家,Enjoy!
正文:
全文11,998字
预计阅读24分钟
AI Agent的GPT时刻,Manus炸醒整个AI圈
时间:2025年3月6日
来源:极客公园
字数:4,161
离用户最近,做出最好的AI Agent。
2025年是AI Agent元年,在北京时间3月6日凌晨,得到应验。
DeepSeek之后,又一个科技圈不眠之夜。
有人彻夜蹲守,只为该产品一个使用邀请码,它是Monica.im研发的全球首款AI Agent产品Manus。
团队介绍,Manus是真正自主的AI Agent,能够解决各类复杂多变任务。与传统AI Agent不同,Manus不仅能提供建议或答案,还能直接交付完整任务成果。
Manus介绍视频,只有短短4分钟,威力惊人
正如Manus名字寓意,它在拉丁文里象征着手。知识不仅要在脑子里,还要能用手执行。这正是Agent与AI Bot聊天机器人产品的本质进阶。
Manus牛在哪里?最直观的是看官方网站展示、用户自发展示的使用用例,极客公园部分整理如下:
旅行规划:不仅整合旅行信息,还为用户创建定制旅行手册。
例如,为用户规划日本4月旅行,提供个性化旅行建议与详细手册。
股票分析:进行深入股票分析,设计视觉上吸引人的仪表盘展示全面股票洞察。
例如,对特斯拉股票进行深度分析,创建可视化仪表盘。
教育内容创建:为中学教师创建视频演示材料,解释动量定理等复杂概念,帮助教师更有效地教学。
保险政策比较:创建清晰的保险政策比较表,提供最佳决策建议,帮助用户选择最适合的保险产品。
供应商采购:在整个网络中进行深入研究,找到最适合用户需求的供应商,作为真正公平的代理为用户服务。
财务报告分析:通过研究与数据分析,捕捉市场对特定公司,如亚马逊情绪变化,提供过去4个季度市场情绪分析。
创业公司列表整理:访问相关网站,识别符合条件的公司,整理成表格。
例如,整理YC W25批次的所有B2B公司列表。
在线商店运营分析:分析亚马逊商店销售数据,提供可操作的洞察、详细可视化与定制策略,帮助提升销售业绩。
当Agent通过一长串思维链与工具调用,最终输出无比完整、专业的结果时,用户们开始感叹真的能帮人类做事。
官方网站信息,在GAIA基准测试,评估通用AI Agent解决真实世界问题的能力中,Manus在所有3个难度级别上,都取得新的最先进SOTA表现。
Manus更想做的,是你在数字世界中,字面意义上的代理人,它做到了。
Manus,你的数字代理人
首先,Manus在体验上,与此前LLM最大不同:它强调直接交付最终结果的能力,不只是给出单纯的答案。
Manus目前采用Multiple Agent架构,运行方式与此前Anthropic发布的Computer Use类似,完全运行在独立虚拟机中;可以在虚拟环境中调用各类工具,编写与执行代码、浏览网页、操作应用等,直接交付完整成果。
官方发布的视频中,介绍了3个Manus在实际使用场景中所完成的工作案例:
第一个任务是筛选简历。
15份简历中,为强化学习算法工程师职位,推荐合适的候选人,根据强化学习专业知识对候选人进行排名。
这个演示中,你甚至不需要给压缩文件解压、将简历文件一份份手动上传。
Manus这时已经展现出人类实习生的一面,手动解压缩文件,逐页浏览每一份简历,记录重要信息。
Manus给出的结果中,不仅有自动生成的排名建议,还会根据工作经验等重要维度,将候选人分为不同等级。
在接受到用户更希望以Excel表格方式呈现后,Manus还能自动将这些内容通过现场编写Python脚本方式,生成对应表格。
Manus甚至还能通过记忆能力,在实践过程中,记录下用户更喜欢通过表格方式接受结果这样信息,下次处理类似任务结果时,会优先使用表格形式来呈现。
第二个案例,更为国人量身打造,是遴选房产。
案例中用户希望在纽约购买房产,输入要求是希望有安全的社区环境、低犯罪率,优质的中小学教育资源,包括最重要的预算,足够在每月固定收入情况下负担的起。
这个需求中,Manus AI将复杂任务分解为待办事项列表,包括研究安全社区、识别优质学校、计算预算、搜索房产等,通过网络搜索,仔细阅读有关纽约最安全社区的文章,收集相关信息。
Manus通过编写Python程序,根据用户收入,计算可负担的房产预算。结合房地产网站上相关房价信息,根据预算范围筛选房产列表。
Manus会整合所有收集的信息,撰写详细报告,包括社区安全分析、学校质量评估、预算分析、推荐房产列表、相关资源链接,类似专业的房地产经纪人一样。
Manus自带完全基于用户利益考虑的属性,使用甚至体验更好。
最后一个案例中,Manus展示对股票价格的分析能力。
案例给出的任务,分析过去3年中,英伟达、迈威尔科技、台积电股票价格之间的相关性:这三支股票之间存在紧密关联性,对新手用户,很难快速将因果关系整理清楚。
Manus的操作,与真正的股票经纪人非常相似,它先是通过API访问雅虎金融等信息网站,获取股票历史数据,还会交叉验证数据准确程度,避免被单一信息来源误导,对最终产生结果带来重大影响。
这个案例中,Manus用到编写Python代码、进行数据分析、可视化的能力,还引入金融相关的专业工具进行分析,最终通过数据可视化图表,搭配详尽的综合分析报告方式,向用户反馈因果关系,真的类似金融领域实习生做的日常工作。
不仅如此,Manus官网还展示十多个Manus能够使用的场景:直接使用Manus帮你整理行程、个性化推荐旅游路线,还能让它学习使用各种复杂工具,来流程化的完成日常工作。
这个过程中,真正让Manus展现出与往常工具不同的,是它的自主规划,来确保执行任务的能力。
自主学习能力,让Manus工作能力提升逻辑,更类似真正的人类,即使现阶段,它可能还无法在某一特定领域做到专家级别精通,已经能看到巨大潜力。
随着自主学习能力加入,AI Agent泛用性得到巨大提升,在用户对Manus实际测试中,甚至可以做到直接对它描述一个视频画面中的相关内容,Manus最终能够直接根据对应的息,跨越平台内容对搜索引擎的限制,精准找到某个抖音短视频的链接。
目前版本Manus,完全基于云端异步运行,Manus能力并不被所使用的端侧平台形态或算力等因素限制,用户甚至可以做到在向Manus下达指令之后,暂时关闭电脑,当Manus执行完成活动结果后,会自动通知你结果。
这个操作逻辑非常眼熟,类似一个人下班以后,在微信喊实习生文件整理好发我。只不过,现在,实习生是真的可以7x24小时的响应,不用担心他会整顿职场。
多代理+自查,跑通AI Agent流
上面案例,不难看出Manus真正杀手锏,并非Computer Use中已经出现过AI Agent概念,而是它模拟人类工作方式的能力。
比起运行计算,Manus工作逻辑更类似思考、执行命令。它没有做到哪些人类当前真正无法做到的事,这也是为什么一些已经体验过当前版本Manus的用户,将它形容为实习生。
Manus官网,展示众多Manus能够完成的任务,就有一个案例,展示在B2B业务中,如何使用Manus。快速精准的将货需求,与全球供应商实现精准匹配。
在类似需求的常规产品中,在平台内整合全球供应链企业信息,帮助用户完成供货商/需求方匹配这件事,是业内通行的逻辑。这件事在Manus的案例中,能看到完全不同的实现方式。
Manus AI使用Multiple Agent架构,运行在独立虚拟机中。通过规划代理、执行代理、验证代理的分工协作机制,大幅提升对复杂任务的处理效率,通过并行计算缩短响应时间。
这个架构中,每个代理可能基于独立的语言模型或强化学习模型,彼此通过API或消息队列通信。每个任务都在沙盒中运行,避免干扰其他任务,支持云端扩展。每个独立模型都能模仿人类处理任务的流程,比如先思考与规划,理解复杂指令,拆解为可执行的步骤,再调用合适的工具。
通过Manus这套多代理架构,它更像是由多个助理,通过协助方式,分别完成检索资源、对接、验证信息是否有效等工作,来完成整个工作流程,这不仅像是招了一个实习生,更像是直接当上微缩版的部门主管。
B2B业务案例中,Manus通过网页爬虫、代码编写、执行能力,Manus会自动在互联网检索,根据你自己的需求,对潜在供应商从产品质量、价格、交货能力等方面,为你匹配到最合适的货源。不仅可以将结论以图表方式直观呈现在你眼前,还能对这些数据进一步给出更加详细的操作建议。
至于Monica团队到底如何、用何种技术实现的视频效果,根据消息,团队或将在北京时间3月6日为大家揭晓。
缝合的极致,是炸裂
Manus背后Monica.im,到底是什么公司?
Monica是款All-in-One的AI Agent,产品形态从浏览器插件、慢慢拓展至APP、网页端。主流使用场景是,当用户在浏览器中点开它的小图标,就能直接使用接入的各大主流模型。通过对细分场景用户需求的准确理解,Monica摘到大模型低垂的果实。
创始人肖弘,昵称小红,英文名Red,是位年轻的连续创业者,1992年生,毕业于华中科技大学。2015年,他毕业后创业,早期创业不算顺利,如校园社交、二手集市。2016年,他创业,为微信公众号运营者提供编辑与数据分析工具,获得百万用户、完成盈利,最终产品2020年出售给某独角兽公司。
等到2022年大模型浪潮后,他正式创立Monica,专注海外市场,通过独立开发者产品ChatGPT for Google,产品快速完成冷启动。
2024年,在GPT-4o、Claude 3.5、OpenAI o1系列上线的第一时间,Monica让用户可以获得最新SOTA模型。随着接入模型的新进展,Monica推出专业搜索、DIY Bot、Artifacts写小程序、记忆等功能也受到用户喜爱。
Monica在YouTube、Twitter、GmAIl、The Information等不同功能的网页里,呈现出不同的交互形态与功能,适配特定场景的用户需求,更新数百个网页的个性化AI体验。
2024年,Monica用户数量翻番,达1,000万,保持着可观的盈利,在海外同类产品中,位居头部。
Monica的强劲表现,验证了一件事:套壳到极致,既是TPF、也是PMF,最后都通往用户价值。
Manus或许延续Monica团队思路,肖弘接受媒体人张小珺访谈时表示,产品不能只有聊天机器人一种形态,Agent会是新增的形态、需要新的产品承接。
他从AI编程产品cursor与Devin中获得灵感,极客公园了解,前者主要是copilot模式、后者是autopilot模式,后者更符合人性需求。
Agent应该像Devin一样,面向大众人群、真正由AI主导进行执行。过去问题是,模型不够聪明。
基于模型已有能力做场景的封装服务,或许正是Monica团队优势。
肖弘说,目前Agent产品团队不多,它需要很多复合能力,比如说团队要搞过chatbot、AI编程、浏览器相关都在浏览器上跑、对模型的边界要有不错感知,今天发展到什么水平,接下来会发展到什么样的水平等。
肖弘说,同时拥有这些能力的公司没那么多,有这些能力的公司,可能手头正在干一个很具体的业务,我们恰好有同学刚好有时间一起把这件事情做出来。。
肖弘总结道,为什么是Monica做出来,第一,我觉得我们比较幸运;第二,某种程度上,如果今天大家都做reasoning,可能是不是又多出一些时间给创业公司?模型预计能力外溢还能走多远?
他认为,目前Agent还在早期阶段。一是目前Agent还在规划阶段,还没到物理世界的执行;二是大模型能力还在往上发展,一切不可预料。
我肯定不知道Agent,是可以被用这样的方式设计出来,它是一个未知的事情。
耐人寻味的是,不知道怎么做Agent的Monica,现在做出让整个AI圈感到炸裂的产品。
Manus可能未必是最终的AI Agent,它无疑在DeepSeek爆火之后,再次将人们对AI的期望拉升一个数量级。
Manus背后华人团队:套壳到极致,就是胜利
时间:2025年3月6日
来源:甲子光年
字数:2,364
Manus是什么
Manus团队Hyan,在专注AI领域的在线学习平台与会员社区Superlinear Academy发帖,介绍称:Manus是全球第一款通用Agent产品,可以解决各类复杂多变的任务。
无论你需要深入市场调研、繁琐的文件批量处理、个性化的旅行规划,还是专业数据分析,Manus都能通过独立思考与系统规划,在自己虚拟环境中灵活调用各类工具,编写执行代码、智能浏览网页、操作各类网页应用,直接交付完整的任务成果,而非仅提供建议或答案。
Manus产品演示,已经近乎达到L4级别完全自动化水平,对个人工作流将带来底的生产力革命。
产品尚未公测,还是买家秀,大部分人不能体验。
Manus为什么出圈,除了本身炸裂的产品能力,背后华人团队让很多人惊喜的一点。
Manus背后团队名为Monica.im,创始人弘,连续创业者。
Monica在2023年开发AI浏览器插件助手Monica。更早之前,肖弘开发两款企业微信SaaS工具,微伴助手、壹伴助手,很多媒体与自媒体工作者日常用到的工具。
Monica团队本身不自研大模型,基于业内大模型开发套壳产品,这是他们成功的秘诀之一。很多人把目光聚焦在OpenAI、DeepSeek等基础大模型进展时,Monica团队悄悄从应用层暗渡陈仓。
业内对产品套壳似乎有种鄙视链,Monica团队正在证明:套壳到极致,就是胜利。
从壹伴助手到Manus
肖弘,华中科技大学软件工程专业2015届校友,连续创业者,具备10年以上技术创业经验。在校期间,肖弘加入联创团队,积极参与项目实践,带领团队先后推出志愿填报助手、咩咩、圈子集市等校园创新产品,为创业之路打下基础。
2015年,肖弘毕业后,创立夜莺科技,开发企业微信SaaS工具,微伴助手、壹伴助手,获腾讯等基金与投资机构数亿元投资,服务超200万B端用户,帮助企业触达数亿C端用户。2020年,该产品在出售给某独角兽公司。这一阶段创业经历,验证依附超级平台做垂直工具的商业模式可行性。
2022年,肖弘敏锐洞察到ChatGPT开启AI技术革命,成立蝴蝶效应公司,推出AI浏览器插件Monica,主攻海外市场。
Monica是基于浏览器的插件工具,主打个人日常通用的AI能力all-in-one,是款纯AI范式应用。
Monica集成当前主流大模型,可以与Monica随时随地聊天、翻译、处理文案、作图等。
Monica定位,肖弘认为Monica现在是具有通识能力的AI Agent,通过浏览器插件形式提供功能,可以帮助用户获取、处理与存储信息。未来,Monica将是个性化个人助手。
肖弘战略选择,源于两点判断。一是规避国内竞争,避开与百度、阿里等互联网平台直接交锋,聚焦欧美用户需求;二是技术套壳的价值重构,认为应用类公司比消费电子公司,如苹果,通过整合大模型API创造差异化体验,而非追求底层技术颠覆。
Monica出海战略:国内To B创业较多,出海To C较多。中国创业者做To C的出海能力,已经比5~6年前强很多。比如Monica.im等,都是在非常短时间内,在海外To C领域获得很多用户关注。
2023年,Monica通过收购独立开发者产品ChatGPT for Google,实现用户快速增长。该插件当时已积累300万用户,收购后与Monica形成产品矩阵。此举不仅缩短开发周期,还验证工具全家桶模式的用户需求。
目前,Monica已积累用户数约400万,ChatGPT for Google用户数约300万,总用户突破700万,在AI Chrome插件的产品中,用户范围与体量、功能广度均属于第一梯队。
2024年10月,肖弘在分享时,鼓励创业者专注解决具体技术问题,不是空谈宏大想法,强调在顺利时做出正确抉择的重要性。
2025年3月6日,Monica团队再次出发,发布震撼科技圈的AI Agent 产品Manus。官网介绍,这是比OpenAI Deep Research更强的AI Agent产品。
less structure more intelligence
无论Monica,还是Manus,都是套壳到极致的产品。
作为AI产品层的创业公司,肖弘不追求自研大模型,通过多模型动态调用GPT-4、Claude3、Gemini提升综合能力。
Manus没有透露背后调用的基础大模型名字,应该也是不同大模型搭配使用。
肖弘认为套壳不可怕,关键在于是否能够解决用户问题。他将大模型公司类比为芯片公司,应用公司类似消费电子公司。
芯片公司专注生产更优质、更具性价比的芯片,消费电子公司更注重品牌、渠道、为用户提供差异化的体验。
对消费电子公司,核心任务是为用户创造价值,实现商业闭环。
套壳可以视为整合与优化资源的方式,只要能够满足用户需求,提供良好的用户体验,套壳是成功的产品策略。
肖弘认为,套壳到极致,既是技术产品化TPF,也是产品市场契合PMF,最终都通往用户价值。
Monica团队,通过将大模型能力与用户需求紧密结合,为用户提供高效、便捷的AI服务。
例如,Monica在YouTube、Twitter、Gmail、The Information等不同功能网页里呈现出不同的交互形态与功能,适配特定场景的用户需求。
这种对用户需求的深刻理解与精准满足,使得Monica在海外市场取得显著成功,用户数量翻番,保持可观的盈利。
并非所有人都认同套壳的产品观。在近期上海GDC大会上,MiniMax副总裁刘华在一场论坛上建议,做AI产品不要雕花,底层模型的升级更加重要。
刘华用DeepSeek与MiniMax的Talkie举例,DeepSeek在2周内用户过亿,比ChatGPT的两周还要快,最核心原因是底层模型V3/R1带来的能力质的飞跃。
Talkie在海外用户体量,已经将最大竞争对手Character.ai远远甩开,原因是Character.ai基础模型团队被谷歌收购,MiniMax基于模应一体会有更高效产品迭代。
MiniMax认为基础大模型的能力,要远比AI应用层的产品雕花更接近本质。
套壳与否,只是技术层的理念,肖弘强调,产品核心在于解决用户问题。
Monica团队在开发产品时,始终将用户需求放在首位。他们通过将复杂技术实现封装在云端,为用户呈现简洁直观的操作界面。
例如,Monica让用户无需理解Python依赖管理、API密钥配置等技术细节,就能驱动AI完成复杂任务。这种用技术对抗技术的反直觉设计,极大降低用户使用AI技术门槛,使用户能够更加轻松享受到AI带来的便利。
产品发布之后,Manus团队Hyan在Superlinear Academy介绍Manus产品哲学:
我们坚信、践行less structure more intelligence哲学:当你数据足够优质、模型足够强大、架构足够灵活、工程足够扎实,computer use、deep research、coding agent等概念,就从产品特性,变为自然涌现的能力。
把任务留给Manus,把时间专注在更有创造性的工作,在任务过程中,可实时通过移动端查看任务执行状态,当你回来时,Manus将呈现令人满意的结果。
2025年被称为AI Agent之年,一场影响所有人工作流的AI革命正式拉开。
这个中国AI产品一夜刷屏,全网都在要邀请码,可能是DeepSeek后最大惊喜
时间:2025年3月6日
来源:APPSO
字数:2,737(有删减)
科技圈被Manus产品刷屏,这是全球首款真正意义上通用AI Agent,从官网展示的案例可以看到,它能够独立思考、规划、执行复杂任务,直接交付完整成果。
比起Claude的Computer use等同样能操作多任务,或者能帮点外卖、订酒店的Agent,Manus可以覆盖更多领域与达成更高执行质量。
Manus在权威的GAIA基准测试中创下新纪录,性能远超OpenAI同类产品。
Manus字来自拉丁语,Mens et Manus,是mind and hand,即手脑并用。这也是麻省理工学院的校训,以此鼓励学生将创意落地为实际成果。
创始人肖弘在Manus发布前几个小时,在即刻平台上发文高潮来临,分享莎士比亚一段书摘。
很难现在就判定Manus诞生是AGI里程碑,它很有可能将让Agent智能体时代真的进入高潮时刻。
Manus体验申请链接:https://manus.im/invitation
筛简历、选房炒股,Manus真会干活?
官方宣称,Manus不仅是只会聊天的对话式AI工具,而是真正的自主智能体Agent。当其他AI可能只停留在生成想法的阶段,Manus能够独立思考并采取行动。
官方将其视为人机协作新范式,甚至可能是通向AGI的口。
与Manus同步出圈的,还有一段长达4分钟的演示demo。
这些案例中,Manus完全自主完成从规划到执行的全流程,展示真正的Agent能力,而非简单的助手功能。
比方说,首先从常见的人力资源任务,筛选简历开始。
另一个演示案例中,结合家庭收入情况与孩子的上学要求,让Manus在纽约筛选一个安全、犯罪率低的社区,并购买符合标准的房产。
面对这类复杂任务,Manus有条不紊地将其拆解为多个步骤,创建详细的待办清单。
转场到第3个案例,Manus摇身一变成专业的股票分析师。让其分析英伟达、迈威尔科技,、台积电在过去3年的股票价格之间的相关性,Manus可以通过API访问权威数据源。在验证数据后,它开始编写用于数据分析与可视化的代码。
官方表示,以上展示的内容仅仅是Manus能力的冰山一角。官网https://manus.im/usecases,还分享Manus更多处理现实世界任务的案例。
从个性化旅行规划、深度股票分析、保险政策比较、供应商采购、财务报告分析到专业数据整理等,Manus都能应付自如。
Manus尚未全面开放,热度已席卷全网。各大平台上,网友们纷纷深夜涌入评论区,询问邀请码,火爆程度可见一斑。
用于评估通用AI Agent,在解决现实世界问题方面能力的GAIA基准测试中,Manus在所有3个难度级别上都达到SOTA水平。
为确保结果的可重复性,Manus使用与其正式版本完全一致的配置进行评测。
除了基准测试,Manus还在Upwork与Fiverr等平台解决真实世界的问题,在Kaggle竞赛中证明自己实力。
这一切都离不开优秀的开源社区,官方希望能回馈社区。Manus采用多重签名multisig系统,由多个独立模型驱动。
2025年晚些时候,官方将计划开源一些模型,特别是Manus的推理postering部分。
中国团队、多款爆品、百万用户那么这款震撼业界的产品背后是谁?
Manus AI背后创始人肖弘,是华中科技大学软件工程专业2015届校友。
毕业后,他连续创业,2015年创立夜莺科技,推出壹伴助手与微伴助手,服务超200万B端用户,获腾讯、真格基金等投资。萦绕在肖弘身上的还有一个更鲜明的AI产品,Monica。这是款号称All-in-One的AI Agent,最初以浏览器插件的形式推出。
通过集成主流大模型,如Claude 3.5、DeepSeek等,Monica提供聊天、翻译、文案处理等功能,用户可通过自然语言创建定制化工具,共享至工具广场。
Monica同样早期以海外市场为主,用户规模破百万,成为AI插件领域头部产品。
2025年2月,Monica中文版monica.cn已开启内测,目前免费向国内用户开放。
该版本基于DeepSeekR1与V3模型打造,具备深度推理思考能力,支持记忆功能与实时联网搜索。
Manus技术哲学:less structure more intelligenceManus奉行的技术理念与主流也有些不同,是更少的结构,更多的智能。
他们认为,当数据足够优质、模型足够强大、架构足够灵活、工程足够扎实时,computer use、deep research、coding agent等能力会自然涌现,无需被设计为特定的产品功能。
作为大力出奇迹的代表之一,GPT-4-Turbo在GAIA公开排行榜上的平均成绩不到7%,即使是使用复杂多智能体系统的解决方案也仅达到40%,Manus的表现可以说是遥遥领先。
创始人肖弘在最近与张小珺访谈中,他提前谈到当时还未发布的Agent产品Manus。看上去它应该是chatbot,这是很符合大家想象的,同时在应用侧很复杂,与Monica不一样,光用好不同模型就挺复杂。
肖弘将目前AI应用分为两类:一是填补主要应用产品空档的不足,二是为特定场景提供独特解决方案的应用。
比如Perplexity提供联网搜索功能,与Monica浏览器插件形态都属于此类,它们填补现有产品留下的空白。
模型驱动的新场景这类应用,主要出现在图片与视频领域,直接由模型技术的进步驱动。
像Pika与Runway等产品,利用模型能力,创造新的应用场景。
有用户调侃Manus是极致的套壳是牛逼,肖弘不忌讳让用户知道自己产品用的是别人模型。
早在2024年,他把Monica比作消费电子产品,把ChatGPT的Logo打在官网。
人机交互新时代已来,别急着把Manus捧上AGI神坛
APPSO在2024年初曾作出一个预测:大模型将成为智能手机新的操作系统,自然用户界面NUI(Natural user interface),将逐步替代现有的图形用户界面GUI。
实现这种新交互的重要入口,是Agent。
2024年,我们在很多手机的发布会上都看到类似案例。
vivo发布会展示可以AI订餐的Phone GPT,华为鸿蒙的小艺与意图框架,还是荣耀的YOYO智能体,智谱的AutoGLM,核心都是一样的:让AI模仿人类的Plan-Do-Check-Act计划-执行-检查-行动循环,像人类操作设备。
智谱AI CEO张鹏之前提到,目前Agent能力,更像是在用户与应用之间,增加能的调度层,链接所有应用,甚至是所有设备。
这可以看做是大模型通用操作系统LLM-OS的一种雏形,将对人机交互形式产生极大的影响。
OpenAI创始成员Andrej Karpathy,曾多次谈到大语言模型操作系统LLM OS,他认为大模型某种程度是一种新的计算机与操作系统,可以连接各种软件与硬件,所有模态信息组成的外设,通过函数调用执行各种任务。
传统操作系统中,需要围绕CPU构建一堆外设,比如鼠标与键盘、磁盘存储、缓存空间等。
在LLM OS中,大模型本身是中央处理器。I/O外设不再是鼠标与键盘,LLM可以兼容更多模态的数据输入与输出。
大模型调用的外部工具,将从传统软件升级为智能体工具。跨应用的操作,是非常关键的一环,意味着Agent能实现更加复杂的自主连贯操作,可能走向真正的商业化落地。至于各家互联网公司提供的服务能否打通,可能是未来实现这种交互最大的障碍。
现在很多AI Agent实现代操作的方式,是调用手机的无障碍功能accessibility features的权限,来控制屏幕点击。
Manus的出现,意味着Agent模式下,AI能够理解需求后独立工作,直到任务完成。
这无疑是人机交互领域的一大步,它让我们看到AI从工具向伙伴转变的潜力。
但要说我们已经一只脚迈入了AGI大门,也还为时尚早。肖弘提到,早期Agent更像是功能机,需要不断迭代与完善。
目前Agent仍需依赖模型能力提升,更完善的虚拟环境支持,才能真正胜任各种长尾任务。
如果类比智能驾驶,大概相当于从L2级,升级到L3级辅助驾驶。
Manus在GAIA基准测试中表现出色,并不意味着已具备AGI全部特征。
通往AGI的道路依然漫长,需要解决模型能力、自主学习、任务泛化等多重挑战。
但有了Manus在自主性与通用性上的突破,通往AGI的大航海中,又多了一颗照亮我们的星。
一手体验首款通用Agent产品Manus
时间:2025年3月6日
来源:数字生命卡兹克
字数:1,570(有删减)
新团队突然发了款通用行的项目:Manus,是OpenAI Deep Research与Claude Computer Use的究极集合体,甚至还能自己写代码,直接Coding Agent。
已经超越OpenAI的Deep Research,成为GAIA评分第一。General AI Assistants是面向通用AI Agent能力的基准评测体系,由Meta AI、Hugging Face等研究团队2023年提出。
有一篇非常著名的论文:
里面有466个精心设计的问题。传统的测试一般都是数学AIME或者一些专业知识问答、编程等,GAIA测试,里面很多都是概念简单,需要多步骤解决的实际问题;分为3级别,Lv.1、Lv.2、Lv.3,难度依次递增。
想通过GAIA的测试,一般需要网络检索能力、工具调用能力、编程能力、文件处理能力等。
2023年时,人类一般能达到90%成功率,那时最强AI GPT-4,在第一级才勉强达到15%。
Manus这波,把Deep Research干碎,它之前已经是最强。
即使是没有拿到邀请码的用户,也可以去Manus官网,大概看一下seCase,每一个,都非常的有意思。
如果有了邀请码,正常登录进去以后,是大的界面:
都是一个对话框,Manus能力不太一样,不是那个提出个问题,AI一会就会直接给你回答Chatbot。
而是出问题之后,他会根据问题与要求,拆解任务,进行极度复杂的任务规划与执行。
会在云端自动运行,你可以直接退出去,等运行完,会通知你。
比如之前那篇GAIA论文,我想把PDF变成能拿出去讲的PPT,我把这个要求提给Manus的时候,他会先把我需求拆解。
我是这么说的:1、我希望你写一段Python程序,用OCR把这篇论文的PDF信息提取出来。2、将PDF里面信息总结成PPT大纲。3、按照小米发布会的风格,做一份给普通人科普用的PPT。4、给我PPT的下载文件。
他会开始花一点时间来理解。
右边窗口上,运行一个虚拟机,准备开始执行操作。
在虚拟机开启之后,会第一时间,列一份To Do List。
会开始执行第一个任务,安装python库。完成的项目,会全部在右边预览窗口打x。
他们用了常有趣的交互形式,是实时加进度同步。
右边界面类似PPT一样,不断下一页下一页,让你实时看到,当前这个Manus正在做什么,你能看到它每一点想法,每一个动作,这个掌控感真的太强。
即使要等很久,你看着他在一点一点执行,这个感觉真的很爽。右下角的任务步骤也可以展开,非常直观告诉你,大步骤进行到哪一个阶段。
交互做的极棒,我这个case,只需要等大概几分钟以后,PPT就出来。
信息是没问题的,这美感是欠缺了一点,在信息排版与内容质量上,真的高到爆炸。
这个并不是特别能展示它的能力,我再展示另一个,我曾经试图让所有Agent尝试的例子,帮我整理发票。
我经常要出差,有一堆乱七八糟的发票,需要让公司报销,公司财务制定一个SOP,是发票你不能直接打包给她,这样太乱,需要做成Excel模板,这样她好对账。
是这样的,你知道,我要每个月把我的十几张发票,都处理成表格,真的很麻烦。当我抱着试试看态度,把这个任务交给Manus时,成功了。
最开始,我Prompt超级简单。
简简单单的一句话,他在思考完以后,处理成8步任务。
压压缩包,安装OCR,提取发票,整理成表格等。
我什么也没干,他自己这么跑着。9分钟后,提示我任务完成。
只有一个小地方没填上,其他都是对的。
同样case,我们先看OpenAI Deep Research结果。
质量是不错,很高,对比一下Manus,那可读性实在是有点不堪重负。
Manus直接把任务拆解成8步。
最重要的是,当他们完成时,所输出的内容。当我看到报告,给出的是一个链接的时候,我就猜到,这个事情有点不简单。
这些图标、图表,是可以交互的。
今天QwQ源32B的推理模型,我让Manus随手做千问开源的时间线。在经历30多分钟后,一张时间线的地图出来。
短短几个小时的体验时间,人类真的即将一败涂地。
在Manus的prompt技巧上,我自己试了下,一定要足够清晰,描述越清晰具体,Manus能执行得越精准。
明确说明期望、格式要求、质量标准,可以大幅提升最终交付物的匹配度。
2025年3月6日,我觉得,即使在AI圈,也是值得铭记的日子。
阿里开源QwQ-32B,以如此尺寸在性能上追平DeepSeekR1满血版,另一边,Manus一夜崛起,把Agent工程带上一个新的高度。这两个团队,都属于我们中国。
实测Manus:首个真干活AI,中国造附50个用例+拆解
时间:2025年3月6日
来源:赛博禅心
字数:1,166(有删减)
这个产品是Manus,全球首款通用型Agent,中国制造,昨夜上线,今早发布。
地址是:https://manus.im/
目前还在内测,可在登录后,申请加入内测。
这东西,在GAIA基准测试中,远远甩开OpenAI。
Manus产品名,意思为手,来自拉丁文mens et manus,知行合一。它体现一种理念:知识与智慧必须通过身体力行,才能对世界产生正向影响。这是Manus的追求,为LLM做一双能巧妙调用工具的手,扩展人的能力,让心中的愿景成为现实。
Manus可以让你轻松知道某个话题在Twitter\youtube等社交媒体上的舆论情况。
Manus调研市场上Top20的CRM机构,整理出各自Slogan与品牌故事。
Manus不仅能整合各类信息,为你提供详尽的个性化旅行定制,还能做一个专属你这次旅行的handbook。
Manus通过深入公开资料研究,写Adobe公司传记。Manus可以真正为你关心的主题写一本书,再也不用担心读不到你喜欢的名人或公司传记。
通过上面例子,你会发现Manus与ChatGPT、Claude这类传统聊天机器人有本质区别。
Manus拥有强大的工具调用能力:它不仅能理解需求,还能主动调用浏览器、代码编辑器、数据分析工具等完成复杂任务。它不只是告诉你应该怎么做,而是直接为你把事情做好,将最终成果交付给你。
运行在云端的Manus有自己计算环境:能够独立工作,不需要持续监督。只需提出需求,去处理其他事务,它会在后台自主完成任务。这种委托-交付模式,真正解放你的时间与注意力。
与Manus的协作,更像与人类同事合作,而非使用工具:你可以随时介入调整方向,中途更改需求,Manus会灵活适应。当某次任务完成得特别好,你可以直接告诉它以后都这样做,它会记住你的偏好,不断调整工作方式,成为越来越懂你的伙伴。
Manus特别擅长处理繁琐文件批处理任务,如批量简历整理、文件格式转换、合同财报审核等:
它能进行深度调研分析,从多渠道搜集信息,提供全面、有见解的研究报告。
面对复杂生活决策,Manus可以帮你比较选项、规划旅行,让决策过程变得轻松。
数据分析方面,Manus会自动找到相关数据源,编写代码分析,创建直观的可视化效果。
如果你的需求,同时涉及多个领域,Manus价值会更加凸显。
与Manus协作,也会与ChatGPT略有不同:
清晰表达很重要:需要更为明确对最终成果期望、格式要求与质量标准。
对于复杂任务,采用渐进式方法更有效:先让Manus完成一部分,再根据中间结果调整下一步。这种迭代式协作,常能带来超出预期成果。
要善用Knowledge系统添加你的特定要求:或在Manus完成满意操作后,告诉它记住这种方式,让它在未来工作中应用这些经验。
发现任务执行方向有偏差时,立即介入指导,告诉它试别的方法。Manus会迅速调整策略,避免在错误方向上浪费时间。
目前Manus还在内测,问题不少,包括不仅限于:
在部分需要扫描、过验证的网站,可能会被卡死:尤其是知乎;
在任务执行时,可能会卡在某一环节;
如果任务过长超出上下文,可能会宣告失败。
最后,中国团队在通用智能体赛道上,迈出实质性的第一步。
2025,东方破晓。
六合年度报告全库会员,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
智能时代专题,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
智能时代专题第二季,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
智能时代专题第一季,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
六合商业研选付费专题报告,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
元宇宙专题,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
头号玩家第二季,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
头号玩家第一季,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
智能电动汽车专题,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
相关研报:
国家经济、投资的范式变化:从碳基经济到硅基经济,AI寒武纪大爆发时刻
【智能时代】现象级游戏《黑神话:悟空》的思考,游戏二元属性,文化与科技
【智能时代】自动驾驶:汽车iPhone时刻,中国三大流派演化形成中
诸神之战:美国科技巨头,从春秋五霸进入战国七雄|GBAT 2023 大湾区智能时代产业峰会
人类未来文明三部曲之二:智能时代专题预售开启,奇点临近,未来已来
九宇资本赵宇杰:智能时代思考,认知思维,存在原生、降维、升维三波认知红利
九宇资本赵宇杰:智能时代思考,以史为鉴,科技浪潮,从互联网到AI
九宇资本赵宇杰:智能时代思考,宇宙视角,从碳基生物,到硅基智能体
人类未来文明三部曲之一:元宇宙专题预售开启,59期45万字
九宇资本赵宇杰:1.5万字头号玩家年度思考集,科技创新,无尽前沿
九宇资本赵宇杰:1.5万字智能电动汽车年度思考集,软件定义,重塑一切
【重磅】前沿周报:拥抱科技,洞见未来,70期合集打包送上
【重磅】六合年度报告全库会员正式上线,5年多研究成果系统**付
【智能电动汽车专题预售】百年汽车产业加速变革,智能电动汽车时代大幕开启
【头号玩家第一季预售】:科技巨头探索未来,头号玩家梯队式崛起
【头号玩家第二季预售】:科技创新带来范式转换,拓展无尽新边疆
【首份付费报告+年度会员】直播电商14万字深度报告:万亿级GMV风口下,巨头混战与合纵连横
【重磅】科技体育系列报告合集上线,“科技+体育”深度融合,全方位变革体育运动
【重磅】365家明星公司,近600篇报告,六合君4年多研究成果全景呈现
九宇资本赵宇杰:CES见闻录,开个脑洞,超级科技巨头将接管一切
【万字长文】九宇资本赵宇杰:5G开启新周期,进入在线世界的大航海时代|GBAT 2019 大湾区5G峰会
九宇资本赵宇杰:抓住电子烟这一巨大的趋势红利,抓住产业变革中的变与不变
【IPO观察】第一季:中芯国际、寒武纪、思摩尔、泡泡玛特、安克创新等11家深度研报合集
【IPO观察】第二季:理想、小鹏、贝壳、蚂蚁、Snowflake、Palantir等12家公司深度研报合集
【IPO观察】第三季:Coinbase、Roblox、快手、雾芯科技等12家公司深度研报合集
【重磅】年度观察2019系列合集:历时3个多月,超20万字近500页,复盘过去,展望未来,洞悉变与不变
【珍藏版】六合宝典:300家明星公司全景扫描,历时3年,210万字超5,000页,重磅推荐
九宇资本赵宇杰:对智能电动汽车产业的碎片化思考
九宇资本赵宇杰:九宫格分析法,语数外教育培训领域的道与术
【2023回乡见闻录】90、00后小伙伴们万字记录,生活回归正轨,春节年味更浓
【2022回乡见闻录】20位90、00后2万字,4国13地,全方位展现国内外疫情防疫、春节氛围、发展现状差异
【2021回乡见闻录】22位90后2万字,就地过年与返乡过年碰撞,展现真实、立体、变革的中国
【2020回乡见闻录】20位90后2万字,特殊的春节,时代的集体记忆
【重磅】22位“90后”2万字回乡见闻录,讲述他们眼中的中国县城、乡镇、农村
六合君3周岁生日,TOP 60篇经典研报重磅推荐
下午茶,互联网世界的三国杀
5G助推AR开启新产业周期,AR眼镜开启专用AR终端时代
新商业基础设施持续丰富完善,赋能新品牌、新模式、新产品崛起,打造新型多元生活方式
【重磅】中国新经济龙头,赴港赴美上市报告合辑20篇
知识服务+付费+音频,开启内容生产新的产业级机遇,知识经济10年千亿级市场规模可期
从APP Store畅销榜4年更替,看内容付费崛起
新三板破万思考:新三板日交易量10年100倍?
九宇资本赵宇杰:科技改变消费,让生活更美好|2017 GNEC 新经济新消费峰会
九宇资本赵宇杰:创业时代的时间法则,开发用户平行时间|2016 GNEC 新经济新智能峰会
九宇资本赵宇杰:互联网引领新经济,内容创业连接新生态|2016 GNEC 新经济新营销峰会
请务必阅读免责声明与风险提示
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。
