社区
首页
集团介绍
社区
资讯
行情
学堂
TigerAI
登录
注册
点赞
2
回复
评论
收藏
编组 21备份 2
分享
矩形
xiufeitian
11-19
怎么跑题了?我看看对比,怎么文章到后面绕其他地方去了???
奥特曼都点赞,谷歌 Gemini 3 Pro 到底强在哪?
谷歌装睡8个月,反手扔出一个王炸Gemini 3 Pro。
奥特曼都点赞,谷歌 Gemini 3 Pro 到底强在哪?
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。
形状备份
2
举报
登录后可参与评论
评论
推荐
最新
暂无评论
热议股票
{"i18n":{"language":"zh_CN"},"data":{"magic":2,"id":501886498263168,"tweetId":"501886498263168","gmtCreate":1763549443881,"gmtModify":1763549446313,"author":{"id":4112422181273870,"idStr":"4112422181273870","authorId":4112422181273870,"authorIdStr":"4112422181273870","name":"xiufeitian","avatar":"https://static.laohu8.com/default-avatar.jpg","vip":1,"userType":1,"introduction":"","boolIsFan":false,"boolIsHead":false,"crmLevel":4,"crmLevelSwitch":0,"individualDisplayBadges":[],"fanSize":0,"starInvestorFlag":false},"themes":[],"images":[],"coverImages":[],"title":"","html":"<html><head></head><body><p>怎么跑题了?我看看对比,怎么文章到后面绕其他地方去了???</p></body></html>","htmlText":"<html><head></head><body><p>怎么跑题了?我看看对比,怎么文章到后面绕其他地方去了???</p></body></html>","text":"怎么跑题了?我看看对比,怎么文章到后面绕其他地方去了???","highlighted":1,"essential":1,"paper":1,"likeSize":2,"commentSize":0,"repostSize":0,"favoriteSize":0,"link":"https://laohu8.com/post/501886498263168","repostId":1120565382,"repostType":2,"repost":{"id":"1120565382","kind":"news","pubTimestamp":1763547861,"share":"https://www.laohu8.com/m/news/1120565382?lang=&edition=full","pubTime":"2025-11-19 18:24","market":"us","language":"zh","title":"奥特曼都点赞,谷歌 Gemini 3 Pro 到底强在哪?","url":"https://stock-news.laohu8.com/highlight/detail?id=1120565382","media":"深潮TechFlow","summary":"谷歌装睡8个月,反手扔出一个王炸Gemini 3 Pro。","content":"<html><head></head><body><p>谷歌装睡8个月,反手扔出一个王炸Gemini 3 Pro。</p><p style=\"text-align: justify;\">谷歌可算是发布Gemini 3 Pro了,很突然,而且很“低调”。</p><p style=\"text-align: justify;\">虽然谷歌在Gemini 3 Pro之前发布了图片编辑模型Nano Banana,进而刷了一波存在感。但是在基座模型方面,谷歌已经静默太久。</p><p style=\"text-align: justify;\">过去这大半年,大家都在热议OpenAI的新动作,或者感叹Claude在代码领域的统治力,唯独没有人提及8个月没有版本号升级的Gemini。</p><p style=\"text-align: justify;\">纵使谷歌的云业务和财报再漂亮,可在AI开发者的核心圈子里,谷歌的存在感仍然被一点点的稀释。</p><p style=\"text-align: justify;\">好在的是,小榜在第一时间体验过后发现,Gemini 3 Pro并没有让我们失望。</p><p style=\"text-align: justify;\">但现在还不能过早下结论。因为现在的AI赛道早就已经过了靠参数量吓人的阶段,大家都在卷应用、卷落地、卷成本。</p><p style=\"text-align: justify;\">谷歌能不能适应新版本和新环境,还是个未知数。</p><p class=\"t-img-caption\"><img src=\"https://community-static.tradeup.com/news/454a6098332a31ca8cec0bf2780cc077\" tg-width=\"828\" tg-height=\"458\"/></p><h2 id=\"id_3259727994\" style=\"text-align: justify;\">01</h2><p style=\"text-align: justify;\">我让Gemini 3 Pro用一句话来形容自己,它是这么回答我的。</p><p style=\"text-align: justify;\">“不再急于向世界证明自己有多聪明,而是开始琢磨如何让自己变得更有用。”——Gemini 3 Pro</p><p style=\"text-align: justify;\">在LMArena排行榜上,Gemini 3 Pro以1501的Elo分数登顶,这是AI模型在综合能力评估中的新纪录。这是一个相当优秀的成绩,就连奥特曼也发推表示祝贺。</p><p class=\"t-img-caption\"><img src=\"https://community-static.tradeup.com/news/2eea6899b9519a59b84489f18ff2f474\" tg-width=\"828\" tg-height=\"119\"/></p><p style=\"text-align: justify;\">数学能力测试中,该模型在AIME2025(美国数学邀请赛)的代码执行模式下达到了100%的准确率。在GPQADiamond科学知识测试中,Gemini 3 Pro的准确率为91.9%。</p><p style=\"text-align: justify;\">MathArenaApex数学竞赛的测试结果显示,Gemini 3 Pro获得了23.4%的得分,而其他主流模型的得分普遍在2%以下。此外,在名为Humanity'sLastExam的测试中,该模型在不使用工具的情况下达到了37.5%的得分。</p><p style=\"text-align: justify;\">Google在此次更新中引入了名为“vibecoding”的代码生成功能。这项功能允许用户通过自然语言描述需求,系统随后生成相应的代码和应用程序。</p><p style=\"text-align: justify;\">在Canvas编程环境的测试中,用户描述“制作一个可以调节转速的电风扇”后,系统在约30秒内生成了包含旋转动画、速度控制滑块和开关按钮的完整代码。</p><p class=\"t-img-caption\"><img src=\"https://community-static.tradeup.com/news/fa98491171e9574d94a7661c682c125f\" tg-width=\"828\" tg-height=\"558\"/></p><p style=\"text-align: justify;\">官方展示的案例还包括核聚变过程的可视化模拟。</p><p style=\"text-align: justify;\">在交互方式上,Gemini 3 Pro增加了“生成式界面”(GenerativeUI)功能。与传统AI助手只返回文本回答不同,该系统可以根据查询内容自动生成定制化的界面布局。</p><p style=\"text-align: justify;\">例如,当用户询问量子计算相关问题时,系统可能生成包含概念解释、动态图表和相关论文链接的交互式界面。</p><p style=\"text-align: justify;\">针对不同受众的同一问题,系统会生成不同的界面设计,举个简单例子,向儿童和成人解释同一概念时,会采用不同的呈现方式。儿童的就会偏可爱,成人则会偏简洁明了。</p><p style=\"text-align: justify;\">Google Labs中提供的Visual Layout实验功能展示了这种界面的应用,用户可以获得杂志风格的视图布局,包含图片、模块和可调节的UI元素。</p><p style=\"text-align: justify;\">此次发布还包含了名为Gemini Agent的智能体系统,目前处于实验阶段。该系统可以执行多步骤任务,并连接到Gmail、Google Calendar和Reminders等谷歌服务。</p><p style=\"text-align: justify;\">在收件箱管理场景中,系统可以自动筛选邮件、标记优先级和起草回复。旅行规划是另一个应用场景,用户只需提供目的地和大致时间,系统会查询日历、搜索航班和酒店选项,并添加行程安排。而这项功能目前仅向美国地区的Google AI Ultra订阅用户开放。</p><p style=\"text-align: justify;\">在多模态处理方面,Gemini 3 Pro基于稀疏混合专家架构构建,支持文本、图像、音频和视频输入。模型的上下文窗口为100万token,意味着可以处理较长的文档或视频内容。</p><p style=\"text-align: justify;\">加拿大劳瑞尔大学历史学教授Mark Humphries的测试显示,该模型在识别18世纪手写文稿时的字符错误率为0.56%,相比前代版本降低了50%到70%。</p><p style=\"text-align: justify;\">Google表示,训练数据包括公开网络文档、代码、图像、音频和视频内容,后训练阶段使用了强化学习技术。</p><p style=\"text-align: justify;\">Google还推出了名为Gemini 3 Deep Think的优化版本,专门用于复杂推理任务。该模式目前正在进行安全评估,计划在未来几周向Google AI Ultra订阅者开放。</p><p style=\"text-align: justify;\">在Google Search的AI模式中,用户可以点击“thinking”选项卡查看该模式的推理过程。与标准模式相比,Deep Think模式会在生成回答前进行更多步骤的分析。</p><p style=\"text-align: justify;\">除了官方提供的资料外,我还将Gemini 3 Pro和ChatGPT-5.1进行了对比。</p><p style=\"text-align: justify;\">第一个对比就是生成图片。</p><p style=\"text-align: justify;\">提示词:给我生成一张iPhone17</p><p style=\"text-align: justify;\">ChatGPT-5.1</p><p class=\"t-img-caption\"><img src=\"https://community-static.tradeup.com/news/b6388d072d5b2bb5fadd9eab72806173\" tg-width=\"828\" tg-height=\"828\"/></p><p style=\"text-align: justify;\">Gemini 3 Pro</p><p class=\"t-img-caption\"><img src=\"https://community-static.tradeup.com/news/d9f5d79a862d8df358e33b5b02b5b2df\" tg-width=\"828\" tg-height=\"828\"/></p><p style=\"text-align: justify;\">主观上来讲,ChatGPT-5.1更符合我的需求,因此这回合是ChatGPT-5.1胜出。</p><p style=\"text-align: justify;\">第二个对比的就是两者的智能体水平。</p><p style=\"text-align: justify;\">提示词:去给我研究研究字母榜这个微信公众号,然后评论一下这个号的水平</p><p style=\"text-align: justify;\">GPT-5.1</p><p class=\"t-img-caption\"><img src=\"https://community-static.tradeup.com/news/36c2475e130600eeefc54da7da26676d\" tg-width=\"828\" tg-height=\"306\"/></p><p style=\"text-align: justify;\">Gemini 3 Pro</p><p class=\"t-img-caption\"><img src=\"https://community-static.tradeup.com/news/e68a680dbeee5ed98fb24209b32be2ee\" tg-width=\"828\" tg-height=\"180\"/></p><p style=\"text-align: justify;\">虽然从主观上来讲,我更喜欢Gemini 3 Pro的解读,但是太过于鼓吹,ChatGPT-5.1能发现小榜还有所不足,更客观真实。</p><p style=\"text-align: justify;\">最后是代码能力,也是目前所有大模型最关注的一块。</p><p style=\"text-align: justify;\">我选的项目是GitHub上最近星数非常高的项目,叫做LightRAG。这是通过整合图结构来增强上下文感知和高效信息检索,从而改进检索增强生成,实现了更高的准确性和更快的响应时间。项目地址https://github.com/HKUDS/LightRAG</p><p style=\"text-align: justify;\">提示词:跟我说说这个项目如何</p><p style=\"text-align: justify;\">GPT-5.1</p><p class=\"t-img-caption\"><img src=\"https://community-static.tradeup.com/news/85204283658075b1b6765ba8819a782a\" tg-width=\"828\" tg-height=\"96\"/></p><p style=\"text-align: justify;\">Gemini 3 Pro</p><p class=\"t-img-caption\"><img src=\"https://community-static.tradeup.com/news/fbe478068a1c49d85aa9e3684ec7ff18\" tg-width=\"828\" tg-height=\"173\"/></p><p style=\"text-align: justify;\">同时,Gemini 3 Pro也获得了业内人士的高度评价。</p><p class=\"t-img-caption\"><img src=\"https://community-static.tradeup.com/news/fba682bf759f94db04f15a254b8fd677\" tg-width=\"828\" tg-height=\"684\"/></p><p class=\"t-img-caption\"><img src=\"https://community-static.tradeup.com/news/06da99b0e0d95bf61159f311246ffd1c\" tg-width=\"828\" tg-height=\"428\"/></p><p class=\"t-img-caption\"><img src=\"https://community-static.tradeup.com/news/469f3cc902a6693407b9f22b984f0cc6\" tg-width=\"828\" tg-height=\"311\"/></p><h2 id=\"id_1846899731\" style=\"text-align: justify;\">02</h2><p style=\"text-align: justify;\">虽然Gemini 3 Pro发布的非常低调,但实际上谷歌已经为Gemini 3 Pro预热了很久。</p><p style=\"text-align: justify;\">在谷歌第三季度财报电话会上,谷歌CEO皮查伊说了这么一句话:“Gemini 3 Pro将在2025年内发布。”没有具体日期,没有更多细节,却拉开了科技行业一场营销大戏的序幕。</p><p style=\"text-align: justify;\">谷歌不断释放信号,让整个AI社区保持高度关注,却始终拒绝给出任何确定的发布时间表。</p><p style=\"text-align: justify;\">从10月开始,各种“意外泄露”接踵而至。10月23日开始流传一份日历,在其11月12日“Gemini 3 Pro Release”的内部日历截图疯传。</p><p class=\"t-img-caption\"><img src=\"https://community-static.tradeup.com/news/9ac93161457f9ea7a000ab772001eee2\" tg-width=\"828\" tg-height=\"671\"/></p><p style=\"text-align: justify;\">而且眼尖的开发者还在Vertex AI的API文档中发现了“gemini-3-pro-preview-11-2025”的字样。</p><p class=\"t-img-caption\"><img src=\"https://community-static.tradeup.com/news/7af23cfc720e03e0907193598be2374a\" tg-width=\"720\" tg-height=\"513\"/></p><p style=\"text-align: justify;\">紧接着,Reddit 和 X上开始出现各种截图。有用户声称在 Gemini Canvas 工具中看到了新模型的身影,有人在移动应用的某些版本中发现了异常的模型标识。</p><p style=\"text-align: justify;\">然后就是,下面这张测试数据开始在社交媒体流传。</p><p class=\"t-img-caption\"><img src=\"https://community-static.tradeup.com/news/b1622f8404efc5023344f3b5467c0b53\" tg-width=\"828\" tg-height=\"888\"/></p><p style=\"text-align: justify;\">这些“泄露”看似偶然,实则构成了一场精心编排的预热。</p><p style=\"text-align: justify;\">每一次泄露都恰到好处地展示了Gemini 3 Pro 的某项核心能力,每一次讨论都将期待值推向新的高度。而 谷歌官方账号的态度则耐人寻味,他们会转发社区的讨论,会用“即将到来”这样的措辞吊胃口,甚至谷歌AI实验室的高层,还在关于发布日期预测的推文下回复了两个“思考”表情符号,但就是不肯说出一个准确日期。</p><p style=\"text-align: justify;\">预热了将近1个月,谷歌终于将新鲜的Gemini 3 Pro端了上来。然而Gemini 3 Pro性能虽然强劲,但是谷歌的更新频率多少让人有点着急。</p><p style=\"text-align: justify;\">早在今年3月份的时候,谷歌就发布了Gemini 2.5 Pro的预览版本,后续又陆续推出了Gemini 2.5 Flash预览版等衍生预览版本。直至Gemini 3 Pro问世,Gemini系列在此期间无任何版本号升级。</p><p style=\"text-align: justify;\">可谷歌的对手们并不会等待Gemini。</p><p style=\"text-align: justify;\">OpenAI在8月7日推出了GPT-5,并在11月12日进一步升级到 GPT-5.1。而且这段时间里,OpenAI还推出了自己的AI浏览器Atlas,直指谷歌腹地。</p><p style=\"text-align: justify;\">Anthropic 的迭代速度更为密集:2月24日发布 Claude 3.7 Sonnet(首个混合推理模型),5月22日推出 Claude Opus 4 和 Sonnet 4,8月5日发布 Claude Opus 4.1,9月29日推出 Claude Sonnet 4.5,10月15日又发布了 Claude Haiku 4.5。</p><p style=\"text-align: justify;\">这一系列攻势打得谷歌有些措手不及,不过目前来看,谷歌顶住了。</p><p class=\"t-img-caption\"><img src=\"https://community-static.tradeup.com/news/8e3e25ef39ce379478b59a03f7f04e9f\" tg-width=\"828\" tg-height=\"584\"/></p><h2 id=\"id_3225548503\" style=\"text-align: justify;\">03</h2><p style=\"text-align: justify;\">谷歌之所以耗时8个月才更新Gemini 3 Pro,最大的原因可能来自于人员上的变更。</p><p style=\"text-align: justify;\">2025年7月至8月前后,微软对谷歌发起了一波猛烈的人才攻势,成功招募了超过20名DeepMind的核心专家和高管。</p><p style=\"text-align: justify;\">这其中就包括DeepMind高级产品总监(Senior Director of Product)戴夫·希创(Dave Citron),负责其核心AI产品的落地。以及Gemini的工程副总裁 (VP of Engineering)阿玛尔·苏布拉马尼亚(Amar Subramanya),他是 Google最重要模型Gemini的核心工程负责人之一。</p><p style=\"text-align: justify;\">另外一方面,谷歌Nano Banana团队曾表示,谷歌在发布Gemini 2.5 Pro后很长一段时间里,都在纠结AI生图领域,进而放缓了基座模型的更新。</p><p style=\"text-align: justify;\">谷歌认为,只有攻克了角色一致性 (Character Consistency)、语境编辑(In-context Editing)、文字乱码(Text Rendering)这三个生成图片领域的难关后,才能让基座模型的表现更好。</p><p style=\"text-align: justify;\">Nano Banana团队表示,模型不仅能“画得好看”,更重要的是能“听懂人话”并“受人控制”,从而让 AI 生图真正进入商业落地阶段。</p><p style=\"text-align: justify;\">这时回头来看Gemini 3 Pro,它是一份合格的答卷,但在这个只争朝夕的 AI 战场,及格早已不够。</p><p style=\"text-align: justify;\">谷歌既然选择了在此时此刻交卷,就必须准备好面对最苛刻的阅卷人,那些已经被竞品“喂刁”了口味的用户和开发者。接下来的几个月,将不是模型参数的比拼,而是生态整合能力的肉搏。谷歌这头大象不仅要学会跳舞,还得跳得比所有人都快。</p></body></html>","source":"lsy1592805329705","collect":0,"html":"<!DOCTYPE html>\n<html>\n<head>\n<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />\n<meta name=\"viewport\" content=\"width=device-width,initial-scale=1.0,minimum-scale=1.0,maximum-scale=1.0,user-scalable=no\"/>\n<meta name=\"format-detection\" content=\"telephone=no,email=no,address=no\" />\n<title>奥特曼都点赞,谷歌 Gemini 3 Pro 到底强在哪?</title>\n<style type=\"text/css\">\na,abbr,acronym,address,applet,article,aside,audio,b,big,blockquote,body,canvas,caption,center,cite,code,dd,del,details,dfn,div,dl,dt,\nem,embed,fieldset,figcaption,figure,footer,form,h1,h2,h3,h4,h5,h6,header,hgroup,html,i,iframe,img,ins,kbd,label,legend,li,mark,menu,nav,\nobject,ol,output,p,pre,q,ruby,s,samp,section,small,span,strike,strong,sub,summary,sup,table,tbody,td,tfoot,th,thead,time,tr,tt,u,ul,var,video{ font:inherit;margin:0;padding:0;vertical-align:baseline;border:0 }\nbody{ font-size:16px; line-height:1.5; color:#999; background:transparent; }\n.wrapper{ overflow:hidden;word-break:break-all;padding:10px; }\nh1,h2{ font-weight:normal; line-height:1.35; margin-bottom:.6em; }\nh3,h4,h5,h6{ line-height:1.35; margin-bottom:1em; }\nh1{ font-size:24px; }\nh2{ font-size:20px; }\nh3{ font-size:18px; }\nh4{ font-size:16px; }\nh5{ font-size:14px; }\nh6{ font-size:12px; }\np,ul,ol,blockquote,dl,table{ margin:1.2em 0; }\nul,ol{ margin-left:2em; }\nul{ list-style:disc; }\nol{ list-style:decimal; }\nli,li p{ margin:10px 0;}\nimg{ max-width:100%;display:block;margin:0 auto 1em; }\nblockquote{ color:#B5B2B1; border-left:3px solid #aaa; padding:1em; }\nstrong,b{font-weight:bold;}\nem,i{font-style:italic;}\ntable{ width:100%;border-collapse:collapse;border-spacing:1px;margin:1em 0;font-size:.9em; }\nth,td{ padding:5px;text-align:left;border:1px solid #aaa; }\nth{ font-weight:bold;background:#5d5d5d; }\n.symbol-link{font-weight:bold;}\n/* header{ border-bottom:1px solid #494756; } */\n.title{ margin:0 0 8px;line-height:1.3;color:#ddd; }\n.meta {color:#5e5c6d;font-size:13px;margin:0 0 .5em; }\na{text-decoration:none; color:#2a4b87;}\n.meta .head { display: inline-block; overflow: hidden}\n.head .h-thumb { width: 30px; height: 30px; margin: 0; padding: 0; border-radius: 50%; float: left;}\n.head .h-content { margin: 0; padding: 0 0 0 9px; float: left;}\n.head .h-name {font-size: 13px; color: #eee; margin: 0;}\n.head .h-time {font-size: 11px; color: #7E829C; margin: 0;line-height: 11px;}\n.small {font-size: 12.5px; display: inline-block; transform: scale(0.9); -webkit-transform: scale(0.9); transform-origin: left; -webkit-transform-origin: left;}\n.smaller {font-size: 12.5px; display: inline-block; transform: scale(0.8); -webkit-transform: scale(0.8); transform-origin: left; -webkit-transform-origin: left;}\n.bt-text {font-size: 12px;margin: 1.5em 0 0 0}\n.bt-text p {margin: 0}\n</style>\n</head>\n<body>\n<div class=\"wrapper\">\n<header>\n<h2 class=\"title\">\n奥特曼都点赞,谷歌 Gemini 3 Pro 到底强在哪?\n</h2>\n\n<h4 class=\"meta\">\n\n\n2025-11-19 18:24 北京时间 <a href=https://www.techflowpost.com/article/detail_29163.html><strong>深潮TechFlow</strong></a>\n\n\n</h4>\n\n</header>\n<article>\n<div>\n<p>谷歌装睡8个月,反手扔出一个王炸Gemini 3 Pro。谷歌可算是发布Gemini 3 Pro了,很突然,而且很“低调”。虽然谷歌在Gemini 3 Pro之前发布了图片编辑模型Nano Banana,进而刷了一波存在感。但是在基座模型方面,谷歌已经静默太久。过去这大半年,大家都在热议OpenAI的新动作,或者感叹Claude在代码领域的统治力,唯独没有人提及8个月没有版本号升级的Gemini。...</p>\n\n<a href=\"https://www.techflowpost.com/article/detail_29163.html\">Web Link</a>\n\n</div>\n\n\n</article>\n</div>\n</body>\n</html>\n","type":0,"thumbnail":"https://static.tigerbbs.com/6d25e1a14780c2d1e6ec5ecf96395d05","relate_stocks":{"GOOGL":"谷歌A","GOOG":"谷歌"},"source_url":"https://www.techflowpost.com/article/detail_29163.html","is_english":false,"share_image_url":"https://static.laohu8.com/e9f99090a1c2ed51c021029395664489","article_id":"1120565382","content_text":"谷歌装睡8个月,反手扔出一个王炸Gemini 3 Pro。谷歌可算是发布Gemini 3 Pro了,很突然,而且很“低调”。虽然谷歌在Gemini 3 Pro之前发布了图片编辑模型Nano Banana,进而刷了一波存在感。但是在基座模型方面,谷歌已经静默太久。过去这大半年,大家都在热议OpenAI的新动作,或者感叹Claude在代码领域的统治力,唯独没有人提及8个月没有版本号升级的Gemini。纵使谷歌的云业务和财报再漂亮,可在AI开发者的核心圈子里,谷歌的存在感仍然被一点点的稀释。好在的是,小榜在第一时间体验过后发现,Gemini 3 Pro并没有让我们失望。但现在还不能过早下结论。因为现在的AI赛道早就已经过了靠参数量吓人的阶段,大家都在卷应用、卷落地、卷成本。谷歌能不能适应新版本和新环境,还是个未知数。01我让Gemini 3 Pro用一句话来形容自己,它是这么回答我的。“不再急于向世界证明自己有多聪明,而是开始琢磨如何让自己变得更有用。”——Gemini 3 Pro在LMArena排行榜上,Gemini 3 Pro以1501的Elo分数登顶,这是AI模型在综合能力评估中的新纪录。这是一个相当优秀的成绩,就连奥特曼也发推表示祝贺。数学能力测试中,该模型在AIME2025(美国数学邀请赛)的代码执行模式下达到了100%的准确率。在GPQADiamond科学知识测试中,Gemini 3 Pro的准确率为91.9%。MathArenaApex数学竞赛的测试结果显示,Gemini 3 Pro获得了23.4%的得分,而其他主流模型的得分普遍在2%以下。此外,在名为Humanity'sLastExam的测试中,该模型在不使用工具的情况下达到了37.5%的得分。Google在此次更新中引入了名为“vibecoding”的代码生成功能。这项功能允许用户通过自然语言描述需求,系统随后生成相应的代码和应用程序。在Canvas编程环境的测试中,用户描述“制作一个可以调节转速的电风扇”后,系统在约30秒内生成了包含旋转动画、速度控制滑块和开关按钮的完整代码。官方展示的案例还包括核聚变过程的可视化模拟。在交互方式上,Gemini 3 Pro增加了“生成式界面”(GenerativeUI)功能。与传统AI助手只返回文本回答不同,该系统可以根据查询内容自动生成定制化的界面布局。例如,当用户询问量子计算相关问题时,系统可能生成包含概念解释、动态图表和相关论文链接的交互式界面。针对不同受众的同一问题,系统会生成不同的界面设计,举个简单例子,向儿童和成人解释同一概念时,会采用不同的呈现方式。儿童的就会偏可爱,成人则会偏简洁明了。Google Labs中提供的Visual Layout实验功能展示了这种界面的应用,用户可以获得杂志风格的视图布局,包含图片、模块和可调节的UI元素。此次发布还包含了名为Gemini Agent的智能体系统,目前处于实验阶段。该系统可以执行多步骤任务,并连接到Gmail、Google Calendar和Reminders等谷歌服务。在收件箱管理场景中,系统可以自动筛选邮件、标记优先级和起草回复。旅行规划是另一个应用场景,用户只需提供目的地和大致时间,系统会查询日历、搜索航班和酒店选项,并添加行程安排。而这项功能目前仅向美国地区的Google AI Ultra订阅用户开放。在多模态处理方面,Gemini 3 Pro基于稀疏混合专家架构构建,支持文本、图像、音频和视频输入。模型的上下文窗口为100万token,意味着可以处理较长的文档或视频内容。加拿大劳瑞尔大学历史学教授Mark Humphries的测试显示,该模型在识别18世纪手写文稿时的字符错误率为0.56%,相比前代版本降低了50%到70%。Google表示,训练数据包括公开网络文档、代码、图像、音频和视频内容,后训练阶段使用了强化学习技术。Google还推出了名为Gemini 3 Deep Think的优化版本,专门用于复杂推理任务。该模式目前正在进行安全评估,计划在未来几周向Google AI Ultra订阅者开放。在Google Search的AI模式中,用户可以点击“thinking”选项卡查看该模式的推理过程。与标准模式相比,Deep Think模式会在生成回答前进行更多步骤的分析。除了官方提供的资料外,我还将Gemini 3 Pro和ChatGPT-5.1进行了对比。第一个对比就是生成图片。提示词:给我生成一张iPhone17ChatGPT-5.1Gemini 3 Pro主观上来讲,ChatGPT-5.1更符合我的需求,因此这回合是ChatGPT-5.1胜出。第二个对比的就是两者的智能体水平。提示词:去给我研究研究字母榜这个微信公众号,然后评论一下这个号的水平GPT-5.1Gemini 3 Pro虽然从主观上来讲,我更喜欢Gemini 3 Pro的解读,但是太过于鼓吹,ChatGPT-5.1能发现小榜还有所不足,更客观真实。最后是代码能力,也是目前所有大模型最关注的一块。我选的项目是GitHub上最近星数非常高的项目,叫做LightRAG。这是通过整合图结构来增强上下文感知和高效信息检索,从而改进检索增强生成,实现了更高的准确性和更快的响应时间。项目地址https://github.com/HKUDS/LightRAG提示词:跟我说说这个项目如何GPT-5.1Gemini 3 Pro同时,Gemini 3 Pro也获得了业内人士的高度评价。02虽然Gemini 3 Pro发布的非常低调,但实际上谷歌已经为Gemini 3 Pro预热了很久。在谷歌第三季度财报电话会上,谷歌CEO皮查伊说了这么一句话:“Gemini 3 Pro将在2025年内发布。”没有具体日期,没有更多细节,却拉开了科技行业一场营销大戏的序幕。谷歌不断释放信号,让整个AI社区保持高度关注,却始终拒绝给出任何确定的发布时间表。从10月开始,各种“意外泄露”接踵而至。10月23日开始流传一份日历,在其11月12日“Gemini 3 Pro Release”的内部日历截图疯传。而且眼尖的开发者还在Vertex AI的API文档中发现了“gemini-3-pro-preview-11-2025”的字样。紧接着,Reddit 和 X上开始出现各种截图。有用户声称在 Gemini Canvas 工具中看到了新模型的身影,有人在移动应用的某些版本中发现了异常的模型标识。然后就是,下面这张测试数据开始在社交媒体流传。这些“泄露”看似偶然,实则构成了一场精心编排的预热。每一次泄露都恰到好处地展示了Gemini 3 Pro 的某项核心能力,每一次讨论都将期待值推向新的高度。而 谷歌官方账号的态度则耐人寻味,他们会转发社区的讨论,会用“即将到来”这样的措辞吊胃口,甚至谷歌AI实验室的高层,还在关于发布日期预测的推文下回复了两个“思考”表情符号,但就是不肯说出一个准确日期。预热了将近1个月,谷歌终于将新鲜的Gemini 3 Pro端了上来。然而Gemini 3 Pro性能虽然强劲,但是谷歌的更新频率多少让人有点着急。早在今年3月份的时候,谷歌就发布了Gemini 2.5 Pro的预览版本,后续又陆续推出了Gemini 2.5 Flash预览版等衍生预览版本。直至Gemini 3 Pro问世,Gemini系列在此期间无任何版本号升级。可谷歌的对手们并不会等待Gemini。OpenAI在8月7日推出了GPT-5,并在11月12日进一步升级到 GPT-5.1。而且这段时间里,OpenAI还推出了自己的AI浏览器Atlas,直指谷歌腹地。Anthropic 的迭代速度更为密集:2月24日发布 Claude 3.7 Sonnet(首个混合推理模型),5月22日推出 Claude Opus 4 和 Sonnet 4,8月5日发布 Claude Opus 4.1,9月29日推出 Claude Sonnet 4.5,10月15日又发布了 Claude Haiku 4.5。这一系列攻势打得谷歌有些措手不及,不过目前来看,谷歌顶住了。03谷歌之所以耗时8个月才更新Gemini 3 Pro,最大的原因可能来自于人员上的变更。2025年7月至8月前后,微软对谷歌发起了一波猛烈的人才攻势,成功招募了超过20名DeepMind的核心专家和高管。这其中就包括DeepMind高级产品总监(Senior Director of Product)戴夫·希创(Dave Citron),负责其核心AI产品的落地。以及Gemini的工程副总裁 (VP of Engineering)阿玛尔·苏布拉马尼亚(Amar Subramanya),他是 Google最重要模型Gemini的核心工程负责人之一。另外一方面,谷歌Nano Banana团队曾表示,谷歌在发布Gemini 2.5 Pro后很长一段时间里,都在纠结AI生图领域,进而放缓了基座模型的更新。谷歌认为,只有攻克了角色一致性 (Character Consistency)、语境编辑(In-context Editing)、文字乱码(Text Rendering)这三个生成图片领域的难关后,才能让基座模型的表现更好。Nano Banana团队表示,模型不仅能“画得好看”,更重要的是能“听懂人话”并“受人控制”,从而让 AI 生图真正进入商业落地阶段。这时回头来看Gemini 3 Pro,它是一份合格的答卷,但在这个只争朝夕的 AI 战场,及格早已不够。谷歌既然选择了在此时此刻交卷,就必须准备好面对最苛刻的阅卷人,那些已经被竞品“喂刁”了口味的用户和开发者。接下来的几个月,将不是模型参数的比拼,而是生态整合能力的肉搏。谷歌这头大象不仅要学会跳舞,还得跳得比所有人都快。","news_type":1,"symbols_score_info":{"GOOG":2.1,"GOOGL":2.1}},"isVote":1,"tweetType":1,"viewCount":145,"commentLimit":10,"likeStatus":false,"favoriteStatus":false,"reportStatus":false,"symbols":[],"verified":2,"subType":0,"readableState":1,"langContent":"CN","currentLanguage":"CN","warmUpFlag":false,"orderFlag":false,"shareable":true,"causeOfNotShareable":"","featuresForAnalytics":[],"commentAndTweetFlag":false,"andRepostAutoSelectedFlag":false,"upFlag":false,"length":53,"optionInvolvedFlag":false,"xxTargetLangEnum":"ZH_CN"},"commentList":[],"hasMoreComment":false,"orderType":2}