• 点赞
  • 评论
  • 1

GPT-5.6或将下周问世:从“模型”迈向“可执行Agent”,定价或仅为竞品1/3

华尔街见闻06-21 14:09

OpenAI据报将于本月下旬推出新一代旗舰模型GPT-5.6,市场预期该模型将在编码、Agent工作流及3D生成等核心能力上实现跨越式提升,同时以更低定价直接冲击竞争对手。

6月19日,据科技媒体testingcatalog报道,GPT-5.6系列涵盖mini、标准版及Pro版,最可能的发布窗口为6月22日至28日。

预测市场Polymarket上该窗口的概率一度高达八成,不过X平台上帖文称GPT 5.6因内部问题而推迟,概率仅剩不足三成,合约总交易量已超过100万美元。

据报道,OpenAI首席科学家Jakub Pachocki已在内部向员工表示,GPT-5.6是对GPT-5.5的"有意义的改进(meaningful improvement)"。

此前,OpenAI Codex后端路由日志中已短暂出现"gpt-5.6"标识。部分ChatGPT Pro用户据报已接触到早期隐秘测试版本,并反馈在相同提示词下输出质量有显著提升。

核心能力:从"语言模型"迈向"可执行Agent"

据报道,GPT-5.6在技术层面最受关注的升级,在于其Agent化能力的全面强化。

上下文窗口从100万tokens扩展至约150万tokens,较GPT-5.5提升约43%,有助于处理更长周期的编码任务和多步会话。

与此同时,据报词元效率再度提升10%至15%,意味着相同费用可处理更多工作量。

从泄露测试反馈来看,GPT-5.6已能够实现视觉复刻(将设计稿直接还原为可运行代码)、SVG 3D对象生成(支持浏览器内旋转与缩放)以及Playwright浏览器自动化(真实执行点击、输入、页面跳转等操作)。

三项能力的组合,使其不再仅是一个给出建议的对话工具,具备直接在用户设备上执行操作的能力。

X网友点评称GPT-5.6脑子还是那个脑子,但他已经长出手了,“一个能和你聊天、告诉你该怎么做的人,现在能打开你的浏览器,移动你的鼠标,复制一个设计,生成一个3D图标,保存到桌面上。”

据wavespeed.ai报道,在智能体编码(agentic coding)场景中,GPT-5.6的表现据称已优于Anthropic的Mythos系列,SVG生成能力亦被指超越Claude Fable 5。

此外,此前GPT-5.5版本中存在的部分对齐问题(包括reward hacking)据报也在新版本中得到修复。

定价策略,以价格战扩大市场份额

在商业策略层面,GPT-5.6或将成为OpenAI在定价上对Anthropic发起正面冲击的重要节点。

据媒体报道,GPT-5.6的token价格可能仅为Claude Fable 5的约三分之一,延续OpenAI当前token价格约为Anthropic一半的定价优势。

分析认为,在性能持平乃至领先的前提下,OpenAI通过大幅降价压缩对手的市场空间,加速企业级客户向OpenAI平台迁移。

GPT-5.6的推进,折射出当前头部AI厂商之间愈发激烈的迭代竞争。

据aiweekly.co报道,OpenAI旗舰模型的发布节奏已明显加速,GPT-5.4至GPT-5.5的间隔约为六周,GPT-5.6或延续了这一节奏。

与此同时,Anthropic的Fable 5及Opus系列、Google Gemini等竞品亦在同期保持高频更新,部分社区将6月下旬视为"AI大事件周"。

网友泼冷水:别太期待GPT-5.6,真正的突破要等GPT-6

近日,多名用户反映GPT-5.5出现"降智"现象,猜测OpenAI正在后台测试GPT-5.6。

有用户直接揣测:

我认为他们在测试5.6,这就是Codex现在这么蠢的原因。

用户Hyper-Jason则补充,他认为软件表现异常源于集成问题,"这几乎是他们一贯的历史",同时表达希望GPT-5.6"不像之前的GPT-5模型那么受限"。

X平台中文用户也吐槽 GPT-5.5 的性能下降:

GPT-5.5绝对这两天是降智了……如果你三天内不出GPT-5.6我就不原谅你了。

此外,有Reddit网友提醒外界降低预期。5.6仅为小迭代更新,参数规模不会大幅跃升,真正的模型级别突破需等待GPT-6。Reddit用户写道:

如果版本号是 5.6(也就是一个小版本迭代,不是新版本),那大家就得降低期望值了。Fable 之所以有自己的版本号(而不是 Opus 4.9),是因为它是一个新版本,而不是旧版本的迭代。而 5.6 应该是(或者说是)一个迭代版本,而不是新版本。

Reddit网友则从参数规模角度泼冷水:

Fable大约是6T级模型,5.5是约2T级。5.6预计不会在参数规模上跳跃2-3倍,我们预计GPT-6才会是下一次模型级别跃升。

用户亦持相似立场:

GPT 5.6不是Fable。GPT要达到Fable水平,得等到预训练参数量接近的时候。

免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

举报

评论

empty
暂无评论
 
 
 
 

热议股票

 
 
 
 
 

7x24