热点 | OpenAI:2024年第四季度投后季度报告
作者 | Wendy
设计 | 马田田
Z Research Factory观点
2024年第四季度OpenAI举行了12天的发布会,发布了新一代推理模型o3系列,预计将在2025年1月正式上线。该系列模型较上一代o1系列在解决问题、编程、研究分析前沿科学课题的能力上实现了较大突破。正式上线了此前发布的o1模型正式版、Sora、Canvas、高级视频语音等功能。财务方面,OpenAI完成新一轮66亿+15亿美元的融资及提升40亿美元的循环信贷额度,可使用流动资金超100亿美元。此外,OpenAI聘请Caitlin担任硬件开发负责人,重启人形机器人项目,并于博通和台积电合作开发驱动人形机器人所需的推理处理器及AI芯片。
PART.1
OpenAI发布新一代推理模型OpenAI o3
12月6日,OpenAI发布新一代推理模型o3,o3是2024年9月发布的o1模型系列的升级版本,拥有o3和o3mini两个版本。在某些条件下,o3可以接近实现AGI,也就是完成一切人类可以完成的任务。o3系列模型在使用场景和学习输出效率上较o1系列有较大提升。
OpenAI o3较OpenAI o1的提升:
打破ARC-AGI分数记录:在通过图形逻辑推理来测试模型解决问题能力的ARC-AGI测试中,o3在低计算场景中得分75.7%(总分100%),在高计算测试中得分87.5%,三倍高于o1 25%-32%的得分。这意味着o3达到了人类水平85%。
图:OpenAI o3解决适应新问题的能力
编程能力的提升:在衡量编程能力的Codeforces Elo评分中,o3取得2,727分,远高于o1的1,891分。在代码生成评估基准SWE-bench Verified中,o3准确率达到71.7%,比o1高出22.8%。此外,O3mini也在中等推理时间模式的变现上超越o1。
图:OpenAI o3在编程能力上超越o1
复杂数理难题准确率的飞跃:o3在美国AIME数学竞赛中取得了96.7%的高分,在FrontierMath前沿数学基准测试中创造了25.2%的记录,此前没有模型能在该项测试中获得超过2%的分数。
图:OpenAI o3在AIME竞赛中能力远超o1系列
o3系列模型的发布让应用场景进一步扩展至教育、科学研究、医疗诊断、金融分析等。用户可以利用o3制定个性化学习方案、分析实验数据、制定投资方案等等。
PART.2
正式上线o1正式版、Sora、Canvas等功能
正式上线OpenAI o1完整版:较早先上线的Preview版本有50%编程能力的提升,在处理复杂问题上错误率降低了34%,可以根据问题的不同难度调节响应速度,并加入了识别图片的功能。
此外,OpenAI推出了200美元/月的付费版本模型ChatGPT Pro。较此前20美元/月的Plus版本,Pro版本所有高阶模型的使用,包括高级语音模式的使用,不再有任何限制。并且,Pro版本中提供了o1 Pro版本模型,较o1模型结果的可靠性有小幅度提升。
图:o1 Pro版本较o1版本的小幅度提升
图:Sora生成的转场视频
正式上线Sora:用户可以通过文本提示让模型生成视频,还能够基于静态图片和已有视频创建新的内容。该版本能生成最长20秒的最高1080p的视频。较早先发布的版本,此次加入了故事板功能,用户可以通过详细描述希望视频在不同时间点发生的内容,指导一系列片段的创作,还可以让其余用户浏览。
目前,该功能针对Plus和Pro版本用户开放,前者可生成50个低分辨率视频,后者可在慢速队列下无限制生成,并在快速模式下生成500个视频。
Canvas向所有用户开放:ChatGPT的又一新界面,主要用于处理需要编辑和修改的写作和编码项目,用户可以直接在浏览器中执行Python代码,输出结果会显示在控制台,ChatGPT还会提供错误建议并尝试修复错误,打破了传统的文本编辑和代码执行的壁垒。
目前,React渲染功能及Transform文本格式化功能正在开发。此外,Canvas支持用户根据自身需求定制属于自己的聊天机器人。
o1 mini版本强化微调:OpenAI团队在强化学习方向对o1mini进行了微调,使得仅需“几十个例子”就能让模型学会特定领域的推理,较之前版本在准确率测试中的通过率高达82%。
与苹果深度合作:在Siri判断需要协助时,将任务交由GPT处理;用户可以直接使用ChatGPT写作并细化或总结;相机控制功能,让用户通过视觉智能更深入的了解拍摄对象;给GPT更多Mac工具的调用权限。
实装高级视频语音模式:用户可以与AI视频通话,对方可以实时看到用户的收集屏幕内容或根据相机内的实时画面与用户聊天或解答问题。
发布的其余功能:
①“Projects”项目功能:用户创建特定项目,上传文件并集中的区域。
②o1图像输入和4o高级语音API正式开放。
③实时通话中可使用Search功能。
④美国用户可给GPT打电话提问。
图:OpenAI团队与o1视频通话
PART.3
完成新一轮融资,投后估值达1,570亿美元
10月2日,OpenAI宣布完成新一轮66亿美元的融资,推高估值至1,570亿美元,保持全球第三大独角兽地位,仅次于字节跳动和SpaceX。此轮融资由Thrive Capital领投13亿美元,微软跟投7.5亿美元,软银5亿美元,英伟达1亿美元,其他投资方还包括Khosla Ventures、Altimeter Capital、富达、Tiger Global以及阿联酋投资公司MGX等。
融资完成后,OpenAI公布以获得40亿美元的循环信贷额度,公司流动资金超100亿美元,合作伙伴包括摩根大通、花旗、高盛、摩根士丹利等全球银行。
11月,软银补充投资15亿美元,是66亿美元融资的重要补充。
OpenAI推出面向员工股份要约的收购计划,预计以210美元/股的价格收购15亿美元的股份,为员工提供套现机会并减轻了公司上市的压力。
PART.4
重启人形机器人计划
过去一年,OpenAI投资了Figure和Physical Intelligence等多家人形机器人初创公司,重启了四年前解散的机器人软件团队。
硬件方面,OpenAI正在与Broadcom和TSMC合作开发推理处理器,用于开发定制人工智能芯片。
上述合作关系将为人形机器人的研发提供强大的技术支持,使其能够优化另一款针对车载人工智能软件的芯片以提供更好的性能。
人事方面,11月聘请了Meta机器人和消费硬件团队的负责人Caitlin Kalinowski来领导机器人硬件开发。
图:OpenAI团队训练机器人手臂解魔方
图:Caitlin加入OpenAI
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。
- 豆哥儿·2025-01-08内容真不错点赞举报

