$快手-W(01024)$ 快手可灵AI 2.0发布会keynotes|东方互联网
1️⃣可灵AI 2.0发布即可用,#模型效果位居全球Top2。根据Artificial Analysis榜单,谷歌Veo2、可灵AI分列文生视频1、2位,可灵AI图生视频效果全球第一。
2️⃣可图2.0:模型效果对比midjourney V7胜负比对比300%+,对比Reve 达193%,对比FLUX1.1达152%。#技术创新点①预训练阶段精准建模文本到视觉表征的映射;②探索后训练阶段的scaling law;③优化模型创造力和稳定性。
3️⃣可灵2.0:和Veo2胜负比达205%,和Sora胜负比达367%。#技术创新点①全新设计视频生成基础模型(全新DiT架构提升视觉/文本模态信息融合能力、全新VAE使复杂动态场景下过渡更顺畅和质感更自然、首次系统性研究视频生成DiT架构的Scaling Law);②全面升级训推策略解锁更强的指令响应和运表现。
3️⃣#发布多模态编辑产品。使用统一表征技术,将文本、图像、视频进行统一表征,使用超长上下文进行训练,通过高效的Token压缩与缓存算法支持长序列的训练和推理;在推理环节使用带有思维链多模态推理能力的技术理解用户输入的多模态信息,实现基于多模态理解的多模态推理。
4️⃣用户端快速增长。累计超2000万用户使用过可灵AI,MAU增长超25倍创作了1.68亿视频和3.44亿图片。超15000+创作者通过API使用可灵AI,生成1200万图像和4000万视频。其中可灵平台图生视频的内容占比达85%。
5️⃣可灵2.0更多模型版本即将发布,其中包括速度更快、价格更普惠的版本。

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

举报

评论

  • 推荐
  • 最新
empty
暂无评论