这篇文章不错,转发给大家看看

刚刚!阿里发新模型,幻觉率爆降70%

作者 | 陈骏达编辑 | 李水青智东西9月15日报道,今天,阿里巴巴通义实验室推出了FunAudio-ASR端到端语音识别大模型。为评估模型在高噪声情况下的表现,他们构建了一个包含28条易触发幻觉音频的测试集,经优化后,幻觉率从78.5%下降至10.7%。可以听到,模型基本准确识别了片段中男性说话者的声音,但在声音音量骤降后识别错误了。在FunAudio-ASR的Context增强模块中,CTC解码器经过高质量数据训练,本身发生串语种的概率极低。
刚刚!阿里发新模型,幻觉率爆降70%

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

举报

评论

  • 推荐
  • 最新
empty
暂无评论