涂鸦重磅发布萌宠语聊模板！On-App AI降噪+音频处理技术，让远程安抚宠物更安心_老虎社区_美港股上老虎

涂鸦重磅发布萌宠语聊模板！On-App AI降噪+音频处理技术，让远程安抚宠物更安心

在当前快节奏的生活背景下，宠物常常会因铲屎官的频繁外出、缺乏互动与情感陪伴，而产生孤独抑郁、焦虑、暴躁易怒等问题。为了提升宠物的安全感，涂鸦重磅推出基于 On-App AI 构建的萌宠语聊模板，旨在通过强大的语音技术和智能设备实现远程陪伴宠物，增强铲屎官与宠物间的情感连接，达到有效缓解宠物焦虑情绪的目的。除了应用于宠物场景，该模板也可拓展应用至智能家电、婴儿看护等领域，以音频能力为辅助，搭建起更人性化的远程监管系统。

涂鸦萌宠语聊模板有哪些功能？

1、宠物行为识别与情绪安抚

结合涂鸦强大的语音识别与宠物行为分析技术，系统可识别频繁嚎叫、低鸣等异常行为，从而判断宠物情绪状态，并迅速采取安抚措施。比如，当检测到宠物焦躁不安时，该模板可自动播放安抚语音包（铲屎官可提前录制，也可使用系统指定语音包），或触发互动模块联动其他智能设备（如逗宠器）及时安抚宠物。

（将铲屎官的录音添加至智能设备中）

2、远程语音陪伴与双向交互

铲屎官也可通过涂鸦远程语音对讲功能，实现与宠物的直接交流，做到“人在外，但爱不缺席”，有效缓解宠物的孤独情绪。

（向智能设备发起语音通话）

涂鸦核心技术亮点是什么？

基于 On-App AI 技术架构，涂鸦结合本地音频采集、实时对讲与文件录制功能，进一步引入 AI 降噪与 AI 语音活动检测能力，并对复杂环境下的人声、噪声进行深度建模与智能分离，最终实现宠物设备与用户之间更智能、更拟人化的语音交互体验。

（涂鸦 On-App AI 整体架构图）

1、兼容多格式语音编码能力

涂鸦支持用户上传和导出 Opus、PCM、WAV、MP3、G.711A、mSBC 等主流音频编码格式，这样可确保在不同设备与传输协议间，实现高保真、低延迟的语音数据传输与协同，在本地存储、服务器上传、语音识别输入等多场景，帮助提升系统集成灵活性。

2、实时智能优化对讲音频质量

涂鸦萌宠语聊模板集成了多项先进的音频处理技术，包括自适应主动降噪（ANC）、回声消除（AEC）、自动增益控制（AGC）和语音活动检测（VAD）。在多设备端的实时语音通信中，可助力全面提升语音质量，并提供更清晰、更稳定、更高效的语音交互体验。

自适应语音降噪（ANC）：涂鸦深度融合学习与传统信号处理算法，可智能识别并区分人声与环境噪声，即便在地铁、街头、风噪等嘈杂环境下，也能实现清晰拾音；
回声消除（AEC）：支持精准识别并清除回声路径中的扬声器反馈声，防止声音因在麦克风端产生回环而扰乱语音的正确传达，大大优化双向语音通话体验；
自动增益控制（AGC）：支持动态调整音量，以保证远近声源响度的一致性，避免因为用户录制的时候声音忽大忽小、距离忽远忽近而产生的听感问题，智能适配多种距离和不同的说话习惯；
智能语音活动检测（VAD）：可精准识别语音段、噪声段和静音段，实时智能过滤无关噪声和静音段，在保持通话质量的同时降低系统功耗，提高响应速度和处理效率。

不同场景下的音频技术处理方案

1、处理本地音频技术

涂鸦支持铲屎官上传自己录制的音频文件，并自动对录音进行优化处理，确保声音清晰流畅、无延迟，真正起到安抚宠物情绪的效果。

录音清晰稳定，远近都能听得清

通过内置自动增益控制（AGC）技术。根据输入信号的强弱可自动调整录音增益，并在 0.3～1.5 米内，动态适配说话人的远近与音量差异，使输出音量保持相对稳定，有效避免因录制距离，或音量变化导致的声音忽大忽小现象。

智能语音检测，自动过滤无效音频

通过语音活动检测（VAD）模块，可在本地实时识别人声与静音/噪声段，有效减少大约 40% 的无效音频数据的采集与处理。涂鸦支持调节灵敏度，灵敏度越高对噪声鲁棒性越强，误判更少，便于根据实际场景灵活优化检测效果。并可结合 AI 大模型，进一步提升复杂环境下的语音检测准确率与适应性。

多格式支持，输出灵活多样

涂鸦兼容支持 MP3、G.711A、G.711U、Opus、AAC、mSBC 等多种主流音频编码格式，可满足多样化平台及应用场景的存储与回放需求。

戳视频，查看录制音频+具体播放效果：

2、实时语音对讲处理技术

在实时语音对讲场景中，涂鸦支持萌宠语聊模板自动对通话音频进行智能化处理，确保双方声音清晰无噪音，沟通流畅无延迟。

智能语音检测，自动过滤无效音频

通过语音活动检测（VAD）模块，可在本地实时识别人声与静音/噪声段，有效减少大约 40% 的无效音频数据的采集与处理。

AI 降噪，复杂环境也清晰

涂鸦 AI 降噪技术基于深度神经网络建模语音与噪声，相较传统频谱减法等算法，在复杂环境下可提升信噪比 515 dB，PESQ 提升 0.5-1.2 分，延迟控制在 100 ms 内，广泛适用于耳机、语音终端等对语音清晰度要求高的场景。结合回声消除（AEC）与降噪技术，可支持最大 200ms 回声延迟路径补偿。

毫秒级低延迟传输，高保真语音对讲

采用 Opus 编码等高效音频压缩技术，在保证语音质量的同时，实现毫秒级低延迟传输，让双向对讲就像面对面交流。适合对时效性要求高的场景，如通话对讲、智能门铃、安防监管等。

开发教程与问题咨询

1、开发教程

复制下方链接，了解具体开发流程：

https://developer.tuya.com/cn/miniapp/solution-ai/ability/voice-solution/petAudioInteraction/overview

2、开发者问题咨询

开发过程中，如遇到任何问题，欢迎登录涂鸦开发者技术论坛进行提问，将有技术小哥及时为你解答：

https://www.tuyaos.com/viewforum.php?f=3

-END-

如需咨询商务合作或智能产品开发方案，可点击【阅读原文】，填写表单后，将有专人与您进行1对1服务哦~

免责声明：上述内容仅代表发帖人个人观点，不构成本平台的任何投资建议。