微软展示智能合成声音定制技术新玩法,让每一个角色都栩栩如生
8 月 18 日消息 智能语音技术的飞速发展,让 AI 合成语音的听感更加自然、逼真,让越来越多企业实现了与客户的多模态互动。基于微软 Azure 云平台创建声音定制服务定制的专属个性化声音,已被广泛应用在诸如语音助手、聊天机器人、在线学习、有声读物或新闻播报等多种使用场景。

传统上,完成一个定制声音时间周期长、复杂度高。需要发音人录制成千上万句语料作为训练数据,再由拥有深度神经网络和语音合成专业背景的专家针对客户的语音数据进行声学模型和语音合成器的训练及调优,整个过程往往需要数月的时间。微软推出基于深度神经网络的声音定制服务,所需训练数据更少,只要 300 至 2000 句语料数据(约 30-120 分钟);训练调优的难度和复杂度更加简化,即使没有深度神经网络和语音合成专业背景的用户也可实现自助训练,得到媲美人类发音的效果。用户需注册 Azure 云平台 Speech Studio,申请获得深度神经网络声音定制权限后,即可一键完成个性化声音模型的训练,并快速部署 API,适用于各种场景的应用开发。
除平台自助服务,微软专家还可为有需求的客户提供包括声音画像设计、发音人选择、录音指导、模型评估和调优等全流程的语音定制支持和辅导,帮助英国 BBC 广播公司、Swisscom 瑞士电信、美国 AT&T 旗下的华纳兔八哥体验店、美国 Progressive 前进保险公司、Duolingo 多邻国和国内的小米、华人运通等不同行业的客户成功打造了自己的专属定制声音。
据悉,美国 AT&T 体验店兔八哥语音助手,采用了微软的声音定制服务,并以兔八哥配音演员的授权声音创建了这一虚拟动画人物的语音模型,以奇趣的风格与顾客对话,回答常见的问题,增强了顾客粘性。
微软 AI 语音技术在 AT & T 体验店的兔八哥上的应用:

-
西部数据推出 SanDisk Professional 闪迪大师存储品牌,发布多款新品
2021-08-19
-
消息称芯片代工巨头格芯已秘密申请上市 Intel 2000亿收购基本无望
2021-08-19
-
微软“你的手机”应用 Win11/Win10 版紧凑型界面 UI 曝光
2021-08-19
-
Netflix 正式为苹果 AirPods 等设备推出空间音频功能
2021-08-19
-
做人工智能的长期主义,商汤科技为AI时代打造基础设施
2021-08-18
-
小米介绍MIX 4独享功能:MIUI智能充电保护延缓电池老化
2021-08-18
-
微软展示智能合成声音定制技术新玩法,让每一个角色都栩栩如生
2021-08-18
-
OPPO未来影像技术发布会官宣,明日将发布重磅手机影像创新
2021-08-18
-
仍要晚于台积电:机构称三星 3nm 工艺不太可能在 2023 年前量产
2021-08-18
-
谷歌 Fuchsia OS 已向初代 Nest Hub 推出
2021-08-18
-
【高交会IT展】科技赋能教育新想象,人工智能推动教育信息化
2021-08-19
-
富途证券ESOP:启动股权激励的流程是什么?创始人必看
2021-08-19
-
荣耀平板 V7 Pro 今日首销:120Hz 全面屏 + 联发科迅鲲 1300T,2599 元起
2021-08-19
-
苹果 iPhone 12s/13 Pro 系列新渲染图:新款“日落金”和“玫瑰金”辨识度更高
2021-08-19
-
骑行去“火星”?雅迪与红牛安奈吉能量之旅即将启航!
2021-08-19
-
微软:Win11 Edge 浏览器 Ink API 将网页电子墨迹延迟加快 240%
2021-08-19
-
西部数据推出 SanDisk Professional 闪迪大师存储品牌,发布多款新品
2021-08-19
-
联想官宣 ThinkPad P1 隐士 2021:系列首款 16 英寸移动图站
2021-08-19
-
消息称芯片代工巨头格芯已秘密申请上市 Intel 2000亿收购基本无望
2021-08-19
-
借贷协议Zebra Protocol用产品创新,构建Defi世界基础设施
2021-08-19