作家
登录

从技术到产品,苹果Siri深度学习语音合成技术揭秘

作者: 来源: 2017-08-30 15:44:29 阅读 我要评论

图 6:AB 查对主不雅听力测试的结不雅。新声音要明显地优于以前版本的声音。

因为 TTS 体系须要在移动设备上运行,我们在速度、内存应用和占用上应用快速预选机制、单位剪枝和计算并行化优化了它的运行时(Runtime)机能。

新声音

对于 IOS 11,我们选择了一位新的女性声优来晋升 Siri 声音的天然度、个性度及表达才能。在选出最佳声优之前,我们评估了成百上千的后选人。在选定之后,我们录制了 20 多小时的语音并应用新的深度进修 TTS 技巧构建了一个新的 TTS 声音。最后,新的美式英语 Siri 听起来要比以前好。下表包含一些语音的比较(无法展示,请查看原文)。

更多技巧详情请查看论文:Siri>

表 1. iOS 11 中的 Siri 新声音示例

个中 u_n 代表第 n 个单位,N 代表单位的数量,w_t 和 w_c 分别代表目标成本和拼接成本的权重。肯定单位的最优次序之后,每个单位波形被拼接,以创建持续的合成语音。

【编辑推荐】

  1. 数据科学家必须知道的10个深度进修架构
  2. 若何精深度进修与你正在做的工作相结合?
  3. 一篇文┞仿控制TensorFlow深度进修
  4. 若何用深度进修练习一个像你一样会聊天的机械人?
  5. 处理移动端传感器时序数据的深度进修框架:DeepSense
【义务编辑:庞桂玉 TEL:(010)68476606】

  推荐阅读

  在Linux中分割和重组文件

异常有效的 csplit 敕令可以将单个文件瓜分成多个文件。Carla Schroder 解释说。Linux 有几个用于瓜分文件的对象法度榜样。那么你为什么要瓜分文件呢?一个用例是将大年夜文件瓜分成更小的>>>详细阅读


本文标题:从技术到产品,苹果Siri深度学习语音合成技术揭秘

地址:http://www.17bianji.com/lsqh/37022.html

关键词: 探索发现

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
自媒体专栏

评论

热度

精彩导读
栏目ID=71的表不存在(操作类型=0)