林志玲郭德纲（地图软件是怎么做到让林志玲）

我是杨伟阿 2022-10-26 20:27:40

林志玲郭德纲（地图软件是怎么做到让林志玲）(1)

提问：@Megan

今日锦囊答主：科大讯飞研究院合成组

语音合成也叫文语转换（Text-To-Speech），简称TTS，简单理解就是“让机器说人话”。合成技术的效果有四个考量维度：表现力、音质、复杂度和自然度。目前的技术演进，自然度和音质都有了明显提升，各大技术提供商更多的是在研究如何提高合成音的表现力，特别是语气和情感方面，很典型的案例产品的就是高德用林志玲和郭德纲的声音播报路况。

那么一条音频是如何合成出来的？这个过程包括了两个步骤：首先是制作语音库，然后是使用语音库将文本变成音频的过程。

制作语料库需要录制用户数小时的干声，对录音开展数据标注，再进行特征训练和技术优化，才能使韵律、音色、音质及自然度更加贴近，让合成的声音更加自然、流畅。以高德地图中林志玲的导航声音为例，在开始合成之前，首先是请志玲姐姐录了一些音频。这些音频不是随意说说就可以的，科大讯飞研究团队为林志玲做了特别设计——除了设计均衡的发音组合、长短语句外，还专门为体现她的“娃娃音”增添了语气词，并结合导航应用做了偏向设计。所以能用最短的语料做出最好的效果。

之后就是把文本合成成语音。输入文本后，首先需要按照词典规则对文本进行语言处理，比如模拟人对自然语言的理解过程，包括文本规整、词的切分、语法语义分析，使计算机对输入的文本能完全理解，并给出后续步骤所需要的各种发音提示。然后是韵律处理，就是为合成语音规划出音段特征，如音高、音长和音强等，使合成语音能正确表达语意，听起来更加自然。最后根据前两部分处理结果的要求输出语音，即合成语音。

未来不仅仅是明星，身边的一切声音理论上皆可合成。

而语音合成技术的应用范围也很广。汽车导航内嵌的语音系统、智能手机语音助手、读书软件等等，这些应用的实现都离不开语音合成，时下热门的AR、机器人、可穿戴设备等也为语音合成技术落地提供了更广阔的市场。

1分钟知识锦囊是36氪的日更问答新栏目，旨在每天以一分钟为限，快问快答一个重要的商业问题。今天我们解答的是人工智能相关的问题。如果你对近期的商业世界还有什么疑问，欢迎在评论区给我们留言，锦囊负责找高手为你解答

展开全文

免责声明：本文仅代表文章作者的个人观点，与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺，请读者仅作参考，并自行核实相关内容。文章投诉邮箱：anhduc.ph@yahoo.com

秒懂生活

林志玲郭德纲（地图软件是怎么做到让林志玲）

猜您喜欢

秦皇陵算不算世界奇迹（秦皇陵到底有多神秘）

cad图怎么测量面积（怎么用手机测量CAD图纸中的立面面积）

华为保时捷手机测评（新车搭载华为HarmonyOS系统）

怎么用手机制作自己的证件照（如何用手机免费制作各种证件照）

win10怎么设置定时自动关机（Win10电脑如何定时关机）

最强大脑最牛的一期脑王（史上最强的大脑测评）

阴阳师平民pve最佳阵容（阴阳师新版本新手快速升级攻略）

热门推荐

排行榜