百度地图推出语音定制功能,一次真正意义上的技术普惠众生

专栏号作者 邻章 / 砍柴网 / 2019-09-22 00:57
"
技术的进步往往能将过往的不可能变为现在的可能。如今在百度地图中,使用百度地图“音定制功能”,人人都能像“茅十八”那样为自己心爱的、在意的人录制专属语音导航包。

科技自媒体 | 邻章

2016年,电影《从你的全世界路过》上映,其中有一个场景颇为令人向往——在去稻城亚丁的路上,杨洋饰演的茅十八使用了自己录制的语音导航包进行导航,强烈融入的个人风格与包含的满怀爱意,在让大家收获欢声欢笑的同时,也让无数人开始幻想什么时候自己也能向电影中的茅十八那样,为自己心爱的、在意的人录制属于专属语音导航包。当然,向往归向往,但大家也都明白,这是百度地图的电影植入,而身为普罗大众的我们要像电影中的茅十八那样在地图应用中录制属于自己的语音导航包,基本属于不可能事件。

但科技技术的进步却往往能将过往的不可能变为现在的可能。

9月19日,百度地图正式发布“语音定制功能”,将此前专注于明星名人的语音定制功能开放给普通用户群体。这让三年前看起来怎么也不可能实现的事情,正式走进普通用户群体,让每一个普通人都能录制属于自己的语音导航包。

普通用户如何录制属于自己的语音导航包

作为全球首个地图语音定制产品,据百度地图介绍,用户只需在百度地图App 上录制20句话,20分钟左右即可生成个人完整语音包。从个人实际体验来看,整个语音录制操作可以说是非常简单的,基本不存在使用门槛。在百度地图中,实际上有多个路径可以实现语音语音导航包的录制。

首先说最简单的方法:打开百度地图App,语音唤醒“小度小度”后说“录制我的语音”即可直接跳转到语音录制选择界面,然后按照界面提升进行操作即可。个人认为这是最为省步骤的方法。

当然,也还有稍微复杂的方法,具体来说是:

1、打开百度地图App,击百度地图首页的“路线”、“出行助手”、“个人中心”等按钮后再选择“语音定制”,进入相应页面。

2、进入页面后,点击最下方的悬浮按钮“录制我的语音”便可进入语音录制选择界面,进行录制选择。

3、按照规则提升,确认后即可开启专属语音定制。

当然,上述两种方法,均需要用户在录入完语音文本后,在等待20分钟左右的专属语音包的生成时间。

背后黑科技——说话人韵律迁移技术Meitron

于是,问题随之而来,百度地图是如何让这件三年前看起来怎么也不可能实现的事情,正式走进普通用户群体,让我们普通人都能录制属于自己的语音导航包?

其背后离不开百度独创的说话人韵律迁移技术 Meitron这一黑科技的支撑。这个技术可以将语音中的音色、风格、情感等要素映射到不同的子空间,在使用时,不同要素可以任意组合,灵活的控制合成语音的风格。作为百度大脑5.0在语音技术上交出的成绩单之一,事实上,这技术是专门为了解决现阶段语音合成技术面临的风格迁移、音色模拟和情感拟人这三大挑战而诞生。从相关资料来看,自2016年开始,百度就通过采用深度学习的离线参数合成、全面深度学习的EMPHASIS声学建模、Tacotron+WaveRNN的联合训练等新技术来训练、提升语音合成产品落地,时至今日已经逐渐取得行业领先的语音合成产品体验成果。

百度语音首席架构师贾磊介绍:“百度地图语音定制功能基于百度独创的风格迁移技术Meitron模型,其特点主要体现在音色转换、多情感朗读和韵律迁移三个方面”。具体来说,多情感朗读是指通过MEITRON技术,合成的语音可以注入不同的情感,韵律迁移是指同一个人的声音可以讲出不同风格的文本,音色转换是指可以用少量语音就可以合成一个人的专属音库。而这三重优势的加持,也使得语音合成效果变得更加逼真、丰富,用户体验也得到了提升。的确,从个人实际体验来看,此言非虚。

百度为什么要在百度地图开放“语音定制功能”?

在此,我们也不得不谈一下这样一个现实问题:百度面向亿级用户开放语音定制功能,让每一个普通用户都能通过百度的语音合成技术简单快捷的生成专属于自己的语音导航包,目的何在?或者说能够带来什么?个人浅显看来,大致可能有三重目的。

从用户的角度来看,百度地图开放语音定制功能,首先是有助于满足用户的个性化需求,实现真正的千人千面。如我们所见,百度地图作为国民级导航软件,每天都有亿级用户在使用它进行导航。在此之前,百度地图为了增添语音导航的人性化与趣味性,邀请了汤唯、杨洋等明星录制语音导航包,以满足用户需求。

但是,明星虽然拥有强大的号召力,能够吸引爱豆们使用,但却也有圈层的限制,不可能人人都喜欢某一位明星的语音导航风格,这是现实。

而此番百度面向用户开放语音定制功能,将定制的权利下放到了用户的手中,让每一位用户都能通过简单几步就能拥有自己的语音导航包,对于满足用户个性化需求,实现真正的千人千面都大有裨益。

其次,这也是百度践行科技温情,以技术赋能用户的又一体现。百度一直认为,真正的科技不应是冷冰冰的存在,应该有人文关怀融合其中。百度此次在百度地图上开放的放语音定制功能,个人看来正是如此。

如我们所见,在语音导航定制包中我们不仅可以录制自己的语音,也可以录制父母、爱人、孩子的语音导航包。

想象一下,在驾车过程中,听到的不是明星语音导航,而是自己父母、爱人或是孩子的语音导航,会是怎么样的一种心情与体验?可以说,相对于明星语音导航包,自己录制的语音导航包,显然是更能拉近更具人性温情的存在,而这恐怕才是真正意义上的技术普惠、赋能众生吧。当然,这也将会进一步拉近用户与产品之间的距离。

同时,百度地图放语音定制功能也是自身语音技术对外的一次实力展示。如上所述,语音识别与合成技术,在当下既是业界研究热点也是科研难点,百度在此领域也是耕耘良久,并斩获颇丰。

而百度此番在百度地图这一国民级导航平台上开放语音定制功能,可以说就是对自家语音合成技术进行的一次前所未有的大练兵,而这显然离不开技术自信的底气支撑。试想,如果没有对自家技术能力的足够自信,如此大规模地开放给用户,任谁恐怕也不敢轻易尝试,毕竟体验不佳带来的口碑翻车打的是自己的脸。

透过百度地图,我们看到了百度独创的说话人韵律迁移技术Meitron所带来的科技温情。在此,我们也不难发现这样一个现实:基于百度大脑5.0的说话人韵律迁移技术Meitron,不仅可以落地到百度地图上,还可以落地教育产品、陪伴机器人等在其他产品上,而这无疑为该技术带来了更大的想象空间。可以说,百度地图只是开始,未来空间不可估量。

注:文中图片源自网络;文章转载请注明出处。

作者:邻章【微信号:ZLxgic 公众号:TMT317】,关注智能手机、人工智能、消费&产业互联网等。

声明:砍柴网尊重行业规范,任何转载稿件皆标注作者和来源;砍柴网的原创文章,请转载时务必注明文章作者和"来源:砍柴网",不尊重原创的行为将受到砍柴网的追责;转载稿件或作者投稿可能会经编辑修改或者补充,有异议可投诉至:post@ikanchai.com
您想第一时间获取互联网领域的资讯和商业分析,请在微信公众号中搜索"砍柴网"或者"ikanchai",或用微信扫描左边二维码,即可添加关注,从此和砍柴网建立直接联系。

相关推荐

热文导读

1
3