当“阿尔茨海默”遇上“语音合成” 终于知道搜狗AI如何完美着陆

当“阿尔茨海默”遇上“语音合成” 终于知道搜狗AI如何完美着陆

随着智能语音助手、智能翻译、智能音箱的流行,语音交互技术在大众眼中早已不是什么神秘话题。语音交互还可以怎么玩?搜狗给出了另一种答案。

今年重阳节,搜狗的语音交互将目光聚焦在阿尔茨海默老年患者身上。在介绍视频中,一位患有阿尔茨海默症的老人,日常生活全由老伴的声音陪伴与提醒。但让人意外的是,老伴的声音并非真人实时发出,而是通过搜狗的语音合成技术,对声音进行的复刻和重现。用熟悉的爱人、家人的声音为阿尔茨海默患者带去陪伴。

“高高在上”的语音合成首次走进大众

语音合成技术(TTS),即通过使用少量数据生成该说话人的合成音。除了能模拟发音外,搜狗还研发出说话人风格的迁移技术,换言之,就是让合成的声音听上去就跟你在说一样。

“在语音、图像里,机器不再只是简单地做识别,而是能生成和你一样的个性化的声音,做声音风格的迁移。”

去年12月的第四届世界互联网大会上,王小川首次向外界展示这项技术,一首王小川版《我的滑板鞋》,让在场观众见识到语音合成的真实效果。据王小川透露,这首歌曲里的真人声音,全是机器通过学习其本人过往演讲的语音素材合成而来。目前搜狗语音合成已支持中英日韩等多个语种,男、女、童等数十个音色的合成。

此外,搜狗的这项语音合成技术还获得了业界权威的认证。今年7月,在 “Blizzard Challenge2018”比赛中,首次参赛的搜狗就获得可懂度和语音停顿两项子任务第一的成绩。

Blizzard Challenge是国际上最具权威性、影响力和规模都最大的语音合成大赛,吸引CMU(美国卡耐基-梅隆大学)、Cambridge University(英国剑桥大学)、University of Edinburge(英国爱丁堡大学)、Nitech(日本名古屋工业大学)、科大讯飞、中科院自动化所等国内外众多国际一流的科研单位和企业参赛。足见搜狗在语音技术领域的领先地位。

而现在,技术领先的优势也助力搜狗抢先完成AI应用的突破。

除了为阿尔茨海默海默患者带去家人、爱人声音的陪伴外。据了解,搜狗语音合成小程序将于不久后上线。它可在获取一定时长人的声音之后,快速合成用该音色进行的语音播报,如新闻播报、阅读儿童读物、阅读私人书单等。语音合成小程序的上线,能够让每一个人都能体验到这一技术带来的陪伴。搜狗的语音合成技术开始为大众服务。

搜狗“单一”AI在遍地开花

实际上纵观搜狗的AI发展,会发现这个旨在“让表达和获取信息更加简单”的公司的执念与与众不同。

与同样做搜索出身的谷歌、百度不同,搜狗的AI战略布局并不像前者那样“全面开花”,而是始终以语言为核心,在语音、图像、对话和问答、翻译领域发力。

这与搜狗搜索、输入法、浏览器“三级火箭”的核心产品有关。一方面,基于搜索和输入法产生的海量数据,解决了搜狗AI学习的先决条件,让搜狗在AI技术上做更多深入探索。

另一方面,语音识别、图像识别、语义识别,与在此基础之上的对话、翻译、智能搜索,能结合核心业务与应用落地商业化,同时也能反哺这些业务的后续发展。

以语音翻译为例,搜狗神经机器翻译技术与其输入法、英文搜索、机器同传系统、智能翻译硬件等领域都已深入融合。截止目前,搜狗同传一共支持了23场大型国际会议,并连续两年成为苹果发布会媒体直播报道的同传标配。

此外,根据搜狗Q2财报显示,二季度搜狗输入法在中英互译基础上,增加了中日、中韩的互译功能,翻译请求量较上一季度增长30%。目前,搜狗神经机器翻译技术的日均翻译请求达1.6亿次,覆盖全球超5亿用户,助力产品产生经济效益超人民币40亿元。

而像此次面向大众推出的语音合成技术,实际上又在垂直搜索、搜狗百科、车载导航以及同声传译等多个场景中早已进行了深度整合。

有没有发现,虽然近年来搜狗在AI上动作不断,但几乎都是沿着一条主线在布局。那就是如何在“对话”中发现用户的潜在需求,以及如何增强用户的表达能力。这是搜狗“表达”与“获取”的使命,也是其人工智能发展的逻辑。

在语言AI赛道上加速度发力

王小川曾表示:“搜狗以语言为核心的AI战略日益清晰。我们会继续提升搜狗搜索结果页首条直接显示答案的比例,让搜索更智能;我们会通过AI提升机器对于语言的理解能力,真正辅助对话,让输入法更聪明。同时,搜狗也会加快智能硬件的布局,让AI技术更好地为大家服务。”

目前,搜狗移动搜索的市场份额17.8%,位居中国第二大搜索引擎。输入法日均语音请求量超过3亿次。除了继续通过AI赋能搜索、输入法产品之外,搜狗同时也在不断推出智能硬件。今年搜狗推出的“搜狗旅行翻译宝”以及“搜狗录音翻译笔”等翻译硬件也均在首发当日售罄。

此外,搜狗的AI能力还得到行业普遍认可,正不断向行业上下游渗透。在与vivo的合作中,搜狗为vivo NEX提供翻译技术支持。今年9月,搜狗与人民日报达成战略合作,成为首家面向全国党媒的AI技术赋能平台。

虽然相比起全面布局的AI战略,搜狗的AI更加聚焦,但聚焦也意味着力量得以更集中的爆发。现在搜狗正以加速度,跑在自己的人工智能赛道上。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2018-10-19
当“阿尔茨海默”遇上“语音合成” 终于知道搜狗AI如何完美着陆
随着智能语音助手、智能翻译、智能音箱的流行,语音交互技术在大众眼中早已不是什么神秘话题。今年重阳节,搜狗的语音交互将目光聚焦在阿尔茨海默老年患者身上。

长按扫码 阅读全文