A.I.是怎么当上会议助理、全科医生、语言老师的?

“亲爱的小伙伴们,你相信自己的眼睛和耳朵吗?看到的明明是刘庆峰,听到的却是老罗的声音”科大讯飞2019年新品发布会以这样的“变声秀”开场。

和“变声秀”一起亮相开场环节的还有科大讯飞的A.I.多语种虚拟主播。这位不知疲倦的虚拟主播在大会进行的过程中,用九种语言同时向全球观众进行了发布会的实况直播。

A.I.是怎么当上会议助理、全科医生、语言老师的?

A.I.多语种虚拟主播“小晴”

本次发布会的主题是“你的世界,因A.I.而能”,有趣的变声效果、多能的虚拟主播都是“因A.I.而能”的例证,在这些实例的背后,科大讯飞多年在人工智能领域的技术积淀为它们提供了最有力的支撑。

SQuAD登顶,CATTI过关:A.I.历史上的两大里程碑

“oh my god,这是谁的idea,后面居然有一个one more thing” 与此同时,舞台两旁讯飞听见的大屏上迅速且分毫不差地将中英夹杂的话语转化成了文字。

A.I.是怎么当上会议助理、全科医生、语言老师的?

科大讯飞董事长刘庆峰在2019新品发布会上作主题发言

在这场超过三小时的大会上,科大讯飞董事长刘庆峰用这样的方式展示了最新研发的“中英混读2.0引擎”。在发布会期间,刘庆峰也反复强调,对于中国企业未来的发展,尤其是人工智能企业的发展而言,必须要关注源头可控的核心技术突破,如果没有核心技术,企业就会就没有未来。

纵览历年财报数据,科大讯飞已连续六年研发投入占营收比例超过20%。这样的研发投入带来了什么?在发布会上刘庆峰就公布了过去一年中,科大讯飞在A.I.发展史上所留下的里程碑式的印记——

Ÿ 2018年11月,科大讯飞机器翻译系统首次参加CATTI全国翻译专业资格(水平)测试,测试结果显示科大讯飞的机器翻译系统已经达到英语二级《口译实务(交替传译类)》和三级《口译实务》合格标准,具备了成为一名专业译员的潜力。据悉,这是历史上首次参加并通过国家级权威口译水平科研评测的人工智能系统,这也标志着机器自动翻译在辅助人类跨语言信息沟通交流方面上了一个新台阶。与此同时,这也是人类在人工智能高级阶段——认知智能上的又一重大突破。也正是由于在翻译领域获得的显著成就,联合国日内瓦总部国际电信联盟正式采购科大讯飞的听见系统,中国的技术由此进入联合国的国际舞台。

Ÿ 2019年3月,在国际顶级的机器阅读理解评测SQuAD 2.0上,科大讯飞提交的模型不仅刷新纪录成功登顶,而且在EM和F1两个评测指标上全球首次都实现超越人类平均水平,创下了评测的全新纪录。在发布会现场,刘庆峰说,“这个里程碑是由中国人写下的,在英文自然语言理解领域,机器已经超过了真人水平”。

A.I.是怎么当上会议助理、全科医生、语言老师的?

站在两大里程碑的角度回看国家和高层对于科技创新的期冀:2018年10月底,习总书记在中共中央政治局第九次集体学习时指出,人工智能具有多学科综合、高度复杂的特征。所以要把增强原创能力作为重点,以关键核心技术为主攻方向,夯实新一代人工智能发展的基础,让关键核心技术掌握在自己手里。

总书记对于包括人工智能在内的科技创新领域的关注还不止于此,2018年5月,在两院院士大会上,习总书记曾指出,“实践反复告诉我们,关键核心技术是要不来、买不来、讨不来的。只有把关键核心技术掌握在自己手中,才能从根本上保障国家经济安全、国防安全和其他安全。”

自1999年成立以来,科大讯飞始终坚持了“顶天立地”的发展模式——包括在SQuAD和CATTI中收获重大突破之外,自2018年来,科大讯飞相继在语音合成、语音识别、模式识别、机器翻译、自然语言理解等人工智能各大主流方向的15项国际顶级评测中收获冠军。这不仅证明了科大讯飞高强度投入研发的价值,也进一步显示了科大讯飞拥有自主可控的人工智能核心技术。

在这场发布会上,当再次谈及源头可控的核心技术创新和企业的未来发展时,刘庆峰说,“科大讯飞的企业使命,就是要让机器像人一样能听会说,能理解会思考,用人工智能来建设美好世界。在这个过程中只有保持顶天立地的技术信仰和战略定力,我们才可以达到人工智能星辰大海的未来目标”。

会议助理、全科医生和语言教学:跨越技术鸿沟后的A.I.赋能

创新从来都是九死一生,从技术突破到发烧友、极客用户开始使用,到早期长线用户开始使用,最后到实用主义用户开始使用,掌握关键核心技术绝非朝夕之事。自主创新要有巨大的勇气,也需“十年磨一剑”的毅力,人工智能技术领域的创新也是同样如此。

在人工智能时代,新产品的打磨和新模式的推出,相比原有互联网时代的产品和模式而言,更加依赖技术的进步,更加依赖于通过长期技术积淀而实现的关键技术跨越鸿沟。

A.I.是怎么当上会议助理、全科医生、语言老师的?

讯飞听见为总理政府工作报告提供中英文实时字幕

例如当科大讯飞的语音识别准确率在2015年超过人类平均水平后,技术的进步让A.I.会议助理成为可能,随后“讯飞听见”的诞生极大程度上解放了速录员的机械化劳动;借助图像识别、自然语言理解和机器学习等认知智能技术的提升,高分通过国家执业医师资格考试综合笔试的“智医助理”也已开始在安徽省合肥市庐阳区双岗街道卫生服务中心等处正式上岗;此外通过语音合成、语音识别和语音评测技术的突破,科大讯飞不仅承担了全球汉语学习平台的建设,还让A.I.语言教学成为我们身边的现实。

刘庆峰表示,随着技术的不断进步和新一轮产业革命的到来,人工智能的确迎来了全新的机遇,但是核心技术的突破和应用落地却不会一蹴而就,未来还有很多技术上的鸿沟有待学术界和产业界共同突破。

首先是融合语音识别、图像识别、手势识别、后台的自然语言理解能力后的多模态拟人交互能力的突破。未来如果可以实现多模态拟人交互能力的突破,人工智能设备就可以做到像灵巧的秘书和助理一样以人为中心。

还有常识推理能力的突破。如今的机器已经可以在给定文本、给定数据的条件下,在特定领域通过学习顶尖专家知识,实现超过一流专家的能力。但是就目前而言,机器在没有给定文本和数据的条件下,在常识推理领域,与普通人的理解和认知能力差距还很大,所以“通用”的人工智能该如何实现,未来还需要有非常多的鸿沟需要跨越。

如何跨越?刘庆峰认为有三大路径可供探索:小样本、无监督、个性化问题的基础算法理论持续突破,脑科学研究和数学统计建模方法的深度结合,人工智能系统和人类行为协作的人机耦合方式上持续探索。

“今天人工智能不仅是一项技术,而是一个深刻改变世界生产和生活方式的产业方向。”刘庆峰表示,人工智能是一个伟大的历史进程,除了技术,还要有产品,更需要有与之匹配的社会管理、法律、伦理和人文。科大讯飞期待携手各界共建人工智能产业,“让每个人的世界因A.I.而能”。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2019-05-28
A.I.是怎么当上会议助理、全科医生、语言老师的?
“亲爱的小伙伴们,你相信自己的眼睛和耳朵吗?看到的明明是刘庆峰,听到的却是老罗的声音”科大讯飞2019年新品发布会以这样的“

长按扫码 阅读全文