Alpha"新狗"自学3天胜人千年 谷歌要用它来做啥

(原标题:《财经》独家专访:Alpha“新狗”自学三天胜人千年背后,谷歌要用它来做什么?)

北京时间10月19日凌晨,谷歌旗下的人工智能公司DeepMind在世界顶级科学杂志Nature杂志上宣布了AlphaGo的新进步,可以在没有人类干预的情况下自我学习,新的AlphaGoZero在自我学习3天之后,就以100比0的成绩战胜了第一代AlphaGo。

AlphaGo zero 图片来自网络
AlphaGo zero 图片来自网络

自我学习能力的出现,对于人工智能和机器学习来说,是一个新的突破。“过去人们普遍认为机器学习是基于海量的大数据,但是从AlphaGoZero身上,我们发现算法比数据更重要。”AlphaGo项目的主要负责人戴维·席尔瓦(David Silver)说道。

也由于使用了更多的算法和更少的数据,所以AlphaGoZero只使用了一台计算机器和4个TPU,被它打败的一代AlphaGo则用到多台机器和48个TPU。

当人们惊讶于AlphaGoZero在围棋领域的神级水平时,对于DeepMind团队来说,这才只是刚刚开始,他们的目的是通过培养自主学习的能力,来解决更多其他领域目前无法解决的棘手问题。

从AlphaGo、AlphaGoMaster到AlphaGo Zero

AlphaGo于2015年10月面世,在广为人知的与棋手李世石对弈之前,它已经打败了欧洲围棋冠军樊麾。樊麾接受《财经》记者采访时表示,当时在他看来,一个计算程序要打败职业棋手是不可能的事情。

结果他以0-5输给了AlphaGo,但他也因此加入了DeepMind团队,帮助训练AlphaGo。2016年3月,在他帮助训练下的AlphaGo以4-1的成绩打败了人类顶尖棋手李世石。2017年初,AlphaGo化名为“Master”,在网络上挑战60名人类棋手,保持全胜的成绩。2017年5月,在乌镇的,名为Master的第二代AlphaGo以3-0战胜了目前人类最强棋手柯洁。

AlphaGo对战柯洁 图片来自网络
AlphaGo对战柯洁 图片来自网络

今年5月的比赛期间,DeepMind的多位高管就已经向《财经》记者透露,Master已经实现了自我学习能力,甚至有了自己的“直觉”,“我们发现AlphaGo已经不需要依赖人类训练师了。”戴维·席尔瓦告诉《财经》记者。

与柯洁的对弈中,AlphaGo已经能下出很多人类棋手完全无法想象的路数,比赛后柯洁表示,第一代的AlphaGo还能找到破绽,Master已经实现了“从人到神”的飞跃。

而AlphaGoZero在“独立”上更进一步,在训练的过程中,它是自我对弈。从训练图上可以看出,由于一开始并不熟悉围棋,对弈双方的水平都很弱,但是随着时间的推进,在短短3天互相博弈490万局后,越来越强,实现了围棋水平的突破。

(图:AlphaGo训练的72小时图谱)
(图:AlphaGo训练的72小时图谱)

人类顶尖棋手柯洁被认为是围棋天才,6岁开始学棋,17岁时在世界范围内排名第一,一个人类天才十几年的学习,被AlphaZero用3天时间超越。

但DeepMind团队志不在此,“AlphaGo的意义不在于打败人类,而是领悟知识,解决更多的问题。”戴维·席尔瓦表示。

商业化加速:1/4精力用于商业变现

今年5月,DeepMind创始人杰米斯·哈萨比斯在接受《财经》记者采访时表示:“如果说谷歌是火箭,DeepMind就是燃料。”

在此定位之下,AlphaGo虽然进化神速,但绝对不会止步于围棋。

这家公司一开始只是一家位于英国伦敦的人工智能实验室,研究方向是开发通用自我学习算法。2011年,哈萨比斯在埃隆·马斯克等人的投资下,成立了DeepMind。2014年,谷歌以4亿英镑(约6.5亿美元)的价格收购该公司,当时这家公司只有50名员工。AlphaGo就来自于这家公司。

AlphaGo战胜韩国第一棋手李世石引爆了AI技术和市场,也让DeepMind在谷歌AI战略中地位举足轻重。

不过,DeepMind团队从一开始研发AlphaGo系统的目的就是能实现行业应用,并带来商业价值。围棋为AlphaGo带来了光环,却并非最终目标。

哈萨比斯对《财经》记者说,“下一阶段,DeepMind整个团队75%的精力用于人工智能技术的研发,另外25%精力放在行业应用上。”

具体分工上,哈萨比斯继续主导技术研究,另一位创始人穆斯塔法·苏莱曼则负责主导商业化。

穆斯塔法认为,继续技术研究和商业化是一种平衡。“我们手里有很多实验室里的新技术,都是宝贵的资源,而这些技术的商用不仅能造福社会,一家公司也必须有可持续的商业利润来源。”他告诉《财经》记者。

据他介绍,目前DeepMind由两个团队组成,哈萨比斯负责研发团队,而他负责技术应用业务。技术应用团队又再分为三个组,一个组服务谷歌的产业和谷歌的其他业务部门;第二个是医疗组,已经与英国的国家医疗健康局合作;第三个组是能源组,目前还在启动阶段。

“这样的分组是为了方便与不同领域的专家更好地合作。”他说。

此前,DeepMind已经牛刀小试,成功利用机器学习为谷歌大幅度节约电量,带来实际收益。

2016年,DeepMind团队就利用AlphaGo的学习能力,不断模拟探索更加省电的方案。DeepMind接管了谷歌数据中心的一些控制单元,包括风扇、空调、窗户和服务器等,通过机器学习,帮助谷歌数据中心的冷却系统节约用电40%,并提高了15%的能源使用效率。

哈萨比斯对《财经》记者说:“谷歌在数据中心设备上的用电太多,几个百分点就意味着每年几百万美元,节约电力的算法每分钟都在给公司省一大笔钱。”

这个算法团队的开发团队仅有5、6个人,耗时仅两三个月。

目前,DeepMind的部分研发项目已经开始用于能源基础设施管理、医疗系统和洁净水源的改进等方面,公司也已经从中获得收益。

DeepMind也已开始进军医疗市场并从中盈利。2015年11月,它与英国伦敦皇家自由医院签订了为期五年的合同,任务是处理170万名患者的医疗记录。

在这次Nature杂志上发表的论文中,戴维·席尔瓦也强调了未来的行业应用,例如蛋白质折叠(用于破译遗传密码)、能量节约以及新材料的研发等等。

在过去,机器学习未能得到广泛应用,主要原因之一就在于很多人类无法解决的领域中,也缺少大量的数据样本来让机器进行学习,例如医疗图像处理等。AlphaGoZero能够摆脱人类的依赖,不需要人类给出数据和样本,这为更广泛的行业应用提供了新的可能性。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2017-10-20
Alpha"新狗"自学3天胜人千年 谷歌要用它来做啥
Alpha“新狗“自学3天胜人千年 谷歌要用它来做啥,谷歌 alphago

长按扫码 阅读全文