阿尔法狗的人工智能,可应用在二手车领域

2016年3月15日,轰动全球的围棋“人机大战”落下帷幕。Google DeepMind的阿尔法狗甫登擂台就先声夺人连下三城,第4盘机器出bug送出一局后,第5盘恢复正常的电脑再次以优异的表现取胜,从而以四胜一负的绝 对优势横扫李世石九段。可以毫不夸张地说,围棋这个“人类智慧的最后堡垒”已在“人工智能”的凌厉攻势下宣告沦陷。

石破天惊的闲庭信步

阿尔法狗不仅赢了棋,而且赢得漂亮,甚至赢得轻松惬意。不信的话,请看zhe一步。

这步棋是此次比赛第3盘的第148手。3月12日那天,这一子落到棋盘上,网络实时转播间里,复旦出身的讲解员立刻用了“藐视”这个词。

当时的形势,是李世石在局面落后的逼迫下放出“胜负手”,在棋盘下方的白棋大阵里“翻江倒海般折腾”。李世石挑起的激烈劫争在证伪“不打劫密约”谣传的同时,把棋局推到了风口浪尖。以笔者粗浅的围棋水平判断,这个大劫的价值不少于80目,可谓一劫定胜负。

就在大劫迫在眉睫,几近炮火纷飞的时刻,阿尔法狗却悠悠然飘到棋盘上方,下了一步价值不小(考虑到后面可能的演变,大致是在25~40目之间)但是怎么说也不在“战线”上的棋。

人工智能”的这个选择理性吗?

可以是,但有一个条件:那就是下出这一手的人(或者计算机)认定下方的大劫即便让对方多走一步照样是铁定打 赢。而且,你必须对自己的计算力信心满满,对于算定了所有的可能没有丝毫的怀疑,坚定地相信计算和判断没有一丁点的错漏。既然这是一个反正赢定了的赌注, 腾出手来顺个大官子级别的便宜,也就是符合逻辑的选择了。

这样一个理性选择的逻辑,倘若对面坐着个业余选手,自然是许多棋手都敢用的;但当对面坐着的是李世石,还有多 少棋手敢用80目以上的决定胜负的大劫去赌?可是阿尔法狗就敢!而且实战下来,在局部“让先”了一步,平淡从容应对无误的阿尔法狗依然稳健地掌控全局,将 李世石竭尽全力的疯狂反扑一一化解。双方战至176手,李世石再也无力反击,投子认输。

围棋的世界里,恰如其分,如此一手棋就是12段高手对9段的丝毫不带遮掩的藐视。或者,用喜欢武侠的朋友熟悉 的方式再类比一下:记得黑木崖上东方不败就凭一根绣花针,一边挑开宝剑震飞长鞭,一边好整以暇地称赞“好剑法,好剑法”那一幕吗?就是跟那差不多,区别嘛 就是这回东方不败赢了。

“可以一战”的“大局观”计算机学得会吗?

随着棋局的推进,从开战之前的不屑一顾到“机器人接管世界”的一片恐慌,历史上多次出现的人类面对陌生事物的本能表现再次浮出水面。

然则,对于了解神经元网络等等“人工智能”是怎么一回事的人来说,计算机下围棋从“业余选手让14子”到能够PK一位世界冠军的历程,在更大程度上,是一个资源整合路径设计的杰作。

在此,首先要旗帜鲜明地把话说清楚:很多人理解的那个“人工智能”是根本不存在的。计算机计算,那个东西永远 不会思考。所谓人工智能,只不过是通过精心设计的模式路径把计算机的计算功能组织起来,使其整合之后在特定领域的外在表现貌似有“智能”,而已。譬如,在 每一步平均几十个变化的国际象棋领域,使用棋局“评分”优化但今天看来仍是简单暴力的“剪枝”路径搜索,结合超级计算机“深蓝”的高速运算,早在1997 年的番棋较量当中便已掀翻世界棋王卡斯帕罗夫。

然而在长达数十年的探索当中,机器下出的围棋却长期停留在“弱智”水平。虽然,早年的“姜昆在最角上下了一子,电脑长考之后认输了”的笑话级早已过去,但直到几年前,仍是即便业余初段也能“一眼看出是机器下的棋”。问题出在哪里呢?

就在围棋牵涉的计算量实在是太大了。面对一张空盘,尽可海阔天空。国际象棋每步几十个变化,总共走个几十回 合;而围棋每手可以多达数百个变化,一盘棋很正常地下到二百多甚至三百手以上。再考虑每手棋下面同等数量级的变化与再变化,倘若暴力硬算,指数级上升的计 算量是无论如何吃不下来的----外在表现就是计算机不停地长考长考长考,就是不落子。

人脑的计算力远不如电脑,但却并不耽误下围棋。这是因为棋手会根据经验、判断乃至个人喜好,把绝大多数“无 用”的变化过滤出去,只对很小一部分变化进行计算,并从中筛选一个相对的最优解。要让计算机学会下围棋,就必须复制人类思维的这个过程。只是,九段高手布 局时认为应当落在右上星位还是下方大场,或是战斗中选择在左边转换还是朝中央打入,凭着的往往就是“可以一战”抑或“略占便宜”的“感觉”----高尚些 就是“大局观”。一些大局观特别出众的棋手,有时甚至计算环节都省了,照着“感觉良好”的那个点“啪”的就拍下去了。这个来无踪去无影的颇有虚幻色彩的 “感觉”,计算机几十年也没学会。

没有至关重要的“感觉”,又无法承担天文数字的计算量,计算机别无它法,只得依赖事先的程序设定,粗暴武断地 强行缩减搜索空间----这里的具体办法千奇百怪,但本质上都是这么回事----计算量是控制住了,但代价可想而知:在一个受到人为限制,而且每每是无理 的严重不靠谱限制下的空间里优化,出来的不是现实世界里的最优解不用说是常态了。

阿尔法狗的革命性突破,就是找到了“感觉”的路径:神经元网络深度学习。

策略神经元与价值神经元:计算机的“人工智能”

DeepMind团队为阿尔法狗配备了两个相辅相成的“大脑”:提供落子推荐(MovePicker)的策略神经元(Policy Network)与负责形势判断(PositionEvaluator)的价值神经元(Value Network)。这里顺便说一句,坊间“策略网络”、“价值网络”的翻译是不确的,因为这里的Network是神经元网络Neural Network的简写,而不是通常所说的那个net。

策略神经元作为阿尔法狗内核跟人脑最相似的部分,就是提供上文所提“灵感”的“人工智能”。这是必须通过数以 百万计的反复“学艺”,先是跟着人类多年积累下来的一盘又一盘名局打谱,然后从低到高不断跟人类对弈,直到“入段”之后自己跟自己下棋,一点一点培养出扫 一眼棋盘就能看到哪里“可以一战”的“感觉”。

跟人类的学习过程很类似是吧。不仅如此,此类神经元网络还有一个类似人脑的特点:不知道为什么知道。更早更 “原始”的计算机工具,比如说线性或非线性回归分析,最后都可以给出公式亮出系数,并且报告哪个系数的权重是多少。可是阿尔法狗用的这类神经元,能够学会 下棋,能够学会开车,但就是无法对学习成果给出一个像样的解释----没有公式,没有系数,什么都没有,最多给出一个拟合的输入端系数权重,还要即刻声明 那只是一个估算,仅供参考。倘若阿尔法狗的策略神经元会说话,他/她会跟人类围棋高手一样说不清为什么要下在那里----就是“感觉”那个点好啊…

这个解释对人类或许已经足够了,内核里头必须计算解决问题的电脑却不能接受,于是价值神经元出场。这玩意,用 木谷门提倡的语言形容,就是专业干“形势判断”的活。当策略神经元产生了“感觉”出来的十几几十个选择后,价值神经元就会一一研判倘若这么走了黑白双方赢 棋的概率。有了整体形势判断,就可以进一步缩小排查范围,直到确定当前这一手落子的最佳位置。

对于围棋这个超级复杂的数学游戏,实际的变化当然还要更多一些:你还需要考虑这一手落下去,对方有许多不同的 方案可以选择,然后下一回合又会出现多少变化…..于是,通过蒙特卡洛树搜索,把以上两部“大脑”组合起来。在更有取胜希望的方向上,蒙特卡洛树生出更多 的分枝树叶,策略脑与价值脑轮番开工在有限的用时里检视完全可能是几千个各式各样的图----作为参照的是,当年以强悍的计算著称的赵治勋九段,全盛时期 一手棋大约算300个图。至于在哪一手上花费更多的时间来确保算透所有可能的变化,在神经元“大脑”运转状态恒定的前提下,取决于蒙特卡洛树搜索的宽度与 深度。对此的控制可以是人为锁定,也可以放开来由机器定夺,最有可能的是一定的边界条件设置之内允许神经元网络随机应变。

这样的“大数据”,抑或是几个“思考网络”翻筋斗式互连互通的“深度学习”技术,笔者还是更愿意称之为自学习 式的超级数据分析----早已不仅是在下棋,从无人驾驶到红绿灯控制,从消费信用评级到故障诊断排查,许多军用与民用领域都能找到这些“人工智能”的身 影。不过,还是那句话:它们压根没有一点点智能,从来都是只会计算不会思考,然而这并不妨碍它们非凡的在许多方面已然超越人类的外在表现。

数据可获得性与二手车估价

既是如此,许多读者想必会关心在更贴近生产生活的领域,超级数据分析,或者姑且就呼之为“大数据”,能够发挥多大的作用。譬如说,困扰业界已久的二手车价格评估,是否可以成为“人工智能”深度学习的拿手好戏?

当然是可以的。只不过,有一个额外的条件。这里有一个阿尔法狗完全不用在乎,现实世界里却必须直面的问题:数据可获得性。

作为数据分析工具,毫无疑问得有数据才能玩得转。阿尔法狗所需的全部数据都在那张棋盘上,无论对局双方还是联 得上服务器的棋迷,对落子的位置全都一目了然。懂得自学习的神经元网络可以尽情地分析这些数据,不存在拿不到数据或虚假数据的问题。现实世界里的现实问 题,往往就没那么简单了。

数据可获得性的概念包含3个层次:1)影响因素可否量化;2)数据掺杂“噪音”的程度与“噪音”的可排除性;3)数据获取成本。在使用“大数据”攻关之前,务必对目标的以上几项进行评估,以确定采用数据分析是否可行。

譬如笔者当年在美国经手的数据分析项目,就在数据获取成本上存在问题:所有数据都来自破坏性的力学实验,而每 个样品每次实验不用说都是有成本的。在找到内在规律所需的不能再小的数据池规模(minimum data pool size)与经济上可接受的成本之间,出现了难以调和的矛盾。相比之下,数据分析技术最适合用在随时“生产”无成本数据,数据收集也极其便利的行当。“互 联网经济”自然而然就会产生,而且自动收集成本无限趋近于零的交易数据,显然是“大数据”理想的分析研究对象。

在这一项上,二手车交易,特别是基于网络平台的二手车交易是符合条件的。但在另外两项上,问题就出现了。比如 说,同型号以及可比型号的新车价格波动,显然是影响二手车市价的重要因素。然而国内车市的现状是,新车价格名目繁杂、波动剧烈,更有甚者在不同地区不同城 市,甚至同一个城市不同的4S店,同样的新车出现可观的价格差异也并非罕见。倘若仅根据主机厂和4S连锁总部公布的指导价来填写评估系统新车价格项的输入 数据,这里就可能带入了与实际状况出入很大的“噪音”,而且这个“噪音”的排除恐非易事。

影响因素难以量化的问题,同样也是存在的。最明显的就是现阶段的中国特色:政策。一线城市限购的影响,如何用 数据来表达;限迁愈演愈烈的影响,又如何用数据来体现?跟阿尔法狗下棋一样,自学习式数据分析是需要积累的。倘若这些背景因素未被量化单列,那么一旦隐含 在输入数据内的基本假设出现改变,百分之九十以上的机率是以往的“学习成绩”不再适用,针对新状况的培训必须从头再来。

总之,由于现阶段的数据可获得性上的存疑,笔者对“大数据”在二手车估价领域的运用持相对保守的态度。当然, 这绝不是说这个领域是“大数据”不能碰的。条件是在不断变化的,当前不具备的条件,或许下个月,或许一两年后就具备了。一个神经元网络叠加出来的深度学习 系统,一旦数据可获得环节圆满解决,所用的培训检验架构正确,以互联网时代的数据“出产”率,自学习的能力与速度是惊人的。几个月前李世石接下“人机大 战”要约时的阿尔法狗,跟几天前把李世石杀得没有脾气的阿尔法狗,战力判若云泥;然而此前计算机下围棋找到感觉的探索之路,却走了漫长的20年!因此,把 “人工智能”科技用于车辆价格评估领域的艰苦努力,是非常值得肯定的。只是由于客观条件的影响,究竟何时评估的精度可以提到车商们要求的高标准仍然存在不 确定因素。有鉴于此,笔者希望业界对于二手车估价的“自动化”一面保持清醒的认识,一面给予大力的支持。

有望立竿见影的车市技术创新

说到这里,把话题再扩大化一些,高科技既已如此神奇,那么在这个行业,可有哪些技术手段没有客观条件的瓶颈,现在就可以立竿见影地收到投入产出效应呢。

在笔者看来,首先是路线正确的标准化车况检测技术。事实上,这不仅是二手车交易走向诚信透明的必需品,也是二 手车估价的重要基础之一。从原理层面看,车辆碰撞刮蹭时遭受的破坏,说到底都是外界的动能传递到车体结构上造成的;破坏程度的大小,也不可避免的与车体结 构吸收的动能成正比。而只要金属或塑料的机械结构吃进了超出弹性限度的动能,就必然留下不可逆的塑形变形。要彻底消除这些永久变形,除非是把那辆车全拆 了,从大梁底盘到承力框架统统大换血。到了那个份上,费的劲和花的本也够再搞一辆车了。因此,通过检测车体结构的塑形变形,不仅可以判定车辆状况,而且是 条能够实现数字化的路径(而不看底盘不用举升机的“车辆检测”,不用说是耍流氓)。

另一个有望成为业界的效益倍增器,让车市真正步入互联网经济时代的杠杆,是植根网络的虚拟现实(VR)技术。 如一位车界大咖不久前所言,转化效率乃是这个行业的生命线,而“二手车库存越大,成交几率越高”。不过,在这个地价房租疯狂上涨,资金往往也不便宜的时 节,高库存的代价着实不菲----展厅里的每一个车位,摆上去的每一辆汽车,都是实打实的真金白银砸在那里。任何一位经营过业务管理过展厅的兄弟姐妹,对 此间的压力与纠结想必都有深有体会。

VR的意义在于以互联网的水银泻地无限扩展消费端的视野,将伸展到的每一个角落都变成了事实上的展厅。一旦引 入车市,仅是无边界破有边界这层意义,VR这位大神就足以全盘颠覆目下的这套秩序。从营销到成交,从前端互动模式到后端资源获取,车市VR化都将引出超乎 想象的变局。

最后,还是回到“大数据”的话题。就在此时此刻,同样运用这一手段,基于数据分析的个性化需求匹配是个高质量 数据立等可取,技术要求甚或可以更低的努力方向。根据一位用户的交易历史、浏览习惯与背景资料,充分自学习的“人工智能”完全可以推断他/她在近期内更新 座驾的概率,并且估算出这位潜在消费者更可能倾向于哪几个品牌,更乐于认购新车还是二手车,等等等等。依据这样的数据分析,制作更准确的定向推送广告,开 发更具亲和力的APP,在买方为王日趋明显之际,可谓中国车市大有前途的“白象”。

行文植字至此,蓦然留意到所推荐的技术路线有个共同之处,那就是着眼于为C端提供更好的消费体验。或许,不仅二手车行业,整个中国经济的出路亦在于此。就如爱迪生所言:为大众更美好的生活服务,才是发(chuang)明(xin)家存在的全部意义。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2016-03-21
阿尔法狗的人工智能,可应用在二手车领域
2016年3月15日,轰动全球的围棋人机大战落下帷幕。Google DeepMind的阿尔法狗甫登擂台就先声夺人连下三城,第4盘机器出bug送出一局后,

长按扫码 阅读全文