因果树讲人工智能+金融:如何突破你的想象

文|未央网 因果树首席分析师曹培坤

本文由未央网“Fin-Lab线上沙龙第十二期:从世界互联网大会看人工智能的发展及与金融行业的结合”整理。主讲嘉宾为因果树首席分析师曹培坤。未央网授权转载。

今天非常高兴能够代表因果树,给未央网的粉丝们做分享交流。今天我定的这个题目叫人工智能金融的未来。

实际上现在做人工智能和金融结合的公司有很多,但客观的说都不成熟,都没有达到他们理想的目标。包括因果树现在做的事情,实际上也代表着未来的一种方向和趋势。所以我们拿现在的案例,包括拿因果树的案例,从具体的业务和技术方面来讲讲人工智能金融的未来。

何为人工智能?

那开篇我们还是得落俗套,从定义开始,谈到人工智能现在大家应该都很熟了,甚至现在又大家发明了很多新的名字,比如说,拟人智能、有情感的计算、有情感的机器人等等。实际上就是希望机器或者叫系统,能够像人类一样思考。比如通过自然语言处理、通过图灵测试,能够很好的表达人类的知识,自动推理,像人类一样去学习,同时能够表达人类的理性的一面以及感性的一面。比如说智能软件来代理和嵌入式的机器人能够通过感知和规划推理学习及沟通和决策等等行动,实现更多的类似于人类的目标。

而大家最早的接触人工智能,我想很可能IBM当年研发的超级电脑——深蓝。他在九七年的时候战胜了国际象棋大师、世界冠军卡斯·帕罗夫。而今年人工智能又火了一把,使这个概念基本上家喻户晓,因为3月15号的时候谷歌的人工智能“AlphaGo”跟世界的冠军李世石打了一场比赛,最终是四比一AlphaGo取胜。因为大家知道围棋的计算量比国际象棋要高很多个level。所以也使得大家对人工智能有了更强的兴趣、更深的理解以及更美好的对未来的憧憬,甚至出现了一些对未来的人工智能的恐慌。

现在世界上人工智能,有两个强势的国家,一个是美国,大家知道美国这么多年来包括从当年的星球计划开始,他在国防高级研究计划局、国家的各种科学基金会,包括他的卫生研究部门,海军、还有他们顶间的情报机构。都投入了大量的资源,做人工智能的研究。第二个就是日本,日本现在已经是大家勿庸置疑的机器人大国。他们从八一年开始就拨款八亿五千万美金,研发人工智能的计算机。到现在在日本的机器人已经几乎涵盖了机器人所能够触及到的每一个细分领域。

人工智能与金融的结合

而人工智能跟金融的结合实际上起步是相对晚一点的。现在人工智能跟金融结合最好的方面应该是人工智能辅助量化交易。也就是说,通过机器学习自然语言的处理。我们知道美国有家公司是李嘉诚投资的叫Sentient Technologies,这家公司就励志与去做一个能够取代投行分析师的投资机器人,叫Kensho,他可以运用自然语言的处理深度学习等AI技术建立量化交易模型。它可以在很短的时间内做高频的数据分析和投资的交易决策。做这种产品或者说实现这种业务功能,最重要的第一步是搭建知识图谱,就是让机器能够像人一样的,去处理这些数据或者说结构化以及非结构化的信息,然后来满足人类的知识表达和业务需求。

人工智能和金融的这种结合,现在在美国也是一个非常热非常前沿的领域。这家叫Palantir的公司现在是硅谷最牛的公司之一。他们现在的估值在两百零二亿美金左右。仅仅排在之前Uber和Airbnb之后。其实这家公司做的事情就是通过人工智能,做一些非常前沿的工作。比如说他们着几个合伙人,以前都是替美国的各种高端机构跟俄罗斯的一些黑客作战的技术精英。经过他们在硅谷的多年的打拼,通过控股和间接的交叉任职也已经影响和掌握了归国大片的IT公司。

他们之前做过很多很奇妙的案例,比如说他们曾经利用人工智能快速的去比对和通过构建知识图谱来挖掘美国每一个个体之间的人与人之间的关系,从而精准的定位出谁是潜在的恐怖份子。而最终提交给美国情报机构的名单,也让美国情报机构吓了一跳,甚至怀疑他们本身就是恐怖分子,是恐怖分子的这个窝里的这种内斗。所以这家公司什么声名鹊起之后他们主要服务于美国的CIA和FBI等等国家机关部门。他们也曾经利用人工智能的技术推出过自己的金融数据分析平台。

其实谈到这家公司这四个合伙人,我想左边第一个大家都会相对熟悉一些,这个Peter实际上是前段时间畅销书《从零到一》的作者。而最近,美国川普竞选的时候他知道整个硅谷的精英都是反对川普的。而只有这个Peter他站出来,出钱出力来帮川普站台。大家也知道Peter,他在投资圈也非常的有名,他有一个投资信条就是我只投大家都不投的。所以他当年给facebook的那几十万美金现在已经翻了不知道多少倍了。所以,现在可以看到美国的顶尖的精英也已经致力于人工智能以及人工智能跟金融的结合这个领域最说这个领域在未来是非常有前途。

人工智能在金融领域的应用

目前能够逐步实现的,或者说有雏形的人工智能在金融领域的应用,我觉得有这么几项,第一是智能投资顾问、第二个是金融预测与反欺诈、然后再就是融资授信、安全监控预警、智能客服以及服务型的机器人。在后面我再给大家举企业案例的时候也会再次可能提到其中的几个点。其实大部分都很好理解,智能投资顾问就包括像我们因果树·图灵产品。他可以三秒钟回答投资圈的任何问题,里面包括行业怎么样、行业的周期、包括投资的所有的项目、投资人创业者包括他们的产品及竞品的运营数据、行业的公司数据、还有产品线的一些运营层面的用户画像等等。

金融预测与反欺诈,这个很好理解,基本上大家可以理解成:利用机器对数据的大规模以及高频率的处理能力。比如说前面还有一个例子是说美国一家公司她专门挖掘个人的隐私信息,但他用这项技术来做好事,他不去泄露你的隐私,而是他监测整个互联网当发现有个人的隐私泄露的时候,他会帮你报警。那么这个也是现在在金融诈骗肆虐的今天也是很重要的一项应用。

融资授信,这个现在像蚂蚁金服、京东金融,都已经在做和应用。安全监控预警,这个后面我会再次讲到,包括对图像的大数据的分析和语音大数据的分析来做到无缝的监控的天网和预警。智能客服这个后面在讲科大讯飞的时候会着重地强调一下。比如说我们可以通过对人语音的这种挖掘可以判断出对方来电的原因、对方来电的情绪、以及对方的内心诉求,然后将它转交给相应的客服。比说你是来投诉的,或者来咨询某种业务的等等。服务型机器人这个也是通过让机器人具备对人的语音。乃至于像一些表情和图像的这种智能化理解来做出具备一定情感和推理决策能力的反应。这都是未来机器人所必须要攻克和实现的一些技术难点和功能。

而目前人工智能的金融结合的最主流的能够变现的玩法,我觉得有几种:

第一种就是自动生成报告。现在我们正在开发的就具备这样功能,包括后面我们即将上线的新的产品。其实,这个也是我们说像Kensho这种产品去取代投行的分析师,那所必须要实现的第一个功能:它可以快速的去挖掘定量和定性的信息。可以实现分析师差不多四十个小时这么大的工作量,基本上机器可能几分钟就能完成,然后自动生成一份可用的有价值的报告。

第二是辅助量化交易。这个目前在中国的金融监管体系之下做的相对还慢一点,而在美国已经应用得非常好了,包括在华尔街多年以前就已经提出要用机器来取代这个分析师甚至交易员。现在有几家成熟的公司已经可以做到用机器来同时监测、投资、决策出二百多种复杂的金融产品的组合来帮用户做尤其是大型的基金,做投资理财。而他们所取得的业绩也已经赶超了像美国的这个彼得·林奇这种传奇级的投资大师。所以说这个应用是非常有前景的。

那么我们转眼来看中国,中国现在在人工智能金融领域应用比较好的企业案例,其实有很多。前段时间我们刚给政府做过一个案例的研究报告,那么其中谈到了大概有八到九家。我们这里我们举四个案例。第一个是京东金融,然后蚂蚁金服,然后是我们自己因果树,然后是科大讯飞。而这里面实际上科大讯飞严格地讲,我们不太方便把他定位在某一个细分领域里,因为我们知道现在很多的领域都要用到他们的一些基于语音的智能分析,所以这里我们也着重的点一下科大讯飞。

我们先看京东金融。实际上京东金融很早就已经关注到智能投顾的这个领域,但是一直没有很好的落地。他们主要是基于基金的这种代销牌照,来推出他们的产品,基于人工智能和大数据等等技术,把理财顾问的这种能力和服务,来固化或者说在系统里去模型化,从而用廉价的在线的种方式为用户提供,比如说小额理财这些服务,甚至一些消费金融,然后在线推荐和投机给她们的消费者。京东金融他们首先规划过用户的需求,除了投资需求以外,还包括用户的财务诊断,比如资产负债、财务自由度、储蓄率等等。他们诊断用户当前财务状况是否健康,通过数字化的方式,来标准和精细化到的线上。

京东借助于他们自己拥有相对完整的用户消费端的画像、数据,来综合用户消费和理财的全流程的场景,来刻画一个比较完整的用户画像,完善他们这种理财环节。其次是进行场景化的包装升级,京东金融的产品是以引擎为内涵,场景化为外延来与用户交互。甚至跟消费打通。他们会考虑用户投资之后有什么样的衍生行为,比如说:去旅游、去消费、买车买房等等。这时候产品不仅仅是一个工具性的东西,还具有某种引导用户进行健康理财的作用,更适合于普通大众层面的理财规划。目前进入金融利用人工智能。逐步优化他们的人机交互体验采取文字乃至语音的方式,使得产品用户体验更好。

而基于以上这些也导致京东金融在从京东集团脱离出来以后,市场给予了更高的预期和可能更高的估值。这与他未来的一些发展方向和前景以及带给投资人的希望当然是分不开的。

然后是蚂蚁金服,蚂蚁金服实际上设立了一个特殊的科学家团队。专门从事继续学习与深度学习等等人工智能领域的前沿的研究和应用。他们的业务场景非常的完整,应该说是目前是国内业务场景最广同时又最深的企业案例他们进行了一系列的创新。比如说互联网小贷、保险、征信、智能投顾、顾客服务等诸多的领域。根据他们自己公布的数据,网上银行的花呗和微贷业务,使用机器学习把虚假交易率降低了近十倍,为支付宝的证件审核系统开发的基于深入学习的OCR系统能使得他们证件校验核查的时间从一天缩小到一秒,同时提升了百分之三十的通过率。

而以智能客服为例的话,2015年双十一期间,蚂蚁金服百分之九十五的远程客户服务都已经由大数据智能机器人来完成,同时实现了百分之百的自动语音识别。当用户通过支付宝客户端进入我的客服以后人工智能就开始发挥作用。我的客服会自动猜出用户可能会有的疑问和提问方式供其选择。这里一部分是所有用户常见的问题,更精准的是基于用户使用的服务市场,最近的行为变量抽取出的一些个性化的疑问点。在教育过程当中也通过深入学习和语义分析,给出自动的回答。问题识别的模型、点击准确率也有大幅的提升,在花呗业务上机器人的问答准确率已经从百分之六十七提升到大概超过百分之八十。

然后科大讯飞在智能语音的挖掘上有很多的专利和技术应用,那么我们就不一一赘述,我们可以单独点下他们的机器人,比如说:科大讯飞现在一直是基于业界领先的这种语音的处理技术,他们研制了一款“小曼”的智能机器人。“小曼”的拟人化程度是非常高的。不仅赋予他人的形象相对应的感情动作,同时具有一定的可交互性,而且是显得比较自然。在技术上它首先是解决了客服机器人在大厅环境下的这种混淆背景噪声、人声干扰、回声等等一系列的噪音问题。通过先进的麦克风和语音序列,以及定位,以及嘈杂环境下的唤醒率的问题,都可以使用户体验非常的完美。

因果树“图灵”:用人工智能解投融资问题

那么下面给大家简单介绍下因果树。我们现在是一个做大数据的人工智能的股权投融资服务平台。实际上,我们现在主要分几个板块,首先,如果说因果树是一颗树的话,那么它的根那自然就是大数据,那我们的数据跟别人有什么不一样?我们知道现在市场上,搜集数据并且分析数据形成产品,然后往外卖的机构,他的数据来源无非有几种。

一种是,结果机构内部的那这个当然非常局限。哪怕你是BAT的巨头之一,你也只有自家的数据。

那么第二种就是网络的spider去抓的数据,那这个数据也是非常有限,因为现在对端口的监控非常严密。

第三就是通过SDK的接入,而这种SDK接入我们知道,像有一些头部应用可能都会不太愿意来让第三方去嵌入内部的这个SDK。那这样的话,他们的很多数据都是靠少量的应用来去反向推测。而这个样本量可能就是百万顶多是千万级的,然后去推测全网几亿甚至十几亿的用户,那这个准确度大家可想而知。很多在数数量级上具有很大的偏差。而我们因果树现在主要是依托运营商的数据,我们知道现在移动终端的普及率已经超过了百分之百,所以应该说最全的数据,肯定是掌握在运营商的手里。

所以因果树历尽千辛万苦和九牛二虎之力,拿到了联通全国和电信全国的整个的用户端的行为数据,以及网信等等网络端和固网的数据。而从这些数据里我们可以挖出大量的宝藏,当然现在我们知道运营商的数据回传量很大。一天的回传量,可能以我们现在的挖掘速度两天都挖不完。但是现在我们采取的战略就是根据市场的需求,市场上最迫切需要的数据优先排期。先把这部分数据。可以确保是精准的,可以确保我们的合作伙伴拿到以后让他来发挥价值,尤其是可以知道我们的投融资市场以及运营方的决策。

目前因果树是一家B轮的公司,所以需要非常注重明确我们的业务战略,现在我们的业务主要是服务于投融资的投前投中投后各个阶段。

从投前的项目挖掘,我们每周都会通过机器自动来甄选优质项目推出我们的超新星。而我们知道现在超新星的这种命中率也就是说,我们推出的超新星企业在未来六月以内,可以顺利拿到下一轮融资的这种概率,已经达到了百分之二十多将近百分之三十。而在投前,我们的很多数据集成和数据端的bd,也可以由机器来完成,也可以解决现在投资人面对项目太多没有时间做尽调,或者说假数据满天飞的现状。在投中,我们知道如果投资人可以提前快速的命中某个跑道的优势企业,那么他现在去接触的时候,他需要相对的一个合理的市场估值。而现在我们通过机器模型,通过过往的投资案例,以及运营端的数据以及团队的个人评估。我们做大批量的机器估值的工作,而这个是如果未来做的更加精准的话,这是市场上的一个定价的权威性。而在投后,我们也做项目的监测与长期的审查与管理来披露项目的的信息进行风险提示,以及帮助做赛道的评估和竞争对手的评估。

我们数据源有五个大的方面。第一个是全网的公开数据。这个目前相对占比较小,它包括了这些项目的官网、媒体报道、社交平台、招聘平台、各种网站论坛以及评论。第二类就是我们国内外的运营商,这个是我们最重要的数据也是我们的宝藏。包括了联通电信移动以及美国电信。第三类就是二级市场的数据,包括一些著名的券商经常使用的一些数据库。那么第四类就是我们定点的行业数据,包括各个行业,包括行业协会和工商等国家的行政单位。再就是知识产权的数据,包括国家知识产权局。

因果树特别强调我们的三级分类。大家看上去可能觉得很简单,但实际上把这么多的企业,精准的划分出来他的层级架构、上下游的关系以及他的合作伙伴,和尤其是巨头的这种赛道布局,还是一个比较艰苦的工作,所以这工作我们做了很长时间。而实际上这是一个基础,有了它我们才可以去做合理的估值。可以明确我们某一个标的、某一个项目需要跟哪些公司去做对比。所以说在这个是我们知识图谱里面最重要的一个部分。

搭建了这个体系以后,我们因果树·图灵就可以改变我们过往单纯利用财务指标来衡量公司价值的现状。我们可以结合行业的具体数据,比如行业周期发展、行业新公司、新产品以及行业的招聘和传播等等一系列的数据。制定每一个行业和企业的KPI。然后从注入市场规模、商业模式、核心竞争力等等很多的维度去评估一家公司,并且知道公司发展过程当中,应该注重哪一个点。也可以使得投融资市场更有序更理智。

当然现在图灵还是迭代的比较早期的一个版本。我们致力于通过他来三秒钟回答任何投融资的问题,比如说如果现在你到百度去问某家企业怎么样和某一个行业怎么样?可能给出答案是碎片化的或者更多的新闻报道,甚至更多的是企业的一些公关稿,那么这些数据和行业观点,很多都是非常水的。而因果树给出的这种答案就包括了详实的数据,可能后面还要接入更多的券商研究的一些行业观点。当然还有整个竞品之间的数据对比,还有投资机构的投资情况的对比等等。

所以说因果树·图灵在入口这个层面,可以解决传统过于碎片化和有效信息非常少的问题,可以使它更加的结构化、可视化,同时是基于知识图谱的,而不是冰冷的数据而是有观点和结论的。

人工智能的未来在哪里?

最后我们看一下未来的展望。实际上人工智能在切入金融这个领域以后肯定会给金融行业带来很大的变革。我们看提到他包括有新的体系,整个的行业可能出现很多的这个玩家,新的人员架构,可能数据的科学家在金融圈会占据越来越重要的位置,包括新的利益分配。那既然在产业链上出现了新的科技金融公司,而且扮演了重要的角色,那么现在的产业链以及利益分配,也肯定会被重新的定义,对于现在的金融体系会形成革命的挑战。挑战其实现在就已经有很多,比如说现在我们大家看到,有些技术人员比如说淘宝的员工通过一些手段来秒杀内部提供的福利然后受到处分,比如说很多网站都要防止机器人过多的采集和刷单。

而现在马上春节了,大家也都非常痛恨这个12306上面也为了防止机器人的过度抢票,来采取了非常复杂的,不受欢迎的这种验证技术等等。而未来,有专家也也讲金融领域会不会有一天由于监管跟不上技术的发展。如法炮制出一个本质上相当于“人工智能与狗不得入内”这种新的行业的游戏规则,这个也是非常有可能的。

互动问答

1、用大数据和人工智能对股票市场进行预测是否可行?

这个问题非常的具体。实际上毋庸讳言,大数据和人工智能能不能用在股票市场,这个首先取决于这个股票市场是不是一个价值投资为主导的市场。更具体点可能用在美国会更加的有效,而实际上现在美国的二级市场,各种基金对于大数据和人工智能的利用已经非常成熟了。就是做这种高频的交易去赚这种利差也好,波动的收益也好。同时可以采取多种衍生金融产品的组合多的真的可以同时操作同时拼凑二百多个金融产品。而且收益率非常高,效果非常好。但是如果拿到中国来讲的话,中国的股票市场,我们也不太方便做太多的点评。可能某位,所谓的,这几大有良知的经济学家之一。曾经讲过是中国的这个股市可能是一个可以看你底牌的赌场。那么这么一个价值投资不占主流的股票市场,同时监管又相对落后,不成熟的市场,大数据和人工智能,当然也可以进,但是不要对它寄予太多的期望。

这个问题就回答这么多。

2、金融行业如果想要和科技巨头们PK人工智能就必须拥有大数据壁垒,您认为银行能够享受的数据优势是什么?

银行的数据太有价值了!目前我们在谈但是还没有真正拿到银行业巨头的数据,但是银行也在拼命的希望跟我们合作来拿我们的数据。直接采购原始的挖掘数据,可见双方都对彼此非常的觊觎。然后其实金融圈尤其是银行的数据,他这个作用就太多了!比如保险公司就每天都得盯着,对吧?很多金融诈骗的也在盯着。那很多机构直接就是跟钱直接相关的账户,和用户的精准的消费画像。那这个东西你可以用来做很多事情。

而实际上人工智能跟金融结合,未来的图景就说可能是十年以后。因果树也希望我们能够产生出新的产品,比如说现在中国的金融市场比较缺乏适合未来新兴中产阶级的理财产品。就是说中等金额的。未来如果说,中产阶级想接触一级的优质的股权投资,现在是没有入口的,是投资无门的,就是说不能带你个人玩儿。未来我们希望能够通过技术的发展,我们把优秀的,一二级市场的标的做一些金融上的处理,形成一些良好的可供个人参与的新型的绿色理财产品。

3、对于互联网金融公司而言,如何合理的布局人工智能领域,进入门槛和时机是否具有关键性影响?

当然现在做的都是一些很初级的事情,就是帮着一些交易所做一些工作,当然我们不说的太详细。再就是帮一些投资机构,当然跟银行的数据的交换,甚至是有可能打通,因为未来可能也是要走的一步战略上的路。

这个进入门槛和时机,门槛肯定是有的,时机肯定是很关键的。但这个门槛可能我们自己公司内部讨论也不认为,大家所讲的数据源是核心门槛,核心壁垒,我不这么认为。可能时机很重要然后商业化重要,然后业务逻辑,知识图谱这些是我们的门槛,是我们的壁垒。再就是我们早期积攒了一些经验,那这些也是门槛。而时机当然很重要,我们知道很多创业公司不是做的不好而是做早了。所以时机很关键,那么现在我们也不断的根据市场的需求变化来调整我们的产出物,然后调整我们的服务和产品的质量。

再一个互联网公司的布局,那这个布局也分两个层次,第一个层次是,要不要自己做,第二个是要不要去投。我想如果你要自己做的话那最好是单独成立公司。然后剥离原公司的人,就是说不要让原公司的人去领导这家公司,然后单独去招聘新的这个技术基因、互联网基因、数据基因以及金融基因。然后布局,如果你有这个实力的话当然布局是非常好的,其实现在BAT也有一定的布局。尤其是百度和阿里。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。