Gmail用人工智能技术判定垃圾邮件

极客网北京7月10日消息,据国外媒体报道,谷歌表示,在人工智能技术的帮助下,Gmail垃圾邮件识别率如今提升到了99.9%。

大约10年前,垃圾邮件几乎要毁了电子邮箱。一场拯救人们的邮箱的比赛随即打响,两大科技巨头也力争夺得垃圾邮件头号杀手的头衔。

2012年2月,微软声称,它能够过滤掉Hotmail 97%的垃圾邮件。谷歌后来作出回应,称它的Gmail能够过滤掉大约99%的垃圾邮件,而且误判率(将没问题的邮件误判为垃圾邮件的比例)也只有1%。

两家公司的成果表明,启发式检测技术——按照预设规则识别垃圾邮件——能奏效。

不过,它们还不够出色。1%的垃圾邮件还是会让人很烦恼,而1%的误判率也可能带来不小的麻烦,尤其是错过重要的信息的话。因此,这些公司继续不断改良各自的垃圾邮件过滤技术。现在,凭借一系列新的人工智能工具,谷歌在这方面又上了一层楼。

谷歌时隔3年再一次公布了Gmail的垃圾邮件数据,称它的垃圾邮件比例已经削减至0.1%,误判率也下降至只有0.05%。该公司将此主要归功于类大脑的“神经网络”的引入。引入到垃圾邮件过滤器后,该类技术能够通过分析大量计算机上的信息来学习识别垃圾邮件和钓鱼信息。

“机器学习的一大好处在于,它能够自行适应不同的环境。”Gmail高级产品经理约翰·瑞伊-格兰特(John Rae-Grant)指出。谷歌称,Gmail目前的全球用户量达到9亿。换言之,Gmail的垃圾邮件过滤器并不只是通过实施预设的规则来清楚垃圾,它们在运行期间还能够自行制定新规则。

针对你不想看到的

与Facebook和Twitter一样,谷歌也是神经网络领域的领先者。近年来,该公司利用该类技术来识别你向Android手机发出的语音指令,辨别你发布到Google Photos服务的照片,等等。据谷歌工程师杰夫·迪恩(Jeff Dean)称,公司将这些技术应用于其互联网帝国上的各种服务。

神经网络技术也能有效用于识别垃圾邮件其实并不令人意外。百度在使用该类技术来推送你可能会有兴趣的广告,Facebook利用它来在动态消息(News Feed)中判断你可能想看的内容。在某种程度上,垃圾邮件识别技术只是这些系统的相反面,它针对的是你不想看到的信息。

其它公司也在探索将神经网络用作过滤工具。除了识别垃圾信息之外,Twitter还计划利用该技术在其社交网络上识别淫秽内容。

粗略地说,这些神经网络是机器的巨大合集,模拟大脑中的神经细胞网络。在谷歌,迪恩和由其他人工智能工程师组成的核心小组负责运作这些网络,提供软件库,从而让包括Gmail团队在内的其它谷歌团队能够用得上。据谷歌软件工程师维贾伊·埃兰蒂(Vijay Eranti)称,Gmail团队几个月前才开始采用该项技术。

说到神经网络,瑞伊-格兰特指出,“从研发到初始应用再到广泛的应用,事情的发展非常迅速,尤其是这个领域。”

个性化调整

微软现在的垃圾邮件过滤率达到多少呢?该公司还没有公布Hotmail(现改称为Outlook.com)这方面的最新数据。不过它也在部分产品中采用神经网络技术。正是由于该技术,Skype电话的即时翻译功能才得以实现。

然而,正确来说,应用神经网络只是像谷歌这样的公司打击垃圾邮件和确保用户收到正当内容的举措的一部分。瑞伊-格兰特还表示,Gmail利用数项工具来调整垃圾邮件过滤器,从而使得它们符合用户特定的偏好。

“这方面有灰色地带,一个人的垃圾对另一个人来说可能是宝贝。”他说道。

“我们会追踪并试图粗略估计你想要看到什么内容,不想看到什么内容,具体是根据你之前关注过什么信息,标记了哪些内容为垃圾信息。所以,除了应用接收所有人的反馈的大机器学习模型,我们还会针对个人进行适当的调整。”(皓慧)

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。