为了数据也是拼了!多伦多大学用人造X射线训练人工智能

AI商业观察 2018-07-10阅读:

高层速读

关键信息:为了解决罕见疾病X射线数据较少的问题,多伦多大学工程师们设计了一种新的方法,利用机器学习创造出人造X射线来增强人工智能训练集,他们使用深度卷积生成对抗网络(DCGAN)来生成并持续改进模拟图像。

关键数据:在一般情况下,结合了人造X射线的增强数据集的分类精度提高了20%,在一些罕见疾病中,准确率提高到40%左右。

关键意义:从某种意义上说,我们正在利用机器学习来进行机器学习。

为了数据也是拼了!多伦多大学用人造X射线训练人工智能

在象限的左边是病人胸部的真实X射线图像,旁边是由人造的合成X射线

人工智能可以提高医学诊断速度和准确性,但在临床医生利用人工智能来识别X射线等图像的情况之前,他们必须“教”会算法寻找什么。

在医学图像中识别罕见的病理现象,给研究人员带来了持续的挑战,因为在监督学习环境中,可以用来训练人工智能系统的图像十分缺乏。

为了数据也是拼了!多伦多大学用人造X射线训练人工智能

多伦多大学电子与计算机工程系(ECE)Shahrokh Valaee教授和他的团队设计了一种新的方法:利用机器学习创造计算机生成的X射线来增强人工智能训练集。“从某种意义上说,我们正在利用机器学习来进行机器学习”,Valaee说。

“我们正在通过计算机制造某些罕见疾病的X射线,我们可以将它们与真实的X射线结合起来,从而拥有足够大的数据库来训练神经网络,以便此后从其他X射线中识别出有异常情况的数据。”

为了数据也是拼了!多伦多大学用人造X射线训练人工智能

Valaee是医学实验室(MIMLab)机器智能的一员,这是一个内科医生、科学家和工程研究人员组成的团队,他们将自己在图像处理、人工智能和医学方面的专业知识结合起来,以解决医疗挑战。

“人工智能有潜力在医学领域提供各种各样的帮助”Valaee说,“但要做到这一点,我们需要大量的数据——我们需要数千个标签的图像让这些系统发挥作用,但一些罕见疾病的数据太少了。”

为了数据也是拼了!多伦多大学用人造X射线训练人工智能

为了制造这些人造X射线,研究小组使用一种被称为深度卷积生成对抗网络(DCGAN)的技术来生成并持续改进模拟图像。

GANs是由两个网络组成的一种算法:一个是生成网络,一个是判别器网络,生成网络负责生成图像,判别器则负责从真实图像中区分出合成的图像,直到这两个网络被训练成一个点,判鉴别器不能区分真实的图像和合成的图像,就可以输出了。

一旦有足够数量的人造X射线被创造出来,它们就会与真实的X射线相结合,来训练一个深度卷积神经网络,这个网络负责将需要鉴别的图像分类为正常或其他情况。

为了数据也是拼了!多伦多大学用人造X射线训练人工智能

Valaee说:“我们已经能够证明,由深度卷积的GANs生成的人工数据可以用来增强真实的数据集,这为培训提供了更多的数据,并提高了这些系统在识别罕见疾病方面的性能。”

在通过人工智能系统输入数据时,MIMLab将其增强数据集的准确性与原始数据集进行了比较,发现在一般情况下,增强数据集的分类精度提高了20%,在一些罕见的情况下,准确率提高到40%左右。

由于合成的X光并不是来自真实的个体,所以数据集容易获得,同时也不会存在侵犯隐私方面的担忧。Valaee说:“这很令人兴奋,我们已经能够克服将人工智能应用于医学的障碍。”

(免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与极客网无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com)

  • AI商业观察
    邮箱:caoceng@fromgeek.com
    专注报道人工智能商业化应用,追踪投资大事件,发掘公司投资价值
    分享本文到