视网膜图片

视网膜图像可以让计算机预测一个人突发心脏病的风险。图源:Paul Parker/SPL

据说眼睛是心灵的窗户,但谷歌的研究人员认为眼睛是一个人健康的指示器。这家科技巨头正在利用深度学习技术,通过分析一个人的视网膜照片来预测一个人的血压、年龄和吸烟状况。谷歌的计算机从血管排列中收集线索,初步研究表明,机器可以利用这些信息预测某人是否有心脏病发作的风险。

这项研究依赖于卷积神经网络,这是一种深度学习算法,正在改变生物学家分析图像的方式。科学家们正在使用这种方法来发现基因组中的突变,并预测单细胞布局的变化。谷歌的方法,在8月的预印本中描述(R. Poplinet al。预印在https://arxiv.org/abs/1708.09843;2017),是一波新的深度学习应用程序的一部分,这些应用程序使图像处理更容易、更通用,甚至可以识别被忽视的生物现象。

加州山景城谷歌Research的工程总监菲利普·纳尔逊(Philip Nelson)说:“以前将机器学习应用于生物学的许多领域是不现实的。”“现在你可以——但更令人兴奋的是,机器现在可以看到人类以前可能看不到的东西。”

卷积神经网络使计算机能够高效、全面地处理图像,而不需要将图像分割成多个部分。由于计算机能力和存储技术的进步,这种方法在2012年左右在科技行业开始流行起来;例如,Facebook使用这种类型的深度学习来识别照片中的面孔。但科学家们很难将网络应用于生物学,部分原因是不同领域之间的文化差异。Calico公司的首席计算官达芙妮·科勒说:“把一群聪明的生物学家放在一间聪明的计算机科学家的房间里,他们会说两种不同的语言,有不同的思维方式。”Calico是一家位于加州旧金山的生物技术公司,由谷歌的母公司Alphabet支持。

科学家们还必须确定哪些类型的研究可以使用网络进行,这些网络必须经过大量图像的训练,然后才能开始进行预测。当谷歌想要使用深度学习来发现基因组中的突变时,它的科学家必须将DNA字母链转换成计算机可以识别的图像。然后,他们用已经与参考基因组对齐的DNA片段训练他们的网络,这些DNA片段的突变是已知的。最终的结果是DeepVariant,这是一种去年12月发布的工具,可以发现DNA序列的微小变化。在测试中,DeepVariant的表现至少和传统工具一样好。

位于华盛顿州西雅图的艾伦细胞科学研究所的细胞生物学家正在使用卷积神经网络将光学显微镜捕捉到的细胞平面灰色图像转换为3D图像,其中细胞的一些细胞器被标记为彩色。这种方法消除了对细胞染色的需要——这一过程需要更多的时间和复杂的实验室,而且可能会损害细胞。上个月,该小组公布了一项先进技术的细节,该技术可以仅使用少量数据(比如细胞的轮廓)就预测更多细胞部分的形状和位置约翰逊et al。在bioRxiv预印本http://doi.org/chwv;2017

麻省理工学院和哈佛大学布洛德研究所(Broad Institute of MIT and Harvard)成像平台主任安妮·卡朋特(Anne Carpenter)说:“你现在看到的是机器学习在完成与成像有关的生物任务方面的前所未有的转变。”2015年,她的跨学科团队开始使用卷积神经网络处理细胞图像;卡朋特说,现在她的中心大约15%的图像数据是由网络处理的。她预测,这种方法将在几年内成为该中心的主要处理模式。

其他人最兴奋的想法是,用卷积神经网络分析图像可以无意中揭示微妙的生物现象,促使生物学家提出他们以前可能没有考虑过的问题。“科学中最有趣的短语不是‘尤里卡!’,而是‘太奇怪了,怎么回事?’”尼尔森说。

艾伦研究所执行主任里克·霍维茨说,这种偶然的发现可能有助于推进疾病研究。他说,如果深度学习可以揭示单个细胞中癌症的微妙标记,它可能有助于改善研究人员对肿瘤进展的分类。这反过来可能引发关于癌症如何传播的新假设。

生物学领域的其他机器学习行家已经把目光投向了新的领域,因为卷积神经网络正在为图像处理服务。“成像很重要,但化学和分子数据也很重要,”亚历克斯·沃尔夫(Alex Wolf)说,他是位于Neuherberg的德国环境健康研究中心的计算生物学家。沃尔夫希望对神经网络进行调整,以便分析基因表达。“我认为未来几年将会有一个非常大的突破,”他说,“这将允许生物学家更广泛地应用神经网络。”