这似乎是一个明显的组合:机器学习和抗击COVID-19。然而,尽管人们对大型数据集的兴趣浓厚,可用性也越来越大,但这种组合的成功案例很少。写在自然, Bastaniet al。1描述他们从2020年8月开始在希腊入境点设计和部署的系统。该算法基于一种被称为强化学习的方法,显著提高了对冠状病毒SARS-CoV-2的检测效率,并有助于希腊保持边境安全开放的能力。这项工作还就大多数其他国家继续使用的相对生硬的政策工具的缺陷提出了明确的警告。

测试是一个机器学习非常适合解决的问题。想象一下希腊岛屿上的边境管制人员。一架航班刚刚降落,该特工的任务是识别并拘留任何新冠病毒感染者。代理可能想测试所有到达的乘客,但岛上的测试能力非常有限,更普遍的是,永远不可能在100%的时间内对任何人群进行100%的测试。另一种选择——在一个高度依赖旅游业的经济体中完全关闭边境——也有其自身的风险。这不仅包括与失去工作和收入有关的巨大财务成本,而且还包括这种损失对公共卫生的负面影响2。因此,边防人员面临着一个艰难的决定:谁应该接受检测?

如前所述3.,测试的价值取决于它的最终结果。在这个场景中,负面测试只产生成本:测试成本和旅行者的延迟。相比之下,检测呈阳性会产生巨大的好处:预防感染SARS-CoV-2的旅行者可能导致的所有COVID-19病例。因此,在决定对谁进行检测时,边境代理人的最佳策略很明确:预测哪些旅行者的检测结果呈阳性的可能性最大,并对他们进行检测。这一策略最大限度地提高了检测的价值,因为它用最少的检测次数检测出了最多的COVID-19旅行者。

如果边防人员能够预测哪些入境旅客的检测结果最有可能呈阳性,就可以有效地分配检测结果(图1)。入境旅客的数据——他们的国家和原籍地区、年龄和性别——可以在所有旅客抵达希腊前24小时填写的旅客定位表上以数字方式获得,这很方便。使用过去入境乘客检测的数据来预测未来哪种“类型”的乘客更有可能检测呈阳性,这似乎足够简单。但是,正如数十年的统计和计算机科学研究所表明的那样4在美国,这种策略有可能陷入昨天的大流行:鉴于COVID-19传播的快速变化动态,算法必须迅速调整其预测,以保持领先一步,并仍然测试正确的乘客。

一名医务人员在雅典机场对一名乘客进行COVID检测

图1雅典埃莱夫特里奥斯·韦尼泽洛斯国际机场抵达旅客的COVID-19检测图片来源:Milos Bicanski/Getty

这就是机器学习的价值变得清晰的地方。就像可以训练算法下围棋一样5巴斯塔尼和他的同事们通过学习哪些动作可以赢得比赛,训练了一个算法,通过学习哪些乘客的测试结果可能呈阳性,来分配稀缺的测试。

关键是,该算法平衡了两个目标。第一个也是最自然的目标是,通过利用从以前关于这些不同群体中SARS-CoV-2检测结果的数据中学习到的模式,测试可能检测呈阳性的乘客类型。第二种方法——可能不那么直观,但同样重要——是通过测试算法知之甚少的乘客类型,探索之前数据中没有反映的模式。

然后,在给定的一天,在给定的入境口岸,该算法会向边境人员提供有针对性的建议,告诉他们哪些乘客需要测试,同时尊重供应链、人员配备、实验室能力和生物样本配送物流所造成的预算和资源限制。这些限制是切实存在的,具有约束力:作者指出,在夏季旅游旺季,即使在希腊国家COVID-19专家委员会明智地批准了集体检测以提高实验室效率之后,仍只有18.4%的入境旅行者有能力进行检测。

作者借鉴了强化学习策略,这种策略推动了在线商务和营销的进步6。但在现实世界中使用这样的算法会带来自身的技术挑战。例如,算法必须不连续地从大量的测试结果中学习,而不是一个接一个地从单个结果中学习。批处理结果的反馈被延迟,迫使算法在等待结果的同时在不知情的情况下操作。解决这些挑战需要对算法进行重大调整,而这些算法通常是为更简单、数据更丰富的在线设置而设计的。

然而,最棘手的挑战是法律和政治方面的。为了遵守欧盟的《通用数据保护条例》(GDPR),作者在与律师、流行病学家和政策制定者密切协商后,故意限制了算法可用的数据,从而限制了算法的准确性。GDPR对算法性能的潜在限制凸显出,保护隐私的善意法律可能会产生积极和消极的后果。在一场不尊重个人隐私的大流行中,这种规定最终可能会妨碍政府保护公民健康的能力。作者还考虑到政策制定者受众对算法进行了调整,选择他们的优化方法来清楚地展示两个算法目标的价值:测试高风险乘客和测试高不确定性乘客。

结果令人印象深刻。自动化系统使检测效率(每次检测发现的病例数)提高了一倍,使边境人员能够检测和隔离正确的乘客,其中许多人没有症状,同时让其他人通过他们的最终目的地。

巴斯塔尼及其同事提出的算法的成功突显了几乎所有其他国家边境政策的不足。这些政策所依据的决定——例如,是拒绝所有旅行者入境,还是强制对来自某个国家的所有旅行者进行检测或隔离——有两个关键缺陷。首先,这些决定是针对整个国家做出的,而不是针对个人,忽视了国家内部人民之间的巨大差异。其次,它们通常是根据国家一级的流行病学数据制定的,正如本研究所显示的那样,这些数据有明显的缺陷。

如果边境人员拒绝所有来自有相关指标的国家的乘客入境,他们本可以阻止这些COVID-19患者进入希腊,但代价是破坏经济的一个关键支柱。然而,如果他们只是根据一个国家报告的COVID-19指标而不是算法预测来测试人口,他们的测试效率会低得多。这是因为报告的COVID-19指标可能与入境旅行者的实际患病率有很大差异。旅行者并非从本国人口中随机抽取,被动收集的COVID-19病例或与该疾病相关的死亡数据反映出报告存在较大偏差和系统性获取障碍7

事实上,通过有效地检测入境旅客,作者的算法能够比单独使用国家级流行病学数据提前近9天预测旅行者人群中SARS-CoV-2感染率的峰值。这表明了明智、深思熟虑的数据收集的巨大价值,以及依赖生硬、有缺陷的国家级数据进行重要决策的危险。

巴斯塔尼和同事们的工作将被铭记为在抗击COVID-19中使用数据的最佳例子之一。这是一个引人注目的故事,讲述了一群研究人员如何与开明的政策制定者合作,开发出一种具有巨大社会价值的工具。它突出了学术研究和公务员服务中最好的部分,并展示了人工智能在做出正确决策方面的巨大前景——在许多情况下,这可能是生与死的区别。