如何通过人脸识别发现儿童罕见疾病？

世界上有1万多种罕见疾病，其中的75%会影响儿童，而受影响的孩子中有大约三分之一活不到5岁生日。
罕见疾病不会引起太多的关注，而且它们的检测非常具有挑战性。而现在，计算机视觉就可以诊断这些罕见病。

安德鲁（为了保护孩子的身份而使用的假名）正在夏日的阳光下于后院玩耍，但这个4岁孩子的父母似乎注意到有些不对劲。也许是因为他的头小得不寻常，也许是因为矫正他先天性疾病的手术所带来的后遗症。

安德鲁的父母咨询了佛罗里达州Nemours儿童医院（Nemours Children’s Hospital）的儿科教授Karen Gripp博士，后者决定进行调查。除了常规的程序外，她还在Face2Gene上进行了快速诊断——这是一款基于计算机视觉的应用程序，可以寻找罕见疾病的迹象。上传至该应用程序的安德鲁面部图片显示，其症状与Smith-Lemli-Opitz综合征（SLO）非常吻合。这是一种罕见的疾病，大约每4万名儿童中会有1名患者。

“这家人以为这种情况已经被排除了，”Karen Gripp说。但随后的检查证实了这一基因诊断结果。安德鲁的面部特征表明他患有轻度SLO。尽管这对他的父母来说是一个打击，可安德鲁还是很快被送进了代谢疾病诊所，并接受了适当的营养和药物治疗。

Karen Gripp表示，“这个家庭对于能够获得明确的诊断结果表示很感激，因为这能解释孩子在行为和学习上遇到的挑战。”他们现在意识到，对安德鲁来说，SLO有25%的复发风险。

世界上有1万多种罕见疾病，其中的75%会影响儿童，而受影响的孩子中有大约三分之一活不到5岁生日。罕见疾病不会引起太多的关注，而且它们的检测非常具有挑战性。

在安德鲁的病例中，多亏了人工智能计算机视觉应用程序，他获得了快速诊断，从而在治疗上取得了突破。那么，面部图片是这些致命疾病的可靠指标吗？在可供算法进行训练的信息如此之少的情况下，人工智能能够检测罕见疾病吗？本文将对这些问题展开讨论，并分享当今医生在采用这些解决方案时的做法。

罕见病是如何隐藏在我们眼皮底下的？

两个因素使得罕见的遗传性疾病更加致命——缺乏认识，以及缺乏有针对性的治疗。

每12个婴儿中就有1个在生下来时患有罕见疾病。尽管全世界有3亿多罕见疾病患者，但人们对这些疾病的认知水平很低。由于影响儿童的罕见疾病超过1万种，相关病例的长尾分布非常分散。与安德鲁不同的是，大多数孩子的病情多年来一直没有被发现，直到症状变得严重。而让情况更复杂的是，找到遗传学家并不容易，光是预约就可能需要几个月的时间。

由于制药公司优先为影响大量人口的疾病研发药物，大多数罕见疾病都缺乏治疗方法。由于每种罕见疾病的患者只有几千人，商业化研究手段无法实行。尽管对罕见病的治疗有激励措施，但罕见病药物的研发却被边缘化了。

不过，面对作出正确诊断和提供高质量护理的双重挑战，技术正催生出新的解决方案。

用人工智能视觉检测罕见疾病

“你能确定某人患有唐氏综合症吗？”专注于计算机视觉领域的连续创业家Moti Shniberg问道。唐氏综合症是一种导致儿童智力残疾和发育迟缓的遗传性疾病，而该疾病会表现出明显的面部状况，很容易识别。

由于每700个儿童中有1个受到该疾病影响，“我们很有可能遇到过患有这种疾病的人，”Moti Shniberg表示。“在最初看了几个患有该疾病的孩子之后，作为人类的我们往往会立即发现这些病例。我们的大脑在没有任何专业医学知识的情况下，就被训练成能直观地发现这种病症。”

然而，即便是专家，要想将这一视觉技能扩展到其他罕见疾病也是一项挑战。成千上万的罕见疾病有着截然不同的症状，而每一种疾病只影响全球数千名儿童，我们的大脑没有足够的例子来进行学习。

这就是计算机视觉可以提供帮助的地方。为此，Moti Shniberg创建了Face.com，这是一个面部识别平台，在互联网上发现了超过180亿张脸。2012年，他把公司卖给了Facebook。当他和搭档Lior Wolf试图用计算机视觉和深度学习来解决其他有影响力的问题时，他们偶然发现了在罕见遗传性疾病中的应用机会。

于是，他们成立了FDNA公司，并开始开发由人工智能驱动的应用程序，如Face2Gene，以便用视觉方式来检测罕见的遗传性疾病。其算法被设计成只从每一种罕见疾病的少数患者的历史照片中进行学习。

在过去的十年里，FDNA通过与遗传学家的合作建立了一个包含5,000种罕见疾病的数据库。“我们的面部识别算法可以检测到1,500种这类疾病，”Moti Shniberg解释说。“其他3,500种疾病则利用了包括自然语言处理在内的技术来进行临床特征分析。”该数据库是Face2Gene背后的支撑，其只需要通过智能手机拍摄的一张面部照片就能帮助诊断病情。

AI视觉检测与基因检测相比效果如何？

2003年，科学家对整个人类基因组进行了测序。这一里程碑引发了社会对于基因分型（genotyping）如何检测和治疗遗传性疾病的强烈关注。大约20年后的今天，许多公司可以花费小几百美元对个人的完整DNA进行测序。然而，这些进步还没有给遗传性疾病的检测带来改变。

利用基因分型来发现疾病就像在海洋中寻找一艘失踪的船只。“我们谈论的是大量的数据，因为我们的遗传物质非常复杂，”Karen Gripp说道。这种方法本身并不是很有效，至少现在还不是。

与此同时，表型分型技术（phenotyping）出现了显著进步，该技术利用可观察到的特征来了解生物，而其中便包括通过面部特征研究来发现潜在疾病。由于人工智能和计算机视觉能力有了新发展，由人工智能驱动的算法可以立即检测出疾病。它们可以通过对医学影像展开的视觉检查，以及诸如人声、打字模式和其他数字化生物标记等输入信息来实现检测。

在实践中，基因分型和表型分型这两种方法不是竞争的，而是互补的。面部表型可以作为一种初步的诊断工具，帮助我们快速、高效地确定候选名单。

“如果我们已经对病人进行了评估，并知道了需要检查的基因，那我们就有了一个非常好的鉴别诊断，”Karen Gripp解释道。“接下来，对我们从基因测试中得到的数据进行分析就会简单得多。”