2023 年 6 月 20 日 — 由 Google Research 健康人工智能团队的 Angelica Willis 和 Akib Uddin 发布谷歌的研究人员如何利用人工智能帮助扩大全球对产妇保健的获取*TensorFlow Lite* 是一个开源框架,用于在移动设备和边缘设备上运行机器学习模型。它在图像分类、目标检测、语音识别、自然语言任务等各种用例中都很受欢迎。从帮助聋哑儿童的父母学习手语到预测空气质量,使用 TensorFlow Lite 的项目证明了设备端 ML 如何通过使这些对社会有益的人工智能应用更易于获得,从而直接积极地影响人们的生活,在全球范围内。在这篇文章中,我们介绍了 TensorFlow Lite 如何被用于帮助开发资源匮乏地区超声工具。
TensorFlow Lite* 是一个开源框架,用于在移动设备和边缘设备上运行机器学习模型。它在图像分类、目标检测、语音识别、自然语言任务等各种用例中都很受欢迎。从帮助聋哑儿童的父母学习手语到预测空气质量,使用 TensorFlow Lite 的项目证明了设备端 ML 如何通过使这些对社会有益的人工智能应用更易于获得,从而直接积极地影响人们的生活,在全球范围内。在这篇文章中,我们介绍了 TensorFlow Lite 如何被用于帮助开发资源匮乏地区超声工具。
根据世界卫生组织,每年约有 287,000 例孕产妇死亡和 240 万例新生儿死亡是由于妊娠和分娩并发症造成的。其中多达 95% 的死亡发生在资源匮乏地区,许多死亡是可以预防的,只要及早发现。产科诊断,如确定妊娠周数和胎儿先露,是制定产前保健计划、监测分娩者和胎儿健康状况以及确定何时需要干预的重要指标。许多这些因素传统上是通过超声检查确定的。
传感器技术的进步使超声设备更加经济实惠且便携,直接与智能手机集成。但是,超声检查需要多年的培训和经验,在许多农村或服务不足的地区,训练有素的超声检查专家短缺,使人们难以获得护理。由于这种全球性的缺乏可用性,据估计,这些地区多达三分之二的孕妇在怀孕期间没有接受超声检查筛查。
Google Research 正在构建人工智能模型以帮助扩大对超声检查的获取,包括用于预测妊娠周数和胎儿先露的模型,使没有超声检查背景的医护人员能够收集临床上有用的超声检查。这些模型根据使用易于教授的操作程序获得的超声视频进行预测,即盲扫协议,其中用户在患者的腹部盲目地扫描超声探头。在我们最近发表的论文中,"用于妊娠周数和胎儿先露评估的移动优化人工智能系统",发表在《自然通讯医学》上,我们证明了在使用盲扫时,这些模型使这些非专家能够在预测这些诊断方面达到标准护理水平的表现。
这种盲扫超声采集程序可以由仅接受过几个小时超声培训的非专家执行。 |
图 A 将我们基于盲扫的妊娠周数回归模型性能与从专家超声检查医师测量的胎儿生物测量中估计胎儿年龄的临床标准护理方法进行了比较。方框表示以天为单位的第 25、50 和 75 个百分位数的绝对误差,而触须表示第 5 和 95 个百分位数的绝对误差(n = 407 个研究参与者)。图 B 显示了我们基于盲扫的胎儿先露分类模型的受试者工作特征 (ROC) 曲线,以及专家超声检查医师或新手收集盲扫病例的特定性能曲线(n = 623 个研究参与者)。有关更多详细信息和额外分析,请参见我们最近的论文。 |
我们了解到,我们的目标部署环境是用户可能无法可靠地访问电源和互联网的环境,因此我们设计了这些模型以进行移动优化。我们的分组卷积 LSTM 架构利用MobileNetV2 在接收到的每个视频帧上进行特征提取。最终的特征层产生一系列图像嵌入,这些嵌入由卷积 LSTM 细胞状态处理。由于循环连接仅在内存消耗较少的嵌入上运行,因此该模型可以在移动环境中高效运行。
对于构成扫描的每个视频帧子序列,我们生成一个剪辑级诊断结果,并且在妊娠周数的情况下,还生成一个模型置信度估计,表示为检测到的年龄的预测方差。剪辑级妊娠周数预测通过逆方差加权进行聚合,以产生最终的病例级预测。
设备端 ML 具有许多优势,包括通过确保敏感输入数据永远不需要离开设备来提供增强的隐私和安全性。设备端 ML 的另一个重要优势,特别是对于我们的用例,是能够在互联网连接较差的地区离线利用 ML,包括智能手机作为更昂贵的传统设备的替代品的地方。我们优先考虑设备端 ML,使 TensorFlow Lite 成为优化和评估现有模型的内存使用和执行速度的自然选择,而无需对模型结构或预测性能进行重大更改。
在使用转换器 API将我们的模型转换为 TensorFlow Lite 之后,我们探索了各种优化策略,包括训练后量化和替代委托配置。利用针对持续推断速度优化的 TensorFlow Lite GPU 委托,为执行速度提供了最显著的提升。速度提高了约 2 倍,而模型精度没有损失,这相当于在 Pixel 设备上并行运行妊娠周数和胎儿先露模型的情况下,每秒推断超过 30 帧的实时推断。我们使用 TensorFlow Lite性能测量工具对各种委托配置的模型初始化时间、推断时间和内存使用情况进行了基准测试,找到了跨多个移动设备制造商的最佳配置。
这些关键速度改进使我们能够利用模型置信度估计,在捕获扫描后立即向用户提供扫描质量反馈。当检测到低质量扫描时,可以向用户提供有关如何改进扫描的提示(例如,施加更多压力或超声凝胶),然后提示他们重新进行扫描。
我们的愿景是使用人工智能驱动的超声检查,使妊娠之旅更安全,并能够在全球范围内扩大获取途径。我们希望在开发人工智能时认真负责,以最大限度地发挥积极作用,并解决挑战,遵循我们的人工智能原则。TensorFlow Lite 帮助我们的研究团队探索、原型设计和降低旨在满足资源较少社区需求的具有影响力的护理交付策略的风险。
这项研究仍处于早期阶段,我们期待着扩展我们工作的机会。为了实现我们的目标并将这项技术扩展到全球更广泛的范围,合作伙伴关系至关重要。我们很高兴与美国西北医学和肯尼亚蓝花楹健康合作,进一步开发和评估这些模型。通过对孕产妇和胎儿健康风险进行更自动化和更准确的评估,我们希望降低障碍,帮助人们获得及时护理。
这项工作由 Google Research 内部的跨学科团队开发:Ryan G. Gomes、Chace Lee、Angelica Willis、Marcin Sieniek、Christina Chen、James A. Taylor、Scott Mayer McKinney、George E. Dahl、Justin Gilmer、Charles Lau、Terry Spitz、T. Saensuksopa、Kris Liu、Tiya Tiyasirichokchai、Jonny Wong、Rory Pilgrim、Akib Uddin、Greg Corrado、Lily Peng、Katherine Chou、Daniel Tse 和 Shravya Shetty。
特别感谢:Yun Liu、Cameron Chen、Sami Lachgar、Lauren Winer、Annisah Um'rani 和 Sachin Kotwani
*TensorFlow Lite 未经认证或验证,不适用于临床、医疗或诊断目的。TensorFlow Lite 用户对其使用该框架以及独立验证其项目生成的任何输出负全部责任。