CircularNet:利用机器学习减少浪费
2022 年 10 月 5 日

由产品经理 Sujit Sanjeev、可持续发展项目经理 Robert Little、机器学习工程师 Umair Sabir 发表

你是否曾经对如何申报税款感到困惑?组装家具时感到困惑?不确定如何理解你的伴侣?事实证明,我们很多人都发现回收行为 比以上所有都更令人困惑。因此,我们在回收方面做得不好,只有 不到 10% 的全球资源被回收,并且 每 5 件物品中就有 1 件(约 17%) 被扔进了不应该扔的回收箱。这对每个人来说都是坏消息——回收设施发生火灾,我们每年 损失数十亿美元 的可回收材料——从本质上讲,我们错过了利用回收作为 应对气候变化的有效工具 的机会。考虑到这一点,我们问自己——我们如何利用科技的力量来确保我们回收更多,并且正确地回收?

随着世界人口增长和城市化进程,预计到 2030 年废物产量将达到 每年 26 亿吨,高于目前的约 21 亿吨。有效的回收策略对于培育可持续的未来至关重要。

处理我们的废物和可回收物的设施称为“材料回收设施”(MRFs)。每个 MRF 每天处理数万磅的社会“废物”,将有价值的可回收材料(如金属和塑料)与不可回收材料分离。当前废物捕获和分类流程中的一个关键低效率是无法识别和将废物分离成高质量的材料流。分类的准确性直接决定了回收材料的质量;对于高质量、具有商业价值的回收,污染水平必须低。即使 MRF 使用各种技术以及人工来将材料分离成不同的清洁流,但由于废物流极其杂乱和污染,自动废物检测难以实现,回收率和利润率保持在不可接受的低水平。

我们称之为“CircularNet”的一套模型出现了,它降低了 AI/ML 技术在废物识别方面的应用门槛,并提供了这种新的透明度所能带来的所有益处。

我们使用 CircularNet 的目标是开发一个用于废物/可回收物检测的强大且数据高效的模型,该模型可以支持我们在整个废物管理生态系统中识别、分类、管理和回收材料的方式。此类模型可能有助于

  • 更好地了解和从回收价值链中获取更多价值
  • 增加材料的填埋场转移率
  • 识别和减少进出材料流中的污染

挑战

每天处理数万磅材料,材料回收设施 的废物流提出了一个独特且不断变化的挑战: 在任何给定时间,复杂、混乱和多样化的材料流。此外,缺乏全面且易于获取的废物图像数据集来训练和评估 ML 模型。

这些模型应该能够在 MRF 的“真实世界”条件下准确识别不同类型的废物——这意味着即使在 严重杂乱和遮挡、前景物体形状和纹理变化很大以及物体严重变形的情况下也能识别物体。

除了这些挑战之外,还需要解决的其他问题包括前景和背景物体的视觉多样性(这些物体通常会严重变形),以及物体类别之间的细微差异 (例如,牛皮纸纸板;或 塑料)。

在跟踪可回收物通过回收价值链(例如在处置点、回收箱和运输卡车内以及材料回收设施内)时,还需要保持一致性。

解决方案

CircularNet 模型通过在数千张图像上使用 Mask R-CNN 算法进行训练来执行实例分割。Mask R-CNN 是从 TensorFlow 模型花园 实现的,它是一个存储库,包含多个模型和 TensorFlow 用户的建模解决方案。

通过与回收行业的专家合作,我们开发了一种定制的、可全球应用的材料类型分类法(例如“纸张”,“金属”,“塑料”等)和材料形式分类法(例如“袋子”,“瓶子”,“罐头”等),用于为模型注释训练数据。开发了模型来识别材料类型、材料形式和塑料类型(HDPE、PETE 等)。为不同目的训练了独特的模型,从而帮助实现更高的准确性(当协调和灵活性以适应不同的应用程序时)。这些模型使用各种骨干网络进行训练,例如 ResNet、MobileNet 和 SpineNet。

为了在不同的废物和可回收物品上训练模型,我们与多个 MRF 合作,并开始积累真实世界的图像。我们计划继续增加 MRF 和废物管理生态系统合作伙伴的数量和地理位置,以便继续在不同的废物流中训练模型。

以下是有关模型训练方式的一些细节。

  • 数据导入、清理和预处理
    • 收集数据后,必须将注释文件转换为 COCO JSON 格式。从 COCO JSON 文件中删除所有噪声、错误和错误标签。还从 COCO JSON 和数据集中删除了损坏的图像,以确保顺利训练。
    • 最终文件被转换为 TFRecord 格式以加快训练速度
  • 训练
  • 模型转换 
    • 训练模型后获得的最终检查点被转换为保存的模型和 TFLite 模型格式,以支持服务器端和边缘端部署
  • 模型部署 
    • 我们正在将模型部署在 Google Cloud 上进行服务器端推理,以及部署在边缘计算设备上
  • 可视化
    • CircularNet 模型表征可回收物的三种方式:形式、材料和塑料类型


      • 模型识别材料类型(例如“塑料”)

      • 模型识别材料的产品形式(例如“瓶子”)

      • 模型识别塑料类型(例如“HDPE”)

    如何使用 CircularNet 模型

    所有模型都提供有指南,其各自的 colab 脚本用于预处理、训练、模型转换、推理和可视化,这些脚本都可以在 Tensorflow 模型花园存储库 中找到。可以直接从服务器、浏览器或移动设备使用的预训练模型可在 TensorFlow Hub 上找到。

    结论

    我们希望该模型能够被废物管理生态系统中的各种利益相关者部署、调整和改进。我们正处于模型开发的早期阶段。通过与整个材料回收价值链中的各种利益相关者合作,我们可以更好地创建一个更具全球适用性的模型。如果您有兴趣与我们一起踏上这段旅程,请联系 [email protected]



    致谢

    对所有为这个项目付出了辛勤努力的人表示衷心的感谢!没有与回收生态系统合作,我们就无法做到这一点。

    特别感谢 Mark McDonald、Fan Yang、Vighnesh Birodkar 和 Jeff Rechtman
    下一篇文章
    CircularNet: Reducing waste with Machine Learning

    由产品经理 Sujit Sanjeev、可持续发展项目经理 Robert Little、机器学习工程师 Umair Sabir 发表 你是否曾经对如何申报税款感到困惑?组装家具时感到困惑?不确定如何理解你的伴侣?事实证明,我们很多人都发现回收行为 比以上所有都更令人困惑。因此,我们在回收方面做得不好,只有 不到 10% 的全球资源被回收,并且 每 5 件物品中就有 1 件(约 17%) 被扔进了不应该扔的回收箱。对每个人来说都是坏消息——回收设施发生火灾,我们每年 损失数十亿美元 的可回收材料——从本质上讲,我们错过了利用回收作为 应对气候变化的有效工具 的机会。考虑到这一点,我们问自己——我们如何利用科技的力量来确保我们回收更多,并且正确地回收?