在 Mac 上加速 TensorFlow 性能
2020 年 11 月 18 日
作者:Pankaj Kanwar 和 Fred Alcober

Apple M1 logo

借助 TensorFlow 2,一流的训练性能在各种不同的平台、设备和硬件上都可实现,使开发人员、工程师和研究人员能够在其首选平台上工作。现在,在 Intel Mac 或搭载 Apple 新 M1 芯片的 Mac 上的 TensorFlow 用户可以使用 Apple 的 针对 Mac 优化的 TensorFlow 2.4 版本 和新的 ML Compute 框架享受加速训练的优势。这些改进,加上 Apple 开发人员能够通过 TensorFlow Lite 在 iOS 上执行 TensorFlow 的功能,继续展示了 TensorFlow 在支持 Apple 硬件上的高性能 ML 执行方面的广度和深度。

使用 ML Compute 在 Mac 上的性能

Mac 一直是开发人员、工程师和研究人员的热门平台。随着 Apple 上周发布的 公告,其中包括更新的 Mac 产品线,这些产品线包含新的 M1 芯片,Apple 的针对 Mac 优化的 TensorFlow 2.4 版本利用了 Mac 的全部功能,性能大幅提升。

ML Compute 是 Apple 的新框架,它为 TensorFlow 模型直接在 Mac 上的训练提供支持,现在让您能够利用在 M1 和 Intel 驱动的 Mac 上的加速 CPU 和 GPU 训练的优势。

例如,M1 芯片包含一个强大的新型 8 核 CPU 和高达 8 核的 GPU,它们针对直接在 Mac 上进行 ML 训练任务进行了优化。在下面的图表中,您可以看到针对 Mac 优化的 TensorFlow 2.4 如何在 M1 和 Intel 驱动的 Mac 上使用流行模型实现巨大的性能提升。

Training impact on common models using ML Compute on M1- and Intel-powered 13-inch MacBook Pro are shown in seconds per batch, with lower numbers indicating faster training time.
使用 M1 和 Intel 驱动的 13 英寸 MacBook Pro 上的 ML Compute 对常见模型的训练影响以每批次秒数显示,数字越低表示训练时间越快。
Training impact on common models using ML Compute on the Intel-powered 2019 Mac Pro
使用 Intel 驱动的 2019 Mac Pro 上的 ML Compute 对常见模型的训练影响以每批次秒数显示,数字越低表示训练时间越快。

开始使用针对 Mac 优化的 TensorFlow

用户无需对其现有的 TensorFlow 脚本进行任何更改,即可将 ML Compute 用作 TensorFlow 和 TensorFlow Addons 的后端。

要开始使用,请访问 Apple 的 GitHub 存储库,了解有关下载和安装针对 Mac 优化的 TensorFlow 2.4 分支的说明。

在不久的将来,我们将通过将分叉版本集成到 TensorFlow 主分支 中,让用户更容易获得这些性能数字。

您可以在 Apple 的机器学习网站 上了解有关 ML Compute 框架的更多信息。


脚注

  1. 测试由 Apple 在 2020 年 10 月和 11 月进行,使用的是搭载 Apple M1 芯片、16GB 内存和 256GB SSD 的预生产 13 英寸 MacBook Pro 系统,以及搭载 Intel Iris Plus Graphics 645、16GB 内存和 2TB SSD 的生产型 1.7GHz 四核 Intel Core i7 13 英寸 MacBook Pro 系统。测试使用的是预发布版 macOS Big Sur、TensorFlow 2.3、预发布版 TensorFlow 2.4、带微调的 ResNet50V2、CycleGAN、风格迁移、MobileNetV3 和 DenseNet121。性能测试使用的是特定计算机系统,反映的是 MacBook Pro 的近似性能。
  2. 测试由 Apple 在 2020 年 10 月和 11 月进行,使用的是搭载 3.2GHz 16 核 Intel Xeon W、32GB 内存、AMD Radeon Pro Vega II Duo 显卡(带 64GB HBM2)和 256GB SSD 的生产型 Mac Pro 系统。测试使用的是预发布版 macOS Big Sur、TensorFlow 2.3、预发布版 TensorFlow 2.4、带微调的 ResNet50V2、CycleGAN、风格迁移、MobileNetV3 和 DenseNet121。性能测试使用的是特定计算机系统,反映的是 Mac Pro 的近似性能。
下一篇文章
Accelerating TensorFlow Performance on Mac

作者:Pankaj Kanwar 和 Fred Alcober

借助 TensorFlow 2,一流的训练性能在各种不同的平台、设备和硬件上都可实现,使开发人员、工程师和研究人员能够在其首选平台上工作。现在,在 Intel Mac 或搭载 Apple 新 M1 芯片的 Mac 上的 TensorFlow 用户可以使用 Apple 的 针对 Mac 优化的 Tensor… 享受加速训练的优势。