2022 年 10 月 28 日 — 英特尔 Jianhui Li、Zhoulong Jiang、Yiqiang Li 和 Google Penporn Koanantakool 发表 深度学习的普遍性推动了许多新型人工智能加速器的开发和部署。然而,使用户能够在这些硬件类型上有效地运行现有的人工智能应用程序是一个重大挑战。为了实现广泛采用,硬件供应商需要将他们的低级软件栈与高级人工智能框架无缝集成。另一方面,框架只能为市场上已经流行的初始设备添加特定于设备的代码 - 对于新的加速器来说这是一个鸡和蛋的问题。无法上游集成意味着硬件供应商需要维护他们定制的分支框架,并在每个新版本发布时重新集成到主要仓库,这既繁琐又不可持续。
英特尔 Jianhui Li、Zhoulong Jiang、Yiqiang Li 和 Google Penporn Koanantakool 发表
深度学习的普遍性推动了许多新型人工智能加速器的开发和部署。然而,使用户能够在这些硬件类型上有效地运行现有的人工智能应用程序是一个重大挑战。为了实现广泛采用,硬件供应商需要将他们的低级软件栈与高级人工智能框架无缝集成。另一方面,框架只能为市场上已经流行的初始设备添加特定于设备的代码 - 对于新的加速器来说这是一个鸡和蛋的问题。无法上游集成意味着硬件供应商需要维护他们定制的分支框架,并在每个新版本发布时重新集成到主要仓库,这既繁琐又不可持续。
认识到 TensorFlow 中需要模块化设备集成接口,英特尔和 Google 共同设计了 可插拔设备,这是一种机制,允许硬件供应商独立发布用于新设备支持的插件包,这些包可以与 TensorFlow 一起安装,而无需修改 TensorFlow 代码库。自可插拔设备在 TensorFlow 2.5 中发布以来,它一直是将新设备添加到 TensorFlow 的唯一方法。为了与原生设备实现功能对等,英特尔和 Google 还将分析 C 接口添加到 TensorFlow 2.7。TensorFlow 社区 迅速采用 可插拔设备,并一直在定期提交贡献以共同改进该机制。目前,有 3 个可插拔设备。今天,我们很高兴地宣布最新的可插拔设备 - 英特尔® TensorFlow 扩展*。
图 1. Intel 数据中心 GPU Flex 系列 |
英特尔® TensorFlow 扩展* 在英特尔平台上加速基于 TensorFlow 的应用程序,重点关注英特尔的独立显卡,包括 Intel® 数据中心 GPU Flex 系列(图 1)和 Intel® Arc™ 显卡。它在 Linux 和 Windows 子系统 Linux (WSL2) 上运行。图 2 说明了插件如何使用 oneAPI 实现可插拔设备接口,oneAPI 是一种基于标准的开放统一编程模型,它在加速器架构之间提供一致的开发者体验。
图 2. 英特尔® TensorFlow 扩展* 如何使用 oneAPI 软件组件实现可插拔设备接口 |
要安装插件,请运行以下命令
$ pip install tensorflow==2.10.0 $ pip install intel-extension-for-tensorflow[gpu] |
2022 年 10 月 28 日 — 英特尔 Jianhui Li、Zhoulong Jiang、Yiqiang Li 和 Google Penporn Koanantakool 发表 深度学习的普遍性推动了许多新型人工智能加速器的开发和部署。然而,使用户能够在这些硬件类型上有效地运行现有的人工智能应用程序是一个重大挑战。为了实现广泛采用,硬件供应商需要将他们的低级软件栈与高级人工智能框架无缝集成。另一方面,框架只能为市场上已经流行的初始设备添加特定于设备的代码 - 对于新的加速器来说这是一个鸡和蛋的问题。无法上游集成意味着硬件供应商需要维护他们定制的分支框架,并在每个新版本发布时重新集成到主要仓库,这既繁琐又不可持续。