12倍推理速度提升！Meta AI开源全新的AI推理引擎AITemplate

为了提高AI模型的推理速度，降低在不同GPU硬件部署的成本，Meta AI研究人员在昨天发布了一个全新的AI推理引擎AITemplate（AIT），该引擎是一个Python框架，它在各种广泛使用的人工智能模型（如卷积神经网络、变换器和扩散器）上提供接近硬件原生的Tensor Core（英伟达GPU）和Matrix Core（AMD GPU）性能。

下图是AIT在A100/CUDA 11.6上的表现。与PyTorch的eager模式相比，ResNet-50最高有12倍性能的提升，BERT最多有5.3倍的性能提升，可以看到效果十分惊艳！

在AMD的软硬件平台上也有很好的表现（MI250/ROCm 5.2）

已经有人测试过使用AITemplate也可以提升Stable Diffusion的速度：

可以看到，在A100-40GB/CUDA 11.6的平台上，使用AIT运行Stable Diffusion最多可以提升2.4倍的推理速度。PyTorch一秒可以迭代17.50次，而AITemplate可以迭代42.45次。速度提升十分明显。

12倍推理速度提升！Meta AI开源全新的AI推理引擎AITemplate

DataLearner 官方微信

为什么要开发AITemplate

AITemplate简介

AITemplate安装使用

热门博客