突破英特尔CPU+英伟达GPU的大模型训练硬件组合:苹果与AMD都有新进展!
大语言模型的训练和微调的硬件资源要求很高。现行主流的大模型训练硬件一般采用英特尔的CPU+英伟达的GPU进行。主要原因在于二者提供了符合大模型训练所需的计算架构和底层的加速库。但是,最近苹果M2 Ultra和AMD的显卡进展让我们看到了一些新的希望。

本文主要介绍一下苹果芯片和基于AMD软硬件系统的大模型训练体系做简单的介绍。因为二者最新的硬件和生态建设都让我们有一种新的性价比选择。尽管除了硬件外还需要考虑加速库和开源库的选择,但是开源的速度让我们看到这些新选择完全没问题。
基于因特尔CPU+英伟达GPU的大模型训练基础架构
当前主流的大模型架构都是基于transformer的架构,属于一种深度学习架构的模型。使用GPU训练深度学习架构的大模型主要优势在于:



