基于GPU的机器学习Python库——RAPIDS简介及其使用方法
随着深度学习的火热,对计算机算力的要求越来越高。从2012年AlexNet以来,人们越来越多开始使用GPU加速深度学习的计算。
然而,一些传统的机器学习方法对GPU的利用却很少,这浪费了很多的资源和探索的可能。在这里,我们介绍一个非常优秀的项目——RAPIDS,这是一个致力于将GPU加速带给传统算法的项目,并且提供了与Pandas和scikit-learn一致的用法和体验,非常值得大家尝试。如果需要使用传统机器学习方法处理大规模的数据,这是非常值得使用的库。这里列举的只是少部分功能,它的强大远远超过你的想象。
目前,RAPIDS提供三个模块处理数据:cuDF相当于Pandas,cuML相当于scikit-learn,cuGraph则是处理图数据的(如PageRank算法)。由于它的兼容性很好,我们可以把RAPIDS与深度学习框架结合,用cuDF来利用GPU加速处理数据,然后使用PyTorch的深度学习模型处理任务。这也是可以的。所以,它非常灵活而且强大。
RAPIDS在Medium上也有博客,介绍了很多使用RAPIDS处理任务的技巧,如使用RAPIDS处理金融数据、使用cuDF加速协同过滤等。链接可以看参考一章。



