大数据文摘出品
来源:medium
编译:赵吉克
在过去的几年里,深度学习硬件方面取得了巨大的进步,Nvidia的最新产品TeslaV和GeforceRTX系列包含专用的张量核,用于加速神经网络中常用的操作。
特别值得一提的是,V有足够的能力以每秒数千张图的速度训练神经网络,这使得基于ImageNet数据集小模型在单GPU上训练只需几小时,与年在ImageNet上训练AlexNet模型所花费的5天时间相比简直是天壤之别!
然而,强大的GPU使数据预处理管道不堪重负。为了解决这个问题,Tensorflow发布了一个新的数据加载器:tf.data.Dataset,用C++编写,并使用基于图的方法将多个预处理操作链接在一起。
另一方面,PyTorch使用在PIL库上用Python编写的数据加载器,既方便优灵活,但在速度上有欠缺(尽管PIL-SIMD库确实稍微改善了这种情况)。
进入NVIDIA数据加载器(DALI):旨在消除数据预处理瓶颈,允许训练和推理全速运行。DALI主要用于在GPU上的预处理,但是大多数操作也在CPU上有快速实现。本文主要