FPGA和GPU在深度神经网络方面谁更胜一筹可编程逻辑技术文章

首页 > 电子技术
发布时间: 2021-02-23　更新时间: 2021-02-23

英特尔最近在研究下一代DNN的各种GEMM操作。开发了用于FPGA的DNN硬件加速模板，为开发稀疏矩阵算法和自定义数据类型提供了一流的硬件支持。该模板是为了支持各种下一代DNN而开发，并且可以定制，为用户给定的DNN变体生成优化的FPGA硬件实例。

该模板被用于运行和评估下一代DNN的各种关键矩阵乘法操作，当前和下一代FPGA (Arria 10, Stratix 10)以及最新的高性能Titan X Pascal GPU.本研究结果发现，与Titan X Pascal GPU相比，在pruned, Int6和二值网络学习上（pruned, Int6, and binarized）DNNs的GEMM操作上，Stratix 10 FPGA的性能分别是Titan X Pascal GPU的1.1倍、1.5倍和5.4倍。

这些测试还表明，Arria 10和Stratix 10 FPGA相对于Titan X GPU提供了令人满意的能源效率(TOP/sec/watt)，与Titan X相比，这两种设备的能源效率都提高了3到10倍。虽然GPU一直是支持DNN的无可争议的选择，但最近对两代Intel FPGA (Arria 10和Stratix 10)和最新的Titan X GPU的性能比较表明，当前DNN算法的趋势有利于FPGA，甚至FPGA可能提供更好的性能。

（责任编辑：fqj）

关于可编程逻辑就介绍完了，您有什么想法可以联系小编。

上一篇：英特尔Stratix 10 GX 10M FPGA的优势是什么

下一篇：高云半导体成功量产Always-On超低功耗GW1NZ-ZV器件