英特尔最近在研究下一代DNN的各种GEMM操作。开发了用于FPGA的DNN硬件加速模板,为开发稀疏矩阵算法和自定义数据类型提供了一流的硬件支持。该模板是为了支持各种下一代DNN而开发,并且可以定制,为用户给定的DNN变体生成优化的FPGA硬件实例。
该模板被用于运行和评估下一代DNN的各种关键矩阵乘法操作,当前和下一代FPGA (Arria 10, Stratix 10)以及最新的高性能Titan X Pascal GPU.本研究结果发现,与Titan X Pascal GPU相比,在pruned, Int6和二值网络学习上(pruned, Int6, and binarized)DNNs的GEMM操作上,Stratix 10 FPGA的性能分别是Titan X Pascal GPU的1.1倍、1.5倍和5.4倍。
这些测试还表明,Arria 10和Stratix 10 FPGA相对于Titan X GPU提供了令人满意的能源效率(TOP/sec/watt),与Titan X相比,这两种设备的能源效率都提高了3到10倍。虽然GPU一直是支持DNN的无可争议的选择,但最近对两代Intel FPGA (Arria 10和Stratix 10)和最新的Titan X GPU的性能比较表明,当前DNN算法的趋势有利于FPGA,甚至FPGA可能提供更好的性能。
(责任编辑:fqj)
关于可编程逻辑就介绍完了,您有什么想法可以联系小编。