一种基于Zynq的CNN加速器设计与实现
【摘要】:卷积神经网络是一种前馈神经网络,它的人工神经元可以响应部分覆盖范围内的临近单元,对于大型图像处理有出色表现。文中设计了一种基于Zynq芯片的CNN加速器,以期在资源和功耗受限的FPGA中实现运算性能加速。该加速器采用数据量化的方式将网络参数从64位双精度浮点数转化为16位定点数;针对CNN不同层的特性和要求,设计了不同的网络结构和优化策略。卷积层和全连接层采用循环分块、循环流水及循环展开等方法进一步改进,而池化层采用流水线的优化方式。亦设计了FPGA和外部存储器的缓存策略,减少FPGA和外部存储器的数据传输量。以CIFAR-10数据集下的图像识别为例,在Zynq7020实验平台上进行板级测试,实验结果表明,100 MHz的工作频率下,平均识别时间为15.5 ms,相对于单核CPU方案实现了144倍的加速。
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||
|
|
|||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||||||||||||||||||||||
|