论文摘要
卷积神经网络(CNN)所有子层中卷积层的计算是整个网络计算中最耗费计算资源的问题,本文提出了一种对卷积神经网络的卷积层并行化实现方案。首先对系统的整体处理结构进行分析,然后对计算核的结构进行详细讨论,最后将卷积层中卷积运算并行映射到阵列处理器上。实验结果表明,在250Mhz的工作频率下,该结构可使FPGA(Field Programmable Gate Array,FPGA)提高峰值运算速度。
论文目录
文章来源
类型: 期刊论文
作者: 杨博文,杨海涛,高浩浩
关键词: 卷积神经网络,现场可编程门阵列,卷积层
来源: 数字技术与应用 2019年10期
年度: 2019
分类: 信息科技
专业: 计算机硬件技术,自动化技术
单位: 西安邮电大学
分类号: TP183;TP332
DOI: 10.19695/j.cnki.cn12-1369.2019.10.75
页码: 136-137
总页数: 2
文件大小: 2212K
下载量: 96
相关论文文献
标签:卷积神经网络论文; 现场可编程门阵列论文; 卷积层论文;