CNN加速器中卷积计算单元的硬件设计

CNN加速器中卷积计算单元的硬件设计

论文摘要

卷积神经网络(CNN)所有子层中卷积层的计算是整个网络计算中最耗费计算资源的问题,本文提出了一种对卷积神经网络的卷积层并行化实现方案。首先对系统的整体处理结构进行分析,然后对计算核的结构进行详细讨论,最后将卷积层中卷积运算并行映射到阵列处理器上。实验结果表明,在250Mhz的工作频率下,该结构可使FPGA(Field Programmable Gate Array,FPGA)提高峰值运算速度。

论文目录

  • 1 卷积计算模块设计
  • 2 实验结果
  • 文章来源

    类型: 期刊论文

    作者: 杨博文,杨海涛,高浩浩

    关键词: 卷积神经网络,现场可编程门阵列,卷积层

    来源: 数字技术与应用 2019年10期

    年度: 2019

    分类: 信息科技

    专业: 计算机硬件技术,自动化技术

    单位: 西安邮电大学

    分类号: TP183;TP332

    DOI: 10.19695/j.cnki.cn12-1369.2019.10.75

    页码: 136-137

    总页数: 2

    文件大小: 2212K

    下载量: 96

    相关论文文献

    标签:;  ;  ;  

    CNN加速器中卷积计算单元的硬件设计
    下载Doc文档

    猜你喜欢