基于近似牛顿法的分布式深度学习

基于近似牛顿法的分布式深度学习

论文摘要

在许多机器学习问题中,往往需要解决大规模模型的最优化问题。最优化问题主要研究各种问题的优化途径及方案,在科学计算和工程分析中起着越来越重要的作用。近似牛顿法作为解决这一问题的有效方法,在计算机视觉、统计机器学习、生物信息和数据挖掘等领域都有广泛的应用。随着深度网络的快速发展,数据和参数规模也日益增长。近些年来,尽管研究人员在提升GPU硬件性能、完善网络架构和改进训练方法等方面均获得了很大的进步,但是在大型数据集上以单一机器训练深度网络模型仍然十分困难,因此,分布式优化及其在大规模深度网络上的训练一直是深度学习研究领域的挑战性问题。随着深度网络数据量和模型参数量的增加,传统的单机训练存在训练时间长,内存容量有限,而分布式优化方法可以很好的解决这一问题。因此,本文将分布式近似牛顿法算法引入到分布式神经网络研究中。该算法将总体样本平均分布至多台计算机,不但减少了每台计算机所需处理的数据量,而且利用计算机之间互相通信高效完成训练任务。首先,对分布式近似牛顿法同步策略进行Matlab同步并行仿真实验,在实验中均衡地划分数据集,并行地对数据集进行计算,在相同矩阵下,并行优化运行时间相比于串行运行时间大大减少,并且收敛性也能得到保证。其次,本文将分布式近似牛顿法用于训练深度网络。该算法使Parameter server集群中的各个Worker节点利用均等分配的本地数据完成计算,并与Server节点进行通信,得到同步优化的结果。利用分布式近似牛顿法训练相同的深度网络时,随着GPU数目呈2的倍数增加,训练时间呈近乎2的指数次幂减少。这与本文的最终目的一致,即在保证精度的前提下,利用现有分布式框架实现近似牛顿法的深度网络训练,提升运行效率。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  •   1.1 研究背景
  •   1.2 国内外研究现状
  •     1.2.1 算法研究现状
  •     1.2.2 并行运算框架与分布式系统
  •   1.3 论文的主要内容及章节安排
  • 第二章 相关方法理论介绍
  •   2.1 牛顿迭代法
  •   2.2 近似牛顿法
  •     2.2.1 Bregman散度
  •     2.2.2 分布式近似牛顿法
  •     2.2.3 二次目标的分布式近似牛顿法
  •   2.3 分布式Parameter server
  •   2.4 深度学习
  • 第三章 近似牛顿法的分布式仿真
  •   3.1 经验风险最小化
  •   3.2 仿真分布式近似牛顿法
  •   3.3 实验设计及结果分析
  •   3.4 本章小结
  • 第四章 基于近似牛顿法的分布式深度网络训练
  •   4.1 分布式优化
  •   4.2 分布式并行算法
  •     4.2.1 可行性分析
  •     4.2.2 分布式并行算法设计
  •   4.3 环境配置
  •     4.3.1 Mxnet环境配置
  •     4.3.2 配置ssh免密码登录
  •   4.4真实数据集实验
  •   4.5 本章小结
  • 第五章 结论与展望
  •   5.1 工作内容及创新之处
  •   5.2 今后工作展望
  • 致谢
  • 参考文献
  • 攻读硕士期间完成的科研情况
  • 附录
  • 文章来源

    类型: 硕士论文

    作者: 王雅慧

    导师: 袁晓彤,朱付平

    关键词: 近似牛顿法,仿真,并行优化,深度网络

    来源: 南京信息工程大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 数学,自动化技术

    单位: 南京信息工程大学

    分类号: TP18;O242.23

    DOI: 10.27248/d.cnki.gnjqc.2019.000541

    总页数: 57

    文件大小: 2104K

    下载量: 66

    相关论文文献

    • [1].对牛顿迭代法的改进[J]. 高师理科学刊 2020(03)
    • [2].浅谈对修正牛顿法的一点改进[J]. 价值工程 2016(34)
    • [3].解非线性方程的一类改进型牛顿法[J]. 湖州师范学院学报 2015(02)
    • [4].关于高斯牛顿法的注记[J]. 哈尔滨师范大学自然科学学报 2016(03)
    • [5].改进牛顿法大规模电力系统潮流计算[J]. 计算技术与自动化 2010(04)
    • [6].一类非光滑方程的两阶段类牛顿法[J]. 桂林电子科技大学学报 2013(04)
    • [7].不精确牛顿法求解一类变分不等式[J]. 嘉兴学院学报 2010(03)
    • [8].不精确牛顿法及其半局部收敛性[J]. 廊坊师范学院学报(自然科学版) 2008(06)
    • [9].数值方法验证弦截法的收敛速度[J]. 科技经济市场 2011(10)
    • [10].以“牛顿法”为背景的高考试题赏析[J]. 中学数学 2011(17)
    • [11].“庖丁解牛” 意在素养——“牛顿法:用导数方法求方程的近似解”教学设计[J]. 中学教研(数学) 2018(12)
    • [12].非光滑方程的方向牛顿法[J]. 应用数学与计算数学学报 2010(01)
    • [13].求解圆锥规划的光滑牛顿法[J]. 数学的实践与认识 2017(10)
    • [14].基于非精确光滑牛顿法的二次规划逆问题的研究[J]. 赤峰学院学报(自然科学版) 2017(02)
    • [15].二阶锥规划的一步光滑牛顿法[J]. 数学物理学报 2012(04)
    • [16].求解非线性方程重根的区间牛顿法[J]. 计算机工程与应用 2012(31)
    • [17].直角坐标下含零注入约束的电力系统状态估计修正牛顿法[J]. 中国电机工程学报 2012(19)
    • [18].线性对称锥规划的一步光滑牛顿法[J]. 黄冈师范学院学报 2009(03)
    • [19].求解非线性互补问题的一个新的光滑牛顿法[J]. 平顶山学院学报 2012(02)
    • [20].求张量扩展特征值的幂法[J]. 井冈山大学学报(自然科学版) 2015(06)
    • [21].基于分布式牛顿法的配电网光伏发电集群电压控制方法[J]. 供用电 2020(08)
    • [22].基于近似牛顿法的分布式卷积神经网络训练[J]. 计算机科学 2019(07)
    • [23].牛顿法在架空线应力计算中的应用[J]. 电力建设 2009(08)
    • [24].牛顿法在求解计算中的应用研究[J]. 价值工程 2013(17)
    • [25].一类非线性二阶锥规划的非光滑牛顿法[J]. 数学杂志 2014(03)
    • [26].采用改进牛顿法计算配电网理论线损[J]. 工矿自动化 2013(01)
    • [27].一个八阶收敛的修正牛顿法[J]. 唐山师范学院学报 2011(02)
    • [28].牛顿法在隐函数中的应用[J]. 赤峰学院学报(自然科学版) 2010(01)
    • [29].解变分不等式的简单牛顿法的收敛性[J]. 浙江工业大学学报 2016(04)
    • [30].一类修正的阻尼牛顿法[J]. 洛阳理工学院学报(自然科学版) 2015(01)

    标签:;  ;  ;  ;  

    基于近似牛顿法的分布式深度学习
    下载Doc文档

    猜你喜欢