导读:本文包含了网络并行算法论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:网络,神经网络,算法,卷积,多核,可编程,门阵列。
网络并行算法论文文献综述
李晓峰,李东[1](2019)在《基于卷积神经网络的多样性关键数据并行推荐算法》一文中研究指出为解决传统数据推荐算法易受干扰因素的影响,忽略对数据结构的分析,导致存在推荐精准度较低的问题,提出基于卷积神经网络的多样性关键数据并行推荐算法.从数据集中挑选点击、收藏、购买等多样性用户行为信息,将用户-商品作为样本展开训练,构建时序行为偏好特征,并对数据并行结构展开分析.从大量数据中提取与并行结构分析相关的关键数据,进行预处理,在此基础上,采用卷积神经网络算法计算最大化似然概率,获取损失函数,按照损失情况将卷积层神经元结构最简化处理,避免过拟合现象出现,由此实现对多样性关键数据的并行推荐.实验结果表明,所提算法的最高推荐精准度可达到98.75%,且在有无干扰因素存在的情况下,精准度均高于传统方法,且本文算法的关键数据提取效率较高,可为用户寻找资料提供便捷途径.(本文来源于《沈阳大学学报(自然科学版)》期刊2019年04期)
刘君楠[2](2019)在《支持复杂神经网络模型并行训练的资源分配算法优化》一文中研究指出近年来,深度学习领域的研究工作取得飞速的发展。更复杂的网络结构和更深的网络层数,使得神经网络模型的规模越来越大。虽然有效地提升了网络模型预测的准确度,但与此同时,网络模型的计算量也随之增长,从而导致对计算设备的要求也在不断增加。为了解决日益增长的计算需求,一种常用的做法是引入GPU来加速网络模型的训练过程。但随着网络规模的不断扩大,单张GPU卡已经无法满足训练需求,使用单节点多GPU卡甚至是多节点多GPU卡来训练神经网络模型成为有效的解决方案。因此如何在多个计算设备上划分神经网络模型从而高效地完成模型训练就变得日益重要。本文基于CPU+GPU异构平台,对如何加快复杂神经网络在模型并行训练时的训练速度进行研究。通过深度强化学习的方法优化神经网络模型在计算设备上的映射,从而加快神经网络模型的训练过程,并且将神经网络的模型并行训练扩展到多节点上。本文的主要内容和成果包括:(1)分析TensorFlow框架的软件架构,通过代码调试等手段动态剖析在CPU+GPU构成的异构计算环境下目标网络模型的训练过程,深入理解计算任务的组织管理方式,形成对复杂神经网络模型并行训练的资源分配方法进行优化的技术路径。(2)针对单机多卡环境下的复杂神经网络模型并行训练的资源分配优化问题,本文研究一种基于强化学习的资源分配优化算法,旨在获得更高的训练加速比。该算法的基本思想是,使用一种序列化的神经网络模型Φ(p)为拟训练的目标网络计算流图G生成一个设备分配方案p。然后,按照该设备分配方案在单机多卡系统上执行该计算流图,将本次执行时间ti当作奖励,反向更新神经网络模型少Φ(P)中的参数。Φ(P)经过多次训练,直至生成使目标网络模型运行时间tmin最小的设备分配方案,最终得到一个针对拟训练目标网络的资源优化分配方案。实验表明,基于预测的资源分配算法相对于基于人工的资源分配算法取得的28.41%的性能提升。(3)针对多机多卡环境下的复杂神经网络模型并行训练的资源分配问题,本文研究一种基于虚拟化技术实现的方法,旨在实现更好的网络模型并行训练规模的可扩展性。该方法借助GPU虚拟化技术实现多节点环境下神经网络的模型并行训练过程。同时我们使用基于强化学习的资源分配算法对训练过程进行优化,并且实验分析该方法的可扩展性。(本文来源于《中国科学技术大学》期刊2019-05-26)
李海朋,李晶皎,金硕巍,杨丹[3](2019)在《多宇宙并行量子遗传神经网络人脸识别算法研究》一文中研究指出针对传统遗传算法交叉、变异过程过于繁琐和神经网络在极值判断及收敛速度受限等问题,提出了一种并行的量子遗传算法优化神经网络权值的算法.首先引入了量子计算的概念,在量子计算的过程中使用量子旋门实现染色体的训练,然后引入量子交叉克服了早熟收敛现象,避免了遗传算法中繁琐的交叉、变异过程.最后设计实现了并行的卷积神经网络,使用并行量子遗传算法优化了卷积神经网络权值,实现了并行量子遗传神经网络人脸识别系统.实验结果表明,相对于原来的遗传算法,该算法在鲁棒性和实验速度上都有明显的提高.(本文来源于《东北大学学报(自然科学版)》期刊2019年05期)
周术鹏,靳松,吕天成,宋丽翠[4](2019)在《基于并行蚁群记忆查找算法的网络重构》一文中研究指出为节省网络重构的计算资源,提高计算准确度,提出一种并行蚁群记忆查找算法。将前一次迭代得到的最小网损及其对应的网络结构记录到查找表中;若本次迭代计算时蚂蚁找到的结构在查找表中已存在,则通过查找表直接得出对应网损以跳过潮流计算,节约计算资源。在信息素积累阶段,对进程中的信息素浓度进行分步式处理,增加不同进程间的差异值,进而扩大并行蚁群算法的搜索范围,使算法不易陷入局部最优。结合实例,对该算法进行仿真分析,其结果表明了该算法的准确性和高效性。(本文来源于《计算机工程与设计》期刊2019年05期)
郭杨,梁家荣,刘峰,谢敏[5](2019)在《一种基于超立方体网络的高效故障诊断并行算法》一文中研究指出超立方网络是一种重要的网络拓扑结构。针对现有的超立方网络故障诊断算法复杂度高的问题,引入故障扇的概念,采用并行深度优先搜索策略设计算法,通过算法寻找超立方体网络中的故障扇,确定该网络的故障节点,以便替换或修复,为增强网络的可靠性提供了一条重要的新途径。最后对所提算法的复杂性进行了分析,证明了该算法的时间复杂度不超过O(N),远优于现有复杂度超过平方级的算法。(本文来源于《计算机科学》期刊2019年05期)
周克飞[6](2019)在《基于并行多目标进化算法的大规模复杂网络社团检测研究》一文中研究指出在现实生活中,存在着各种各样的复杂系统,这些复杂系统通常可以抽象地表示为复杂网络。利用社团检测算法对复杂网络进行社团检测,能更好地理解系统结构,挖掘系统潜在的信息,还可以对一些未知的功能和属性进行预测。多目标进化算法具有良好的并行性、全局搜索能力以及对多种函数类可用等优良特性,成为解决复杂网络社团检测问题的重要方法之一。但目前大多数基于进化的社团检测算法都无法很好地处理大规模网络,为了进一步提升社团检测算法在大规模复杂网络上的性能,本文分别提出了基于并行多目标进化的大规模复杂网络非重迭和重迭社团检测算法。本文的主要研究工作如下:(1)提出了基于并行多目标进化的大规模复杂网络非重迭社团检测算法(PMOEA)。为了解决大规模复杂网络的社团检测问题,本文避免直接检测整个网络的社团划分,而是采用多个多目标进化算法并行检测网络中与对应关键点相关的社团。算法主要思想是首先检测出整个网络的关键点,然后运用多个多目标进化算法并行检测网络中与对应关键点相关的社团集合,最后使用单目标进化算法,从与每个关键节点相关的社团集合中来获得整个网络的社团划分。本文采用了与传统多目标社团检测算法不同的优化目标,设计了特别的交叉变异策略,同时缩短了个体编码长度,减小进化过程中种群的搜索空间,有助于发掘出更好的社团结构。配合多线程和分布式计算资源,多个多目标进化算法并行检测,缩短了多目标进化算法检测大规模复杂网络社团的时间。本文验证了PMOEA算法在真实网络和LFR基准网络上的有效性,尤其在大规模复杂网络上,实验结果表明本文提出的PMOEA算法与六个现有的社团检测算法相比具有一定的优势。(2)提出了基于并行多目标进化的大规模复杂网络重迭社团检测算法(PMOEAO)。现实生活中很多复杂网络都是重迭结构的,但在(1)的工作中没有对重迭结构进行特殊考察,无法检测出重迭的社团结构。因此本文在(1)算法的基础上进行进一步改进,提出PMOEAO算法,该算法继承了(1)算法并行处理的机制,同时具有解决重迭社团检测问题的能力。本文算法在(1)算法的MOEA进化过程中加入了候选重迭节点策略来调整社团边界,让改进的MOEA发掘的与单个关键节点相关的社团结构具有更合理的社团边界。之后再选用评价重迭社团划分的扩展模块度作为目标函数,通过单目标进化算法来确定整个网络的重迭社团划分。通过与六个具有代表性的重迭社团检测算法的实验结果的对比表明,PMOEAO算法在解决大规模复杂网络的重迭社团检测问题上具有一定的优势。(本文来源于《安徽大学》期刊2019-05-01)
何姣姣[7](2019)在《多尺度并行通道级联网络的行人检测算法研究》一文中研究指出行人检测作为目标检测的重要研究方向之一,多年来引起了人们特别的关注,并成为了理论研究和应用研究的热点,在智能监控视频、智能辅助驾驶、智能机器人等多个领域广泛被应用。而在实际应用中,由于摄像头拍摄视角受限,行人呈现尺度各异,小尺度行人所占比重较大,现有的目标检测器对小尺度行人的检测都存在局限性,因此,本文主要研究监控视频下的多尺度行人检测。论文对比研究了早期的行人检测算法和当前主流的基于深度学习的行人检测算法,探讨了影响行人检测的因素,并确定了基于深度学习的行人检测算法作为本课题研究的技术方案。针对多尺度行人检测,本文以Faster R-CNN的思想作为思维导向,提出了一种新的端到端的多尺度并行通道级联网络的行人检测算法。首先,研究了卷积神经网络不同层所提取的特征通道信息在表达行人特征中的不同表现特性,因此提出了一种全新的通道级联网络结构。在此基础上搭建并行通道级联网络以引入行人运动特征。其次,设计了多尺度行人区域建议网络,该网络利用通道注意力机制对图像特征通道重新赋予权值以调整特征关注域,再通过自适应地学习适用于行人的参考框来获取高质量的行人候选区域。最后,联合训练并行通道级联网络和多尺度行人区域建议网络,结合深度网络训练中常用的技巧,训练端到端的多尺度并行通道级联行人检测网络。在检测过程中,利用超分辨率重建技术恢复更多小尺寸行人的细节纹理信息,再送入检测网络中进行检测。为了验证所提出算法的有效性,本文建立了广角视频行人数据集,该数据集中行人分布密集、尺度范围广且小尺度行人居多。在该数据集上,本文提出的多尺度行人检测算法获得了极具竞争力的结果,特别是小尺度行人检测。同时,本文所研究的内容也适用于其他的目标检测,如交通灯检测、车辆检测等。(本文来源于《长安大学》期刊2019-04-10)
王巍,周凯利,王伊昌,王广,杨正琳[8](2019)在《卷积神经网络(CNN)算法的FPGA并行结构设计》一文中研究指出本文进行了CNN算法的FPGA并行结构设计.该设计首先利用CNN的并行计算特征以及循环变换方法,实现了可高效进行并行流水线的卷积计算电路,然后利用能够减少存储器访存时间的双缓存技术,在输入输出部分实现了缓存阵列,用于提高电路的计算性能(GOPS,每秒十亿次运算数).同时本文还对激活函数进行了优化设计,利用查找表和多项式结合的分段拟合方法设计了激活函数(sigmoid)的硬件电路,以保证近似的激活函数的硬件电路不会使精度下降.实验结果表明:输入时钟为150 MHz时,整体电路在计算性能上由15.87 GOPS提高到了20.62 GOPS,并在MNIST数据集上的识别率达到了98.81%.(本文来源于《微电子学与计算机》期刊2019年04期)
贾凯[9](2019)在《人工蜂群算法与BP神经网络并行集成学习研究》一文中研究指出在人类的生活、生产活动中,经常遇到的就是最优化问题,学者们也研究了很多解决最优化问题的方法,其中群智能优化算法作为重要的分枝,为最优化问题的求解提供了新的思路。人工蜂群算法(Artificial Bee Colony Algorithm,ABC)是一种新颖的群智能算法,通过研究自然界中蜜蜂信息交换和采蜜行为提出的一种自然计算方法,具有算法设计过程简洁、参数少、能够很好的跳出局部最优解且不需要计算梯度等特点。但是,现实世界中更多的是离散最优化问题,因此迫切需要对ABC算法进行离散化研究。BP神经网络(Back Propagation Neural Network,BPNN)算法也是解决最优化问题的一种方法,自提出以来,国内外很多专家学者对其进行了大量的改进研究,也取得了很多成果。但是传统BP神经网络的初始权值和阈值是随机的,导致算法寻优效率不高,易发生早熟且最终收敛精度不够,因此如何优化BP神经网络的缺陷,成为研究的重要方向。基于此,本文主要针对离散人工蜂群算法的改进及其与BP神经网络算法的并行集成学习进行了研究。研究成果如下:首先本文构建以高斯变异函数作为概率映射函数的离散二进制人工蜂群算法(IBABC),从理论上分析证明了算法的有效性,并通过在Benchmark测试函数上通过实验证明了IBABC算法较其他改进方案具有更好的效果;其次,将改进的二进制人工蜂群算法用于训练BP神经网络,并提出了基于改进二进制人工蜂群算法和BP神经网络算法的并行集成学习算法,即IBABC-BP算法,并通过理论分析和实验结果证明了并行集成学习算法的有效性;最后,基于IBABC-BP并行集成学习算法设计了雾霾预测模型,并用雾霾数据进行了相关的对比试验,证明了本文构建的雾霾预测模型的有效性。(本文来源于《合肥工业大学》期刊2019-04-01)
翟建丽[10](2019)在《基于云计算的社交网络并行推荐算法》一文中研究指出云计算平台的诞生,推动了推荐系统的发展。传统社会网络并行算法在大数据处理方面存在不足,利用签到记录时,不能充分利用签到信息所隐含的偏好、位置和社交网络信息,从而造成准确率低的问题。基于此,提出了基于云计算的社交网络并行推荐算法,Debogone算法设计。通过特征提取算法实现Debogone算法设计,以用户历史偏好为基础,综合考虑用户社交关系,以用户的活动范围为约束点,实现用户兴趣点的推荐。通过实验对比,证明了Debog one算法设计准确率高,稳定性高,具有推广意义。(本文来源于《信息与电脑(理论版)》期刊2019年05期)
网络并行算法论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
近年来,深度学习领域的研究工作取得飞速的发展。更复杂的网络结构和更深的网络层数,使得神经网络模型的规模越来越大。虽然有效地提升了网络模型预测的准确度,但与此同时,网络模型的计算量也随之增长,从而导致对计算设备的要求也在不断增加。为了解决日益增长的计算需求,一种常用的做法是引入GPU来加速网络模型的训练过程。但随着网络规模的不断扩大,单张GPU卡已经无法满足训练需求,使用单节点多GPU卡甚至是多节点多GPU卡来训练神经网络模型成为有效的解决方案。因此如何在多个计算设备上划分神经网络模型从而高效地完成模型训练就变得日益重要。本文基于CPU+GPU异构平台,对如何加快复杂神经网络在模型并行训练时的训练速度进行研究。通过深度强化学习的方法优化神经网络模型在计算设备上的映射,从而加快神经网络模型的训练过程,并且将神经网络的模型并行训练扩展到多节点上。本文的主要内容和成果包括:(1)分析TensorFlow框架的软件架构,通过代码调试等手段动态剖析在CPU+GPU构成的异构计算环境下目标网络模型的训练过程,深入理解计算任务的组织管理方式,形成对复杂神经网络模型并行训练的资源分配方法进行优化的技术路径。(2)针对单机多卡环境下的复杂神经网络模型并行训练的资源分配优化问题,本文研究一种基于强化学习的资源分配优化算法,旨在获得更高的训练加速比。该算法的基本思想是,使用一种序列化的神经网络模型Φ(p)为拟训练的目标网络计算流图G生成一个设备分配方案p。然后,按照该设备分配方案在单机多卡系统上执行该计算流图,将本次执行时间ti当作奖励,反向更新神经网络模型少Φ(P)中的参数。Φ(P)经过多次训练,直至生成使目标网络模型运行时间tmin最小的设备分配方案,最终得到一个针对拟训练目标网络的资源优化分配方案。实验表明,基于预测的资源分配算法相对于基于人工的资源分配算法取得的28.41%的性能提升。(3)针对多机多卡环境下的复杂神经网络模型并行训练的资源分配问题,本文研究一种基于虚拟化技术实现的方法,旨在实现更好的网络模型并行训练规模的可扩展性。该方法借助GPU虚拟化技术实现多节点环境下神经网络的模型并行训练过程。同时我们使用基于强化学习的资源分配算法对训练过程进行优化,并且实验分析该方法的可扩展性。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
网络并行算法论文参考文献
[1].李晓峰,李东.基于卷积神经网络的多样性关键数据并行推荐算法[J].沈阳大学学报(自然科学版).2019
[2].刘君楠.支持复杂神经网络模型并行训练的资源分配算法优化[D].中国科学技术大学.2019
[3].李海朋,李晶皎,金硕巍,杨丹.多宇宙并行量子遗传神经网络人脸识别算法研究[J].东北大学学报(自然科学版).2019
[4].周术鹏,靳松,吕天成,宋丽翠.基于并行蚁群记忆查找算法的网络重构[J].计算机工程与设计.2019
[5].郭杨,梁家荣,刘峰,谢敏.一种基于超立方体网络的高效故障诊断并行算法[J].计算机科学.2019
[6].周克飞.基于并行多目标进化算法的大规模复杂网络社团检测研究[D].安徽大学.2019
[7].何姣姣.多尺度并行通道级联网络的行人检测算法研究[D].长安大学.2019
[8].王巍,周凯利,王伊昌,王广,杨正琳.卷积神经网络(CNN)算法的FPGA并行结构设计[J].微电子学与计算机.2019
[9].贾凯.人工蜂群算法与BP神经网络并行集成学习研究[D].合肥工业大学.2019
[10].翟建丽.基于云计算的社交网络并行推荐算法[J].信息与电脑(理论版).2019