多线程处理器论文_陈逸飞,朱蕾,李宏亮

导读:本文包含了多线程处理器论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:多线程,处理器,多核,线程,实时,检查点,便签。

多线程处理器论文文献综述

陈逸飞,朱蕾,李宏亮[1](2019)在《一种多线程阵列众核处理器的二级Cache划分机制》一文中研究指出阵列众核处理器由于其较高的计算性能和能效比已经广泛应用于高性能计算领域。而要构建未来高性能计算系统处理器必须解决严峻的"访存墙"挑战以及核心协同问题。通常的阵列处理器,其核心多采用单线程结构,以减少开销,但是对访存提出了较高的要求。引入硬件同时多线程技术,针对实验中单核心多线程二级Cache利用率较低的问题,提出了一种共享二级Cache划分机制。经实验模拟,通过上述优化的共享二级Cache划分机制,二级指令Cache失效率下降18.59%,数据Cache失效率下降6.60%,整体CPI性能提升达到10.1%。(本文来源于《计算机工程与科学》期刊2019年03期)

[2](2019)在《Arm首款多线程处理器增强驾驶员对大规模部署自动驾驶的安全信任》一文中研究指出Arm宣布推出首款集成功能安全的多线程处理器Arm Cortex-A65AE,它是Arm汽车增强版IP产品组合的最新补充,旨在更高效地处理下一代车辆中产生的多种传感器数据流,安全地实现创新的驾驶员体验。2018年早些时候,Arm承诺,致力于帮助OEM厂商和一级汽车主机厂部署安全的全自动车辆,推出"安全就绪"计划和一系列专用的汽车增强版IP (包括Cortex-A76AE),其提供了自动应用所需的处理性能,同时具(本文来源于《单片机与嵌入式系统应用》期刊2019年02期)

李旭[3](2017)在《多核处理器中具有临界区的多线程调度方法研究》一文中研究指出随着多核技术以及多线程技术的发展,多线程在多核处理器上的调度问题成为研究热点。由于多核处理器结构的复杂性,使得资源管理更困难。当多线程在多核平台上运行时,怎样更好的利用多核资源,让多线程能够正确快速的执行,决定了系统性能的提高。一个优秀的针对多核处理器的线程调度算法可以有效利用资源,提高系统吞吐率,兼顾公平性,降低程序的响应时间和周转时间。对于多核多线程的调度方法的研究,一般都先提出一种多线程的模型,并在这种模型的基础上针对不同的多核平台提出不同的调度方法。在多线程模型上,很多人都选择DAG图,但是传统的DAG图有其自身的缺陷,例如不能对任务间的关系进行近一步的刻画。本文针对具有临界区的线程,提出一种基于Forest的多线程调度模型,通过该模型维护线程间的前后依赖、数据资源和共享资源关系。为有效的提高系统性能,减少计算资源空闲时间,提出了综合考虑线程共享资源情况以及前后依赖关系的调度方法CSTS算法。该算法以临界区作为线程间共享资源的依据,对具有相同临界区线程进行同核调度。并且由于临界区不可同时执行的特点,临界区成为限制系统整体性能的重要因素。为减少由临界区而造成的堵塞,算法提出了基于临界区的优先级计算方法,并且兼顾公平性。在多核处理器中,由于各核间计算能力的不同,异构多核处理器较同构多核处理器更具有实用性。因此,本文除针对一般多核处理器设计了多线程模型以及基于该森林模型的调度方法外,还针对异构多核处理器各核间处理能力的不同,优化了加速临界区算法。加速临界区算法可以有效缩短具有临界区的线程的执行时间,但是有可能会造成无关临界区串行化的问题。本文在加速临界区算法基础上提出改进加速临界区算法。该算法跟踪记录所有包含临界区的线程在核上的执行情况,对线程的优先级因子进行调整,通过该优先级因子指导线程在高速核与低速核间的动态迁移。该算法不仅加速了临界区的执行而且能有效解决加速临界区方法所造成的线程在高速核上的堵塞的问题。本文采用模拟实验的方法对基于森林线程模型的算法进行模拟验证。较同类算法对于临界区密集型任务具有较高的性能,核利用率也较高。针对于适应于异构平台改进临界区迁移算法,本文采用Simics仿真平台进行异构多核系统仿真,输入为12个临界区密集型负载,实验结果表明,该方法较原始加速临界区算法和朴素算法拥有更好的性能。(本文来源于《华北电力大学》期刊2017-03-01)

刘欢,韩俊刚,李卯良,杨铮[4](2016)在《时钟共享多线程处理器SIMD控制器设计与实现》一文中研究指出针对图形图像处理器中指令与数据加载以及数据收集的问题,设计和实现了一种时钟共享多线程处理器中的SIMD控制器,完成相关SIMD指令的发送、数据的加载和数据的收集。该控制器以实现高效的数据级并行计算为目标,采用有限状态机实现了前向处理单元、行控制器和列控制器的设计。实验结果表明,所设计的专用硬件电路能够有效提高图形图像处理器处理并行数据的能力。(本文来源于《电子技术应用》期刊2016年11期)

刘文凯[5](2016)在《基于RISC架构的多线程微处理器设计及验证》一文中研究指出微处理器的硬件多线程架构是计算机体系结构中一种重要的线程级并行方式,其以增加少量逻辑资源为代价,将单核映射为多个逻辑核,使处理器可以同时执行多个线程的指令。本文基于MIPS32指令集,设计了单核微处理器,在此基础上设置多个线程上下文环境以及共享流水线,将单核映射为四个逻辑核,使多个线程的指令可以在处理器内部交叉执行。本文在对同时多线程结构深入研究与总结的基础之上,设计了一个适用于RISC处理器核心的多线程微结构,用硬件实现可以同时运行四个线程指令的设计目标,处理器取指部件设计四个程序计数器,通过线程控制器完成各个线程的取指切换,每个线程拥有独立的通用寄存器文件,设计多线程流水线寄存器用于保存当前周期各线程的执行结果,设计协处理单元以实现其精确异常处理,多线程流水级执行部件中的译码器、功能部件ALU和访存控制器采用共享方式,处理器所有模块均使用Verilog硬件描述语言设计完成。针对多线程软核微处理器构建测试用例,完成了指令功能与系统功能的定向测试,并且搭建基于UVM验证方法学的SystemVerilog验证平台进行大规模随机验证,构造覆盖点数据完成了功能覆盖率统计分析。该硬件多线程微处理器内核在TSMC 40nm工艺下使用Design Compiler完成逻辑综合,其运行时钟频率达到550MHz,同时运行四个线程的指令使处理器的吞吐率和并行度大幅度提升。(本文来源于《西安理工大学》期刊2016-06-30)

吴琳[6](2016)在《片上多线程处理器调度策略分析》一文中研究指出片上多线程处理器是在一个芯片上集成多个多线程处理器核的高性能处理器系统。线程以CMP、SMT两种方式并行执行,显着提高了处理器性能。然而,从单核到多核,不仅仅是处理器核心的数量的增多,同时对处理器体系架构、存储系统、操作系统等相关领域提出巨大的挑战。对现有CMT系统研究现状进行了充分的研究和分析,在此基础上提出了静态任务层次分配策略和动态线程协同调度策略。(本文来源于《工业控制计算机》期刊2016年06期)

桂小冬[7](2016)在《硬件多线程处理器的便签存储器分配策略的设计与实现》一文中研究指出外围设备的管理是嵌入式微处理器的主要工作负荷之一,而高效管理多路外围设备是体现系统实时性能的标志。硬件多线程处理器支持多中断任务并发执行,中断延迟固定。同时,便签存储器访存效率高且访存延迟确定。硬件多线程处理器和便签存储器非常适合构建高实时系统。但是现有的便签存储器分配策略大多不适用于硬件多线程处理器,无法发挥硬件多线程处理器的高实时性优势。本文以缩短程序最差情况执行时间为目标,设计了一种硬件多线程处理器的指令和数据SPM分配策略。在硬件多线程处理器中,当多个硬件线程同时执行时,线程将相互竞争执行资源,单个线程的指令流水被不停打断。针对这种线程间干扰问题,本文提出了一种多线程指令流静态分析算法,能够求解单个指令节点的执行时间,并据此设计了一种迭代式指令节点SPM分配策略。本文按照数据节点访问属性不同将数据节点分为私有数据节点和共享数据节点,并采用整数线性规划算法分别设计了私有数据节点和共享数据节点的SPM分配策略。与此同时,本文基于硬件多线程处理器设计了一种以USB接口为标准的外围设备管理系统,外围设备管理系统采用了一种指令SPM独享,数据SPM虚拟共享的分区结构。最后本文根据SPM分配方案,优化了外围设备管理系统的程序和数据结构设计。本文采用了软件模拟和FPGA两种验证方法。实验结果显示,在SPM资源按比例增长时,外围设备管理系统的执行时间会显着缩减。当只有50%的SPM资源可用时,外围设备管理系统的执行时间缩短了20.3%。相比于在多核处理器SPM分配策略中运用广泛的Kim算法,系统的执行时间缩减量提高了两倍。(本文来源于《东南大学》期刊2016-06-18)

李乐,李涛[8](2016)在《同时多线程处理器的指令调度器设计》一文中研究指出同时多线程处理器SMT(Simultaneous Multi-Threading)是用于图形、图像及数字信号处理的一种可以实现指令级并行(ILP)和线程级并行(TLP)的轻核处理器.针对这种处理器提出了一种结构简单的动态指令调度器,用于避免四个活跃线程中指令间的结构冲突和对一些特殊指令的不同要求的调度.结果表明,SMT处理器中的指令调度器通过调度各线程的执行先后顺序,四个线程被选中的概率均接近25%.(本文来源于《微电子学与计算机》期刊2016年06期)

丁杰[9](2016)在《面向外设管理的微处理器硬件多线程扩展》一文中研究指出近年来,物联网技术发展迅速,广泛地应用于社会生活,如智能家居、医疗电子、汽车电子等。物联网技术本质上是传感器控制系统,其利用大量传感器设备去采集事物的信息,传感器设备一般具有实时性要求。传统微处理器针对有实时性要求的外设管理存在局限性,如需要保存与恢复中断现场、中断响应延迟随机性较大等。本文基于传统微处理器扩展设计了一款面向外设管理的硬件多线程处理器,主要的设计目标有两点:一是提高中断响应速度;二是当多中断并发处理时,减少中断平均处理时间。为了加快中断的响应速度,本文提出一种基于CK802嵌入式微处理器的细粒度多线程扩展设计方案,支持四个硬件线程并行处理中断,并且允许中断派发器直接将中断服务程序派发到处理器的硬件线程上执行,无需软件干预,减少了中断现场的保存与恢复操作。同时,本文还提出一种条件轮询的硬件线程调度策略,该策略只允许就绪的硬件线程参与调度,相比于轮询调度策略,在多中断并发场景下,其能够更好地隐藏并发中断的流水线延迟,提高处理器的中断并行处理效率,减少中断处理平均所需的时间。本文对多线程扩展前后的处理器进行了对比分析。实验表明当硬件多线程处理器中存在空闲硬件线程时,其中断响应延迟只需一个时钟周期,远快于基准处理器12个时钟周期的中断响应速度。而且当多中断并发处理时,硬件多线程处理器的中断平均处理时间较基准处理器减少了48.80%,代价是综合面积增加了15.2%。本文还将该硬件多线程处理器与按轮询策略调度的硬件多线程处理器进行了对比分析,实验表明当多中断并发处理时,本文实现的硬件多线程处理器的中断平均处理时间比按轮询策略调度的硬件多线程处理器减少了15.43%,而综合面积只增加了1.3%。(本文来源于《东南大学》期刊2016-06-02)

乔少明[10](2016)在《龙芯多核处理器多线程故障恢复系统设计与实现》一文中研究指出目前,大数据和物联网进入了高速发展时代,离不开的一个背景就是多核处理器与多线程技术的越发成熟。这也对多核处理器环境下多线程程序运行的稳定性和健壮性提出越来越高的要求。但在实际应用环境中,设备程序在运行阶段不可避免的总会遇见设计之初不曾考虑到的故障。其中,瞬态故障是导致程序不能正常运行的最常见原因。由于实际环境的复杂性,要完全避免瞬态故障的出现需要及其高昂的成本代价。因此,在目前技术基础之上,及时的故障恢复技术变得极具研究价值。本文针对多核处理器多线程故障恢复技术展开研究。首先对现存的故障恢复技术进行了介绍以及分析,接着对内核进程的实现以及多线程的实现机制进行了分析,确定了为实现完整的故障恢复功能需要对多线程程序进行保存的信息,包括寄存器、内存、信号、文件等。通过以上研究分析,本文设计了一种基于检查点的操作体统级的故障恢复系统,即在正常运行阶段对多线程程序设定检查点文件,一旦故障出现就可以根据检查点文件对多线程程序进行恢复。该系统在对程序信息进行保存与恢复过程中对应用层程序透明。关于检查点设置,寄存器、内存地址、当前工作目录、文件等数据可直接保存到设定的数据结构中,然后以页为单位写入内核缓冲区中。而对于内存中的数据,则需要拷贝物理内存页框中的数据。内核缓冲区中的数据由内核线程负责写入非易失磁盘中。另外,针对检查点设置的时间,本文提出了一种新的思路,即通过对包含数据传输的系统调用进行计数来决定检查点设置的时间,而不再采取时间间隔的方式。在进行故障恢复的时候,对于文件、内存等共享信息只需在一个线程中进行恢复,而线程寄存器、信号等私有信息则需要在所有线程中进行恢复。最后,对实验环境和编译方法进行了说明,对系统的基本功能进行了测试,并在线程数量、数据规模和时间间隔叁个方面选择不同的测试程序对系统性能进行了测试,实验结果表明线程数量和时间间隔更能引起性能损失的变化,而数据规模对性能损失的变化影响较小。(本文来源于《哈尔滨工业大学》期刊2016-06-01)

多线程处理器论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

Arm宣布推出首款集成功能安全的多线程处理器Arm Cortex-A65AE,它是Arm汽车增强版IP产品组合的最新补充,旨在更高效地处理下一代车辆中产生的多种传感器数据流,安全地实现创新的驾驶员体验。2018年早些时候,Arm承诺,致力于帮助OEM厂商和一级汽车主机厂部署安全的全自动车辆,推出"安全就绪"计划和一系列专用的汽车增强版IP (包括Cortex-A76AE),其提供了自动应用所需的处理性能,同时具

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

多线程处理器论文参考文献

[1].陈逸飞,朱蕾,李宏亮.一种多线程阵列众核处理器的二级Cache划分机制[J].计算机工程与科学.2019

[2]..Arm首款多线程处理器增强驾驶员对大规模部署自动驾驶的安全信任[J].单片机与嵌入式系统应用.2019

[3].李旭.多核处理器中具有临界区的多线程调度方法研究[D].华北电力大学.2017

[4].刘欢,韩俊刚,李卯良,杨铮.时钟共享多线程处理器SIMD控制器设计与实现[J].电子技术应用.2016

[5].刘文凯.基于RISC架构的多线程微处理器设计及验证[D].西安理工大学.2016

[6].吴琳.片上多线程处理器调度策略分析[J].工业控制计算机.2016

[7].桂小冬.硬件多线程处理器的便签存储器分配策略的设计与实现[D].东南大学.2016

[8].李乐,李涛.同时多线程处理器的指令调度器设计[J].微电子学与计算机.2016

[9].丁杰.面向外设管理的微处理器硬件多线程扩展[D].东南大学.2016

[10].乔少明.龙芯多核处理器多线程故障恢复系统设计与实现[D].哈尔滨工业大学.2016

论文知识图

本文研究内容框架一6“龙腾R2”同时多线程处理器与...一4“龙腾R2”同时多线程处理器与...一5“龙腾R2”同时多线程处理器与...同时多线程处理器硬件结构一3“龙腾RZ”同时多线程处理器与...

标签:;  ;  ;  ;  ;  ;  ;  

多线程处理器论文_陈逸飞,朱蕾,李宏亮
下载Doc文档

猜你喜欢