帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

面向多核向量处理器的并行优化方法研究及应用

导  师: 董守斌

授予学位: 硕士

作  者: ();

机构地区: 华南理工大学

摘  要: 多核化与向量化是高处理器性能的重要手段。并且被广泛应用在CPU与GPU的硬件优化上。多核向量处理器的编程需要依赖于并行编程方法论。本文综合考虑CPU与GPU共有的多核向量特性,重点研究面向多核向量处理器的并行优化方法。本文首先研究了多核向量处理器的结构特点、基于多核向量处理器的公共结构与通用并行编程方法,总结了面向多核向量处理器的并行程序设计模式;针对问题空间、算法结构、程序结构与实现机制四个层面上的设计模式,出了面向多核向量处理器的并行化方法,包括问题分析,算法结构设计,程序结构设计与实现四个步骤。在程序结构设计中,本文出了以循环为中转的多核向量并行策略,并总结了其他程序结构向循环转化的方法与循环在多核向量并行化中需要解决的问题。本文还根据多核向量处理器的共性出了两种优化方法,即存储模式优化与循环规整优化。本文将并行优化方法应用于数字图像关联分析(DIC)与基因数据比对这两种典型应用,以蒋震宇等人出的一种路径无关数字关联分析算法(PiDIC)与BWA-MEM算法做为两个应用领域的代表算法进行并行优化研究,分别设计并实现了cuDIC与vecMEM两种向量并行化算法。由于PiDIC显示出了细粒度规整的数据并行模式;而BWA-MEM中需反复使用的Smith Waterman运算的运行模式也较为规整,因此两种算法潜在可以进行多核向量优化。在算法设计中,本文针对DIC使用了较为简单的并行模式来保证每次并行调用的代价较低,在保证MEM的较合理的流水线外层算法结构的基础上进行算法结构调整;在程序设计中,使用了一系列以循环为中心的程序结构调整策略。分别基于GPU和CPU实现了多核向量并行优化的cuDIC和vecMEM。在多核向量并行化的基础上,还进行了存储模式优化,并针对执行模式较为复杂但是可预测的vecME

关 键 词: 多核向量处理器 并行优化

领  域: []

相关作者

作者 左小明

相关机构对象

机构 学院
机构 暨南大学

相关领域作者