%0 Journal Article %A 刘书勇 %A 吴艳霞 %A 张博为 %A 张国印 %A 戴葵 %T 基于可重构计算系统的矩阵三角化分解硬件并行结构研究 %D 2015 %R 10.3969/j.issn.0372-2112.2015.08.026 %J 电子学报 %P 1642-1650 %V 43 %N 8 %X

可重构计算系统成为加速计算密集型应用的重要选择之一.在众多受到关注的计算密集型问题中,矩阵三角化分解作为典型的基础类应用始终处于研究的核心地位,在求解线性方程组、求矩阵特征值等科学与工程问题中有重要的研究价值.本文面向矩阵三角化分解中共有的三角化计算过程,通过分析该过程的线性计算规律,提出一种适于硬件并行实现的子矩阵更新同一化算法及矩阵三角化计算FPGA (Field Programmable Gate Array)并行结构.针对LU矩阵三角化分解在并行结构模板上的高性能实现及优化方法开展了研究.理论分析表明,该算法针对矩阵三角化计算过程具有更高的数据并行性与流水并行性;实验结果表明,与通用处理器的软件实现相比,根据该算法实现的矩阵三角化分解FPGA并行结果在关键计算性能上可以取得10倍以上的加速比.

%U https://www.ejournal.org.cn/CN/10.3969/j.issn.0372-2112.2015.08.026