电子学报 ›› 2017, Vol. 45 ›› Issue (9): 2256-2262.DOI: 10.3969/j.issn.0372-2112.2017.09.029

• 学术论文 • 上一篇    下一篇

基于流体系结构的VLIW二维压缩及并行解压

李功丽1,2, 戴紫彬1, 徐进辉1, 王寿成1, 朱玉飞1, 李丹3   

  1. 1. 解放军信息工程大学, 河南郑州 450001;
    2. 河南师范大学计算机与信息工程学院, 河南新乡 453002;
    3. 中国人民解放军61840部队, 北京 100089
  • 收稿日期:2016-05-24 修回日期:2016-09-18 出版日期:2017-09-25 发布日期:2017-09-25
  • 作者简介:李功丽,女,1981年生于河南信阳.信息工程大学博士生,主要研究方向为计算机体系结构、流处理器、高性能计算.E-mail:ligl522@163.com;戴紫彬,男,1966年生于河南商丘.信息工程大学教授,博士生导师.研究方向为专用芯片设计、可重构芯片、可重构SoC设计;徐进辉,男,1978年生于江西宁都.博士,讲师,主要研究方向可重构计算、计算机体系结构研究;王寿成,男,1992年生于甘肃金昌.信息工程大学硕士生,主要研究方向计算机体系结构;朱玉飞,男,1990年生于江苏淮安.信息工程大学硕士生,主要研究方向为专用芯片设计;李丹,男,1978年生于河北唐山.工程师,研究方向为专用芯片设计.
  • 基金资助:
    国家自然科学基金项目(No.61404175)

2-D Compression and Parallel Decoding of VLIW Based on Stream Architecture

LI Gong-li1,2, DAI Zi-bin1, XU Jin-hui1, WANG Shou-cheng1, ZHU Yu-fei1, LI Dan3   

  1. 1. PLA Information Engineering University, Zhengzhou, Henan 450001, China;
    2. College of Computer & Information Engineering, Henan Normal University, Xinxiang, Henan 453002, China;
    3. PLA of Unit 61840, Beijing 100089, China
  • Received:2016-05-24 Revised:2016-09-18 Online:2017-09-25 Published:2017-09-25

摘要: VLIW(Very Long Instruction Word)指令因为含有较多的空操作导致严重的代码体积膨胀问题,代码压缩是解决这一问题的有效措施.VLIW代码压缩需要解决三个关键问题,一是提高压缩率;二是降低解压操作对性能的影响;三是分支目标重定位.针对流体系结构上的VLIW指令特点,提出了二维压缩,对VLIW进行垂直与水平两个方向上的压缩,且水平解压可以与代码执行并行,并通过设置堆栈寄存器缓存循环入口地址.实验结果表明二维压缩有效解决了VLIW代码体积膨胀问题,可以使指令存储器的面积减少36.48%,并使得整个CISP系统面积减少了7.85%.

关键词: 流处理器, VLIW, 二维压缩, 并行解压

Abstract: Due to having many NOPs,VLIW(Very Long Instruction Word) exists serious code size expansion problem.As an efficient way to solve this problem,the code compression needs to deal with three key points:improving the compression ratio (CR),simplifying decomposition operations,and relocating the branch target.According to the characteristics of VLIW on stream architecture,a two-dimension(2-D) compression scheme is put forward,where VLIW code is compressed in both vertical and horizontal directions,the horizontal decompression and code execution can be implemented in parallel,and loop entrance addresses are buffered by stack registers.The experiment results illustrate that 2-D compression scheme can resolve code expansion issue effectively.Specifically,it has achieved a 36.48% area reduction of the on-chip instruction memory and a 7.85% area reduction of the CISP system.

Key words: stream processor, VLIW, 2-D compression, parallel decoding

中图分类号: