电子学报 ›› 2014, Vol. 42 ›› Issue (7): 1410-1418.DOI: 10.3969/j.issn.0372-2112.2014.07.026

• 科研通信 • 上一篇    下一篇

基于MPEG-AAC编码器的压缩域音频增强方法

邓峰, 鲍枫, 鲍长春   

  1. 北京工业大学电子信息与控制工程学院, 北京 100124
  • 收稿日期:2013-05-20 修回日期:2013-09-27 出版日期:2014-07-25
    • 作者简介:
    • 邓峰 男.1983年12月出生于湖南郴州.2012年进入北京工业大学攻读博士学位,主要研究方向为语音和音频增强.E-mail:dengfeng@emails.bjut.edu.cn;鲍枫 男.1990年6月出生于吉林长春.2012年进入北京工业大学攻读硕士学位,主要研究方向为语音和音频增强.E-mail:baofeng@emails.bjut.edu.cn;鲍长春 男.1965年6月出生于内蒙古赤峰.博士,北京工业大学教授、博士生导师,IEEE高级会员,国际语音通信学会(ISCA)会员,亚太信号与信息处理学会(APSIPA)会员,中国电子学会理事,中国声学学会理事,中国电子学会信号处理分会委员.主要研究方向为语音与音频信号处理.E-mail:baochch@bjut.edu.cn
    • 基金资助:
    • 北京市教育委员会科技发展计划重点项目 (No.KZ201110005005); 国家自然科学基金 (No.61072089)

Audio Enhancement in Compressed Domain Based on MPEG-AAC Codec

DENG Feng, BAO Feng, BAO Chang-chun   

  1. School of Electronic Information and Control Engineering, Beijing University of Technology, Beijing 100124, China
  • Received:2013-05-20 Revised:2013-09-27 Online:2014-07-25 Published:2014-07-25

摘要:

本文基于MPEG-AAC音频编解码器,提出了一种压缩域的音频增强方法.首先,对含噪音频信号的比特流进行解码,得到含噪音频信号的MDCT系数;然后,利用修正的加权递归平均(Modified Weighted Recursive Averaging,MWRA)方法估计噪声功率;再者,利用基于听觉掩蔽原理的自适应β-阶双曲余弦(COSH)统计模型,对含噪音频的MDCT系数进行增强处理;最后,将增强后的MDCT系数重新量化编码,得到用于解码的增强比特流实验结果表明,本文提出的方法能有效去除AAC解码音频信号中的多种背景噪声,其性能明显优于参考方法.

关键词: 音频增强, AAC比特流, 压缩域, MWRA噪声估计, COSH估计器

Abstract:

An audio enhancement method based on MPEG-AAC codec in compressed domain is proposed.First,the bit-stream derived from noisy audio signal is decoded to obtain MDCT coefficients of noisy audio signals.Then,the noise power is estimated by modified weighted recursive averaging (MWRA).Next,the adaptive β-order COSH statistic modal method is employed to enhance MDCT coefficients.Finally,the enhanced MDCT coefficients are re-quantized to obtain an enhanced bit-stream which is used to get the enhanced audio signals by AAC decoder.The test results indicate that the proposed algorithm can effectively remove the noises derived from AAC bit-stream of audio signals and obviously outperforms the reference noise reduction methods.

Key words: audio enhancement, AAC bit-stream, compressed domain, MWRA noise estimation, COSH estimator

中图分类号: