电子学报 ›› 2021, Vol. 49 ›› Issue (11): 2186-2194.DOI: 10.12263/DZXB.20200476

• 学术论文 • 上一篇    下一篇

基于贝叶斯主成分分析的i-vector说话人确认方法

肜娅峰1, 陈晨1,2, 陈德运1,2, 何勇军1   

  1. 1.哈尔滨理工大学计算机科学与技术学院,黑龙江 哈尔滨 150080
    2.哈尔滨理工大学计算机科学与技术博士后流动站,黑龙江 哈尔滨 150080
  • 收稿日期:2020-05-19 修回日期:2020-11-09 出版日期:2021-11-25 发布日期:2021-11-25
  • 作者简介:肜娅峰 女,1997年出生.哈尔滨理工大学计算机科学与技术学院硕士研究生.主要研究方向为说话人识别、语音信号处理等. E-mail:rongyafeng908@163.com
    陈 晨 女,1990年出生.哈尔滨理工大学计算机科学与技术学院讲师、博士后、硕士生导师.主要研究方向为语音信号处理、音频信息分析、说话人识别等. E-mail:chenc@hrbust.edu.cn
    陈德运(通讯作者) 男,1962年出生.哈尔滨理工大学计算机科学与技术学院教授、博士生导师.主要研究方向为模式识别、机器学习等. E-mail:chendeyun@hrbust.edu.cn
    何勇军 男,1980年出生.哈尔滨理工大学计算机科学与技术学院教授、博士生导师.主要研究方向为语音信号处理、图像处理等. E-mail:holywit@163.com
  • 基金资助:
    国家自然科学基金(62101163);黑龙江省自然科学基金(JJ2019JQ0013);黑龙江省博士后专项经费(LBH-Z20020);黑龙江省普通高校基本科研业务费专项资金(2020-KYYWF-0341);哈尔滨市杰出青年人才基金(2017RAYXJ013)

Bayesian Principal Component Analysis for I-Vector Speaker Verification

Ya-feng RONG1, Chen CHEN1,2, De-yun CHEN1,2, Yong-jun HE1   

  1. 1.School of Computer Science and Technology,Harbin University of Science and Technology,Harbin,Heilongjiang 150080,China
    2.Postdoctoral Research Station of Computer Science and Technology,Harbin University of Science and Technology,Harbin,Heilongjiang 150080,China
  • Received:2020-05-19 Revised:2020-11-09 Online:2021-11-25 Published:2021-11-25

摘要:

身份-矢量(identity-vector, i-vector)方法作为说话人确认领域中的主流方法之一,能够通过学习总变化空间来获取有效的低维说话人特征——i-vector特征.但是当开发集数据不充足时,会导致学习到的总变化空间模型误差较大;同时,还无法有效确认此时的总变化空间是否因为预先设置的维度过高而学到了冗余信息.为此,本文将贝叶斯主成分分析(Bayesian Principal Component Analysis, BPCA)引入总变化空间的学习过程中,利用其来为总变化空间引入更多的先验信息,从而对开发集数据中包含的信息进行补充,并在先验信息的约束下削弱总变化空间中无效维的影响.实验结果表明,当开发集数据不充足时,相比于传统的总变化空间学习方法,BPCA方法能够有效提升说话人确认系统的识别性能.

关键词: 说话人确认, 身份-矢量(i-vector), 总变化空间, 贝叶斯主成分分析

Abstract:

As one of the most important methods in speaker verification, the identity-vector (i-vector) approach can obtain effective low-dimensional i-vector by learning the total variability space (TVS). However, when there is no sufficient development data, it will lead to a large error in the learned TVS model. Meanwhile, it is difficult to determine whether there is redundancy in the learned TVS due to the high preset dimension. To solve the above problems, the Bayesian principal component analysis (BPCA) is introduced into the learning of the TVS. And this proposed method can introduce more prior information into the TVS to supply more information. Additionally, under the constraint of prior information, the influence of invalid dimension in the TVS can be weakened. The experimental results show that when the development data is insufficient, the BPCA method can effectively improve the performance compared with the traditional TVS learning methods.

Key words: speaker verification, i-vector, total variability space, Bayesian principal component analysis

中图分类号: