An Automatic Caption Generator for Mandarin Broadcast News

ZHENG Li-lei; XIE Lei; LU Mi-mi; WANG Xiao-xuan; YANG Yu-lian; ZHANG Yan-ning

您当前的位置：

首页 >

文章列表页 >

An Automatic Caption Generator for Mandarin Broadcast News

更新时间：2025-07-16

- An Automatic Caption Generator for Mandarin Broadcast News
- Acta Electronica Sinica Vol. 39, Issue 3A, Pages: 69-74(2011)
- 作者机构：
  
  西北工业大学计算机学院陕西省语音与图像信息处理重点实验室,陕西,西安,710072
- 作者简介：
- 基金信息：
- DOI：
  CLC： TP39
- Published：2011
- 稿件说明：
移动端阅览
ZHENG Li-lei, XIE Lei, LU Mi-mi, et al. An Automatic Caption Generator for Mandarin Broadcast News[J]. Acta Electronica Sinica, 2011, 39(3A): 69-74.
DOI：

ZHENG Li-lei, XIE Lei, LU Mi-mi, et al. An Automatic Caption Generator for Mandarin Broadcast News[J]. Acta Electronica Sinica, 2011, 39(3A): 69-74. DOI：

摘要

本文设计与实现了一个全自动中文新闻字幕生成系统

输入为新闻视频

输出为视频对应的字幕文本.以《新闻联播》为语料

实现了音频提取、音频分类与切分、说话人识别、大词汇量连续语音识别、视频文件的播放和文本字幕的自动生成等多项功能.新闻字幕的自动生成

避免了繁重费时的人工字幕添加过程.实验表明

该系统识别率高

能够满足听障等特殊人群和特殊场合的电视新闻收视需求.

Abstract

Automatic broadcast news transcription converts speech into text by a large vocabulary continuous speech recognizer (LVCSR).This technique is an important prerequisite to various tasks

e.g.

structural segmentation

semantic access and content-based retrieval of broadcast news.In this paper

we develop an automatic caption generator (ACG) for Mandarin broadcast news.The system integrates various functions

i.e.

audio extraction from video

audio type classification and segmentation

speaker recognition

LVCSR

caption generation and video control.Experiments show that the system can achieve high speech recognition accuracy.A potential deployment of ACG is to help the hearing impaired and elderly people in enjoying TV programs.

关键词

Keywords

references

Views

1529

下载量

CSCD

Alert me when the article has been cited

提交

Tools

Publicity Resources

TFA-Conformer Based Network for Short Utterance Speaker Recognition

An In-Vehicle Interaction Speech Enhancement and Recognition Method Based on Lightweight Models in Complex Environment

An End-to-End Chinese Speech Recognition Algorithm Integrating Language Model

Hardware Realization of Semiconductor Neurocomputer and Its Application to Continuous Speech Recognition

Related Author

YANG Lu

ZHANG Bang-cheng

YANG Jun-mei

ZENG De-lu

LIAN Xiao-yu

XIA Nan

DAI Gao-le

YANG Hong-qin

Related Institution

School of Electronics and Information Technology, South China University of Technology

School of Information Science and Engineering， Dalian Ploytechnic University

Ministry of Education Key Laboratory of Symbol Computation and Knowledge Engineering， Jilin University

College of Computer Science and Technology， Jilin University

School of Computer Science， Zhuhai College of Science and Technology

⁰