%0 Journal Article
%A 卓亚琦
%A 魏家辉
%A 李志欣
%T 基于双注意模型的图像描述生成方法研究
%D 2022
%R 10.12263/DZXB.20210696
%J 电子学报
%P 1123-1130
%V 50
%N 5
%X <p>现有图像描述生成方法的注意模型通常采用单词级注意，从图像中提取局部特征作为生成当前单词的视觉信息输入，缺乏准确的图像全局信息指导.针对这个问题，提出基于语句级注意的图像描述生成方法，通过自注意机制从图像中提取语句级的注意信息，来表示生成语句所需的图像全局信息.在此基础上，结合语句级注意和单词级注意进一步提出了双注意模型，以此来生成更准确的图像描述.通过在模型的中间阶段实施监督和优化，以解决信息间的干扰问题.此外，将强化学习应用于两阶段的训练来优化模型的评估度量.通过在MSCOCO和Flickr30K两个基准数据集上的实验评估，结果表明本文提出的方法能够生成更加准确和丰富的描述语句，并且在各项评价指标上优于现有的多种基于注意机制的方法.</p>
%U https://www.ejournal.org.cn/CN/10.12263/DZXB.20210696