%0 Journal Article %A 卓亚琦 %A 魏家辉 %A 李志欣 %T 基于双注意模型的图像描述生成方法研究 %D 2022 %R 10.12263/DZXB.20210696 %J 电子学报 %P 1123-1130 %V 50 %N 5 %X

现有图像描述生成方法的注意模型通常采用单词级注意,从图像中提取局部特征作为生成当前单词的视觉信息输入,缺乏准确的图像全局信息指导.针对这个问题,提出基于语句级注意的图像描述生成方法,通过自注意机制从图像中提取语句级的注意信息,来表示生成语句所需的图像全局信息.在此基础上,结合语句级注意和单词级注意进一步提出了双注意模型,以此来生成更准确的图像描述.通过在模型的中间阶段实施监督和优化,以解决信息间的干扰问题.此外,将强化学习应用于两阶段的训练来优化模型的评估度量.通过在MSCOCO和Flickr30K两个基准数据集上的实验评估,结果表明本文提出的方法能够生成更加准确和丰富的描述语句,并且在各项评价指标上优于现有的多种基于注意机制的方法.

%U https://www.ejournal.org.cn/CN/10.12263/DZXB.20210696