简介:摘要几年之前,由于计算能力的不足以及大规模图像字幕数据集的缺少,这就导致了国外很少有人做这方面的研究,其所得到的结果也让人不尽满意,在国内更是鲜有人涉及这个方向。不过,随着近两年计算机运算能力的提高、深度学习(DL)的发展以及众多大规模图像字幕数据集的出现,这才使得这项任务重新回归到人们的视野并逐渐成为了计算机视觉与自然语言处理领域中的一个研究热点。本文就图像字幕生成任务中所涉及的深度学习算法,在总结前人提出的各种网络及其成效的基础上,研究适合图像字幕生成任务的深度学习模型,为该研究方向提供一定的指导意义。