收藏本站
《井冈山大学学报(自然科学版)》 2016年05期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于GoogLeNet多阶段连带优化的图像描述

汤鹏杰  谭云兰  许恺晟  李金忠  
【摘要】:图像描述是使用计算机将一副图像中的内容使用自然语言的形式重新表达,是图像理解任务中极具挑战性的工作。目前,使用深度CNN模型和RNN模型对图像进行编码和解码框架来解决该问题已经成为研究热点,也在多个数据集上取得了突破。但这些工作在使用CNN的过程中对其参数优化不足,且常使用分阶段训练的方式,导致整个系统易陷入局部最优。针对这些问题,在Goog Le Net模型的基础上,利用其中间特征,自底向上添加了两个辅助LSTM分支及其监督函数,通过联合训练,对整个模型进行优化,保证了CNN模型低层参数对任务的有效性,避免了系统陷入局部最优点;同时,由于加入了低层监督函数的干扰,使得模型有了额外的正则化,提高了模型的泛化能力。在Flickr8K和Flickr30K两个数据集上的实验表明,本文方法优势明显,在多个统计指标上均超过了现有其他方法。

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 吴娱;赵嘉济;平子良;杜昊翔;;基于指数矩的图像描述[J];现代电子技术;2013年14期
2 任越美;程显毅;李小燕;谢玉宇;;基于概念级语义的图像描述与识别[J];计算机科学;2008年07期
3 毛玉萃;;一种面向用户需求的图像描述方法[J];制造业自动化;2010年11期
4 周昌;郑雅羽;周凡;陈耀武;;基于局部图像描述的目标跟踪方法[J];浙江大学学报(工学版);2008年07期
5 宫伟力;安里千;赵海燕;毛灵涛;;基于图像描述的煤岩裂隙CT图像多尺度特征[J];岩土力学;2010年02期
6 张汉华,王伟,姜卫东,陈曾平,庄钊文;基于图像描述技术的飞机目标架次判别方法[J];系统工程与电子技术;2003年09期
7 胡美燕,姜献峰,柴国钟;Hu矩在一次性输液针图像描述中的应用[J];中国图象图形学报;2005年02期
8 谢玉鹏;吴海燕;;基于AAM的人脸图像描述与编码[J];计算机仿真;2009年06期
9 阿木古楞,杨性愉,平子良;用变形雅可比(p=4,q=3)-傅立叶矩进行图像描述[J];光电子·激光;2003年09期
10 于永新;冯志勇;;基于常识库支持的图像描述和检索系统[J];计算机应用研究;2009年02期
中国博士学位论文全文数据库 前1条
1 汤进;基于图理论的图像描述与检索方法研究[D];安徽大学;2007年
中国硕士学位论文全文数据库 前2条
1 钟艾妮;人脸识别中图像描述方法的研究[D];哈尔滨工业大学;2010年
2 陈影;基于复杂网络理论的图像描述与识别方法研究[D];安徽大学;2014年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026