收藏本站
《自动化学报》 2014年08期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

用于提高谷歌图像搜索结果的二分类器在线学习方法(英文)

万玉钗  刘峡壁  韩菲霏  童坤琦  刘宇  
【摘要】:It is promising to improve web image search results through exploiting the results visual contents for learning a binary classifier which is used to refine the results relevance degrees to the given query. This paper proposes an algorithm framework as a solution to this problem and investigates the key issue of training data selection under the framework. The training data selection process is divided into two stages: initial selection for triggering the classifier learning and dynamic selection in the iterations of classifier learning. We investigate two main ways of initial training data selection, including clustering based and ranking based, and compare automatic training data selection schemes with manual manner. Furthermore, support vector machines and the max-min pseudo-probability(MMP) based Bayesian classifier are employed to support image classification, respectively. By varying these factors in the framework, we implement eight algorithms and tested them on keyword based image search results from Google search engine. The experimental results confirm that how to select the training data from noisy search results is really a key issue in the problem considered in this paper and show that the proposed algorithm is effective to improve Google search results, especially at top ranks, thus is helpful to reduce the user labor in finding the desired images by browsing the ranking in depth. Even so, it is still worth meditative to make automatic training data selection scheme better towards perfect human annotation.

知网文化
【相似文献】
中国重要会议论文全文数据库 前8条
1 ;A Novel Approach to Select Important Genes from Microarray Data[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年
2 ;Gait Recognition Based on the Fast Fourier Transform and SVM[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年
3 Mok Hingtung;;Fault Diagnosis Based on Knowledge Extracted from Neurofuzzy Networks Using Binary and Real-Valued Fault Databases[A];第二十七届中国控制会议论文集[C];2008年
4 陈猛;郭华平;范明;;一种基于贝叶斯的多窗口数据流分类模型[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
5 Lum Kai Yew;;Integration and Implementation of a Low-cost and Vision-based UAV Tracking System[A];第二十六届中国控制会议论文集[C];2007年
6 ;Multi-pattern Recognition of sEMG Based on Improved BP Neural Network Algorithm[A];第二十九届中国控制会议论文集[C];2010年
7 ;Shadow Detection Based on Adaboost Classifiers in a Co-training Framework[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年
8 翟静;李海宏;唐常杰;陈敏敏;李智;;可验证对象集分类器的再训练演进[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
中国博士学位论文全文数据库 前3条
1 尹华;面向高维和不平衡数据分类的集成学习研究[D];武汉大学;2012年
2 欧阳震诤;不平稳数据流的分类技术研究[D];国防科学技术大学;2009年
3 李海生;基于证据理论的分类方法研究[D];华南理工大学;2013年
中国硕士学位论文全文数据库 前10条
1 李晓燕;面向稀有类的组合方法和组合选择方法[D];郑州大学;2013年
2 黄丹梅;多分类器系统在蛋白质功能预测方面的应用[D];吉林大学;2010年
3 余民杰;贝叶斯网络分类器与应用[D];云南财经大学;2012年
4 王健;基于多关系分类聚类的学习适应性诊断[D];江苏大学;2010年
5 周晓堂;基于中心法的文本分类算法研究[D];吉林大学;2013年
6 李丽坤;基于主动学习的bug自动分配[D];大连理工大学;2013年
7 彭湘华;基于相关性的癌症特征选择及分类算法研究[D];湖南大学;2012年
8 孙凉艳;基于K近邻集成算法的分类挖掘研究[D];西北大学;2010年
9 武婷婷;分类器性能评价研究[D];北京交通大学;2010年
10 刘雪莲;AdaBoost中加权方式的改进[D];北京交通大学;2010年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978