收藏本站
《中文信息学报》 2012年05期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

排序学习中数据噪音敏感度分析

牛树梓  程学旗  郭嘉丰  
【摘要】:排序学习是当前信息检索领域研究热点之一。为了避免训练集中噪音的影响,当前排序学习算法较多关注鲁棒性。已有的工作发现相同的排序学习方法的性能在不同的数据集上会有截然不同的噪音敏感度。模型改变是导致性能下降的直接原因,而模型又是从训练集学习到的,因此根源在于训练数据的某些特性。该文根据具体排序学习场景分析得出影响噪音敏感度的根本原因在于训练集中文档对分布的结论,并在LETOR3.0上的实验验证了这一结论。

【共引文献】
中国期刊全文数据库 前1条
1 程凡;仲红;李龙澍;张以文;;一种基于结构化学习的排序算法[J];计算机工程与应用;2011年12期
中国博士学位论文全文数据库 前2条
1 何因;排序学习中基于直接优化信息检索评价准则算法的理论分析[D];中国科学技术大学;2010年
2 蔡鹏;排序学习中的领域自适应研究[D];华东师范大学;2011年
中国硕士学位论文全文数据库 前2条
1 肖敏;基于列表级的相关文本排序学习算法研究[D];哈尔滨工业大学;2010年
2 沈彦波;面向智能信息检索:集成支撑矢量机排序、约束自适应传递和交互式图像检索[D];西安电子科技大学;2012年
【相似文献】
中国期刊全文数据库 前10条
1 张枢;;基于数据仓库的数据清洗算法研究[J];煤炭技术;2010年07期
2 陈俊杰,邹友峰;GIS空间数据质量评价软件设计探讨[J];矿山测量;2005年03期
3 孟啸;王宏志;高宏;李建中;;bibEOS:一个高质量的社会化文献检索与管理系统[J];计算机科学与探索;2010年01期
4 晨光;;加强档案数据质量的管理[J];中国档案;1993年02期
5 杜永明;数据仓库中数据质量若干问题的研究[J];福建电脑;2003年01期
6 吴玉珍;提高中文馆藏书目数据质量的思考[J];科技情报开发与经济;2004年12期
7 初蓓,贾志琦;影响统计数据信息质量的原因及对策[J];科技情报开发与经济;2005年03期
8 柳霞;柳锋;张平;;PDM系统中数据质量的研究[J];机械设计与制造;2006年06期
9 于千城;;用元数据来控制数据仓库的信息质量[J];四川理工学院学报(自然科学版);2008年06期
10 毕月侠;;影响企业信息系统数据质量的因素和提高的措施[J];现代商业;2009年12期
中国重要会议论文全文数据库 前10条
1 张勇斌;孙彦广;;提高钢铁企业数据仓库中数据质量的方法与探讨[A];冶金轧制过程自动化技术交流会论文集[C];2005年
2 李心科;金元杰;;一种基于PSM的DWP数据质量度量模型研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
3 文琳;;HPD源数据编辑中质量检查技术初探[A];中国航海学会航标专业委员会测绘学组学术研讨会学术交流论文集[C];2008年
4 顾彬;王彦敏;卢刚;;大比例尺DLG数据质量检查方法研究[A];江苏省测绘学会2009年学术年会论文集[C];2009年
5 孟啸;王宏志;高宏;李建中;;bibEOS:一个高质量的社会化文献检索与管理系统[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
6 刘慧芹;;HPD源数据整合的质量检查流程与方法[A];第二十一届海洋测绘综合性学术研讨会论文集[C];2009年
7 刘慧芹;;HPD源数据整合的质量检查流程与方法[A];中国航海学会航标专业委员会测绘学组学术研讨会学术交流论文集[C];2009年
8 陶富强;;建立征信系统数据质量保障长效机制的探索和思考[A];《武汉金融》2010年第12期[C];2010年
9 吴玉珍;;提高中文馆藏书目数据质量的思考[A];山西省科学技术情报学会学术年会论文集[C];2004年
10 郑群英;熊淑娣;;小比例尺图DEM、DOM检查方法的探讨[A];华东地区第九次测绘学术交流大会论文集[C];2005年
中国重要报纸全文数据库 前10条
1 本报记者 刘书臻;切实提高统计调查数据质量[N];中国信息报;2009年
2 本报记者 王布刚;视数据质量为生命[N];中国信息报;2003年
3 贺崇生 通讯员 文礼发;荆州企调七条措施保数据质量[N];中国信息报;2005年
4 徐林 邓吉元;耕耘数字也风流[N];中国信息报;2008年
5 记者史家美罗娜;坚持依法调查 确保数据质量[N];中国信息报;2002年
6 包奇志 娜仁;内蒙古统计局为提高数据质量寻招[N];中国信息报;2004年
7 记者 杨永芹 实习生 周娟;强调把数据质量放在重要位置[N];重庆日报;2009年
8 本报记者 孙启文;牢记使命 奋进创新 努力提高国家统计调查能力数据质量和公信力[N];中国信息报;2010年
9 国家统计局河南调查总队总队长 刘世德;准确把握四个“度” 奋力推进“三个提高”[N];中国信息报;2010年
10 豫统;平顶山局五项举措提高数据质量[N];中国信息报;2006年
中国博士学位论文全文数据库 前10条
1 封毅;中医药知识发现可靠性研究[D];浙江大学;2008年
2 吴毅;数字人全身分割数据集的建立及人体胸腔与盆腔的数字化研究[D];第三军医大学;2012年
3 胡洋;最大间隔方法及其在图像检索中的应用[D];中国科学技术大学;2009年
4 袁华;基于分子结构特征的药物毒性预测方法研究[D];浙江大学;2007年
5 陈德品;基于迁移学习的跨领域排序学习算法研究[D];中国科学技术大学;2010年
6 程凡;基于排序学习的信息检索模型研究[D];中国科学技术大学;2012年
7 金锋;文档摘要算法的研究与应用[D];清华大学;2011年
8 纳赛尔 阿里 穆罕默德 巴拉卡特;复杂化学数据的知识发现新型化学计量学算法研究[D];湖南大学;2005年
9 石陆魁;非线性维数约减算法中若干关键问题的研究[D];天津大学;2005年
10 林伟琦;多变量图像解析与定量结构活性相关性研究的化学计量学新算法[D];湖南大学;2006年
中国硕士学位论文全文数据库 前10条
1 谭亚竹;基于XML数据清洗的应用研究[D];重庆大学;2006年
2 季长冰;针对贝叶斯分类器的数据质量的定量分析研究[D];北京交通大学;2008年
3 徐静;质量驱动的数据仓库三层体系结构[D];中国海洋大学;2003年
4 王静;GIS数据质量控制理论与实践[D];辽宁工程技术大学;2004年
5 周宏广;异构数据源集成中清洗策略的研究及应用[D];中南大学;2004年
6 李人和;数据流异常检测系统若干问题研究[D];复旦大学;2008年
7 范志勇;县级农村土地利用空间数据库的建设及质量控制研究[D];中南大学;2010年
8 陈兵;面向银行数据仓库的数据质量管理研究与实现[D];厦门大学;2008年
9 谢福成;面向金融行业数据仓库的数据质量控管的研究与实现[D];厦门大学;2009年
10 黄丽莎;非国有经济统计指标体系与调查方法研究[D];东北林业大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026