收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

锚文本检索有效性分析

周博  刘奕群  张敏  金奕江  马少平  
【摘要】:锚文本对网络信息检索性能的提升作用已经得到验证,并被广泛地应用于商用网络搜索引擎.然而,锚文本制作的不可控性导致其中蕴含大量与目标网页不相关或具有作弊倾向的无用信息.另外,对于需要衡量检索结果服务质量的事务类查询,原始锚文本推荐的目标网页也往往与真实的用户体验不一致.为了解决上述问题,基于大规模真实用户的互联网浏览行为日志展开研究.首先提出了锚文本检索有效性的评估框架,然后分析了用户网络浏览点击行为与锚文本检索有效性之间的联系,挖掘了用户网络浏览点击行为中有助于筛选高质量锚文本的特征.基于这些特征,提出了两种超链接文档生成方法.实验结果表明,基于用户网络浏览点击行为特征筛选出的锚文本,与原始锚文本相比,能够明显地提升网络检索的性能.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李世玲;;网络信息检索技术的评价[J];图书馆学刊;2007年02期
2 高镔;;聚类在网络信息检索中的辅助作用[J];信息技术;2010年04期
3 王启云;;网络信息检索效果评价指标体系设计探讨[J];图书馆杂志;2006年11期
4 倪莉;;网络环境下的自然语言检索[J];当代图书馆;1999年04期
5 王勇;;网络信息检索对图书馆信息服务的影响[J];现代情报;2006年04期
6 刘奕群;张敏;马少平;;基于非内容信息的网络关键资源有效定位[J];智能系统学报;2007年01期
7 杨玉焕;;网络信息检索对图书馆信息服务的影响[J];长沙民政职业技术学院学报;2007年02期
8 邱宏,付琼;联机检索与网络信息检索的比较研究[J];东北电力学院学报;2001年02期
9 莫莉蓉;对搜索引擎发展态势的分析[J];高校图书馆工作;2004年02期
10 许芳,徐国虎;网络信息检索智能AGENT技术探讨[J];现代情报;2005年04期
11 刘奕群,张敏,马少平;基于改进决策树算法的网络关键资源页面判定[J];软件学报;2005年11期
12 龚剑;一种新型互联网信息检索系统的构想[J];现代情报;2005年09期
13 薛琳;;网络信息检索与图书馆信息服务的变革与创新[J];焦作师范高等专科学校学报;2006年04期
14 黄珍;;浅析网络环境下的信息检索[J];情报探索;2010年08期
15 彭华;网络时代如何优化文献检索课教学[J];图书馆学研究;2001年01期
16 凌志泉;搜索引擎中的网络数据挖掘技术[J];计算机工程与设计;2003年09期
17 陈业奎;通过网络信息检索辅助判断期刊真假[J];新世纪图书馆;2004年04期
18 刘奕群;张敏;马少平;;面向信息检索需要的网络数据清理研究[J];中文信息学报;2006年03期
19 程艳林;庞燕;;网络信息污染程度检测模型初探[J];传媒观察;2010年05期
20 黄如花,张春蕾;网络信息检索的发展趋势[J];图书情报知识;2002年04期
中国重要会议论文全文数据库 前10条
1 刘奕群;张敏;马少平;;面向信息检索需要的网络数据清理研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
2 刘菁菁;林鸿飞;杨志豪;;基于PageRank和锚文本的网页排序研究[A];第三届学生计算语言学研讨会论文集[C];2006年
3 刘奕群;马少平;;利用虚拟站点定位技术的网络信息检索研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
4 余慧佳;刘奕群;张敏;茹立云;马少平;;基于大规模日志分析的网络搜索引擎用户行为研究[A];第三届学生计算语言学研讨会论文集[C];2006年
5 岑荣伟;刘奕群;张敏;茹立云;马少平;;网络搜索引擎用户行为分析和研究[A];第五届全国信息检索学术会议论文集[C];2009年
6 刘奕群;张敏;马少平;;用户行为分析在网络信息检索中的应用概述[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
7 李建春;钟立国;;网上多媒体课件的制作技术初探[A];面向21世纪的图学教育——第十二届全国图学教育研讨会暨第三届制图CAI课件演示交流会论文集[C];2000年
8 张磊;李亚楠;王斌;李鹏;蒋在帆;;网页搜索引擎查询日志的session划分研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
9 李燕军;王世铎;;网络信息挖掘在情报信息工作中的应用[A];第二十一次全国计算机安全学术交流会论文集[C];2006年
10 郭新涛;梁敏;阮备军;朱扬勇;;挖掘Web日志降低信息搜寻的时间费用[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
中国博士学位论文全文数据库 前10条
1 王辉;基于质心具有增量性质的主题爬行[D];吉林大学;2007年
2 曲怀敬;Contourlet变换在纹理图像检索和医学图像分割中的应用研究[D];山东大学;2009年
3 刘悦;WWW上链接分析算法的若干研究[D];中国科学院研究生院(计算技术研究所);2004年
4 潘翔;三维模型形状分析和检索[D];浙江大学;2005年
5 范欣;针对移动设备的跨媒体网络信息检索及自适应信息显示研究[D];中国科学技术大学;2007年
6 许存禄;图像纹理分析的新方法及其应用[D];复旦大学;2005年
7 包胜华;基于Web的实体信息搜索与挖掘研究[D];上海交通大学;2008年
8 徐晴阳;基于关系子群发现算法的聚焦爬行技术[D];吉林大学;2008年
9 黄健斌;基于条件概率图模型的Deep Web数据抽取与集成研究[D];西安电子科技大学;2007年
10 郑铁然;基于音节网格的汉语语音文档检索方法研究[D];哈尔滨工业大学;2008年
中国硕士学位论文全文数据库 前10条
1 王涛;基于HTML标记的主题爬行器的设计与实现[D];电子科技大学;2009年
2 陈瑶;基于移动Agent的Web信息检索系统的研究[D];武汉理工大学;2007年
3 姚忠存;锚文本增量主题爬行[D];吉林大学;2007年
4 药成刚;基于链接结构的中文网页排序算法研究[D];哈尔滨工业大学;2006年
5 宋钧;对世界著名公司主页中超链接部分的语言学分析[D];对外经济贸易大学;2000年
6 闫晓妍;Web2.0环境下网络信息检索模式研究[D];郑州大学;2009年
7 熊回香;网络信息检索及其发展趋势研究[D];华中师范大学;2003年
8 刘文;主题相关的PageRank算法的改进策略的研究和实现[D];中国海洋大学;2009年
9 王轶讴;个性化网络信息检索系统的研究、设计与实现[D];大连理工大学;2004年
10 朱世顺;WWW上基于内容的多媒体数据挖掘[D];南京理工大学;2002年
中国重要报纸全文数据库 前10条
1 马继前;网页浏览量5000多次[N];海南日报;2007年
2 ;手机浏览网页的标准有望出台[N];人民邮电;2006年
3 一口;搜索巨人传闻多多[N];中国电脑教育报;2004年
4 西蒙·埃里森;YouTube高管该换换脑筋了[N];中国计算机报;2009年
5 冷云;拨号还好用[N];中国计算机报;2004年
6 天;“夹心”网页你敢“吃”?[N];电脑报;2005年
7 曹增光;吃掉Feedburner Google的胃口有多大[N];中国经济时报;2007年
8 晓英;智能网页打印:小窍门大省心[N];大众科技报;2007年
9 尧阁;NTTDoCoMo增加FOMA手机的网页浏览功能[N];人民邮电;2005年
10 湖南 隆珍辉;看峥嵘岁月,谁逐鹿中原[N];电脑报;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978