收藏本站
《北京工业大学学报》 2008年04期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

结构化向量空间模型及其在Web信息检索中的应用

李玉鑑  操卫平  周兰珍  
【摘要】:针对Web信息检索的特点,通过分析传统向量空间模型在Web检索中存在的若干问题,对传统向量空间模型进行改进,并提出结构化向量空间模型,其基本思想是将Web文档表达为具有一定逻辑结构的向量,即结构化向量组.每个结构化向量组由若干子向量构成,每个子向量对应Web文档中相对应独立的文本段.理论分析和实验证明,该方法能提高向量空间模型在信息检索精度和召回率方面的性能.

【引证文献】
中国期刊全文数据库 前2条
1 罗长寿;张峻峰;孙素芬;魏清凤;;基于改进VSM的农业实用技术自动问答系统研究[J];安徽农业科学;2009年28期
2 付永贵;;基于云计算的余弦向量度量法文本检索模型[J];情报科学;2012年05期
中国博士学位论文全文数据库 前4条
1 张毅波;史文结构化信息检索系统的研究与实现[D];中国科学院研究生院(软件研究所);2001年
2 凌波;基于对等计算的信息检索技术[D];复旦大学;2004年
3 陈圣兵;基于商空间理论的海量信息检索模型的研究[D];安徽大学;2010年
4 王洁;基于FPGA的硬件防火墙内容过滤技术研究[D];哈尔滨工业大学;2009年
中国硕士学位论文全文数据库 前4条
1 彭毅;基于潜在语义索引的文本分类及其在科技信息检索中的研究[D];中南大学;2009年
2 杨旭;主谓关系识别与主题相关性计算技术研究[D];东北大学;2009年
3 门瑞;高质量个性化论文推荐系统研究[D];天津大学;2012年
4 段晓丽;Web文本自动文摘的研究[D];大连理工大学;2012年
【参考文献】
中国期刊全文数据库 前4条
1 陆玉昌,鲁明羽,李凡,周立柱;向量空间法中单词权重函数的分析和构造[J];计算机研究与发展;2002年10期
2 邹涛;王继成;杨文清;张福炎;;文本信息检索技术[J];计算机科学;1999年09期
3 吕铁强,于满泉,孟庆发,周立德;基于网页分块的个性化信息采集的研究与设计[J];微电子学与计算机;2005年10期
4 陶跃华;基于向量的相似度计算方案[J];云南师范大学学报(自然科学版);2001年05期
【共引文献】
中国期刊全文数据库 前10条
1 胡凌云;胡桂兰;徐勇;李龙澍;;基于Web的新闻文本分类技术的研究[J];安徽大学学报(自然科学版);2010年06期
2 郑康锋;郭世泽;杨义先;王秀娟;;基于树与网结合的可控蠕虫网络结构模型[J];兵工学报;2008年10期
3 李文斌;刘椿年;陈嶷瑛;;基于特征信息增益权重的文本分类算法[J];北京工业大学学报;2006年05期
4 敖成龙,苏英,龚元明;基于相似度的复杂数据对象比较[J];北京理工大学学报;2003年05期
5 顾益军,樊孝忠,王建华,汪涛,黄维金;中文停用词表的自动选取[J];北京理工大学学报;2005年04期
6 焦黎冰;封化民;何文才;李雪龙;;一种改进的基于Web的新闻视频内容语义分析方法[J];江西师范大学学报(自然科学版);2008年02期
7 吴锐;丁树良;甘登文;;一种新的项目反应理论等值准则——余弦准则[J];江西师范大学学报(自然科学版);2008年02期
8 王纪辉;赵卓宁;;基于协同过滤算法的电子商务网站个性化推荐系统设计[J];成都信息工程学院学报;2007年S1期
9 彭喜化;黄睿;;基于向量空间模型的多关键字检索技术[J];重庆职业技术学院学报;2006年03期
10 赵洋;滕桂法;张玉新;何冬梅;;基于Internet的农业信息垂直搜索引擎的设计[J];河北农业大学学报;2009年06期
中国重要会议论文全文数据库 前10条
1 李明宙;罗艳;王宗义;;Lucene全文检索引擎的研究及应用[A];广西计算机学会2010年学术年会论文集[C];2010年
2 王凯;刘代志;李东旭;齐玮;;地球物理环境情报搜集系统研究[A];国家安全地球物理丛书(四)——地球物理环境探测和目标信息获取与处理[C];2008年
3 顾寄南;陈晓燕;;检索系统专业化和智能化的研究与实现[A];走中国特色农业机械化道路——中国农业机械学会2008年学术年会论文集(下册)[C];2008年
4 姜丽华;张宏斌;;基于Multi-Agent的个性化Web信息采集系统[A];中国农业信息科技创新与学科发展大会论文汇编[C];2007年
5 丁山山;陈世平;;智能Agent技术在个性化WEB信息代理中的应用研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
6 徐小琴;章成志;;Web信息检索中相关词提示技术与评测[A];第三届学生计算语言学研讨会论文集[C];2006年
7 陈志玮;肖诗斌;施水才;王昕;;一种基于HTML位置信息的查询扩展技术[A];第三届学生计算语言学研讨会论文集[C];2006年
8 张爱华;靖红芳;王斌;徐燕;;文本分类中特征权重因子的作用研究[A];第五届全国信息检索学术会议论文集[C];2009年
9 徐志明;丛帅;王宇颖;雷萌;;基于仿生模式识别文本分类算法[A];第五届全国信息检索学术会议论文集[C];2009年
10 王珍;维尼拉·木沙江;赵丽红;;维、哈、柯文搜索引擎中自动分类技术的应用研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 眭新光;文本信息隐藏及分析技术研究[D];解放军信息工程大学;2007年
2 刘朝涛;中文问答系统中的句型理论及其应用研究[D];重庆大学;2010年
3 邸书灵;Agent联盟和流形学习在中文问答系统中的应用研究[D];天津大学;2009年
4 黄定轩;企业核心能力智能挖掘应用基础研究[D];西南交通大学;2005年
5 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
6 王秀娟;文本检索中若干问题研究[D];北京邮电大学;2006年
7 肖聚亮;建筑物迁移动力系统智能监控研究与应用[D];天津大学;2006年
8 刘伟;图像检索中若干问题的研究[D];浙江大学;2007年
9 杨传耀;中文信息检索索引模型及相关技术研究[D];复旦大学;2007年
10 王树梅;信息检索相关技术研究[D];南京理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 范丹;Web检索中的查询扩展及结果聚类技术研究[D];辽宁师范大学;2010年
2 雷斌;基于Java技术的智能化搜索引擎的研究与设计[D];哈尔滨工程大学;2010年
3 张珍军;基于内容的图像检索技术研究[D];哈尔滨工程大学;2010年
4 刘辉;基于KNN算法的中文Web文本分类技术研究[D];辽宁工程技术大学;2010年
5 刘伟丽;基于粒子群算法和支持向量机的中文文本分类研究[D];河南工业大学;2010年
6 吴世汉;面向查询的XML文本摘要技术[D];江西财经大学;2010年
7 李健;基于内容的新闻视频检索关键技术研究[D];哈尔滨理工大学;2010年
8 王阿婷;基于概念集合的网页内容过滤方法的研究[D];北京交通大学;2010年
9 吕靖;互联网搜索词分类关键技术研究[D];浙江大学;2011年
10 史炜;个性化搜索引擎的研究与设计[D];电子科技大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 何学锋,彭超群;科技期刊学术影响力的动态评估模型[J];编辑学报;2002年04期
2 郝秀原;游苏宁;沈锡宾;吕相征;汪谋岳;钱寿初;;影响因子的应用现状及展望[J];编辑学报;2008年05期
3 路景云;如何评判文章的学术价值[J];编辑之友;1994年03期
4 吴锐;丁树良;甘登文;;一种新的项目反应理论等值准则——余弦准则[J];江西师范大学学报(自然科学版);2008年02期
5 陈光远,黎美华,孙岱生,孙传敏;弓长岭铁矿二矿区的科马提岩[J];成都地质学院学报;1983年01期
6 刘大明;关于改进本刊论文摘要写法的建议[J];长江科学院院报;1999年01期
7 吴彦文;黄珍;张昆明;;毕业设计中的个性化推荐服务[J];电化教育研究;2008年05期
8 杨思春;;一种改进的句子相似度计算模型[J];电子科技大学学报;2006年06期
9 颜建峰;吴宁;;基于PCI总线的DMA高速数据传输系统[J];电子科技大学学报;2007年05期
10 金博,史彦军,滕弘飞;基于语义理解的文本相似度算法[J];大连理工大学学报;2005年02期
中国博士学位论文全文数据库 前6条
1 潘谦红;分布式信息检索的研究与应用[D];中国科学院研究生院(计算技术研究所);1999年
2 陈海霞;面向数据挖掘的分类器集成研究[D];吉林大学;2006年
3 王树梅;信息检索相关技术研究[D];南京理工大学;2007年
4 钱铁云;关联文本分类关键技术研究[D];华中科技大学;2006年
5 王丽娟;基于特征评价的模式识别算法研究[D];哈尔滨工业大学;2007年
6 陈竹敏;面向垂直搜索引擎的主题爬行技术研究[D];山东大学;2008年
中国硕士学位论文全文数据库 前10条
1 李辉;基于语义关系的摘要提取[D];南京理工大学;2004年
2 龙军;国家科技奖励综合业务处理平台研究[D];中南大学;2005年
3 庞剑锋;基于向量空间模型的自反馈的文本分类系统的研究与实现[D];中国科学院研究生院(计算技术研究所);2001年
4 刘加发;EBM网络搜索引擎的研究与实现[D];大连海事大学;2008年
5 李淑鹏;基于神经网络的文本自动分类系统的研究[D];武汉理工大学;2008年
6 何媛媛;基于潜在语义分析的多网页自动文摘研究[D];上海师范大学;2008年
7 江娟;垂直搜索引擎数据分析技术的研究与实现[D];华北电力大学(北京);2008年
8 刘秋水;Web信息抽取与网页摘要的研究与应用[D];大连理工大学;2008年
9 肖欣延;基于词汇链和PageRank的多文档自动文摘研究[D];厦门大学;2008年
10 杨杰;个性化推荐系统应用及研究[D];中国科学技术大学;2009年
【二级引证文献】
中国期刊全文数据库 前2条
1 黄名选;严小卫;张师超;;查询扩展技术进展与展望[J];计算机应用与软件;2007年11期
2 徐连杰;胡德华;;基于量子的交互式信息检索模型分析[J];情报探索;2012年01期
中国博士学位论文全文数据库 前7条
1 王秀娟;文本检索中若干问题研究[D];北京邮电大学;2006年
2 陈德华;基于对等网络的分布式构件库系统若干关键技术研究[D];东华大学;2006年
3 夏阳;跨地域分布式电子商务系统架构及其关键支撑技术研究[D];中国矿业大学;2009年
4 贾兆庆;非结构化P2P中搜索算法及信任机制研究[D];上海交通大学;2008年
5 李绍滋;非结构化对等网络中的信息检索若干关键技术研究[D];国防科学技术大学;2009年
6 于小兵;基于数据仓库和移动Agent的智能电子商务研究与应用[D];武汉理工大学;2010年
7 朱振方;基于微粒群和遗传优化的文本过滤关键技术研究[D];山东师范大学;2012年
中国硕士学位论文全文数据库 前10条
1 宋超臣;基于推荐网络的服务搜索技术研究[D];哈尔滨工程大学;2010年
2 陈治纲;基于向量空间模型的文本分类系统研究与实现[D];天津大学;2005年
3 陈丽珍;维文网络中不良文本信息检索、监控系统的研究[D];新疆大学;2006年
4 公爱国;基于web的XML中文检索模型的研究与实现[D];山东大学;2006年
5 钱丽平;基于对等网络的音乐搜索软件的设计[D];西安电子科技大学;2007年
6 曹阳;基于非结构化的P2P信息检索关键技术研究[D];厦门大学;2006年
7 李森;层次化文本分类方法的研究[D];山东大学;2007年
8 黄名选;基于完全加权关联规则挖掘的查询扩展研究[D];广西师范大学;2007年
9 朱澄斌;基于广域网群集的共享文件搜索策略研究[D];华南师范大学;2007年
10 孙丽丽;基于语义和信任的超节点P2P网络模型及其搜索算法[D];中南大学;2008年
【二级参考文献】
中国期刊全文数据库 前1条
1 李凡,鲁明羽,陆玉昌;关于文本特征抽取新方法的研究[J];清华大学学报(自然科学版);2001年07期
【相似文献】
中国期刊全文数据库 前10条
1 李卫东;陆玲;;融合VSM技术的PageRank算法研究与应用[J];计算机与现代化;2011年07期
2 陶惠;张妍;郝光权;;基于向量空间的文档聚类算法分析[J];电脑知识与技术;2011年20期
3 张永兴;孙四明;张峰;;基于本体的信息检索系统研究[J];微计算机信息;2011年07期
4 吴梦兰;;WEB内容推荐算法在远程教育中的应用[J];电脑知识与技术;2011年26期
5 朱培焱;夏栋梁;;汉英跨语言信息检索研究[J];计算机与现代化;2011年08期
6 刘勘;刘萍;;基于VSM的专家领域分析及可视化研究[J];图书情报工作;2011年10期
7 邢美凤;过仕明;;文本内容新颖性探测研究综述[J];情报科学;2011年07期
8 王萌;徐超;李春贵;何婷婷;;一种概念同现模型的多文档文摘研究[J];计算机工程与科学;2011年07期
9 李黎;阮留照;;一种合理的数字水印相似度评价公式[J];杭州电子科技大学学报;2011年03期
10 刘珺;张文欣;;基于RSS的层次结构用户兴趣模型的分析与设计[J];河南工程学院学报(自然科学版);2011年03期
中国重要会议论文全文数据库 前10条
1 苏祺;昝红英;胡景贺;项锟;;词性标注对信息检索系统性能的影响[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
2 李娆娆;雷沛霖;黄兰岚;原思通;刘营;;芫花药材高效液相指纹图谱研究[A];中华中医药学会四大怀药与地道药材研究论坛暨中药炮制分会第二届第五次学术会与第三届会员代表大会论文集[C];2007年
3 张虎;郭玉翠;宫尚宝;;移动Ad-hoc网络中基于第三方观察机制的信任管理研究[A];第十六届全国青年通信学术会议论文集(上)[C];2011年
4 王志松;;决策树中数据遗失值填充方法的研究[A];2001年中国智能自动化会议论文集(下册)[C];2001年
5 汤丽华;赵吴静;金菊良;张明;;基于熵的水质综合评价的相似插值模型[A];第八届中国管理科学学术年会论文集[C];2006年
6 王娟;;一种基于粗糙集理论的操作风险判别方法[A];科学发展观与系统工程——中国系统工程学会第十四届学术年会论文集[C];2006年
7 刘晓林;郁滨;;基于相似度的遗传算法模式理论研究[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(下册)[C];2008年
8 金保华;高湘飞;柳雪环;张磊;;基于XML框架与CBR智能预案管理的研究[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
9 王超;许方;;一种基于奇异值分解的印刷体数字识别算法[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
10 麦智毅;杨春玲;;基于结构相似度的H.264帧内预测快速算法[A];通信理论与信号处理新进展——2005年通信理论与信号处理年会论文集[C];2005年
中国重要报纸全文数据库 前10条
1 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;寻“宝”有术[N];计算机世界;2003年
2 ;整合信息资源 提升服务能力[N];中国计算机报;2005年
3 记者 刘安;“全国档案报刊文献及科技成果信息检索系统”通过鉴定[N];中国档案报;2002年
4 证券时报记者  韩如冰;基金投资相似度趋高[N];证券时报;2006年
5 聂磊 曹进 罗国安;中药指纹图谱相似度评价方法各有千秋[N];中国医药报;2006年
6 孟祥宁 张亚萌 郭青剑;山寨文化:是一种什么样的文化[N];中国艺术报;2009年
7 聂磊;曹进;罗国安;中药指纹图谱相似度评价方法作用各一[N];中国医药报;2005年
8 海潮;俄研究发现妊娠中毒症疑与夫妇HLA基因相似度有关[N];中国医药报;2007年
9 栾海;妊娠中毒症可能与夫妇 HLA基因相似度有关[N];医药经济报;2007年
10 沈阳药科大学药学院 孙国祥;中药指纹图谱研究新进展[N];中国中医药报;2007年
中国博士学位论文全文数据库 前10条
1 王进;基于本体的语义信息检索研究[D];中国科学技术大学;2006年
2 梁作鹏;面向Web的XML检索关键技术研究[D];东南大学;2005年
3 马晖男;信息检索中浅层语义模型的研究[D];大连理工大学;2007年
4 熊文新;信息检索Query语言分析[D];北京语言大学;2006年
5 杨为民;基于场论的信息检索模型的研究[D];安徽大学;2007年
6 颜端武;面向知识服务的智能推荐系统研究[D];南京理工大学;2007年
7 李斌;LZ复杂性算法及其在生物序列分析中的应用研究[D];中南大学;2008年
8 刘涛;现代信息检索中的文本分类及图像恢复研究[D];北京邮电大学;2006年
9 顾本柏;客体相似性表征的认知和发展机制研究[D];西南大学;2011年
10 刘磊;概念内涵属性计算研究[D];上海交通大学;2011年
中国硕士学位论文全文数据库 前10条
1 杨蓓虹;基于企业协作信息网平台的信息检索系统的设计与实现[D];苏州大学;2005年
2 操卫平;基于结构化向量空间模型的中文信息检索系统研究与实现[D];北京工业大学;2008年
3 王艳萍;基于XML的移动信息检索模型研究[D];大连理工大学;2006年
4 王宏霞;基于ONTOLOGY的信息检索系统的研究[D];河北工业大学;2005年
5 李洋;企业注册登记文件聚类软件设计与实现[D];大连理工大学;2007年
6 陈锐;基于概念图的信息检索查询扩展模型研究与实现[D];西北大学;2009年
7 杨永火;组合向量空间模型和语言模型的信息检索系统[D];天津大学;2006年
8 李媛媛;基于潜在语义索引的中文文本检索研究[D];西南交通大学;2008年
9 黄名选;基于完全加权关联规则挖掘的查询扩展研究[D];广西师范大学;2007年
10 付克志;基于Web的文本信息检索算法的研究[D];大连理工大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026