收藏本站
《计算机研究与发展》 1999年08期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

WWW上的信息挖掘技术及实现

邹涛  王继成  朱华宇  金翔宇  张福炎  
【摘要】:随着Internet应用的逐渐普及,WWW已经发展成为一个巨大的分布式信息空间,为用户提供了一个极具价值的信息源.但因Internet所固有的开放性、动态性与异构性,又使得用户很难准确快捷地从WWW上获取所需信息.文中将数据挖掘的思想引入WWW信息处理领域来解决网上信息有效获取的问题,讨论了在WWW上进行信息挖掘所采用的算法和策略,最后简要介绍了一个采用向量空间模型和改进Robot技术的网络信息挖掘系统的设计与实现.经实验表明,系统能够较好地解决WWW上的信息自动获取问题.

【引证文献】
中国期刊全文数据库 前10条
1 李业丽,陆利坤;数据挖掘在虚拟企业联盟中的应用研究[J];北京印刷学院学报;2004年01期
2 韩惠琴,刘柏嵩,董其军;知识发现在数字图书馆中的应用[J];大学图书馆学报;2001年01期
3 邓丽,吴扬扬;挖掘Web数据[J];福建电脑;2003年08期
4 高文杰,刘素兰;一种基于WWW的INTERNET信息开采系统[J];电脑与信息技术;2000年03期
5 张海强,张永;网络用法挖掘及其应用[J];兰州理工大学学报;2004年05期
6 张脂平,林世平;Web文本挖掘中特征提取算法的分析及改进[J];福州大学学报(自然科学版);2004年S1期
7 刘敏钰,薛鸿民;Web数据挖掘系统的设计及关键技术研究[J];航空计算技术;2005年01期
8 袁方,杨柳,张红霞;基于k-近邻方法的渐进式中文文本分类技术[J];华南理工大学学报(自然科学版);2004年S1期
9 卢小华;WWW信息挖掘技术及其在水利水电领域中的应用[J];湖北水力发电;2003年01期
10 孙志东;潘懋;孙知信;闫秋艳;;轻量级自适应搜索引擎的设计与实现[J];广西师范大学学报(自然科学版);2007年02期
中国重要会议论文全文数据库 前5条
1 胥永康;岳筱玲;;浅谈网络信息挖掘应用技术[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
2 栾悉道;谢毓湘;文军;吴玲达;;基于知识库的主动式专题搜索引擎[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
3 李振星;徐泽平;;基于兴趣模型的WEB信息预测采集过滤方法[A];第一届学生计算语言学研讨会论文集[C];2002年
4 陶兰;李四明;冯爽;;面向领域的网上信息挖掘系统研究与实现[A];第六届全国计算机应用联合学术会议论文集[C];2002年
5 鄢丹;刘杰;李洁;;基于信息技术的食源性疾病防范体系[A];2004年生命系统建模仿真国际会议暨第一届全国生命系统建模仿真学术会议论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 高飞;关联规则挖掘算法研究[D];西安电子科技大学;2001年
2 李四明;基于智能Agent的网上农业信息挖掘研究[D];中国农业大学;2003年
3 陈定权;自动主题搜索的应用研究[D];中国科学院研究生院(文献情报中心);2003年
4 朱征宇;Web资源组织与服务性能研究[D];重庆大学;2003年
5 刘君强;海量数据挖掘技术研究[D];浙江大学;2003年
6 郭秀娟;基于关联规则数据挖掘算法的研究[D];吉林大学;2004年
7 傅明;基于Web的空间数据挖掘研究[D];中南大学;2004年
8 代六玲;互联网内容监管系统关键技术的研究[D];南京理工大学;2005年
9 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
10 陈燕;数据仓库的设计与实现[D];大连理工大学;2000年
中国硕士学位论文全文数据库 前10条
1 刘艳青;基于Web的个性化信息检索研究[D];山东大学;2005年
2 孙英慧;基于向量空间模型的数据挖掘技术的研究[D];东北师范大学;2005年
3 马丽娜;基于Web的数据挖掘技术研究[D];山东师范大学;2002年
4 唐飞龙;Internet信息获取技术的研究[D];合肥工业大学;2002年
5 朱世顺;WWW上基于内容的多媒体数据挖掘[D];南京理工大学;2002年
6 朱毅华;智能搜索引擎中的同义词识别算法研究[D];南京农业大学;2001年
7 吴思;聚类分析及其在农业物种信息自动提取中的应用[D];湘潭大学;2001年
8 黄炳骜;动态PUSH系统原型的设计[D];西南师范大学;2001年
9 乔智勇;Web数据挖掘系统的设计及关键技术研究[D];西安电子科技大学;2002年
10 陈小宁;Web信息资源获取技术的研究与实现[D];暨南大学;2001年
【参考文献】
中国期刊全文数据库 前1条
1 张晓辉,邵华,常桂然;WWW上的信息发现与搜索引擎技术[J];小型微型计算机系统;1998年06期
【共引文献】
中国期刊全文数据库 前10条
1 赵丹群;数据挖掘:原理、方法及其应用[J];现代图书情报技术;2000年06期
2 谢成山,牛纪海,徐济仁;DM技术及其在数据处理中的应用[J];电讯技术;2003年02期
3 黄君羡,欧薇;浅谈互联网信息挖掘技术[J];广东交通职业技术学院学报;2003年04期
4 刘晓政;;网络信息挖掘与网络虚拟咨询[J];河北科技图苑;2006年03期
5 陆丽娜,xjtu.edu.cn,陈亚萍,xjtu.edu.cn,杨麦顺,xjtu.edu.cn,魏恒义,xjtu.edu.cn;挖掘关联规则算法的优化处理[J];计算机工程与应用;2000年08期
6 张宜生,刘凡,梁书云;人力资源数据挖掘技术及其应用[J];计算机工程与应用;2002年06期
7 罗可,蔡碧野,卜胜贤,谢中科;数据挖掘及其发展研究[J];计算机工程与应用;2002年14期
8 肖立英,李建华,谭立球;Web日志挖掘技术的研究与应用[J];计算机工程;2002年07期
9 许兆新,周双娥,郝燕玲;决策支持系统相关技术综述[J];计算机应用研究;2001年02期
10 黄绍君,杨炳儒,谢永红;知识发现及其应用研究回顾[J];计算机应用研究;2001年04期
中国博士学位论文全文数据库 前5条
1 许兆新;基于元知识的数据挖掘系统研究[D];哈尔滨工程大学;2003年
2 郭平;定性空间推理技术及应用研究[D];重庆大学;2004年
3 王文铭;基于数据仓库的矿山企业信息系统及其应用研究[D];东北大学;2000年
4 张智雄;Internet科技信息资源门户网站(STIP)系统的实践研究[D];中国科学院文献情报中心;2000年
5 李广建;个性化网络信息检索系统的研究与实现[D];中国科学院研究生院(文献情报中心);2002年
中国硕士学位论文全文数据库 前10条
1 田容;人工神经网络在数据挖掘中的应用研究[D];华北工学院;2001年
2 骆志群;数据挖掘技术在我国移动通信运营业的应用研究[D];浙江大学;2002年
3 刘赏;结合密度思想的蚂蚁聚类算法[D];河北工业大学;2003年
4 刘继昌;基于统计的股市多维数据关联规则发现实现[D];河北工业大学;2003年
5 蒋晓静;基于XML及关联规则的WEB日志挖掘技术研究[D];江西师范大学;2003年
6 王扬;高技术企业经营业绩评价决策支持系统[D];哈尔滨理工大学;2003年
7 薛静;专家信息管理系统在CRM中的研究与应用——基于java技术的构架[D];西北工业大学;2001年
8 张兵;一种高效的序列模式增量挖掘算法(NPSP)[D];广西师范大学;2003年
9 闫禹;多维关联规则数据挖掘研究及其在学生信息系统中的应用[D];沈阳工业大学;2003年
10 刘立平;一种中文文本聚类方法的研究[D];湘潭大学;2003年
【同被引文献】
中国期刊全文数据库 前10条
1 黄晓斌;基于网络的文献知识发现系统研究[J];情报科学;2003年02期
2 曹绍火;基于语义网络的神经网络系统[J];计算机工程与应用;2001年11期
3 朱玉全;陈耿;杨鹤标;;正负关联规则挖掘算法研究[J];计算机科学;2006年03期
4 曹玉霞;搜索引擎新思维[J];现代图书情报技术;2000年05期
5 骈茂林;质的评价:课堂教学评价的另一种取向[J];河北师范大学学报(教育科学版);2002年05期
6 李晓丽,杜振龙,李明,余冬梅;基于Bayes概率的用户兴趣发现[J];计算机工程与科学;2003年05期
7 施章清;论档案袋评定与学生评价[J];课程.教材.教法;2004年01期
8 揭春雨 ,刘源 ,梁南元;论汉语自动分词方法[J];中文信息学报;1989年01期
9 卫金茂,王石,伊卫国;基于XML的数据挖掘[J];计算机工程与设计;2003年10期
10 唐懿芳 ,牛力 ,傅赛香 ,严小卫;文本的自动分类[J];广西师范大学学报(自然科学版);2001年04期
中国博士学位论文全文数据库 前10条
1 范九伦;模糊聚类新算法与聚类有效性问题研究[D];西安电子科技大学;1998年
2 张智雄;Internet科技信息资源门户网站(STIP)系统的实践研究[D];中国科学院文献情报中心;2000年
3 王栩;Agent系统通讯理论及组织结构的研究[D];中国科学院软件研究所;2001年
4 李广建;个性化网络信息检索系统的研究与实现[D];中国科学院研究生院(文献情报中心);2002年
5 毛军;Web信息服务中受控语言研究[D];中国科学院研究生院(文献情报中心);2002年
6 刘业政;基于粗糙集数据分析的智能决策支持系统研究[D];合肥工业大学;2002年
7 陈定权;自动主题搜索的应用研究[D];中国科学院研究生院(文献情报中心);2003年
8 李四明;基于智能Agent的网上农业信息挖掘研究[D];中国农业大学;2003年
9 张兵;时空信息辅助下的高光谱数据挖掘[D];中国科学院研究生院(遥感应用研究所);2002年
10 兰少华;多Agent技术及其应用研究[D];南京理工大学;2002年
中国硕士学位论文全文数据库 前10条
1 吴俊杰;基于用户访问兴趣的路径聚类研究[D];太原理工大学;2005年
2 刘向辉;专题性智能搜索引擎的研究与实现[D];昆明理工大学;2001年
3 蒋伟华;搜索引擎中的信息抽取技术研究[D];湖南大学;2001年
4 易靖;基于信息粒度原理的文本分类方法的研究[D];北京工业大学;2001年
5 高春玲;关联规则挖掘的实现[D];郑州大学;2001年
6 孙良;一种分布式智能信息检索系统的研究与实现[D];浙江大学;2002年
7 钱小军;Web文本挖掘技术研究及其实现[D];浙江大学;2002年
8 沈培华;支持矢量机的算法研究和应用[D];南京理工大学;2002年
9 王胜海;网络智能知识服务系统设计与实现[D];中国科学院研究生院(文献情报中心);2002年
10 张俭恭;扩展元搜索引擎(EMSE)的系统设计[D];中国科学院研究生院(文献情报中心);2002年
【二级引证文献】
中国期刊全文数据库 前10条
1 董玉德,王志诚,王明保,李道伦;基于WEB课件中动态题库的设计与开发[J];安徽纺织职业技术学院学报;2003年01期
2 高洪歌;赵会群;;关联规则挖掘在乒乓球比赛技战术分析中的应用[J];北方工业大学学报;2006年01期
3 刘芳;陆立;;广义点摄影测量的平差及质量分析[J];北京测绘;2006年01期
4 周燕;网络信息资源组织研究[J];图书与情报;2003年01期
5 曹霞,孙成权;数字图书馆与知识创新[J];图书与情报;2004年06期
6 冯琼;基于网络信息组织的图书馆个性化主动服务[J];图书与情报;2005年03期
7 刘杰;束博;;一种高效的HTML/XHTML至WML的转换方法[J];北京工商大学学报(自然科学版);2006年06期
8 林冬云;刘慧平;;应用空间聚类进行点数据分布研究[J];北京师范大学学报(自然科学版);2006年04期
9 吴琪;一种基于客户端的用户浏览行为的采集方法[J];长春师范学院学报;2005年09期
10 钱榕,李欣,杨炳儒;经济全球化背景下竞争情报系统的研究[J];重庆工学院学报;2005年02期
中国重要会议论文全文数据库 前2条
1 曾旭平;陈刚;王树良;程新文;;基于云理论的滑坡监测分析[A];第二届环境与工程地球物理国际会议论文集[C];2006年
2 韩冰;林鸿飞;;基于支撑向量机的人物关系抽取[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 黄解军;贝叶斯网络结构学习及其在数据挖掘中的应用研究[D];武汉大学;2005年
2 许建潮;Web挖掘中若干问题的研究[D];吉林大学;2005年
3 廖敏;基于资源集成的协同产品开发原理与实施方法研究[D];四川大学;2005年
4 王占全;基于地理信息系统空间数据挖掘若干关键技术的研究[D];浙江大学;2005年
5 荣耀;海底隧道衬砌裂缝控制关键技术研究[D];同济大学;2007年
6 王兴玲;基于XML的地理信息Web服务研究[D];中国科学院研究生院(遥感应用研究所);2002年
7 王宇翔;分布式网络地理信息系统研究[D];中国科学院研究生院(遥感应用研究所);2002年
8 周海燕;空间数据挖掘的研究[D];中国人民解放军信息工程大学;2003年
9 史玉峰;数字信息模式识别理论及其应用[D];山东科技大学;2003年
10 李雪红;重大水工混凝土结构裂缝演变规律及转异诊断方法研究[D];河海大学;2003年
中国硕士学位论文全文数据库 前10条
1 李福新;基于网络的企业知识组织研究[D];武汉大学;2005年
2 杨盛;电子邮件过滤系统的研究与设计[D];中南大学;2005年
3 朱耀稷;自考系统数据挖掘应用研究[D];天津大学;2005年
4 曲著伟;基于树匹配的交互式Web数据抽取技术的研究[D];天津大学;2005年
5 车立杰;纯文本文档处理技术在法律信息数据库中的应用[D];北京邮电大学;2006年
6 黄峰;基础教育搜索引擎中的网页文档特征提取研究[D];南京师范大学;2006年
7 刘轶群;基于Maze用户行为分析的资源推荐系统设计与实现[D];北京大学;2007年
8 李爱明;个性化搜索引擎用户模型研究[D];华中师范大学;2007年
9 马媛媛;互联网环境下的服务质量管理问题研究[D];北京工业大学;2007年
10 药成刚;基于链接结构的中文网页排序算法研究[D];哈尔滨工业大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 王卫亚,张秋霞;Internet信息检索原理[J];洛阳师范学院学报;1999年05期
2 陈瞿铁;构建企业级网络 Intranet[J];湖南电力;1998年04期
3 邓志刚,周秉峰;一个新VRML浏览器的构造与实现[J];计算机工程;1999年12期
4 许慧虹,杨传厚;基于Web的企业内部网络管理[J];数据通信;1999年04期
5 李蔚,霍涛,惠勇侠;WWW的信息检索技术研究[J];济南大学学报(自然科学版);2001年03期
6 王振强;基于WWW的信息挖掘[J];中国计算机用户;1997年10期
7 徐琪;Web页面的组织与设计[J];电脑学习;1998年06期
8 鄂明杰;JAVA语言在网页制作上的应用[J];天津城市建设学院学报;1999年04期
9 徐念祖,陈铭南;应用Web技术 开发教育资源[J];微型电脑应用;1999年04期
10 张晓滨,石美红,蔡桂洲;信息采集Robot的实现及应用[J];西安工程科技学院学报;2002年01期
中国重要会议论文全文数据库 前10条
1 郑登理;;万维网WWW及其近期发展[A];OA’97全国办公自动化学术与经验交流会论文集[C];1997年
2 卢增祥;李衍达;;一种基于INTERNET的信息资源组织方法[A];1996年中国智能自动化学术会议论文集(下册)[C];1996年
3 陈品德;龚正虎;;WWW服务器安全问题研究[A];第十二届全国计算机安全技术交流会论文集[C];1997年
4 柏桂荣;章勇;;基于RSS的用户兴趣模型研究[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年
5 蔡彪;廖闻剑;彭艳兵;;Deep Web数据集成和关键技术综述[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年
6 杨旭东;张景生;;信息网络系统的安全分析与防范措施[A];第十二届全国计算机安全技术交流会论文集[C];1997年
7 邹声元;周龙骧;;WWW文档的结构[A];第十五届全国数据库学术会议论文集[C];1998年
8 吴玉宪;宋宝燕;张斌;郑怀远;;Hi-View-Web系统中的WWW页面包装技术[A];第十五届全国数据库学术会议论文集[C];1998年
9 杨艳春;孟祥武;;P2P网络服务环境中的节点相似性度量研究[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
10 张贯虹;乌达巴拉;巩政;;基于向量空间模型的网页文本句子对齐方法研究[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
中国重要报纸全文数据库 前1条
1 王明明 苏娟;从入口吸引青少年 手机浏览器评测[N];中国计算机报;2009年
中国硕士学位论文全文数据库 前10条
1 符燕华;Web文本数据挖掘研究[D];同济大学;2006年
2 胡永晖;数据挖掘技术在提高Web用户访问速度上的应用研究[D];湘潭大学;2005年
3 张丽;基于Winnow算法的反垃圾邮件引擎的设计与实现[D];东南大学;2006年
4 吴驰文;基于聚类技术的网页分类应用[D];江南大学;2008年
5 陈明芳;高校有向子群网实证研究与分析[D];广西师范大学;2008年
6 张强;网页内容获取及基于意图的聚类[D];北京邮电大学;2010年
7 马庆;P2P网络中基于查询的聚类的研究[D];北京邮电大学;2010年
8 田大军;WWW孤立文件发现机制的设计与应用[D];东北大学;2009年
9 秦超;网页噪声识别与消除方法研究[D];山东科技大学;2011年
10 缪平;基于微博用户兴趣模型的信息推送技术的研究[D];武汉理工大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026