收藏本站
《电脑知识与技术》 2008年14期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

Web日志挖掘中的数据预处理研究

李鹏  张永平  
【摘要】:Web日志信息的预处理是Web日志挖掘任务中的重要阶段,是整个Web日志挖掘过程的基础和实施有效挖掘算法的前提,在Web日志挖掘中起着重要的作用,也是工作量较大的一部分。数据预处理的基本技术,包括数据清理、数据集成和转换、数据归约等。本文介绍了数据预处理中涉及到的数据清理、用户识别、会话识别、路径补充、事务识别等过程,并提出了一种路径补充算法。
【作者单位】中国矿业大学计算机学院 中国矿业大学计算机学院
【分类号】:TP311.13

【引证文献】
中国期刊全文数据库 前3条
1 彭晶;;浅谈Web日志挖掘技术[J];计算机光盘软件与应用;2012年04期
2 黄健青;黄浩;;Web日志分析中数据预处理的设计与实现[J];河南科技大学学报(自然科学版);2009年05期
3 周方;周根宝;;Web使用挖掘中的会话识别算法[J];内蒙古农业大学学报(自然科学版);2010年04期
中国硕士学位论文全文数据库 前1条
1 邵延振;基于Web挖掘的信息提取与推荐相关研究[D];广西师范大学;2010年
【共引文献】
中国期刊全文数据库 前10条
1 周常恩;林端宜;杨雪梅;赖新梅;褚剑锋;;频繁模式挖掘算法综述[J];福建电脑;2010年02期
2 马青霞;李广水;孙梅;;频繁模式挖掘进展及典型应用[J];计算机工程与应用;2011年15期
3 谢伙生;何星星;;数据流中基于滑动窗口的序列模式挖掘算法[J];计算机工程与应用;2012年04期
4 王慧;张骏温;;基于改进的Wap算法的Web序列模式的研究[J];计算机科学;2012年02期
5 胥春艳;;基于编码频繁模式树的序列模式挖掘算法[J];计算机工程;2007年06期
6 赵立娟;许志伟;吴赵杰;;基于语义关联和结构分析的WEB到WAP转换器的研究[J];计算机工程与科学;2012年05期
7 詹宇斌;殷建平;张玲;龙军;程杰仁;;一种基于有向树挖掘Web日志中最大频繁访问模式的方法[J];计算机应用;2006年07期
8 黄钧钧;谢伙生;;数据流中基于滑动窗口的闭序列模式挖掘算法[J];计算机工程与设计;2011年06期
9 习慧丹;郭勇;;Web日志增量挖掘研究及应用[J];武汉理工大学学报;2010年24期
10 方杰;朱京红;;日志挖掘中的数据预处理[J];计算机技术与发展;2010年04期
中国重要会议论文全文数据库 前2条
1 陈子军;李伟;李霞;王鑫昱;;基于投影编码的频繁子树挖掘算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
2 何星星;谢伙生;;流数据中一种高效剪枝的频繁序列挖掘算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
中国博士学位论文全文数据库 前3条
1 张寅;个性化技术及其在数字图书馆中应用的研究[D];浙江大学;2009年
2 徐玉生;频繁模式挖掘算法与剪枝策略研究[D];兰州大学;2008年
3 郭建奎;数据流相似性查询及模式挖掘研究[D];复旦大学;2008年
中国硕士学位论文全文数据库 前10条
1 王慧;Web日志中用户频繁访问路径挖掘算法的研究[D];北京交通大学;2011年
2 王永强;基于DF2Ls的序列模式挖掘研究[D];兰州大学;2011年
3 解玉洁;基于树结构的精简序列模式挖掘算法研究[D];燕山大学;2010年
4 刘喆;基于USSD和WAP的多介入式法律信息系统[D];大连理工大学;2006年
5 王春贺;个性化推荐技术研究及其在数字图书馆中应用[D];浙江大学;2007年
6 王鑫昱;Web日志挖掘会话识别的研究[D];燕山大学;2007年
7 李伟;频繁子树挖掘研究[D];燕山大学;2007年
8 詹宇斌;Web日志挖掘相关算法研究[D];国防科学技术大学;2006年
9 习慧丹;基于概念格的Web日志挖掘的研究[D];中南大学;2007年
10 胥春艳;序列模式挖掘算法研究及其在业务流程设计中的应用[D];天津大学;2007年
【同被引文献】
中国期刊全文数据库 前10条
1 吉海颖;吕宗健;;用户访问模式挖掘及在电子商务中的应用[J];北方经济;2007年02期
2 王越;桂袁义;;基于关联分析的数据挖掘在体检CRM中的应用[J];重庆理工大学学报(自然科学版);2010年03期
3 林惠民,张文辉;模型检测:理论、方法与应用[J];电子学报;2002年S1期
4 侯枫;;Web日志数据预处理[J];河南工程学院学报(自然科学版);2008年03期
5 殷贤亮;张为;;Web使用挖掘中的一种改进的会话识别方法[J];华中科技大学学报(自然科学版);2006年07期
6 韩家炜,孟小峰,王静,李盛恩;Web挖掘研究[J];计算机研究与发展;2001年04期
7 周军锋,汤显,郭景峰;一种优化的协同过滤推荐算法[J];计算机研究与发展;2004年10期
8 张健沛,刘建东,杨静;基于Web的日志挖掘数据预处理方法的研究[J];计算机工程与应用;2003年10期
9 欧阳一鸣,汪曦东,郭骏,刘红樱;Web使用挖掘数据预处理中的会话构造[J];计算机工程与应用;2005年25期
10 许敏;邱玉辉;;电子商务中推荐系统存在的问题及其对策研究[J];计算机科学;2001年04期
中国博士学位论文全文数据库 前1条
1 孙小华;协同过滤系统的稀疏性与冷启动问题研究[D];浙江大学;2005年
中国硕士学位论文全文数据库 前2条
1 谢中;基于Web数据挖掘商务网站推荐系统的研究[D];西南师范大学;2002年
2 王霞;协同过滤在电子商务推荐系统中的应用研究[D];河海大学;2003年
【二级引证文献】
中国期刊全文数据库 前3条
1 彭晶;;浅谈Web日志挖掘技术[J];计算机光盘软件与应用;2012年04期
2 田曲波;邱德红;张奇峰;孙蕾;;超级计算机错误预测模型研究[J];计算机工程与应用;2010年20期
3 程新党;张新刚;王保平;刘志都;;分布式IDS动态可信度反馈调整算法[J];河南科技大学学报(自然科学版);2010年04期
中国硕士学位论文全文数据库 前4条
1 周方;面向智能信息检索技术的Web挖掘关键技术的研究[D];内蒙古农业大学;2011年
2 刘其辉;大众行为下基于贝叶斯网的知识集群模型及其应用[D];华南理工大学;2011年
3 田曲波;基于日志分析的超级计算机错误预测方法研究[D];华中科技大学;2010年
4 车琳娜;面向个性化信息服务的网络营销模式研究[D];黑龙江大学;2011年
【相似文献】
中国期刊全文数据库 前10条
1 李超锋;杨殿生;许云;;Web使用挖掘中数据预处理过程研究[J];电子测量技术;2007年03期
2 李超锋;;Web使用挖掘中数据预处理算法的设计与实现[J];中南民族大学学报(自然科学版);2007年01期
3 王琼;刘珏;徐汀荣;;结合Web站点结构的路径补充[J];计算机技术与发展;2007年06期
4 张建东;;基于XML的Web日志预处理[J];许昌学院学报;2008年02期
5 张玲;;浅析WEB日志数据挖掘技术[J];今日科苑;2009年17期
6 向坚持,陈晓红,刘相滨,徐选华;基于Web Log的数据预处理研究[J];湖南师范大学自然科学学报;2004年04期
7 孙金华;谢彦麒;;Web使用挖掘日志预处理算法设计[J];现代计算机(专业版);2009年08期
8 王听忠;王辉;;基于协同过滤算法的Web日志预处理[J];计算机时代;2006年02期
9 周爱武;肖云;封军;;Web日志挖掘数据预处理优化[J];计算机技术与发展;2011年01期
10 汪瑛;;Web日志挖掘中Frame页面过滤的研究与实现[J];福建电脑;2009年02期
中国重要会议论文全文数据库 前10条
1 胡钛;李英玉;孟新;王春梅;李秀冰;;双星计划地面应用数据预处理的设计与实现[A];中国空间科学学会空间探测专业委员会第十七次学术会议论文集[C];2004年
2 谭立云;凯丽比努尔;塔西甫拉提;高学东;热合木江;;数据挖掘中的数据预处理方法研究[A];全国第16届计算机科学与技术应用(CACIS)学术会议论文集[C];2004年
3 吕琳;朱东华;刘玉琴;;面向数据仓库的数据预处理研究综述[A];2007年中国智能自动化会议论文集[C];2007年
4 周炳玉;卢野;刘珍阳;;多传感器数据融合中的数据预处理技术研究[A];2007年光电探测与制导技术的发展与应用研讨会论文集[C];2007年
5 傅琪琦;乐嘉锦;;CRM数据仓库中的数据预处理研究[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
6 肖英治;刘中蔚;姚佳丽;陈红;王珊;;PW-ETL:一种利用知识库进行数据预处理的ETL构架[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
7 曾宏;王媛;;三维地质建模及其在隧洞工程中的应用[A];2007重大水利水电科技前沿院士论坛暨首届中国水利博士论坛论文集[C];2007年
8 王爽;魏振钢;;空间关联规则算法在环境污染事故应急处理系统中的应用研究[A];第四届中国智能计算大会论文集[C];2010年
9 闫永慧;;空间数据挖掘中数据预处理技术探讨[A];数字测绘与GIS技术应用研讨交流会论文集[C];2008年
10 王健;靳奉祥;;车载激光扫描测量数据的预处理技术[A];中国测绘学会第九次全国会员代表大会暨学会成立50周年纪念大会论文集[C];2009年
中国重要报纸全文数据库 前10条
1 《网络世界》评测实验室 于洋;用好Web日志[N];网络世界;2004年
2 陈代寿;网管的四两拨千斤[N];中国计算机报;2004年
3 ;反击!抓住幕后黑手[N];电脑报;2004年
4 胡亚;地面应用系统开始联调联试[N];中国气象报;2008年
5 徐德军 蔡忠亮 邬国锋 杜清运;城市多媒体电子地图集的制作[N];中国测绘报;2003年
6 中国人民大学数据仓库与商务智能工程研究中心 $$  中国人民大学数据与知识工程研究所王珊、谢佳明、陈红、刘中蔚、邵琦洪、张宁;创建数据仓库:要面向三条路线[N];中国计算机报;2002年
7 肖薇;月球三维图像将如何诞生[N];中国测绘报;2007年
8 黄全权冯晓芳;首张月球三维图像如何“诞生”?[N];新华每日电讯;2007年
9 覃进文;在Windows 2000&&2003下快速安装Webalizer[N];中国电脑教育报;2003年
10 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
中国博士学位论文全文数据库 前10条
1 李超锋;Web使用挖掘关键技术研究[D];华中科技大学;2007年
2 李艳;制浆蒸煮过程纸浆卡伯值软测量技术研究与应用[D];华南理工大学;2003年
3 刘妍;高速公路建设期安全风险智能管理研究[D];大连理工大学;2011年
4 马昕;粗糙集理论在数据挖掘领域中的应用[D];浙江大学;2003年
5 贾磊;机械制造过程中的知识管理的研究[D];上海大学;2005年
6 郑作亚;GPS数据预处理和星载GPS运动学定轨研究及其软件实现[D];中国科学院研究生院(上海天文台);2005年
7 白爱民;基于客户集群和拓扑理论的CRM模型与算法研究[D];天津大学;2006年
8 陈玉坤;多模复合制导信息融合理论与技术研究[D];哈尔滨工程大学;2007年
9 佟强;科学数据网格中数据挖掘技术研究[D];中国科学院研究生院(计算技术研究所);2006年
10 刘业政;基于粗糙集数据分析的智能决策支持系统研究[D];合肥工业大学;2002年
中国硕士学位论文全文数据库 前10条
1 刘春亚;基于粗集理论的数据预处理及应用研究[D];重庆大学;2003年
2 崔冬;平坦快速衰落信道预测方法的研究[D];吉林大学;2004年
3 胡剑琛;微机继电保护数据预处理的研究[D];华北电力大学(北京);2005年
4 程川生;Web挖掘技术及其应用[D];山东大学;2005年
5 严峰;银行房贷信用评估的联机分析与挖掘算法实现[D];大连理工大学;2006年
6 张增敏;数据挖掘技术在变电站设备及缺陷管理系统中的应用[D];西安理工大学;2006年
7 管进勇;数据挖掘在银行个人优质客户管理中的应用研究[D];南昌大学;2008年
8 郭笑语;Web日志挖掘相关技术及算法的研究[D];哈尔滨工程大学;2009年
9 文志安;应急通信监控系统中采集数据预处理技术研究[D];沈阳理工大学;2010年
10 杨锦园;基于数据仓库的桥梁健康监测数据分析与处理系统研究[D];武汉理工大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026