收藏本站
《江苏科技大学学报(自然科学版)》 2012年01期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

Web日志挖掘中的数据预处理研究

卢健  刁雅静  
【摘要】:Web日志挖掘中,数据源(日志文件)的复杂性是挖掘所面临的主要问题之一.针对Web日志挖掘的数据预处理问题,全面梳理了数据预处理的全过程.针对日志文件数据量巨大的难题,使用Python语言程序高效的实现了数据清理.在用户识别、会话识别和路径完善中,在传统方法的基础上引入了启发性规则,通过实验数据验证了方法的有效性.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 杨树林;田卫东;;基于农业本体的用户兴趣模型研究[J];电脑知识与技术;2011年13期
2 滕启龙;王健;;基于Web挖掘的个性化远程教学系统的研究与实现[J];福建电脑;2011年06期
3 王立平;刘艳玲;;web挖掘在农业数字图书馆中的应用[J];农业考古;2011年03期
4 张玉峰;何超;;基于Web日志挖掘的网络动态竞争情报分析研究[J];情报理论与实践;2011年09期
5 曹棣;孔晓斌;;基于粗糙k-均值的web事务的聚类[J];山西师范大学学报(自然科学版);2011年02期
6 袁健;金鑫;;一种重构网站结构的Web日志挖掘数据预处理方法[J];小型微型计算机系统;2011年07期
7 夏惠芬;董卫民;;基于关联规则的Web挖掘技术研究[J];现代电子技术;2011年16期
8 马伟杰;;数据挖掘在高校学生工作中的应用[J];软件导刊;2011年08期
9 戴菲;;数据挖掘技术在电子商务中的应用[J];电脑知识与技术;2011年21期
10 张笑;;一种新的基于Web日志的数据聚类算法研究[J];电脑知识与技术;2011年21期
11 彭耶萍;;自适应遗传模拟退火的Web日志关联挖掘[J];软件导刊;2011年07期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 丁瑾;;基于Web数据挖掘的综述[A];山西省科学技术情报学会学术年会论文集[C];2004年
2 赵桦;曲飞;;序列模式挖掘算法在Web挖掘上的应用[A];全国第十届企业信息化与工业工程学术年会论文集[C];2006年
3 师伟;廖闻剑;;数据挖掘在Web上的研究与应用[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
4 耿涛;;Web日志分析在电子数据取证中的应用[A];第二十一次全国计算机安全学术交流会论文集[C];2006年
5 张艳;周国祥;;Web挖掘在个性化信息检索中的应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
6 常智荣;马自卫;邓芳;;基于Web日志的数据挖掘技术的研究[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
7 宋江春;沈钧毅;;基于CORBA的分布式Web挖掘系统的设计与实现[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
8 林政;吕雅娟;刘群;马希荣;;基于双语混和网页的平行语料挖掘[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
9 栾悉道;谢毓湘;文军;吴玲达;;基于知识库的主动式专题搜索引擎[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
10 汪洋;张磊;章毅;;基于短语匹配的中文Web文档聚类算法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
中国重要报纸全文数据库 前5条
1 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
2 涂序彦 陈泓娟;在网络信息海洋中淘金[N];计算机世界;2001年
3 ;Web收获:吸纳有用信息[N];计算机世界;2004年
4 张德政;信息挖掘商业智能之“芯”[N];中国计算机报;2002年
5 本报记者 仝仁;数据库网联服务[N];中国计算机报;2001年
中国博士学位论文全文数据库 前8条
1 肖敏;基于领域本体的电子商务推荐技术研究[D];武汉理工大学;2009年
2 易明;基于Web挖掘的电子商务个性化推荐机理与方法研究[D];华中科技大学;2006年
3 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
4 胡蓉;WEB日志和子空间聚类挖掘算法研究[D];华中科技大学;2008年
5 易高翔;粗糙集在Web挖掘中的应用研究[D];华中科技大学;2006年
6 鲍钰;WEB日志挖掘及其应用研究[D];华东师范大学;2010年
7 袁方;面向智能信息检索的Web挖掘关键技术研究[D];东北大学;2006年
8 邓爱林;电子商务推荐系统关键技术研究[D];复旦大学;2003年
中国硕士学位论文全文数据库 前10条
1 唐飞龙;Internet信息获取技术的研究[D];合肥工业大学;2002年
2 陈景强;序列模式挖掘在Web日志挖掘中应用研究[D];重庆大学;2008年
3 蒲秋梅;基于XML的Web数据挖掘技术的研究[D];武汉大学;2004年
4 孙丽;Web数据的挖掘方法研究[D];大庆石油学院;2004年
5 田海山;基于Web日志的数据挖掘研究[D];河北工业大学;2003年
6 牟刚;基于XML的Web信息挖掘技术的研究[D];重庆大学;2004年
7 郭鹏;基于Web数据挖掘分类算法的个性化信息服务[D];太原理工大学;2003年
8 詹晶晶;基于WEB挖掘的网络蜘蛛的研究与实现[D];厦门大学;2007年
9 门志勇;CRM系统及应用研究[D];首都经济贸易大学;2002年
10 祝效普;WEB用户访问序列模式挖掘[D];天津大学;2005年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978