| | | | | 基于HITS与MASEL算法的融合算法 | | | 赵莹莹;韩元杰 | | | H ITS算法和M A SEL算法分别实现针对用户的查询进行W EB结构挖掘和W EB使用挖掘,从而提供给用户查询所得信息。为了针对用户的某一查询搜索出更符合用户需求的信息,提出了一种新的挖掘算法。该算法是对H ITS算法和M A SEL算法的融合应用和改进,可以解决在H ITS算法中所产生的主题偏移问题以及M A SEL算法中不能很好的查找出中枢网页和权威网页的问题。模拟实验结果表明:针对某一查询,基于H ITS和M A SEL算法的融合算法具有更高的准确率,查询的结果路径更接近用户的经验兴趣路径。 【作者单位】:桂林电子科技大学计算机系 广西桂林541004 【关键词】:WEB挖掘;HITS算法;MASEL算法 【基金】:广西教育厅基金项目(D200355);桂林电子科技大学基金项目(Z200512) 【分类号】:TP301.6 【DOI】:cnki:ISSN:1001-7437.0.2006-04-002 【正文快照】: 随着万维网上信息的迅猛增加,为用户准确而快速地找到他们所需要的信息和资源已经成为当前一项极具挑战性的任务。数据挖掘算法也被随之扩展到网络领域,从而产生了越来越多的W EB挖掘算法。W EB挖掘就是使用数据挖掘技术从W EB文档和W EB服务中检索、提取和评估用于知识发现的信息。W EB挖掘通常分为三种:W EB结构挖掘、W EB应用挖掘和W EB内容挖掘[1]。其中W EB结构挖掘是用来提取网络的拓扑信息,即挖掘网页之间的链接结构和网页的内部结构,从网页的实际组织结构中获取信息;W EB应用挖掘是通过研究网站的访问日志,识别用户的访… | | | 推荐 CAJ下载 PDF下载 | | | CAJViewer7.0阅读器支持所有CNKI文件格式,AdobeReader仅支持PDF格式 | | | | A fusion algorithm based on HITS algorithm and MASEL algorithm | | | ZHAO Ying-ying;HAN Yuan-jie(Dept.of Computer Science;Guilin University of Electronic Technology;Guilin 541004;China) | | | In order to search better resources,a new mining algorithm is introduced in this paper,which integrates HITS algorithm with MASEL algorithm.This method makes HITS and MASEL algorithms complement each other.It can also solve the problem of topic drift in HITS algorithm as well as the problem that MASEL algorithm can't efficiently find hubs and authorities WebPages.The results of simulation studies show that the fusion method performs better than the HITS and MASEL algorithms in terms of returning large number of relevant pages to a given query. 【Keyword】:WEB mining;HITS algorithm;MASEL algorithm |
| | | | | | 1 | 关永,沈孝本,赵冬生,张聪霞; 基于嵌入式系统的智能教具研究 [J];电子器件; 2007年01期 | | 2 | 吕爽,陈高云; 数据挖掘技术在高校教学评估中的应用 [J];广东广播电视大学学报; 2006年03期 | | 3 | 赵宇,戚国强; 数据仓库技术在水稻栽培管理决策支持系统中的应用 [J];东北农业大学学报; 2006年04期 | | 4 | 陆安生,陈永强,屠浩文; 决策树C5算法的分析与应用 [J];电脑知识与技术; 2005年09期 | | 5 | 董燕; Web挖掘对电子商务网站建设的影响 [J];管理学报; 2005年S2期 | | 6 | 杨少华,陈静,赵晓波; 电力经营管理分析与辅助决策系统解决方案 [J];电力信息化; 2005年12期 | | 7 | 王维虎,刘延申; 浅析提升电信企业数据仓库中数据质量的方法 [J];高等函授学报(自然科学版); 2006年01期 | | 8 | 赵建英,刘长良,曲晓平; 遗传算法在数据挖掘中的应用分析 [J];仪器仪表用户; 2006年03期 | | 9 | 庞洁,李睿仙,胡建华; 数据挖掘在电信交叉销售领域的研究 [J];电脑知识与技术; 2006年35期 | | 10 | 李社,管太阳,林子瑜; 基于空间数据挖掘的遥感图像处理 [J];测绘与空间地理信息; 2005年05期 |
|
| | | | | | 1 | 赵莹莹,韩元杰; 基于HITS与MASEL算法的融合算法 [J];桂林电子科技大学学报; 2006年04期; 15-18 | | 2 | 何典,宋中山; 基于Web挖掘的个性化网络教育研究 [J];计算机与现代化; 2005年05期; 101-103 | | 3 | 韩向峰,刘希玉; 基于Web挖掘的高考预测系统的设计与实现 [J];计算机应用研究; 2004年08期; 165-167 | | 4 | 曾瑛; Web挖掘工具与数字图书馆信息服务 [J];中国科技信息; 2005年07期; 30 | | 5 | 刘建国; Web挖掘在电子商务中的应用 [J];重庆工商大学学报(自然科学版); 2004年04期; 66-69 | | 6 | 程筱胜,廖文和,田宏,薛善良; 面向电子商务的Web挖掘系统模型研究与应用 [J];南京航空航天大学学报; 2004年03期; 52-56 | | 7 | 来玲,杨宝森; 用Web挖掘方法扩充大学图书馆知识库研究 [J];情报杂志; 2005年02期; 20-22 | | 8 | 吴冰,刘仲英; 不完全信息系统的粗集Web挖掘方法 [J];同济大学学报(自然科学版); 2004年01期; 115-118 | | 9 | 贾宇波,王永利,孙淑荣; 基于J2EE的Web挖掘原型系统的研究与应用 [J];计算机应用研究; 2003年04期; 120-122+131 | | 10 | 陈萍丽; Web挖掘在竞争情报系统中的应用 [J];中国信息导报; 2003年03期; 57-58 |
|
| | | | | | 1 | 丁瑾; 基于Web数据挖掘的综述 [A];山西省科学技术情报学会学术年会论文集 [C]; 2004年 | | 2 | 宋江春,沈钧毅; 基于CORBA的分布式Web挖掘系统的设计与实现 [A];2005年全国开放式分布与并行计算学术会议论文集 [C]; 2005年 | | 3 | 栾悉道,谢毓湘,文军,吴玲达; 基于知识库的主动式专题搜索引擎 [A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集 [C]; 2005年 | | 4 | 汪洋,张磊,章毅; 基于短语匹配的中文Web文档聚类算法 [A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集 [C]; 2005年 | | 5 | 方高林,于浩,孟遥,邹纲; 基于字分析单元的辅助阅读系统 [A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集 [C]; 2006年 | | 6 | 周香凝; 一种支持快速查询的敏感数据加密机制 [A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(下册) [C]; 2006年 | | 7 | 孙涛,张宏建,胡赤鹰; 基于模糊逻辑融合算法的气液两相流流型辨识方法 [A];中国仪器仪表学会第三届青年学术会议论文集(上) [C]; 2001年 | | 8 | 符强,萧泽新,陈乐庚; 基于小波分解的医学显微图像融合 [A];2006年国防光学及光电子学学术研讨会暨中国兵工学会光学专业委员会成立25周年年会论文集 [C]; 2006年 | | 9 | 杨志,毛士艺,陈炜; 基于多分辨率局部峰度熵的鲁棒图像融合算法 [A];中国航空学会信号与信息处理专业全国第八届学术会议论文集 [C]; 2004年 | | 10 | 张军,徐光佑,陶霖密; 支持多动因动作及其融合的生动人脸动画技术 [A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集 [C]; 2005年 |
|
|
|