《桂林电子科技大学学报》2006年04期 加入收藏    获取最新 
 基于HITS与MASEL算法的融合算法
 赵莹莹;韩元杰
   H ITS算法和M A SEL算法分别实现针对用户的查询进行W EB结构挖掘和W EB使用挖掘,从而提供给用户查询所得信息。为了针对用户的某一查询搜索出更符合用户需求的信息,提出了一种新的挖掘算法。该算法是对H ITS算法和M A SEL算法的融合应用和改进,可以解决在H ITS算法中所产生的主题偏移问题以及M A SEL算法中不能很好的查找出中枢网页和权威网页的问题。模拟实验结果表明:针对某一查询,基于H ITS和M A SEL算法的融合算法具有更高的准确率,查询的结果路径更接近用户的经验兴趣路径。
【作者单位】:桂林电子科技大学计算机系 广西桂林541004
【关键词】:WEB挖掘;HITS算法;MASEL算法
【基金】:广西教育厅基金项目(D200355);桂林电子科技大学基金项目(Z200512)
【分类号】:TP301.6
【DOI】:cnki:ISSN:1001-7437.0.2006-04-002
【正文快照】:
  随着万维网上信息的迅猛增加,为用户准确而快速地找到他们所需要的信息和资源已经成为当前一项极具挑战性的任务。数据挖掘算法也被随之扩展到网络领域,从而产生了越来越多的W EB挖掘算法。W EB挖掘就是使用数据挖掘技术从W EB文档和W EB服务中检索、提取和评估用于知识发现的信息。W EB挖掘通常分为三种:W EB结构挖掘、W EB应用挖掘和W EB内容挖掘[1]。其中W EB结构挖掘是用来提取网络的拓扑信息,即挖掘网页之间的链接结构和网页的内部结构,从网页的实际组织结构中获取信息;W EB应用挖掘是通过研究网站的访问日志,识别用户的访…
 推荐 CAJ下载           PDF下载
 CAJViewer7.0阅读器支持所有CNKI文件格式,AdobeReader仅支持PDF格式
 A fusion algorithm based on HITS algorithm and MASEL algorithm
 ZHAO Ying-ying;HAN Yuan-jie(Dept.of Computer Science;Guilin University of Electronic Technology;Guilin 541004;China)
  In order to search better resources,a new mining algorithm is introduced in this paper,which integrates HITS algorithm with MASEL algorithm.This method makes HITS and MASEL algorithms complement each other.It can also solve the problem of topic drift in HITS algorithm as well as the problem that MASEL algorithm can't efficiently find hubs and authorities WebPages.The results of simulation studies show that the fusion method performs better than the HITS and MASEL algorithms in terms of returning large number of relevant pages to a given query.
【Keyword】:WEB mining;HITS algorithm;MASEL algorithm
 【共引文献】 共(212)篇 
 中国期刊全文数据库找到 10 条
 
1关永,沈孝本,赵冬生,张聪霞; 基于嵌入式系统的智能教具研究 [J];电子器件; 2007年01期
2吕爽,陈高云; 数据挖掘技术在高校教学评估中的应用 [J];广东广播电视大学学报; 2006年03期
3赵宇,戚国强; 数据仓库技术在水稻栽培管理决策支持系统中的应用 [J];东北农业大学学报; 2006年04期
4陆安生,陈永强,屠浩文; 决策树C5算法的分析与应用 [J];电脑知识与技术; 2005年09期
5董燕; Web挖掘对电子商务网站建设的影响 [J];管理学报; 2005年S2期
6杨少华,陈静,赵晓波; 电力经营管理分析与辅助决策系统解决方案 [J];电力信息化; 2005年12期
7王维虎,刘延申; 浅析提升电信企业数据仓库中数据质量的方法 [J];高等函授学报(自然科学版); 2006年01期
8赵建英,刘长良,曲晓平; 遗传算法在数据挖掘中的应用分析 [J];仪器仪表用户; 2006年03期
9庞洁,李睿仙,胡建华; 数据挖掘在电信交叉销售领域的研究 [J];电脑知识与技术; 2006年35期
10李社,管太阳,林子瑜; 基于空间数据挖掘的遥感图像处理 [J];测绘与空间地理信息; 2005年05期
 中国优秀硕士学位论文全文数据库找到 10 条
 
1范明; 聚类算法在Web挖掘中的应用 [D];西北工业大学; 2007年
2房一鸣; 用分类树算法进行上市公司评级的实证研究 [D];对外经济贸易大学; 2006年
3卢金秋; 数据挖掘中的人工神经网络算法及应用研究 [D];浙江工业大学; 2006年
4陈维; 金融监管信息系统发展研究 [D];对外经济贸易大学; 2004年
5赵信洋; 基于数据仓库的物流配送系统研究 [D];武汉理工大学; 2006年
6宁剑辉; 基于OLAP的离散型生产优化调度研究 [D];哈尔滨工程大学; 2006年
7胡江洪; 基于决策树的分类算法研究 [D];武汉理工大学; 2006年
8王威; 个人征信数据仓库系统的设计研究 [D];对外经济贸易大学; 2006年
9曹爱华; 数据仓库技术研究及在电信经营分析系统的应用 [D];北京邮电大学; 2006年
10王建军; 基于数据仓库的广电智能器材管理系统的研究与实现 [D];北京邮电大学; 2006年
 中国博士学位论文全文数据库找到 7 条
 
1黄陈蓉; 基于Gap统计的图像分割理论与算法研究 [D];南京理工大学; 2005年
2任永功; 面向聚类的数据可视化方法及相关技术研究 [D];东北大学; 2006年
3张华; 缺血性中风急性期中医证候演变和神经功能缺损程度的相关性研究 [D];北京中医药大学; 2006年
4张俊; 商业化证券信息服务及其实现策略 [D];武汉大学; 2005年
5何斌; 基于可拓逻辑的机器学习理论与方法 [D];华南理工大学; 2005年
6钱晓东; 基于神经网络等技术的数据与文本聚分类研究 [D];天津大学; 2005年
7王明春; 基于粗糙集的数据及文本挖掘方法研究 [D];天津大学; 2005年
 中国重要会议论文全文数据库找到 4 条
 
1董燕; Web挖掘对电子商务网站建设的影响 [A];第11届海峡两岸信息管理发展策略研讨会论文集 [C]; 2005年
2郑新奇,刘晓丽; 基于Clementine决策树的空间数据挖掘方法探讨——以平阴县安城乡为例 [A];提高全民科学素质、建设创新型国家——2006中国科协年会论文集(下册) [C]; 2006年
3陈震,陈维默; 浅谈数据挖掘技术 [A];福建省科协第五届学术年会数字化制造及其它先进制造技术专题学术年会论文集 [C]; 2005年
4鲁俐; 高校档案管理工作中的一种决策树分类算法研究 [A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上) [C]; 2006年
 【相似文献】 
 中国期刊全文数据库
 
1赵莹莹,韩元杰; 基于HITS与MASEL算法的融合算法 [J];桂林电子科技大学学报; 2006年04期; 15-18
2何典,宋中山; 基于Web挖掘的个性化网络教育研究 [J];计算机与现代化; 2005年05期; 101-103
3韩向峰,刘希玉; 基于Web挖掘的高考预测系统的设计与实现 [J];计算机应用研究; 2004年08期; 165-167
4曾瑛; Web挖掘工具与数字图书馆信息服务 [J];中国科技信息; 2005年07期; 30
5刘建国; Web挖掘在电子商务中的应用 [J];重庆工商大学学报(自然科学版); 2004年04期; 66-69
6程筱胜,廖文和,田宏,薛善良; 面向电子商务的Web挖掘系统模型研究与应用 [J];南京航空航天大学学报; 2004年03期; 52-56
7来玲,杨宝森; 用Web挖掘方法扩充大学图书馆知识库研究 [J];情报杂志; 2005年02期; 20-22
8吴冰,刘仲英; 不完全信息系统的粗集Web挖掘方法 [J];同济大学学报(自然科学版); 2004年01期; 115-118
9贾宇波,王永利,孙淑荣; 基于J2EE的Web挖掘原型系统的研究与应用 [J];计算机应用研究; 2003年04期; 120-122+131
10陈萍丽; Web挖掘在竞争情报系统中的应用 [J];中国信息导报; 2003年03期; 57-58
 中国优秀硕士学位论文全文数据库
 
1李晓; Web挖掘技术 [D];河海大学; 2001年
2蒲秋梅; 基于XML的Web数据挖掘技术的研究 [D];武汉大学; 2004年
3王永利; 关联规则挖掘算法及其在Web挖掘上应用的研究 [D];哈尔滨工程大学; 2003年
4孙丽; Web数据的挖掘方法研究 [D];大庆石油学院; 2004年
5李炳习; 圈和路径添加边后的直径问题 [D];大连理工大学; 2004年
6陈学进; Web结构挖掘研究 [D];合肥工业大学; 2006年
7张占英; 关于数据库汉语查询语句中查询信息的研究 [D];河南大学; 2004年
8王浩; 基于虚拟地景仿真中地物与地形融合算法的初探 [D];吉林大学; 2006年
9黄欢; 求解TSP问题的混合演化算法研究 [D];武汉理工大学; 2006年
10蒋科; 基于领域概念定制的主题爬虫系统的设计与实现 [D];西安电子科技大学; 2007年
 中国博士学位论文全文数据库
 
1郑逢斌; 关于计算机理解自然查询语言的研究 [D];西南交通大学; 2004年
2张友华; 面向智能服务的Web内容计算研究与应用 [D];中国科学技术大学; 2006年
3袁方; 面向智能信息检索的Web挖掘关键技术研究 [D];东北大学; 2006年
4刘理峰; 配网地理信息系统数据组织方法及在运行与规划中应用的研究 [D];重庆大学; 2001年
5姜忠鼎; 基于深度全景视频的虚拟场景绘制技术研究 [D];浙江大学; 2004年
6李强; 手部特征识别及特征级融合算法研究 [D];北京交通大学; 2006年
7许伦辉; 面向公路网络规划及智能运输系统交通分配理论与方法研究 [D];华南理工大学; 1999年
8李伟; 像素级图像融合方法及应用研究 [D];华南理工大学; 2006年
9李晖晖; 多传感器图像融合算法研究 [D];西北工业大学; 2006年
10叶学义; 基于虹膜和脸像的多生物特征身份识别及融合算法的研究 [D];中国科学技术大学; 2006年
 中国重要会议论文全文数据库
 
1丁瑾; 基于Web数据挖掘的综述 [A];山西省科学技术情报学会学术年会论文集 [C]; 2004年
2宋江春,沈钧毅; 基于CORBA的分布式Web挖掘系统的设计与实现 [A];2005年全国开放式分布与并行计算学术会议论文集 [C]; 2005年
3栾悉道,谢毓湘,文军,吴玲达; 基于知识库的主动式专题搜索引擎 [A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集 [C]; 2005年
4汪洋,张磊,章毅; 基于短语匹配的中文Web文档聚类算法 [A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集 [C]; 2005年
5方高林,于浩,孟遥,邹纲; 基于字分析单元的辅助阅读系统 [A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集 [C]; 2006年
6周香凝; 一种支持快速查询的敏感数据加密机制 [A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(下册) [C]; 2006年
7孙涛,张宏建,胡赤鹰; 基于模糊逻辑融合算法的气液两相流流型辨识方法 [A];中国仪器仪表学会第三届青年学术会议论文集(上) [C]; 2001年
8符强,萧泽新,陈乐庚; 基于小波分解的医学显微图像融合 [A];2006年国防光学及光电子学学术研讨会暨中国兵工学会光学专业委员会成立25周年年会论文集 [C]; 2006年
9杨志,毛士艺,陈炜; 基于多分辨率局部峰度熵的鲁棒图像融合算法 [A];中国航空学会信号与信息处理专业全国第八届学术会议论文集 [C]; 2004年
10张军,徐光佑,陶霖密; 支持多动因动作及其融合的生动人脸动画技术 [A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集 [C]; 2005年
 中国重要报纸全文数据库
 
1哈尔滨 姚巍; 组合灵活的查询条件设置及查询条件的重复使用 [N];软件报; 2004年
2许向前; 批量获取文件路径 [N];中国电脑教育报; 2003年
3杨屹立; 重叠路径的填充 [N];中国包装报; 2003年
4蓝风; 沿路径飘动的文字 [N];中国电脑教育报; 2004年
5河北 吴新年; 查看当前文档路径 [N];电脑报; 2002年
6特约作者 周鸣扬; 第十二讲 路径外观的维护 [N];软件报; 2004年
7胡涌; PHOTOSHOP6.0路径的应用技巧 [N];中国包装报; 2002年
8特约作者:周鸣扬; 第十讲 使用路径 [N];软件报; 2004年
9 路径变三维的奇妙玩法 [N];电脑报; 2004年
10装机工; 制作浪漫邮票 [N];中国计算机报; 2004年
关于知网 | CNKI导报 | 知识产权声明 | 联系我们 | 知网招商
京ICP证040431号 京ICP证040441号 互联网出版许可证新出网证(京)字008号
售卡热线:800-810-6613、010-62789720、010-62773682
售后服务:800-810-1436(限座机拨打) 010-62791813、010-62783978
招商热线: 010-62772106 投诉电话:010-62791994 2007 中国知网(cnki)