收藏本站
《计算机工程与应用》 2004年27期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于文字链接比的网页分类的研究

高波  张忠能  查志琴  
【摘要】:对于Web内容挖掘来说,对挖掘对象进行初步的识别是非常重要的,首先必须把含有具体内容的网页识别出来,才能进一步进行有效的分析。论文提出了链接比的概念,以此来分析网页的特征,然后进行有监督的学习,从而导出相关的规则,再用该规则对新的网页进行分类。

【相似文献】
中国期刊全文数据库 前10条
1 贺全荣;;轻松解锁网页 随意复制粘贴[J];电脑迷;2011年12期
2 阚文浩;;巧制网页 在淘宝购物中赚“回扣”[J];电脑爱好者;2011年11期
3 黄伟光;;网页木马及其防范[J];保密科学技术;2011年05期
4 阎皓的皓;;选择性屏蔽网页中的音乐[J];电脑迷;2011年18期
5 ;教你几招识别和防御Web网页木马好方法[J];计算机与网络;2010年Z1期
6 曹春华;;想让更多朋友加入你的群吗[J];电脑爱好者;2011年05期
7 ;全球等待[J];长三角;2010年Z1期
8 kikier;;随时随地 记录一切[J];电脑迷;2011年15期
9 毕超;;找回网页图片添加为QQ表情功能[J];电脑爱好者;2011年05期
10 郭成贺;;浏览界面非全屏 稍微调整显原形[J];电脑爱好者;2011年11期
中国重要会议论文全文数据库 前10条
1 维尼拉·木沙江;吐尔洪·吾司曼;;维、哈、柯文搜索引擎中网页爬行器的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
2 冯艳卉;洪宇;颜振祥;姚建民;朱巧明;;基于搜索引擎的双语混合网页识别新方法[A];第六届全国信息检索学术会议论文集[C];2010年
3 江志纲;丁增喜;刘洋;王大玲;鲍玉斌;于戈;;基于面向属性规约方法的网页和超链的分类[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
4 孔辉;梁洪亮;辛阳;杨义先;陈林顺;;一种高性能的网页篡改检测与恢复机制[A];2010年全国通信安全学术会议论文集[C];2010年
5 刘晖;赵萍;;新疆环境气象中心网站的总体规划及建设[A];信息技术在气象领域的开发应用论文集(一)[C];2005年
6 王玉龙;叶新铭;李秀华;;网页优化策略的模糊C均值(FCM)聚类算法研究(英文)[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
7 郑传新;谢筱惠;;基于网页技术的决策气象服务信息系统[A];2002年广西气象电子专业技术交流会论文集[C];2002年
8 吴建军;;谈网页设计的艺术性表现[A];经天纬地——全国测绘科技信息网中南分网第十九次学术交流会优秀论文选编[C];2005年
9 陈小飞;王轶彤;冯小军;;一种基于网页质量的PageRank算法改进[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
10 唐雅茜;朱海波;黎玲;;破解恶意网页十大招[A];2008年广西气象学会学术年会论文集[C];2008年
中国重要报纸全文数据库 前10条
1 范德生 邓亚玲;守住网页的秘密[N];电脑报;2005年
2 记者 李佳;一成政府网页被恶意“暗链”[N];长江日报;2010年
3 天津 李鸣;IE在保存网页时的Bug[N];电脑报;2002年
4 四川 张晋飞;网页中的“每日一帖”[N];电脑报;2002年
5 黄杰云;网页保存随心所欲[N];中国电脑教育报;2004年
6 ;弹指开启多个网页[N];大众科技报;2000年
7 湖北 费飞波;在网页加入分级代码[N];电脑报;2003年
8 吉林 六子;网页可以这样存[N];电脑报;2003年
9 湖北 崔新潮;网页不能正常显示的处理[N];电子报;2004年
10 TOSKY;轻松制作FAQ网页[N];中国电脑教育报;2004年
中国博士学位论文全文数据库 前10条
1 孙建涛;Web挖掘中的降维和分类方法研究[D];清华大学;2005年
2 荆涛;面向领域网页的语义标注若干问题研究[D];吉林大学;2011年
3 覃健诚;网络多层纵深防御体系的关键技术研究[D];北京邮电大学;2011年
4 朱征宇;Web资源组织与服务性能研究[D];重庆大学;2003年
5 吴瑞;模糊和粗糙环境下的网络用户浏览模式研究[D];天津大学;2006年
6 刘竟;面向概念检索的农史信息门户的设计与构建[D];南京农业大学;2008年
7 江开忠;上下文感知的Web搜索关键技术研究[D];华东师范大学;2008年
8 陈治平;智能搜索引擎理论与应用研究[D];湖南大学;2003年
9 李东方;Web 2.0环境下互联网信息过滤理论与方法研究[D];中国科学技术大学;2009年
10 黄九鸣;面向舆情分析和属性发现的网络文本挖掘技术研究[D];国防科学技术大学;2011年
中国硕士学位论文全文数据库 前10条
1 孙学刚;面向奥运的中文网页信息获取方法的初步研究[D];清华大学;2004年
2 张晓宇;农业网站中垃圾网页过滤方法的研究[D];新疆大学;2011年
3 韩培培;网页分类及存储查询系统的设计及实现[D];燕山大学;2010年
4 吕婷婷;统计和规则相结合的新闻网页分类系统的设计与实现[D];电子科技大学;2011年
5 伍菲;面向主题型的网页分类技术的研究与实现[D];华中科技大学;2011年
6 沈抖;万维网上数据处理方法的研究[D];清华大学;2004年
7 朱建建;非负矩阵分解及其在模糊网页分类中的应用[D];安徽大学;2012年
8 黄美宁;基于用户行为分析的网页分类系统的研究与实现[D];北京邮电大学;2011年
9 邱鹏;移动终端网页转换系统的设计与实现[D];大连理工大学;2012年
10 涂涛;嵌入式浏览器网页排版技术的研究与实现[D];华中科技大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026