收藏本站
《软件学报》 2001年09期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

用Naive Bayes方法协调分类Web网页

范焱  郑诚  王清毅  蔡庆生  刘洁  
【摘要】:WWW上的信息极大丰富 ,如何从巨量的信息中有效地发现有用的信息 ,是亟待解决的问题 ,而 Web网页的正确分类正是其中的核心问题 .针对超文本结构中的结构特征 ,提出了用 Naive Bayes方法协调分别利用超文本页面中的文本信息和结构信息进行分类的方法 .经实验验证 ,与只用单种方法对超文本进行分类的方法相比 ,综合分类法有效地提高了分类的正确率 .

【引证文献】
中国期刊全文数据库 前10条
1 邵浩然,张亮,马范援;基于损失最小化的SVM多类网页分类算法[J];计算机应用与软件;2005年07期
2 张玉芳;彭时名;吕佳;;基于文本分类TFIDF方法的改进与应用[J];计算机工程;2006年19期
3 贾泂,梁久祯;基于支持向量机的中文网页自动分类[J];计算机工程;2005年10期
4 许勇,宋柔;基于HMM的百科辞典文本中句子的知识点分类[J];计算机工程与应用;2005年04期
5 王丽侠,房福亭;分级聚类与平面划分结合方法在网页分类中的应用[J];计算机工程与应用;2004年35期
6 梁春燕,郭力,夏诏杰,杨章远;网络搜索引擎的性能优化策略和相关技术[J];计算机工程与应用;2004年36期
7 刘壁松,李春平;一个可扩展的文本分类系统的设计与实现[J];计算机工程与应用;2004年30期
8 袁家政;须德;鲍泓;;基于结构与文本关键词相关度的XML网页分类研究[J];计算机研究与发展;2006年08期
9 张茂元;邹春燕;卢正鼎;;一种基于变调整学习规则的模糊网页分类方法研究[J];计算机研究与发展;2007年01期
10 陈治平,林亚平,彭雅,王雷,童调生;基于最小类差异的无关信息预处理算法[J];电子学报;2003年11期
中国重要会议论文全文数据库 前2条
1 许勇;宋柔;;基于HMM的百科辞典文本中知识点划分方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
2 张健沛;李连江;杨静;;个性化搜索引擎排序算法的研究与改进[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前3条
1 朱征宇;Web资源组织与服务性能研究[D];重庆大学;2003年
2 周瑛;神经网络作为分类器的算法研究及在信息检索中的应用[D];安徽大学;2006年
3 袁家政;可伸缩矢量图形(SVG)的数据表示研究[D];北京交通大学;2008年
中国硕士学位论文全文数据库 前10条
1 曹渝昆;基于RDF的个性化服务模型[D];重庆大学;2002年
2 任函;大规模中文网页的自动分类研究[D];华中师范大学;2006年
3 刘军;网页采集、净化与分类[D];浙江工商大学;2006年
4 王飞;Web挖掘中超文本分类的研究与实现[D];西北工业大学;2006年
5 祝翠玲;基于无监督聚类和朴素贝叶斯分类的文本分类方法研究[D];山东大学;2005年
6 侯小静;贝叶斯分类器研究及其在Web文档分类中的应用[D];郑州大学;2005年
7 张海龙;Web挖掘技术在东亚植物遗传资源管理系统中的应用研究[D];中国农业大学;2005年
8 李建祥;智能网页推荐系统的相关技术研究[D];西南交通大学;2004年
9 蒋伟贞;基于类别的特征选择算法的文本分类系统[D];西南交通大学;2004年
10 彭雅;文本分类算法及其应用研究[D];湖南大学;2004年
【共引文献】
中国期刊全文数据库 前10条
1 冀俊忠,沙志强,刘椿年,郎青;B2C电子商务站点中知识发现的研究[J];北京工业大学学报;2003年02期
2 何兴无;;用户兴趣实例模型与K_means算法的改进[J];重庆师范大学学报(自然科学版);2006年02期
3 应晓敏,刘明,窦文华;一种面向个性化服务的无需反例集的用户建模方法[J];国防科技大学学报;2002年03期
4 牛伟霞,张永奎;潜在语义索引方法在信息过滤中的应用[J];计算机工程与应用;2001年09期
5 赵银春,付关友,朱征宇;基于Web浏览内容和行为相结合的用户兴趣挖掘[J];计算机工程;2005年12期
6 黄希全;;数字图书馆推荐系统中用户偏好的建模方法[J];情报杂志;2006年01期
7 卢增祥,路海明,李衍达;网络信息过滤中的固定文章集表达方法[J];清华大学学报(自然科学版);1999年09期
8 张瑜;袁方;;基于用户兴趣的个性化信息检索方法[J];山东大学学报(理学版);2006年03期
9 刘艳青,田萱,苏桂莲;基于Internet的个性化信息检索技术的研究[J];计算机工程与设计;2004年05期
10 张永奎;基于分类模板的用户模型构造方法[J];山西大学学报(自然科学版);2002年02期
中国博士学位论文全文数据库 前10条
1 李四明;基于智能Agent的网上农业信息挖掘研究[D];中国农业大学;2003年
2 应晓敏;面向Internet个性化服务的用户建模技术研究[D];中国人民解放军国防科学技术大学;2003年
3 张程;面向服务环境中服务的个性化推荐[D];中国科学院研究生院(计算技术研究所);2006年
4 李艳燕;基于语义的学习资源管理及利用[D];中国科学院研究生院(计算技术研究所);2005年
5 张磊;个性化信息分发及概念检索的研究[D];中国科学院研究生院(计算技术研究所);2002年
6 赵鹏;复杂网络与互联网个性化信息服务的研究[D];中国科学技术大学;2006年
7 王宏宇;商务推荐系统的设计研究[D];中国科学技术大学;2007年
8 雷震;基于事件的新闻报道分析技术研究[D];国防科学技术大学;2006年
9 刘炜;智能元搜索引擎中个性化模式库的研究[D];太原理工大学;2007年
10 刘康苗;自适应网络信息获取服务技术研究[D];浙江大学;2008年
中国硕士学位论文全文数据库 前10条
1 马献明;个性化agent技术研究与系统实现[D];广西师范大学;2000年
2 杜民;应用神经网络的Internet智能代理的实现[D];暨南大学;2001年
3 段练军;数据挖掘在WWW上的实现技术[D];郑州大学;2001年
4 李勇;智能检索中基于本体的个性化用户建模技术及应用[D];国防科学技术大学;2002年
5 高雷;网络智能过滤系统的设计与实现[D];广东工业大学;2003年
6 田萱;基于Internet的信息检索若干问题的研究[D];山东师范大学;2003年
7 张继东;基于Web目志数据挖掘的Web缓存策略[D];太原理工大学;2003年
8 盛秋艳;基于Agent的个性化信息检索技术的研究[D];哈尔滨工程大学;2003年
9 史豪斌;基于Web数据挖掘的信息智能过滤技术研究[D];西北工业大学;2004年
10 禤毅良;电子商务智能推荐系统研究[D];广东工业大学;2004年
【同被引文献】
中国期刊全文数据库 前10条
1 秦拯;张玲;李娜;;改进的PageRank在Web信息搜集中的应用[J];计算机研究与发展;2006年06期
2 龚静;李英杰;;文本聚类算法的分析与比较[J];湖南环境生物职业技术学院学报;2006年03期
3 田力威,尹朝万;虚拟企业专业搜索引擎中个性化用户系统设计与实现[J];小型微型计算机系统;2004年06期
4 涂承胜,陆玉昌;Web使用挖掘技术研究[J];小型微型计算机系统;2004年07期
5 张宏斌,朱明富,陈德军;智能化搜索引擎技术的研究进展[J];信息与控制;2003年06期
6 张琨,徐永红,王珩,刘凤玉;用于入侵检测的贝叶斯网络[J];小型微型计算机系统;2003年05期
7 魏应彬,黄健青,周星;PHP技术及其应用[J];计算机与现代化;2000年05期
8 陈新中,李岩,谢永红,杨炳儒;Web挖掘研究[J];计算机工程与应用;2002年13期
9 谭琼,史忠植;分词中的歧义处理[J];计算机工程与应用;2002年11期
10 邓汉成,王敏芳,王瑛;查全率与查准率之间关系的理论研究[J];情报学报;2000年04期
中国重要会议论文全文数据库 前3条
1 孙丽华;王洪俊;肖诗斌;施水才;;规则分类在文本自动分类中的应用[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
2 李正学;吴微;;引入技术指标的BP网络在沪市综合指数涨跌预测中的应用[A];Data Analysis, Econo-physics and Risk Management--Proceedings of CCAST (World Laboratory) Workshop[C];2001年
3 万中英;王明文;廖海波;左家莉;;维数约简在网页分类中的应用[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 吴涛;构造性知识发现方法研究[D];安徽大学;2003年
2 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年
3 陈定权;自动主题搜索的应用研究[D];中国科学院研究生院(文献情报中心);2003年
4 杨旭华;神经网络及其在控制中的应用研究[D];浙江大学;2004年
5 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
6 刘永丹;文档数据库若干关键技术研究[D];复旦大学;2004年
7 薛德军;中文文本自动分类中的关键问题研究[D];清华大学;2004年
8 邵郅邛;连续感知器学习算法的有限收敛性及连续距离转换神经网络[D];大连理工大学;2005年
9 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
10 张持健;商空间下模糊系统与模糊控制的问题求解[D];安徽大学;2005年
中国硕士学位论文全文数据库 前10条
1 王圆;文本内容过滤的关键技术研究[D];东北师范大学;2006年
2 贾美娟;基于互联网的不良信息过滤技术的设计与实现[D];哈尔滨工程大学;2006年
3 张旭;一个基于词典与统计的中文分词算法[D];电子科技大学;2007年
4 刘兴宇;基于倒排索引的全文检索技术研究[D];华中科技大学;2004年
5 高清霞;中文智能搜索引擎的设计与实现[D];北京工业大学;2000年
6 孙及园;对Web网页的信息提取技术的研究[D];福州大学;2001年
7 易靖;基于信息粒度原理的文本分类方法的研究[D];北京工业大学;2001年
8 都云琪;中文文本自动分类的研究与实现[D];西安电子科技大学;2002年
9 孙丽华;中文文本自动分类的研究[D];哈尔滨工程大学;2002年
10 陈本庆;遗传算法研究及其在排课问题中的应用[D];西南交通大学;2003年
【二级引证文献】
中国期刊全文数据库 前10条
1 唐培丽;解飞;陈志雨;;基于概念检索的中文搜索引擎研究[J];长春大学学报;2006年04期
2 江祥奎,原思聪;中文网页分类中的网页特征提取方法[J];电脑开发与应用;2005年10期
3 刘晓庆;;浅析数据挖掘的研究现状及其应用[J];电脑知识与技术;2006年26期
4 王一蕾;吴英杰;;基于数据量的文本分词算法选取的研究[J];福建电脑;2006年09期
5 刘梦燕;;搜索引擎分类体系及其性能优化初探[J];高校图书馆工作;2006年02期
6 韩芳,李建平,杨永琴,陈锋;自由环境下网络数据采集与分析[J];后勤工程学院学报;2004年02期
7 周宽久;王艳萍;李瑶;;Web用户聚类算法[J];计算机工程与应用;2006年16期
8 张茂元;邹春燕;卢正鼎;;一种基于语义匹配的Web信息提取方法研究[J];计算机工程与应用;2006年23期
9 赵世奇,张宇,刘挺,陈毅恒,黄永光,李生;基于类别特征域的文本分类特征选择方法[J];中文信息学报;2005年06期
10 廖莎莎;江铭虎;;中文文本分类中基于概念屏蔽层的特征提取方法[J];中文信息学报;2006年03期
中国重要会议论文全文数据库 前4条
1 董学春;胡学钢;谢飞;吴共庆;;基于词向量空间模型的文本分类方法[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
2 张迪;郑德权;赵铁军;于浩;;Blog网页分类与识别技术研究[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
3 Geng Zengmin~(1,2) Liu Wanchun~1 Zhu Yuwen~1 Yang Jing~2 (1 Computer Department of Beijing Institute of Technology,Beijing,100081,China) (2 China Institute of Atomic Energy,Beijing,102413,China);Applications of Data Mining Technology at Ionization Radiation Metrology[A];Proceedings of 6th International Symposium on Test and Measurement(Volume 1)[C];2005年
4 倪茂树;林鸿飞;;基于词共现概念的文本分类研究[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 王秀娟;文本检索中若干问题研究[D];北京邮电大学;2006年
2 王宏;基于粗糙集数据挖掘技术的客户价值分析[D];哈尔滨工程大学;2006年
3 曲吉林;时间序列挖掘中索引与查询技术的研究[D];天津大学;2006年
4 储节旺;企业应对危机的知识管理问题研究:能力、体系、机制与技术[D];南昌大学;2006年
5 郑洪英;基于进化算法的入侵检测技术研究[D];重庆大学;2007年
6 李力;物流信息平台构建与应用研究[D];武汉理工大学;2006年
7 杨为民;基于场论的信息检索模型的研究[D];安徽大学;2007年
8 宗校军;中文网页定题采集及分类研究[D];华中科技大学;2006年
9 钱铁云;关联文本分类关键技术研究[D];华中科技大学;2006年
10 易明;基于Web挖掘的电子商务个性化推荐机理与方法研究[D];华中科技大学;2006年
中国硕士学位论文全文数据库 前10条
1 邓小艳;基于Blog与RSS技术的网络教学系统研究[D];中南大学;2007年
2 花建立;基于粗集理论的股价走势预测[D];西南交通大学;2005年
3 汤赛丽;常识知识问答系统中知识库构建的研究与设计[D];河南大学;2005年
4 蔡敏;网络个性化信息服务系统设计与实现[D];武汉大学;2004年
5 彭雅;文本分类算法及其应用研究[D];湖南大学;2004年
6 栾江;数据质量控制:数据预处理研究、设计与实现[D];四川大学;2004年
7 马安香;基于分类语义的Web信息抽取机制的研究与实现[D];东北大学;2005年
8 蒋萍;基于用户兴趣挖掘的个性化模型研究与设计[D];苏州大学;2005年
9 杨翔宇;SVM在Web文本挖掘中的应用与研究[D];哈尔滨工程大学;2005年
10 郑秀萍;基于信息理论盲源分离算法的研究[D];太原理工大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 范毅君;马永威;;浅谈门户网站的设计与在油田中的应用[J];中国石油和化工标准与质量;2011年07期
2 杜婷;陶克斌;夏勤;;基于Web的无刷新即时通讯设计与实现[J];重庆科技学院学报(自然科学版);2011年04期
3 张爱军;;电子商务技术的创新发展趋势[J];电脑知识与技术;2011年26期
4 钟寿福;吴伟信;;中学研究性学习网络支撑平台的设计与实现[J];福建电脑;2011年07期
5 陈雅茹;;web服务技术在电子商务中的应用研究[J];科技致富向导;2011年24期
6 康长安;陈玉红;;基于前端的Web性能优化[J];电脑知识与技术;2011年16期
7 杨亮涛;;基于Web的计算机实训课程管理系统设计[J];实验室研究与探索;2011年06期
8 夏大文;;Web系统开发模型及其环境的分析与应用[J];现代计算机;2011年07期
9 农罗锋;李法运;;Wap和Web相结合构建西部乡镇电子政务系统[J];农业网络信息;2011年08期
10 高翔;龙苇;王敏;;基于快速自适应聚类算法的网络异常检测方法[J];西北工业大学学报;2011年03期
中国重要会议论文全文数据库 前10条
1 李利波;刘明利;;一种改进的无回溯反向Web服务动态组合方法[A];2011年全国通信安全学术会议论文集[C];2011年
2 游争光;刘建勋;唐明董;;分布式Web服务测试系统的设计与实现[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
3 ;基于广义对话的Web用户的聚类(英文)[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
4 胡建强;周斌;尹刚;邹鹏;;基于角色的Web服务访问控制技术研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
5 黄建波;丁扬;方芳;;基于代理服务器的Web加速的实现[A];2010通信理论与技术新发展——第十五届全国青年通信学术会议论文集(上册)[C];2010年
6 陶冶;刘建勋;唐明董;;基于Map/Reduce的分布式Web服务搜索引擎设计与实现[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
7 黄胜;彭敦陆;王晓玲;周傲英;;基于与或树搜索的快速Web服务组合方法[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
8 刘绍波;胡盈;郑涵;乐嘉锦;;Web站点链接结构的动态调整模型研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
9 胡建强;郭长国;贾焰;邹鹏;;一种可扩展的分布式Web服务发现架构[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
10 刘建伟;于守健;乐嘉锦;;基于Web服务资源框架的流数据查询处理系统[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
中国重要报纸全文数据库 前10条
1 本报记者 毛江华;安启华联手赛门铁克 掘金Web安全[N];计算机世界;2009年
2 赵晓涛;Web安全市场经历“蝴蝶效应”[N];网络世界;2009年
3 边歆;动态阻断Web2.0威胁[N];网络世界;2009年
4 赵晓涛;Web2.0攻击滚滚袭来[N];网络世界;2009年
5 Anchiva中国区总经理 李松;Web安全选型三个标准[N];网络世界;2008年
6 本报记者 赵晓涛;真实的较量Web安全之三路搏杀[N];网络世界;2009年
7 瓦力 编译;Web架构配置无小事[N];计算机世界;2009年
8 本报记者 赵晓涛;Web安全迈入2.0新时代[N];网络世界;2009年
9 本报记者 边歆;6步实现Web应用的整体安全[N];网络世界;2009年
10 ;网络世界2009年度Web安全创新产品奖[N];网络世界;2009年
中国博士学位论文全文数据库 前10条
1 张建武;面向Web应用的安全评测技术研究[D];北京邮电大学;2012年
2 李常宝;基于索引的web服务发现研究[D];北京邮电大学;2011年
3 魏登萍;语义Web服务发现中匹配策略的研究与实现[D];国防科学技术大学;2011年
4 马建斌;中文Web信息作者同一认定技术研究[D];河北农业大学;2010年
5 陈世展;服务网络:基于语义和社会化关系的Web服务计算基础设施[D];天津大学;2010年
6 胡佳;语义Web服务自动组合及验证的研究[D];天津大学;2010年
7 王辉;面向互联网的Web服务基础设施构建和应用[D];天津大学;2010年
8 刘铁江;组合Web服务选择、部署与执行的关键技术研究[D];复旦大学;2011年
9 宋波;Web应用交互的建模和测试用例生成[D];上海大学;2010年
10 王泽来;基于Web服务集成的物流应急关键技术研究[D];天津大学;2012年
中国硕士学位论文全文数据库 前10条
1 唐黎;Deep Web页面结构分析与核心内容提取研究[D];重庆大学;2011年
2 吴新勇;基于需求群组的Web服务调度模型研究[D];上海交通大学;2011年
3 徐卫;Web新闻热点发现系统的设计与实现[D];华中科技大学;2011年
4 姜本臣;基于嵌入式Web服务器应用技术的研究[D];沈阳工业大学;2012年
5 温梨梨;基于零拷贝的Web服务器技术研究[D];中国海洋大学;2011年
6 焦燕廷;一种基于领域本体的语义Web服务匹配和组合方法[D];山东科技大学;2011年
7 黄亮;Web漏洞扫描系统中的智能爬虫技术研究[D];杭州电子科技大学;2012年
8 赵春娟;Web服务组合方法的研究与实现[D];天津理工大学;2011年
9 张囡;基于概念的语义Web服务匹配算法的研究及其在配送中心系统的应用[D];华南理工大学;2010年
10 张敏;面向Web应用的测试适配技术研究[D];山东师范大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026