收藏本站
《小型微型计算机系统》 2005年05期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于核方法的Web挖掘研究

傅向华  冯博琴  马兆丰  韩冰  
【摘要】:基于词空间的分类方法很难处理文本的高维特性和捕获文本语义概念.利用核主成分分析和支持向量机,提出一种通过约简文本数据维数抽取语义概念、基于语义概念进行文本分类的新方法.首先将文档映射到高维线性特征空间消除非线性特征,然后在映射空间中通过主成分分析消除变量之间的相关性,实现降维和语义概念抽取,得到文档的语义概念空间,最后在语义概念空间中采用支持向量机进行分类.通过新定义的核函数,不必显式实现到语义概念空间的映射,可在原始文档向量空间中直接实现基于语义概念的分类.利用核化的GHA方法自适应迭代求解核矩阵的特征向量和特征值,适于求解大规模的文本分类问题.试验结果表明该方法对于改进文本分类的性能具有较好的效果.

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前2条
1 刘清;基于SVM的网络文本分类问题研究与应用[D];南昌大学;2007年
2 尚旭祥;基于关联的中文文本分类系统的设计与实现[D];解放军信息工程大学;2006年
【参考文献】
中国期刊全文数据库 前1条
1 宫秀军,史忠植;基于Bayes潜在语义模型的半监督Web挖掘[J];软件学报;2002年08期
【共引文献】
中国期刊全文数据库 前9条
1 刘壁松,李春平;一个可扩展的文本分类系统的设计与实现[J];计算机工程与应用;2004年30期
2 赵鹏;蔡庆生;;一种基于《知网》的中文文本聚类算法的研究[J];计算机工程与应用;2007年12期
3 宋枫溪,高林;文本分类器性能评估指标[J];计算机工程;2004年13期
4 宫秀军,刘少辉,史忠植;一种增量贝叶斯分类模型[J];计算机学报;2002年06期
5 陈涛,宋妍,谢阳群;基于IIG和LSI组合特征提取方法的文本聚类研究[J];情报学报;2005年02期
6 董德民;何钦铭;;面向电子商务的Web挖掘技术及其应用研究[J];计算机工程与设计;2006年01期
7 王小英,赵海,林涛,张文波,尹震宇;基于信任的普适计算服务选择模型[J];通信学报;2005年05期
8 傅向华,冯博琴,马兆丰,何明;可在线增量自学习的聚焦爬行方法[J];西安交通大学学报;2004年06期
9 赵鹏;耿焕同;蔡庆生;;一种基于语义和统计特征的中文文本特征表示方法[J];小型微型计算机系统;2007年07期
中国重要会议论文全文数据库 前1条
1 张东娜;彭宏;吴铁峰;;一种基于粗集与贝叶斯分类器的中文网页分类方法[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
中国博士学位论文全文数据库 前8条
1 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
2 王进;基于本体的语义信息检索研究[D];中国科学技术大学;2006年
3 李晓光;XML非完全结构查询处理中若干关键技术的研究[D];东北大学;2006年
4 赵鹏;复杂网络与互联网个性化信息服务的研究[D];中国科学技术大学;2006年
5 胡静;机器学习及其神经网络分类器优化设计[D];合肥工业大学;2007年
6 王晓嘉;旋转对称三角传感器智能信号处理系统研究[D];合肥工业大学;2007年
7 尚文倩;文本分类及其相关技术研究[D];北京交通大学;2007年
8 吴科;基于机器学习的文本分类研究[D];上海交通大学;2008年
中国硕士学位论文全文数据库 前10条
1 段晓峰;网站日志的数据挖掘[D];重庆大学;2003年
2 杨晓东;基于贝叶斯网络的配电网可靠性评估[D];华北电力大学(河北);2004年
3 赵银春;用户浏览内容分析与用户兴趣挖掘[D];重庆大学;2004年
4 祝翠玲;基于无监督聚类和朴素贝叶斯分类的文本分类方法研究[D];山东大学;2005年
5 刘壁松;策略可扩展的搜索引擎研究和实现[D];清华大学;2005年
6 芦立华;基于后缀树的中文文本聚类算法研究[D];上海海事大学;2005年
7 马晓峰;基于语义网络的病理诊断案例表示及不确定性研究[D];合肥工业大学;2006年
8 唐敏;垃圾邮件过滤技术研究[D];西华大学;2006年
9 孙雪;基于XML的Web实时信息挖掘[D];太原理工大学;2006年
10 钟配蓉;基于Web挖掘的文本预处理研究及应用[D];湖南大学;2006年
【同被引文献】
中国期刊全文数据库 前10条
1 冯刚,马光胜,杜振军;动态串扰优化的开关盒布线[J];半导体学报;2005年02期
2 王永利;徐宏炳;董逸生;钱江波;刘学军;;基于低阶近似的多维数据流相关性分析[J];电子学报;2006年02期
3 王昌林;张勇;李东生;;CMOS集成电路功耗分析及其优化方法[J];舰船电子工程;2006年03期
4 张雷;王习仁;喻文健;王泽毅;;工艺参数变动下的三维互连电容快速模式建库方法[J];计算机辅助设计与图形学学报;2006年12期
5 骆祖莹;;芯片功耗与工艺参数变化:下一代集成电路设计的两大挑战[J];计算机学报;2007年07期
6 钟涛,王豪才;CMOS集成电路的功耗优化和低功耗设计技术[J];微电子学;2000年02期
7 刘春燕,原巍,沈绪榜;逻辑级功耗估计方法的研究[J];微电子学与计算机;2005年08期
8 张俐,李晶皎,胡明涵,姚天顺;中文WordNet的研究及实现[J];东北大学学报(自然科学版);2003年04期
9 朱靖波,陈文亮;基于领域知识的文本分类[J];东北大学学报(自然科学版);2005年08期
10 吴雅娟,柳培林 ,丁子睿;基于统计分词的中文文本分类系统[J];电脑知识与技术;2005年11期
中国硕士学位论文全文数据库 前1条
1 陈波;中文WEB文档自动分类的研究与实现[D];武汉理工大学;2005年
【二级引证文献】
中国硕士学位论文全文数据库 前1条
1 宁登鹏;垂直搜索引擎中的多元化信息融合检索研究[D];浙江大学;2008年
【相似文献】
中国期刊全文数据库 前10条
1 张滨;;用语义概念简化知识库系统部件接口[J];计算机工程与科学;1986年02期
2 夏南;;谈谈使用CA关键词索引的选择法[J];晋图学刊;1986年01期
3 谢晓尧;面向对象的工程数据库的数据模型[J];贵州工业大学学报;1995年06期
4 周飞跃 ,宋兆陆;多媒体数据库中图片内容的恢复[J];多媒体世界;1995年10期
5 郭薇,陈军;基于流形拓扑的三维空间实体形式化描述[J];武汉测绘科技大学学报;1997年03期
6 ;介绍Jane Willis著《任务学习法概览》[J];外语教学与研究;1998年04期
7 陈力为,袁琦;跨世纪的中文信息处理基础研究和产品开发[J];信息系统工程;1998年12期
8 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
9 尹凌,张冬茉;多语种文本自动生成系统中句子规划部分知识表示模型的构造[J];计算机工程;2000年03期
10 汪启军,申瑞民;基于Web Mining的智能化、个性化的远程教育模型研究[J];计算机工程;2000年12期
中国重要会议论文全文数据库 前10条
1 刘军;马骏;;格值逻辑系统LP(X)的推理性质讨论[A];模糊集理论与应用——98年中国模糊数学与模糊系统委员会第九届年会论文选集[C];1998年
2 郝兆宽;;数理逻辑中的真概念[A];1994年逻辑研究专辑[C];1994年
3 袁正校;何向东;;关于真谓词的冗余论的若干问题[A];1998年逻辑研究专辑[C];1998年
4 孙思;;语义学真理概念评析[A];第一届、第二届东亚符号学国际会议论文集[C];1998年
5 张全;;WordNet与HNC的语义知识表示[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
6 柳长华;;基于知识元的中医古籍计算机知识表示方法[A];中国生物医学工程学会第六次会员代表大会暨学术会议论文摘要汇编[C];2004年
7 王萌;何婷婷;王晓荣;;基于hownet概念获取的中文自动文摘系统[A];第二届全国学生计算语言学研讨会论文集[C];2004年
8 钟福金;穆斌;;语义Web挖掘研究[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
9 易虹;许德刚;;Web数据挖掘的研究与应用[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
10 丁瑾;;基于Web数据挖掘的综述[A];山西省科学技术情报学会学术年会论文集[C];2004年
中国重要报纸全文数据库 前6条
1 涂序彦 陈泓娟;在网络信息海洋中淘金[N];计算机世界;2001年
2 张德政;信息挖掘商业智能之“芯”[N];中国计算机报;2002年
3 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
4 ;Web收获:吸纳有用信息[N];计算机世界;2004年
5 艾斐;文学:从时尚走向时代[N];人民日报;2005年
6 张明;脑血栓的诊治[N];农村医药报(汉);2006年
中国博士学位论文全文数据库 前10条
1 顾红芳;常识推理中非单调逻辑的研究[D];南京航空航天大学;2001年
2 邓爱林;电子商务推荐系统关键技术研究[D];复旦大学;2003年
3 阮备军;Web使用挖掘若干关键问题研究[D];复旦大学;2004年
4 孙建涛;Web挖掘中的降维和分类方法研究[D];清华大学;2005年
5 孙舒杨;统计关系学习的若干问题研究[D];吉林大学;2006年
6 袁方;面向智能信息检索的Web挖掘关键技术研究[D];东北大学;2006年
7 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
8 张静;视频信息检索研究[D];复旦大学;2006年
9 何丽;基于Web挖掘的决策支持系统模型研究[D];天津大学;2005年
10 易高翔;粗糙集在Web挖掘中的应用研究[D];华中科技大学;2006年
中国硕士学位论文全文数据库 前10条
1 李晓;Web挖掘技术[D];河海大学;2001年
2 邓英;数据仓库与数据挖掘技术理论及应用的研究[D];甘肃工业大学;2001年
3 聂亚可;序列挖掘及其在证券分析中的应用[D];重庆大学;2001年
4 钱小军;Web文本挖掘技术研究及其实现[D];浙江大学;2002年
5 门志勇;CRM系统及应用研究[D];首都经济贸易大学;2002年
6 陈耀光;Web数据查询研究[D];江西财经大学;2002年
7 程静;基于Agent和Web挖掘的个性化用户模型研究[D];西南师范大学;2002年
8 高晓琳;网络书签服务系统与Web挖掘技术应用[D];大连理工大学;2002年
9 苏大威;基于关联规则发现的Web挖掘[D];河海大学;2002年
10 唐飞龙;Internet信息获取技术的研究[D];合肥工业大学;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026