收藏本站
《福建电脑》 2005年02期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于概念的文本自动分类研究的综述

徐建斌  施亚东  
【摘要】:随着网络信息的迅猛发展 ,特别是Internet上在线信息的增加 ,文本自动分类系统成为重要的研究方向。本文首先描述了基于统计 (主要是向量空间模型 )的分类方法的优点和不足 ,然后重点综述了基于概念的文本自动分类的几种方法和实现技术 ,最后 ,文章给出了今后的研究方向。

【引证文献】
中国期刊全文数据库 前2条
1 陈龙;范瑞霞;高琪;;基于概念的文本表示模型[J];计算机工程与应用;2008年20期
2 唐一之;;基于知网的领域概念抽取与关系分析研究[J];湘潭大学自然科学学报;2009年01期
中国博士学位论文全文数据库 前1条
1 唐一之;基于知识本体的网络消费行为理论与方法研究[D];北京交通大学;2009年
中国硕士学位论文全文数据库 前3条
1 李帅;基于语义相似度的查询扩展优化[D];杭州电子科技大学;2011年
2 周剑烽;基于语义本体的信息检索方法的研究[D];杭州电子科技大学;2010年
3 李运龙;基于概念的文本分类算法研究[D];华南理工大学;2010年
【共引文献】
中国期刊全文数据库 前10条
1 李龙澍;;PROLOG线性归结的研究与设计[J];安徽大学学报(自然科学版);1997年03期
2 时雷;虎晓红;席磊;段其国;;集成学习技术在农业中的应用[J];安徽农业科学;2008年26期
3 时雷;席磊;虎晓红;段其国;;基于支持向量机的农业数据分类研究[J];安徽农业科学;2009年05期
4 时雷;虎晓红;席磊;;基于Naive Bayes算法的大豆病害诊断研究[J];安徽农业科学;2009年11期
5 程玉胜,任广永;基于ROUGH集的决策树测试属性选择方法[J];安庆师范学院学报(自然科学版);2004年04期
6 程玉胜;Rosetta实验系统在机器学习中的应用[J];安庆师范学院学报(自然科学版);2005年02期
7 吴华;徐甜;;机器翻译中源语分析的研究与探讨[J];安阳工学院学报;2006年02期
8 刘晓志;黄厚宽;尚文倩;;带专业词库的特征选择[J];北京交通大学学报;2006年02期
9 金纯;浅谈计算机自然语言理解[J];浙江中医学院学报;2005年03期
10 孙健,王伟,钟义信;基于K-最近距离的自动文本分类的研究[J];北京邮电大学学报;2001年01期
中国重要会议论文全文数据库 前10条
1 侯松;周斌;贾焰;;分词结果的再搭配对文本分类效果的增强[A];全国计算机安全学术交流会论文集(第二十四卷)[C];2009年
2 朱艳辉;王平;周咏梅;;一种基于Agent的中文Web信息自动检索系统(英文)[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
3 梁飞;吕洪波;姚锦峰;;舆情分析中语料库降维[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
4 陈庆轩;郑德权;赵铁军;;多分类器融合的文本分类技术研究[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
5 高秀恒;钱红兵;;一种基于Agent增强的软件审查过程模型[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
6 任玉辉;张涛;柏庆岩;钱学明;张东平;王云川;;轧钢加热炉加热过程最优控制与智能系统的开发与应用[A];2005中国钢铁年会论文集(第4卷)[C];2005年
7 陶钧;朱学其;林文喜;;高炉配料自动控制方法研究[A];2008年全国炼铁生产技术会议暨炼铁年会文集(下册)[C];2008年
8 刘功申;李建华;李生红;;基于类信息的特征选择和加权方法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
9 邬郑;吕晓莉;晋耀红;;将HNC领域引入文本分类的尝试与探讨[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 张永;陈思睿;杨志勇;;一种改进的文本分类方法的研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 郑军红;基于知识工程的智能夹具设计系统构建研究[D];浙江大学;2010年
2 李炳龙;文档碎片取证关键技术研究[D];解放军信息工程大学;2007年
3 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
4 许有军;基于扩展规则的若干SAT问题研究[D];吉林大学;2011年
5 马丽娜;模糊推理方法及知识推理的计量化研究[D];陕西师范大学;2011年
6 胡明娣;逻辑度量空间的内蕴结构的研究[D];陕西师范大学;2011年
7 斯·劳格劳;现代蒙古语依存句法自动分析研究[D];内蒙古大学;2011年
8 缪鹍;公(铁)工程三维选线的群智能算法研究[D];中南大学;2011年
9 孙珂;大规模文档标签自动标注技术研究[D];哈尔滨工业大学;2011年
10 梁艳红;基于专利挖掘的创新设计关键技术研究[D];河北工业大学;2011年
中国硕士学位论文全文数据库 前10条
1 王丽敬;地理案例的空间相似性计算[D];山东科技大学;2010年
2 吕万里;中文文本分类技术研究[D];山东科技大学;2010年
3 陈晶;基于词片网格的语音文档主题分类[D];哈尔滨工程大学;2010年
4 桑媛媛;基于非负稀疏表示的文本分类算法研究[D];大连理工大学;2010年
5 朱谦成;基于CLIPS的注塑模具方案智能设计研究及程序实现[D];湘潭大学;2010年
6 熊超;基于潜在语义对偶空间的跨语言文本分类研究[D];江西师范大学;2010年
7 徐旭;基于决策树的Web应用系统个性化身份验证研究[D];合肥工业大学;2010年
8 孙海虹;基于模糊粗糙集的Web文本分类研究[D];哈尔滨理工大学;2010年
9 林良健;电网调度智能防误系统研究[D];华南理工大学;2010年
10 梁晔平;中文文本自动分类相关算法的研究与实现[D];华南理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
2 崔林,宋瀚涛,陆玉昌;基于语义相似性的资源协同过滤技术研究[J];北京理工大学学报;2005年05期
3 许云,樊孝忠,张锋;基于知网的语义相关度计算[J];北京理工大学学报;2005年05期
4 罗子明;消费者心理行为研究中的误差及消除[J];北京工商大学学报(社会科学版);2002年03期
5 彭军锋;顾客满意与顾客忠诚的一个规范解释[J];商业研究;2003年19期
6 李忠艳;电子商务中的消费心理浅析[J];商业研究;2004年11期
7 张俐,李晶皎,胡明涵,姚天顺;中文WordNet的研究及实现[J];东北大学学报;2003年04期
8 朱靖波,陈文亮;基于领域知识的文本分类[J];东北大学学报;2005年08期
9 吴满意,谢海蓉;论网络消费[J];电子科技大学学报(社会科学版);2000年03期
10 黄德根,朱和合,王昆仑,杨元生,钟万勰;基于最长次长匹配的汉语自动分词[J];大连理工大学学报;1999年06期
中国博士学位论文全文数据库 前3条
1 李广建;个性化网络信息检索系统的研究与实现[D];中国科学院研究生院(文献情报中心);2002年
2 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
3 刘平峰;基于知识网格的电子商务智能推荐理论方法研究[D];武汉理工大学;2006年
中国硕士学位论文全文数据库 前5条
1 柯青;网络消费者购买行为模式研究[D];华中师范大学;2004年
2 沈建良;基于本体论的个性化信息搜索系统研究[D];哈尔滨工程大学;2005年
3 陈建;领域本体的创建和应用研究[D];对外经济贸易大学;2006年
4 张功杰;基于本体的领域资源语义检索研究[D];暨南大学;2007年
5 高珊;信息检索中的查询扩展及相关技术研究[D];华中师范大学;2008年
【二级引证文献】
中国期刊全文数据库 前9条
1 张征杰;王自强;;文本分类及算法综述[J];电脑知识与技术;2012年04期
2 黄伟;刘海涛;;汉语语体的计量特征在文本聚类中的应用[J];计算机工程与应用;2009年29期
3 唐晓波;肖璐;;基于词汇同现的多用户兴趣本体构建研究[J];情报理论与实践;2012年05期
4 李艳霞;史一民;李冠宇;;基于概念格的K-Means算法研究[J];计算机工程与设计;2011年02期
5 王丹;黄映辉;李冠宇;;粗糙形式概念抽取的属性集合幂集方法[J];计算机工程与设计;2011年09期
6 郭丽红;王箭;;基于PCA的XML文档特征提取方法[J];计算机工程与设计;2011年11期
7 李海燕;李生红;张月国;;面向离散文本舆情分析的分聚类方案[J];信息安全与通信保密;2010年02期
8 贾文娟;何丰;;基于HowNet的中文本体学习方法研究[J];计算机技术与发展;2011年06期
9 申莹;徐东平;庞俊;;基于概念的中文博客情感极性聚类分析[J];计算机系统应用;2011年08期
中国硕士学位论文全文数据库 前10条
1 马朋云;本体公理推理及其在交通领域中的应用[D];大连交通大学;2010年
2 申莹;针对确定话题的离散文本舆情聚类与可视化研究[D];武汉理工大学;2011年
3 华炳;基于供应链系统信息共享的公共本体构建研究[D];南京大学;2011年
4 宁再早;两类仿生学算法在文本分类中的应用研究[D];安徽大学;2011年
5 郝阳;基于语义分析的产品评论挖掘技术研究[D];天津大学;2010年
6 邢敏玲;基于网页分块的主题爬虫方法研究[D];重庆大学;2011年
7 李阳;英文文本中命名实体识别及关系抽取技术研究[D];华东理工大学;2012年
8 贾洪强;面向海量短文本的舆情系统实现[D];北京邮电大学;2012年
9 段焕中;事务类搜索意图分类模型研究[D];北京邮电大学;2012年
10 来火尧;基于主题相关性的中文文本情感分类研究[D];上海交通大学;2009年
【相似文献】
中国期刊全文数据库 前10条
1 杨丽华;戴齐;郭艳军;;KNN文本分类算法研究[J];微计算机信息;2006年21期
2 周文霞;;现代文本分类技术研究[J];武警学院学报;2007年12期
3 赵博;丁华福;;一种基于关键向量的文本分类模型[J];信息技术;2007年12期
4 马甲林;张桂珠;刘金岭;;中英文文本分类系统异同因素的探讨[J];电脑学习;2011年02期
5 张冬慧;孙波;徐照财;程显毅;;文本自动分类关键技术研究[J];微计算机信息;2008年06期
6 拓守恒;;基于改进PSO的SVM文本分类研究[J];电脑开发与应用;2010年10期
7 朱红斌;蔡郁;;基于主动学习支持向量机的文本分类[J];计算机工程与应用;2009年02期
8 张浩;汪楠;;文本分类技术研究进展[J];科技信息(科学教研);2007年23期
9 张永奎;李红娟;;基于类别关键词的突发事件新闻文本分类方法[J];计算机应用;2008年S1期
10 张冰波;;改进类中心分类算法在文本分类中的应用[J];大众科技;2010年10期
中国重要会议论文全文数据库 前10条
1 杜长海;吉根林;;模糊聚类的最大树法在文本分类中的应用研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
2 陈克利;宗成庆;王霞;;基于大规模真实文本的平衡语料分析与文本分类方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 刘秉权;李博;孙林;王宝勋;刘远超;;标签特征和正文特征融合的SVM博客文本分类算法研究[A];第六届全国信息检索学术会议论文集[C];2010年
4 王小华;陆蓓;张国煊;;文本自动分类的模糊方法[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
5 庞剑锋;程学旗;;反馈方法在文本分类系统中的应用[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
6 王慧玲;宋柔;戴伟长;;汉语文本按语体分类的研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
7 海丽且木·艾沙;维尼拉·木沙江;;Web文本分类及其维、哈、柯多文种信息检索中的应用研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
8 商炳章;白清源;;基于特征项权重改进的关联文本分类[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
9 胡俊;黄厚宽;;一种基于SVM的可视化文本分类的方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
10 朱慕华;陈文亮;朱靖波;;词聚类在文本分类中的应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国重要报纸全文数据库 前7条
1 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
2 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;寻“宝”有术[N];计算机世界;2003年
3 高利华;传承陆游风骨 推进国际交流[N];人民日报海外版;2005年
4 林木树;反垃圾邮件有待新突破[N];人民邮电;2004年
5 希安;微软试水信息检索[N];经济日报;2004年
6 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
7 应晓敏 窦文华;技术架构[N];计算机世界;2003年
中国博士学位论文全文数据库 前10条
1 李智星;用于文本分类的简明语义分析技术研究[D];重庆大学;2011年
2 章舜仲;文本分类中词共现关系的研究及其应用[D];南京理工大学;2010年
3 孟佳娜;迁移学习在文本分类中的应用研究[D];大连理工大学;2011年
4 冯国忠;文本分类中的贝叶斯特征选择[D];东北师范大学;2011年
5 刘伍颖;面向垃圾信息过滤的主动多域学习文本分类方法研究[D];国防科学技术大学;2011年
6 王博;文本分类中特征选择技术的研究[D];国防科学技术大学;2009年
7 杜卫锋;粗糙集理论在中文文本分类中的应用[D];西南交通大学;2006年
8 郝立柱;汉语文本自动分类[D];吉林大学;2008年
9 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年
10 孙道军;文本挖掘预处理相关基础技术分析与应用研究[D];北京邮电大学;2008年
中国硕士学位论文全文数据库 前10条
1 张保富;基于粗糙集的中文文本分类算法研究及应用[D];江苏大学;2010年
2 张彪;文本分类中特征选择算法的分析与研究[D];中国科学技术大学;2010年
3 黄海英;基于概念空间的文本分类的应用研究[D];广西师范大学;2002年
4 蒋健;文本分类中特征提取和特征加权方法研究[D];重庆大学;2010年
5 闫晨;KNN文本分类研究[D];燕山大学;2010年
6 郭妍;基于市长公开电话文本为背景的两种自动分类算法的比较[D];东北师范大学;2006年
7 张桂喜;基于语义的领域相关文本分类研究[D];北京工业大学;2011年
8 都云琪;中文文本自动分类的研究与实现[D];西安电子科技大学;2002年
9 褚金正;面向特定领域的文本识别和分类[D];湖南大学;2005年
10 张玉杰;基于偏斜数据集的中文文本分类问题的改进特征权重算法研究[D];东北师范大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026