收藏本站
《计算机工程与应用》 2002年06期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一个基于概念的中文文本分类模型

苏伟峰  李绍滋  李堂秋  
【摘要】:文章提出一个电子文档的自动分类的模型:基于《知网》之上,经过对文档的关键词的抽取和排歧,进而得到关键词的概念,再对关键词的概念进行综合而得到该文本所属的类别,实验证明该模型有较好的效果。

【引证文献】
中国期刊全文数据库 前10条
1 吴志峰,田学东;人名、机构名在基于概念的文本分类中的应用研究[J];河北大学学报(自然科学版);2004年06期
2 钟茂生;WEB页面的模糊聚类[J];华东交通大学学报;2004年05期
3 李卫;刘建毅;何华灿;王枞;;基于主题的智能Web信息采集系统的研究与实现[J];计算机应用研究;2006年02期
4 高洁,吉根林;文本分类技术研究[J];计算机应用研究;2004年07期
5 王朝静,郑庆华;面向答疑文本的词类标注方法的研究与实现[J];计算机工程与应用;2004年16期
6 王梦云,王素格;一个基于字特征的文本分类模型[J];计算机工程与应用;2004年13期
7 廖莎莎;江铭虎;;中文文本分类中基于概念屏蔽层的特征提取方法[J];中文信息学报;2006年03期
8 吴志峰,田学东;基于概念的文本分类中的人名、地名处理研究[J];微机发展;2005年03期
9 李彦平,张佳骥;文本聚类中的降维技术研究[J];无线电工程;2005年06期
10 曹二堂,刘玉林;基于语义理解的智能搜索引擎的研究[J];情报杂志;2005年06期
中国重要会议论文全文数据库 前1条
1 苏伟峰;李绍滋;李堂秋;尤文建;;可分义原向量空间中的跨语种文本过滤模型[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国博士学位论文全文数据库 前4条
1 王永恒;海量短语信息挖掘技术的研究与实现[D];国防科学技术大学;2006年
2 柏宏权;适应性教学系统中个性化教学策略研究[D];南京师范大学;2006年
3 周瑛;神经网络作为分类器的算法研究及在信息检索中的应用[D];安徽大学;2006年
4 张榕;术语定义抽取、聚类与术语识别研究[D];北京语言大学;2006年
中国硕士学位论文全文数据库 前10条
1 高洁;增量式中文文本分类算法研究与实现[D];南京师范大学;2004年
2 马建斌;基于SVM的中文电子邮件作者身份挖掘技术研究[D];河北农业大学;2004年
3 吴志峰;基于概念特征的中文文本分类研究[D];河北大学;2005年
4 张海燕;基于分词的中文文本自动分类研究与实现[D];湖南大学;2002年
5 苏伟峰;基于概念的文本自动分类研究[D];厦门大学;2002年
6 于洪杰;垃圾邮件过滤技术算法研究[D];大连海事大学;2007年
7 仲婷;基于文本处理技术的中文电子邮件分类系统的设计与实现[D];南京航空航天大学;2007年
8 邓琨;基于Rough集的Web文本分类及其信息抽取研究[D];南昌大学;2007年
9 周新栋;中文文本分类的文档索引机制及分类模型的研究[D];国防科学技术大学;2004年
10 凌菁;基于数据挖掘的中文垃圾邮件过滤方法研究与实现[D];广东工业大学;2005年
【参考文献】
中国期刊全文数据库 前2条
1 李蕾,钟义信,郭祥昊;全信息理论在自动文摘系统中的应用[J];计算机工程与应用;2000年01期
2 曹素丽,曾伏虎,曹焕光;基于汉字字频向量的中文文本自动分类系统[J];山西大学学报(自然科学版);1999年02期
【共引文献】
中国期刊全文数据库 前8条
1 潘景昌,许中卫;结合同义词的Web搜索匹配算法初探[J];安徽大学学报(自然科学版);2003年03期
2 郭庆琳,樊孝忠,柳长安;基于文本聚类和NLU的自动文摘研究[J];北京理工大学学报;2005年08期
3 黄丽琼;何中市;;基于统计语义和结构特征的自动文摘[J];广西师范大学学报(自然科学版);2006年04期
4 李莼,罗振声,厉宇航;基于语义相关和概念相关的自动分类方法研究[J];计算机工程与应用;2003年12期
5 郭庆琳,樊孝忠,柳长安;文本聚类在自动文摘中的应用研究[J];计算机应用;2005年05期
6 刘华;;基于关键短语的文本分类研究[J];中文信息学报;2007年04期
7 张海燕,陈治平,童调生;基于2-grams短语标引的关键词自动抽取[J];绍兴文理学院学报;2002年09期
8 郭庆琳,樊孝忠;基于文本聚类和NLU的自动文摘系统的研究与实现[J];现代电力;2004年04期
中国重要会议论文全文数据库 前1条
1 周雪忠;方青;吴朝晖;;中文文本分类特征表示及分类方法比较研究[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
中国博士学位论文全文数据库 前3条
1 王兰成;基于XMARC信息描述的知识标引与概念检索研究[D];东华大学;2004年
2 周雪忠;文本挖掘在中医药中的若干应用研究[D];浙江大学;2004年
3 刘华;基于关键短语的文本内容标引研究[D];北京语言大学;2005年
中国硕士学位论文全文数据库 前10条
1 杜民;应用神经网络的Internet智能代理的实现[D];暨南大学;2001年
2 王崑崙;中文网页自动分类的一种实现[D];大连理工大学;2002年
3 张海燕;基于分词的中文文本自动分类研究与实现[D];湖南大学;2002年
4 姚松源;文本自动分类系统的研究与实现[D];北京工业大学;2003年
5 王明燕;基于WEB页面的关键词与关键概念提取技术[D];北京工业大学;2003年
6 吴福英;面向用户的信息过滤研究与实现[D];江西师范大学;2004年
7 林丽;数字图书馆数据挖掘研究[D];武汉大学;2004年
8 王术;面向个性化服务的网页特征描述方法研究[D];重庆大学;2004年
9 马慧敏;中文文本自动分类方法的研究和实现[D];华北电力大学(河北);2005年
10 周新栋;中文文本分类的文档索引机制及分类模型的研究[D];国防科学技术大学;2004年
【同被引文献】
中国期刊全文数据库 前10条
1 赵华;赵铁军;张姝;王浩畅;;基于内容分析的话题检测研究[J];哈尔滨工业大学学报;2006年10期
2 张锋,樊孝忠,许云;基于遗传算法的文本聚类特征选择[J];华南理工大学学报(自然科学版);2004年S1期
3 刘涛,吴功宜,陈正;一种高效的用于文本聚类的无监督特征选择算法[J];计算机研究与发展;2005年03期
4 何蕾;Web信息资源整合系统的技术研究及实现[J];计算机工程与应用;2004年02期
5 邹嘉麟,陈家训;Web信息资源整合系统模型和方法[J];计算机工程;2004年12期
6 郑家恒,卢娇丽;关键词抽取方法的研究[J];计算机工程;2005年18期
7 王宁,王延章,叶鑫,裘江南;一种基于数据中心的政府信息资源整合系统架构设计[J];计算机应用研究;2005年09期
8 骆卫华;于满泉;许洪波;王斌;程学旗;;基于多策略优化的分治多层聚类算法的话题发现研究[J];中文信息学报;2006年01期
9 索红光;刘玉树;曹淑英;;一种基于词汇链的关键词抽取方法[J];中文信息学报;2006年06期
10 韩客松,王永成;一种用于主题提取的非线性加权方法[J];情报学报;2000年06期
中国博士学位论文全文数据库 前10条
1 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
2 蒋刚;核机器学习方法若干问题研究[D];西南交通大学;2006年
3 何清;机器学习与文本挖掘若干算法研究[D];中国科学院研究生院(计算技术研究所);2002年
4 罗瑜;支持向量机在机器学习中的应用研究[D];西南交通大学;2007年
5 肖明;WWW科技信息资源自动标引的理论与实践研究[D];中国科学院文献情报中心;2001年
6 吴涛;构造性知识发现方法研究[D];安徽大学;2003年
7 李芸;信息科学和信息技术术语概念体系研究[D];北京语言文化大学;2003年
8 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年
9 温磊;基于有向项集图的关联规则挖掘算法研究与应用[D];天津大学;2004年
10 杨旭华;神经网络及其在控制中的应用研究[D];浙江大学;2004年
中国硕士学位论文全文数据库 前10条
1 马宏伟;基于SVM的中文文本分类系统的建模与实现[D];大连理工大学;2006年
2 孙丽华;中文文本自动分类的研究[D];哈尔滨工程大学;2002年
3 张旭;一个基于词典与统计的中文分词算法[D];电子科技大学;2007年
4 丁琼;基于向量空间模型的文本自动分类系统的研究与实现[D];同济大学;2007年
5 于瑞萍;中文文本分类相关算法的研究与实现[D];西北大学;2007年
6 庄新妍;基于SVM的中文文本分类系统的研究与实现[D];吉林大学;2007年
7 高亚波;文本分类系统的设计与实现[D];北京交通大学;2008年
8 都云琪;中文文本自动分类的研究与实现[D];西安电子科技大学;2002年
9 辛明海;个性化信息服务中的本体论自动分类和多Agent技术[D];华侨大学;2002年
10 周孟霞;基于规则学习的中医药文献自动标引系统[D];浙江大学;2004年
【二级引证文献】
中国期刊全文数据库 前4条
1 谢科;张辉;陈鹏;庞斌;;文本分类系统关键技术[J];广西师范大学学报(自然科学版);2007年02期
2 周宽久;王艳萍;李瑶;;Web用户聚类算法[J];计算机工程与应用;2006年16期
3 赵佳鹤;王秀坤;刘亚欣;;基于语义分析的主题信息采集系统的设计与实现[J];计算机应用;2007年02期
4 刘金红;陆余良;;主题网络爬虫研究综述[J];计算机应用研究;2007年10期
中国重要会议论文全文数据库 前1条
1 张全;张运良;袁毅;;利用语言概念表示的作者写作风格分类研究[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 胡燕;基于Web信息抽取的专业知识获取方法研究[D];武汉理工大学;2007年
2 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
3 谭松波;高性能文本分类算法研究[D];中国科学院研究生院(计算技术研究所);2006年
4 石陆魁;非线性维数约减算法中若干关键问题的研究[D];天津大学;2005年
5 任东;基于支持向量机的植物病害识别研究[D];吉林大学;2007年
6 储节旺;企业应对危机的知识管理问题研究:能力、体系、机制与技术[D];南昌大学;2006年
7 杨为民;基于场论的信息检索模型的研究[D];安徽大学;2007年
8 黄涛;知识服务的语义匹配机制研究[D];华中师范大学;2007年
9 宗校军;中文网页定题采集及分类研究[D];华中科技大学;2006年
10 尹世群;Web文本分类关键技术研究[D];西南大学;2008年
中国硕士学位论文全文数据库 前10条
1 侯丽敏;基于网络的智能答疑系统的研究与实现[D];河南大学;2005年
2 邹金凤;基于综合评价理论的多分类器容器[D];大连理工大学;2005年
3 陈洁;面向XML文档的信息检索技术研究[D];内蒙古大学;2007年
4 吴志峰;基于概念特征的中文文本分类研究[D];河北大学;2005年
5 马志柔;中文信息检索分类技术的研究[D];北京化工大学;2005年
6 郭琛;数字图书馆的中文网页文本分类器研究[D];武汉理工大学;2005年
7 凌菁;基于数据挖掘的中文垃圾邮件过滤方法研究与实现[D];广东工业大学;2005年
8 任爽;基于XML和SVM的Web文本挖掘研究[D];大连理工大学;2006年
9 郑伟;基于类别均衡的文本分类算法研究[D];西安电子科技大学;2006年
10 王铭军;基于互联网的模糊数据挖掘技术的研究与应用[D];中国地质大学(北京);2006年
【二级参考文献】
中国期刊全文数据库 前3条
1 杨晓兰,钟义信;基于文本理解的自动文摘系统研究与实现[J];电子学报;1998年07期
2 刘挺,王开铸;自动文摘的四种主要方法[J];情报学报;1999年01期
3 曹素青,曾伏虎,曹焕光;一个中文文本自动分类数学模型[J];情报学报;1999年01期
【相似文献】
中国期刊全文数据库 前10条
1 申莹;徐东平;庞俊;;基于概念的中文博客情感极性聚类分析[J];计算机系统应用;2011年08期
2 胡平霞;;物联网及其应用探索[J];湖南环境生物职业技术学院学报;2011年02期
3 刘舒佳;;我们看好2.0[J];信息方略;2010年17期
4 曾诚;韩光辉;李兵;朱子龙;;一种改进的基于路径的语义相似度计算算法[J];微电子学与计算机;2011年08期
5 陆燕;;物联网:教师应该了解的一个概念[J];新课程(综合版);2011年07期
6 张越;;刊首语[J];个人电脑;2011年09期
7 高璇;;物联网技术对社会生活的影响及应用现状[J];网络与信息;2011年07期
8 ;盘点成长[J];信息方略;2010年01期
9 刘舒佳;;CIO上位四级跳[J];信息方略;2010年21期
10 江瑞峰;;工业领域的物联网雏形——基于称重技术的无人值守系统[J];衡器;2011年07期
中国重要会议论文全文数据库 前10条
1 胡玉娴;;基于《知网》和遗传算法的中文文本聚类特征选择[A];2009全国计算机网络与通信学术会议论文集[C];2009年
2 钟羊根;熊运斌;;预防和打击计算机犯罪[A];全国计算机安全学术交流会论文集(第二十三卷)[C];2008年
3 杨尔弘;米丽萍;郝秀兰;;基于《知网》的词义排岐方法[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
4 梁志国;孟晓风;;关于虚拟仪器概念的讨论[A];2007'仪表,自动化及先进集成技术大会论文集(一)[C];2007年
5 杨尔弘;李盛;;面向真实文本的汉语词义排歧模型研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
6 秦进;侯桂荣;;基于车辆的混合式路径诱导系统分析[A];2007第三届中国智能交通年会论文集[C];2007年
7 何梅;刘亚军;陈耿;;词性划分和差额法在主观题阅卷中的应用[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
8 董强;郝长伶;董振东;;基于《知网》的中文语块抽取器[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 陆勇;侯汉清;;基于词典注释的汉语同义词自动识别[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
10 王永恒;贾焰;杨树强;;面向汉语短文的话题识别系统研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
中国博士学位论文全文数据库 前1条
1 李荣军;中文商品评论倾向性分析研究[D];北京邮电大学;2011年
中国硕士学位论文全文数据库 前10条
1 袁瑞红;基于语义相似度的WEB结构挖掘研究及实现[D];南京理工大学;2009年
2 唐凌志;基于语义理解的论文相似度研究[D];湘潭大学;2011年
3 李盛;面向真实文本的汉语词义排歧系统[D];山西大学;2003年
4 李江涛;从美国网络出版的成功看我国网络出版前景[D];东北师范大学;2006年
5 向泰;基于广度优先最小生成树及《知网》词汇语义相似度的启发式P2P搜索技术研究与实现[D];云南师范大学;2006年
6 林丽;基于语义距离的文本聚类算法研究[D];厦门大学;2007年
7 何元娇;基于本体的语义文本分类研究[D];北京化工大学;2008年
8 赵红艳;基于语义知识的动词隐喻识别与应用[D];南京师范大学;2012年
9 裴运亮;基于切词和语义的中文相似度研究与应用[D];电子科技大学;2011年
10 麦艺华;面向中文微博的社会网络分析及应用[D];华南理工大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026