收藏本站
《重庆邮电学院学报(自然科学版)》 2006年03期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于不完备信息系统的文本分类研究与应用

代劲  胡峰  王国胤  
【摘要】:在文本分类中,文本特征向量通常高达几千甚至上万维,给整个分类过程带来了相当庞大的计算量,因此进行有效的降维处理是非常重要的。在不完备信息系统理论的基础上,结合文本分类的特点,提出了一种量化容差关系和启发式的属性约简算法。实验证明该属性约简算法不仅能有效地降低文本特征向量的维度,同时能保证分类的正确率。

知网文化
【相似文献】
中国期刊全文数据库 前10条
1 陶兰,申军霞;文本信息自动分类系统ITC98(Ⅱ)──基于BP网络的文本分类子系统[J];中国农业大学学报;1999年04期
2 陆蓓!信息工程分院,王小华!信息工程分院,陈勤!信息工程分院;基于多智能体的文本分类模型[J];杭州电子工业学院学报;1999年04期
3 李晓黎,刘继敏,史忠植;概念推理网及其在文本分类中的应用[J];计算机研究与发展;2000年09期
4 黄萱菁,吴立德,石崎洋之,徐国伟;独立于语种的文本分类方法[J];中文信息学报;2000年06期
5 庞剑锋,卜东波,白硕;基于向量空间模型的文本自动分类系统的研究与实现[J];计算机应用研究;2001年09期
6 杨斌,孟志青;一种文本分类数据挖掘的技术[J];湘潭大学自然科学学报;2001年04期
7 陆玉昌,鲁明羽,李凡,周立柱;向量空间法中单词权重函数的分析和构造[J];计算机研究与发展;2002年10期
8 刘贵龙,王慧玲,宋柔;矩阵的奇异值分解在文本分类研究中的应用[J];计算机工程;2002年12期
9 刁力力 ,胡可云 ,陆玉昌 ,石纯一;用Boosting方法组合增强Stumps进行文本分类(英文)[J];软件学报;2002年08期
10 王小华,张国煊,陆蓓;文本分类系统的评价因素探讨[J];杭州电子工业学院学报;2002年03期
中国重要会议论文全文数据库 前10条
1 王慧玲;宋柔;戴伟长;;汉语文本按语体分类的研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 王小华;陆蓓;张国煊;;文本自动分类的模糊方法[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 庞剑锋;程学旗;;反馈方法在文本分类系统中的应用[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
4 孙晓明;马少平;;基于写作风格的作者识别[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
5 房一飞;张冬茉;;基于boosting的文本分类在股市领域信息抽取系统中的应用[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
6 高楚舒;丁于思;;因特网中文文本信息分析[A];计算机模拟与信息技术会议论文集[C];2001年
7 殷苌茗;陈焕文;谢丽娟;;基于最大期望学习算法的无标识文本分类[A];2002中国控制与决策学术年会论文集[C];2002年
8 金千里;赵军;徐波;;弱指导的统计隐含语义分析及其在跨语言信息检索中的应用[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 张鑫;程学旗;谭建龙;王映;;一种快速的多模式串匹配算法及其在实时汉语文本分类系统中的应用[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
10 陈克利;宗成庆;王霞;;基于大规模真实文本的平衡语料分析与文本分类方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国重要报纸全文数据库 前4条
1 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
2 希安;微软试水信息检索[N];经济日报;2004年
3 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
4 高利华;传承陆游风骨 推进国际交流[N];人民日报海外版;2005年
中国博士学位论文全文数据库 前10条
1 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年
2 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
3 徐建锁;知识管理和文本挖掘的若干问题研究[D];天津大学;2004年
4 刘华;基于关键短语的文本内容标引研究[D];北京语言大学;2005年
5 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
6 赵晖;支持向量机分类方法及其在文本分类中的应用研究[D];大连理工大学;2006年
7 王秀娟;文本检索中若干问题研究[D];北京邮电大学;2006年
8 刘涛;现代信息检索中的文本分类及图像恢复研究[D];北京邮电大学;2006年
9 周瑛;神经网络作为分类器的算法研究及在信息检索中的应用[D];安徽大学;2006年
10 万国根;面向内容的网络安全监控模型及其关键技术研究[D];电子科技大学;2005年
中国硕士学位论文全文数据库 前10条
1 易靖;基于信息粒度原理的文本分类方法的研究[D];北京工业大学;2001年
2 杨昂;文本分类算法研究[D];湖南大学;2002年
3 翟静;可扩展的文本分类系统的核心API的设计与实现[D];四川大学;2003年
4 刘钢;基于神经网络的文本分类系统NNTCS的设计和实现[D];中国科学院研究生院(软件研究所);2003年
5 湛燕;K-近邻、K-均值及其在文本分类中的应用[D];河北大学;2003年
6 黄海英;基于概念空间的文本分类的应用研究[D];广西师范大学;2002年
7 徐爱华;面向文本分类的中文文本挖掘技术研究及实现[D];武汉理工大学;2004年
8 梅胜;基于SVM的多层次大类别数文本分类系统(HJ-TCM)的设计与实现[D];南京理工大学;2004年
9 张滨;中文文档分类技术研究[D];武汉大学;2004年
10 谢振亮;基于WEB挖掘技术的网页自动分类和聚类的研究[D];天津大学;2004年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978