收藏本站
《鞍山科技大学学报》 2005年05期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于LSI和Rough集的文本分类研究

赵顺  迟呈英  
【摘要】:针对传统的基于VSM的文本分类算法未能考虑到VSM中各特征向量间相互影响关系,构成VSM的词条集合并不能完全、准确地反映文本的内容,分类精度不是很理想的问题,提出了一种基于LSI和Rough集的文本分类方法。在构造VSM的过程中引入了LSI理论,将语义关系体现在VSM中,从而减少了向量空间的维数,然后再运用粗糙集理论中规则推理方法,建立文本分类的规则库,对于任意一个未知文本,只需要将其条件属性与规则库中的规则进行相似匹配,即可完成分类。实验表明,该方法在文本分类的精度和效率方面比传统的基于VSM的文本分类方法均有10%以上的提高。

【共引文献】
中国期刊全文数据库 前10条
1 杨萍,万上海,陈耿;一种基于可变支持度的缺省规则挖掘算法[J];安徽工程科技学院学报(自然科学版);2004年02期
2 江效尧,胡林生;基于粗糙集的RDT决策树生成算法的研究及应用[J];安徽工程科技学院学报(自然科学版);2004年03期
3 孙全玲;基于粗集和神经网络的建模方法研究[J];安徽建筑工业学院学报(自然科学版);2005年02期
4 吴军,梁冰;基于粗糙集和自适应神经网络集成理论的边坡稳定性分析[J];安徽师范大学学报(自然科学版);2005年03期
5 程玉胜,任广永;基于ROUGH集的决策树测试属性选择方法[J];安庆师范学院学报(自然科学版);2004年04期
6 程玉胜;Rosetta实验系统在机器学习中的应用[J];安庆师范学院学报(自然科学版);2005年02期
7 王琪;张伟;;城市环境质量定量评价方法[J];环境科学与管理;2006年02期
8 黄显明,易继锴;Rough集理论发展现状与应用前景[J];北京工业大学学报;2005年01期
9 兴连国;许宝杰;;基于粗糙集对旋转机械故障诊断系统的研究[J];北京机械工业学院学报;2006年02期
10 鄂旭,高学东,武森,张秋月;信息表中不完备数据的填补方法[J];北京科技大学学报;2005年03期
中国重要会议论文全文数据库 前10条
1 庞清乐;曹银杰;穆健;郎丰法;;基于粗集理论的小电流接地系统故障选线研究[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
2 谢刚;;基于变精度粗集的战略石油储备规模预测方法[A];提高全民科学素质、建设创新型国家——2006中国科协年会论文集[C];2006年
3 魏崇辉;金福禄;何亚群;;基于粗糙集和神经网络的空军航材消耗预测方法[A];江苏省自动化学会七届四次理事会暨2004学术年会青年学者论坛论文集[C];2004年
4 孔秋菊;胡寿松;;基于知识的歼击机起飞爬升阶段的故障诊断与报警[A];江苏省自动化学会七届四次理事会暨2004学术年会青年学者论坛论文集[C];2004年
5 苏宏升;;基于粗糙集理论多区域并行神经分类器在变电站故障诊断中的应用[A];2005年全国自动化新技术学术交流会论文集[C];2005年
6 苏宏升;;一种基于粗集的电力系统调度新方法[A];第十七届全国过路控制会议论文集[C];2006年
7 张卫丰;徐宝文;崔自峰;徐峻岭;;一种基于粗糙集角分类神经网络的文档分类方法(英文)[A];全国语域web与本体能研讨会论文集[C];2006年
8 姚平;梁静国;陈培友;;模糊信息系统两种属性约简算法[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
9 赵奕;施鹏飞;朱莉莉;;感兴趣Rough格关联规则发现[A];中国体视学学会图像分析专业、中国体视学学会仿真与虚拟现实专业、中国航空学会信号与信息处理专业第一届联合学术会议论文集[C];2000年
10 赵青杉;;基于GDT和粗糙集的数据挖掘[A];第六届中国青年运筹与管理学者大会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 陈燕;数据仓库的设计与实现[D];大连理工大学;2000年
2 李刚;知识发现的图模型方法[D];中国科学院软件研究所;2001年
3 孙颖楷;内燃机智能故障诊断系统的研究及应用[D];重庆大学;2001年
4 曹龙汉;柴油机智能化故障诊断技术研究[D];重庆大学;2001年
5 许志兴;粗集理论的若干技术及其应用研究[D];南京航空航天大学;2001年
6 李玉榕;信息融合与智能处理的研究[D];浙江大学;2001年
7 刘业政;基于粗糙集数据分析的智能决策支持系统研究[D];合肥工业大学;2002年
8 刘沐宇;基于范例推理的边坡稳定性智能评价方法研究[D];武汉理工大学;2002年
9 何离庆;网络环境下的智能化农业信息平台研究[D];重庆大学;2002年
10 易正俊;多源信息智能融合算法[D];重庆大学;2002年
中国硕士学位论文全文数据库 前10条
1 朱红;基于Rough Set的特征抽取算法的研究[D];湘潭大学;2002年
2 徐章艳;基于Vague集的近似推理[D];广西师范大学;2000年
3 张伟钢;数据挖掘技术在市场调研中的应用研究[D];西北工业大学;2001年
4 董卫军;利用小波分析进行基于形状的图像检索技术研究[D];西北大学;2001年
5 牟宗瀛;粗集选股模型及随机择机模型初探[D];北京工业大学;2001年
6 赵家刚;数据挖掘的关联规则研究[D];云南师范大学;2001年
7 郑晓妹;安全操作系统访问控制机制研究[D];南京航空航天大学;2002年
8 凌方;基于粗集理论的数据挖掘技术研究[D];南京航空航天大学;2002年
9 刘震宇;粗糙集约简算法在知识发现中的研究与应用[D];西安电子科技大学;2002年
10 张建利;软计算融合和协作技术的研究及其应用[D];西安电子科技大学;2002年
【同被引文献】
中国期刊全文数据库 前10条
1 位耀光,郑德玲,付冬梅,周颖;基于生物免疫系统克隆选择机理和免疫网络理论的免疫算法[J];北京科技大学学报;2005年02期
2 胡佳妮,徐蔚然,郭军,邓伟洪;中文文本分类中的特征选择算法研究[J];光通信研究;2005年03期
3 秦进,陈笑蓉,汪维家,陆汝占;文本分类中的特征抽取[J];计算机应用;2003年02期
4 周茜,赵明生,扈旻;中文文本分类中的特征选择研究[J];中文信息学报;2004年03期
5 王斌,潘文锋;基于内容的垃圾邮件过滤技术综述[J];中文信息学报;2005年05期
6 王金凤;一种基于特征聚合理论和LSI的文本分类新方法[J];北京理工大学学报(社会科学版);2004年05期
7 林鸿飞,高仁璟;基于潜在语义索引的文本摘要方法[J];大连理工大学学报;2001年06期
8 林鸿飞;丁洪文;杨志豪;赵晶;;基于概念和统计的问答系统实现机制[J];大连理工大学学报;2006年02期
9 谷波,张永奎;文本聚类算法的分析与比较[J];电脑开发与应用;2003年11期
10 杨梁彬;文本检索的潜在语义索引法初探[J];大学图书馆学报;2003年06期
中国硕士学位论文全文数据库 前1条
1 陈希;基于混合模式的文本过滤系统的研究[D];山东师范大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 王黔英;科学地形成系统的综合评价指标体系——Rough集的应用[J];小型微型计算机系统;1999年06期
2 李龙澍,倪志伟,凌成;基于Rough集的空间属性数据挖掘的研究与实践[J];系统仿真学报;2002年12期
3 王黔英;基于Rough集理论的同类人员综合评判模型及其简化[J];系统工程理论与实践;2001年04期
4 魏大宽;基于误差度的Rough集近似质量的分析[J];计算机工程与应用;2005年17期
5 刘清;基于Rough集的模态逻辑及其近似推理[J];计算机应用与软件;1999年04期
6 刘国光;基于Rough集的磨削参数决策系统[J];机床与液压;2002年06期
7 徐久成,沈钧毅,王国胤;求方程近似解方法的Rough集解释[J];计算机工程与应用;2002年22期
8 ;第五届中国Rough集与软计算学术研讨会(CRSSC2005) 征文通知[J];计算机学报;2004年12期
9 陈凤娟;刘升;;Rough集在数据挖掘中的应用[J];科技资讯;2007年31期
10 刘国光;基于Rough集数据挖掘模型的钻头磨损状态预报系统[J];现代制造工程;2002年11期
中国重要会议论文全文数据库 前1条
1 王桐;刘大昕;田迪;孙伟;张万松;;一种改进的XML向量空间模型及其近似匹配算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
中国博士学位论文全文数据库 前2条
1 张守志;Rough集中若干问题的研究[D];复旦大学;2004年
2 吴涛;构造性知识发现方法研究[D];安徽大学;2003年
中国硕士学位论文全文数据库 前10条
1 邱云飞;基于Rough集理论区分规则挖掘方法研究[D];辽宁工程技术大学;2004年
2 蒋运承;Rough集和Rough关系数据库中熵的研究[D];广西师范大学;2000年
3 陈玥孜;基于粗集的软件产品用户满意度评价方法研究[D];西南大学;2006年
4 黄辉;基于LSI和SVC的网页文本分类算法研究[D];长沙理工大学;2010年
5 张静波;基于空间数据库的数据挖掘技术研究[D];西安电子科技大学;2004年
6 陈玉明;基于信息粒与粒计算理论的数据约简研究[D];南昌大学;2005年
7 邓琨;基于Rough集的Web文本分类及其信息抽取研究[D];南昌大学;2007年
8 林丽清;Rough集和云理论在空间数据挖掘中的应用[D];北京化工大学;2007年
9 周辉;基于粒计算理论的数据挖掘模型研究[D];南昌大学;2007年
10 汪廷华;基于股票时间序列数据的关联规则挖掘研究[D];南昌大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026