收藏本站
《北京理工大学学报(社会科学版)》 2004年05期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一种基于特征聚合理论和LSI的文本分类新方法

王金凤  
【摘要】:根据特征聚合理论和隐含语义索引理论(LSI)提出了一种文本分类新方法,该方法应用特征聚合理论和LSI理论来构造向量空间模型,大大削减了特征向量的维数,同时增强了稀有词的作用,并在特征向量中引入了语义成分,从而提高了分类的速度和精度。
【作者单位】天津大学
【分类号】:TP391.1

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 孙丽华,张积东,李静梅;一种改进的kNN方法及其在文本分类中的应用[J];应用科技;2002年02期
【共引文献】
中国期刊全文数据库 前10条
1 张晓辉,李莹,王华勇,赵宏;应用特征聚合进行中文文本分类的改进KNN算法[J];东北大学学报(自然科学版);2003年03期
2 张莉,康耀红,王曙光,张春元;中文网页自动分类现状的研究[J];福建电脑;2004年05期
3 何峰,林亚丽;改进的KNN文本分类算法综述[J];福建电脑;2005年01期
4 袁方,杨柳,张红霞;基于k-近邻方法的渐进式中文文本分类技术[J];华南理工大学学报(自然科学版);2004年S1期
5 李雪蕾,张冬茉;一种基于向量空间模型的文本分类方法[J];计算机工程;2003年17期
6 解本政;;TCBPL:一种高效文本分类新方法[J];计算机工程;2005年23期
7 魏松;钟义信;王翔英;;中文Web文本挖掘系统WebTextMiner开发[J];计算机应用研究;2006年06期
8 代六玲,黄河燕,陈肇雄;中文文本分类中特征抽取方法的比较研究[J];中文信息学报;2004年01期
9 赵世奇,张宇,刘挺,陈毅恒,黄永光,李生;基于类别特征域的文本分类特征选择方法[J];中文信息学报;2005年06期
10 罗海飞;吴刚;杨金生;;基于贝叶斯的文本分类方法[J];计算机工程与设计;2006年24期
中国重要会议论文全文数据库 前1条
1 罗海飞;虞立群;章志凌;邵晓敏;陈林;汪更生;陈弈秋;何伟杰;;一种改进型CHI的特征抽取方法[A];第二十四届中国控制会议论文集(下册)[C];2005年
中国博士学位论文全文数据库 前4条
1 王树梅;信息检索相关技术研究[D];南京理工大学;2007年
2 代六玲;互联网内容监管系统关键技术的研究[D];南京理工大学;2005年
3 王明春;基于粗糙集的数据及文本挖掘方法研究[D];天津大学;2005年
4 李冠军;电子政务服务理论及其支撑技术的研究[D];天津大学;2006年
中国硕士学位论文全文数据库 前10条
1 王香港;中文文本自动分类算法研究[D];上海交通大学;2008年
2 余从津;非线性维数约减的研究及其应用[D];天津大学;2004年
3 刘卓;基于KNN算法的中文文本自动分类[D];吉林大学;2004年
4 张红霞;渐进式中文文本分类技术研究[D];河北大学;2004年
5 田震生;基于文本聚类技术的邮件分类系统的研究与实现[D];河海大学;2005年
6 李文;公安执法监督管理中的文本理解技术的研究及其应用[D];南昌大学;2005年
7 刘泉永;基于系统调用的异常入侵检测系统研究[D];武汉理工大学;2006年
8 唐敏;垃圾邮件过滤技术研究[D];西华大学;2006年
9 王金森;文本分类算法在垃圾邮件过滤中的研究与应用[D];吉林大学;2006年
10 赵敏涯;基于主题的新闻搜索引擎的研究与实现[D];扬州大学;2006年
【同被引文献】
中国期刊全文数据库 前10条
1 赵顺,迟呈英;基于LSI和Rough集的文本分类研究[J];鞍山科技大学学报;2005年05期
2 林鸿飞,高仁璟;基于潜在语义索引的文本摘要方法[J];大连理工大学学报;2001年06期
3 林鸿飞;丁洪文;杨志豪;赵晶;;基于概念和统计的问答系统实现机制[J];大连理工大学学报;2006年02期
4 杨梁彬;文本检索的潜在语义索引法初探[J];大学图书馆学报;2003年06期
5 任纪生,王作英;一种新的潜在语义分析语言模型[J];高技术通讯;2005年08期
6 牛伟霞,张永奎;潜在语义索引方法在信息过滤中的应用[J];计算机工程与应用;2001年09期
7 李永平,程莉,叶卫国;基于隐含语义的kNN文本分类研究[J];计算机工程与应用;2004年06期
8 顾榕,王小平,曹立明;一种基于潜在语义分析的查询扩展算法[J];计算机工程与应用;2004年18期
9 沈玉利,郭雷,任建峰;基于LSI的图像语义检索[J];计算机工程与应用;2005年22期
10 杨清;李方敏;;基于LSI和SVM分类法的定题邮件过滤研究[J];计算机工程与应用;2006年35期
【二级参考文献】
中国期刊全文数据库 前3条
1 黄萱菁,吴立德,石崎洋之,徐国伟;独立于语种的文本分类方法[J];中文信息学报;2000年06期
2 李国臣;文本分类中基于对数似然比测试的特征词选择方法[J];中文信息学报;1999年04期
3 薛翠芳,郭炳炎;汉语文本特征词的抽取方法[J];情报学报;2000年03期
【相似文献】
中国期刊全文数据库 前6条
1 阎永新,李石山,王雅君;从3NF模型到ER模型[J];计算机应用与软件;1998年05期
2 杨小康,余波,张文军,余松煜;基于局部兴奋全局抑制振荡网络的图像分割[J];红外与毫米波学报;1999年01期
3 张晓辉,李莹,王华勇,赵宏;应用特征聚合进行中文文本分类的改进KNN算法[J];东北大学学报(自然科学版);2003年03期
4 王金凤;一种基于特征聚合理论和LSI的文本分类新方法[J];北京理工大学学报(社会科学版);2004年05期
5 张晓辉;李莹;常桂然;赵宏;;适于Internet新闻文本实时分类的动态向量空间模型DVSM[J];计算机科学;2004年06期
6 何峰,林亚丽;改进的KNN文本分类算法综述[J];福建电脑;2005年01期
中国硕士学位论文全文数据库 前1条
1 何峰;基于文本分类的人才自动推荐系统[D];苏州大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026