收藏本站
《中文信息学报》 2000年03期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

文本自动分类中的词权重与分类算法

刁倩  王永成  张惠惠  何骥  
【摘要】:本文详细阐述了自动分类中的词与文献的相关权重的经典计算方法IDF(InverseDocumentFrequency) ,进一步总结了两种典型的分类算法———Bayes判别准则与向量空间模型 (VSM) ,并提出结合词权重和分类算法进行分类的具体公式以及相关实验结果。

【引证文献】
中国期刊全文数据库 前10条
1 刘翌南;基于SPI的信息过滤的设计及实现[J];长沙交通学院学报;2005年01期
2 王理达;电子政务中中文文本分类技术的应用[J];大众科技;2005年01期
3 沈丹莹;;Web信息智能过滤系统WIIFS的研究[J];福建电脑;2006年01期
4 秦进,陈笑蓉,汪维家,陆汝占;文本分类中的特征抽取[J];计算机应用;2003年02期
5 李国臣,段建勇;基于语法语义信息量化模型的语素字再分类[J];计算机工程;2004年11期
6 刘云峰,齐欢,Xiang’en Hu,Zhiqiang Cai;潜在语义分析权重计算的改进[J];中文信息学报;2005年06期
7 李渝勤,孙丽华;基于规则的自动分类在文本分类中的应用[J];中文信息学报;2004年04期
8 王洪,贾惠波,徐端颐;基于人工标引的中文学术期刊文献自动分类算法[J];清华大学学报(自然科学版);2002年06期
9 曹玖新,张德运,吴瞻,刘伟娜;基于内容的邮件安全审计系统及实现[J];西安交通大学学报;2002年06期
10 陈涛,宋妍,谢阳群;改进的信息增益特征选择方法在文本聚类中的应用[J];现代图书情报技术;2004年12期
中国博士学位论文全文数据库 前4条
1 李广建;个性化网络信息检索系统的研究与实现[D];中国科学院研究生院(文献情报中心);2002年
2 胡燕;基于Web信息抽取的专业知识获取方法研究[D];武汉理工大学;2007年
3 夏天;研究性学习支持系统[D];华东师范大学;2007年
4 张磊;个性化信息分发及概念检索的研究[D];中国科学院研究生院(计算技术研究所);2002年
中国硕士学位论文全文数据库 前10条
1 刘玉国;基于遗传算法的网络信息过滤模型研究[D];山东师范大学;2006年
2 杨建光;电信级智能网络信息过滤引擎的研究和应用[D];浙江大学;2005年
3 郑伟;基于类别均衡的文本分类算法研究[D];西安电子科技大学;2006年
4 柳培林;基于向量空间模型的中文文本分类技术研究[D];大庆石油学院;2006年
5 王新梅;基于内容挖掘的垃圾邮件过滤技术[D];武汉理工大学;2006年
6 章兰;一种基于VSM模型的动态文本分类器的设计[D];苏州大学;2004年
7 吴娟;军用信息自动分类的研究与实现[D];南京理工大学;2004年
8 段建勇;现代汉语词性细分类标注研究[D];山西大学;2004年
9 骆昌日;基于统计方法的中文文本自动分类研究[D];华中师范大学;2004年
10 向旭宇;邮件安全审计和过滤技术研究与实现[D];中国人民解放军国防科学技术大学;2003年
【同被引文献】
中国期刊全文数据库 前10条
1 赵姝,张燕平,张铃,张媛,陈传明;覆盖聚类算法[J];安徽大学学报(自然科学版);2005年02期
2 赵顺,迟呈英;基于LSI和Rough集的文本分类研究[J];鞍山科技大学学报;2005年05期
3 武旭,须德;基于向量空间模型的文本自动分类系统的研究与实现[J];北方交通大学学报;2003年02期
4 龚汉明,周长胜;汉语分词技术综述[J];北京机械工业学院学报;2004年03期
5 许云,樊孝忠,张锋;基于知网的语义相关度计算[J];北京理工大学学报;2005年05期
6 阎光才;教育过程中知识的公共性与教育实践——兼批激进建构主义的教育观和课程观[J];北京大学教育评论;2005年02期
7 张行勇,郭柏寿,李明德;科技期刊管理信息系统的开发及其在因特网上的应用[J];编辑学报;2002年06期
8 吴坚;国外科技期刊审稿的一些特点[J];编辑学报;2004年02期
9 孙健,王伟,钟义信;基于K-最近距离的自动文本分类的研究[J];北京邮电大学学报;2001年01期
10 钟义信;自然语言理解的全信息方法论[J];北京邮电大学学报;2004年04期
中国博士学位论文全文数据库 前10条
1 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年
2 郑义;多媒体信息自动摘要及其相关技术研究[D];复旦大学;2003年
3 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
4 薛德军;中文文本自动分类中的关键问题研究[D];清华大学;2004年
5 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
6 孙建涛;Web挖掘中的降维和分类方法研究[D];清华大学;2005年
7 卜东波;聚类/分类理论研究及其在文本挖掘中的应用[D];中国科学院研究生院(计算技术研究所);2000年
8 刘少辉;知识发现中粗糙集理论的研究[D];中国科学院研究生院(计算技术研究所);2003年
9 王煜;基于决策树和K最近邻算法的文本分类研究[D];天津大学;2006年
10 宗校军;中文网页定题采集及分类研究[D];华中科技大学;2006年
中国硕士学位论文全文数据库 前10条
1 孙良;一种分布式智能信息检索系统的研究与实现[D];浙江大学;2002年
2 都云琪;中文文本自动分类的研究与实现[D];西安电子科技大学;2002年
3 杨昂;文本分类算法研究[D];湖南大学;2002年
4 孙丽华;中文文本自动分类的研究[D];哈尔滨工程大学;2002年
5 苏伟峰;基于概念的文本自动分类研究[D];厦门大学;2002年
6 张海燕;基于分词的中文文本自动分类研究与实现[D];湖南大学;2002年
7 姚松源;文本自动分类系统的研究与实现[D];北京工业大学;2003年
8 罗强;基于粗糙集理论的知识发现在web文本挖掘上的应用研究[D];广西大学;2003年
9 高健;网络隔离系统研究[D];西北工业大学;2003年
10 朱珣;中文自动分词系统的研究[D];华中师范大学;2004年
【二级引证文献】
中国期刊全文数据库 前10条
1 王煜,张明,马力;基于词条聚合和决策树的文本分类方法[J];河北大学学报(自然科学版);2005年03期
2 程泽凯,陆小艺;文本分类中的特征选择方法[J];安徽工业大学学报(自然科学版);2004年03期
3 袁方,杨柳,张红霞;基于k-近邻方法的渐进式中文文本分类技术[J];华南理工大学学报(自然科学版);2004年S1期
4 万乐;刘万春;;类别特征词权重加权文本分类方法[J];军民两用技术与产品;2006年03期
5 徐林,张德运,孙钦东,张晓彤;基于NAPI的数据包捕获技术研究[J];计算机工程与应用;2004年26期
6 丁文斌,李斌,罗浩;基于改进贝叶斯的垃圾邮件过滤系统设计与实现[J];计算机工程与应用;2005年18期
7 王浩鸣,张曰贤,吴志军,史西兵;基于智能Agent的中文元搜索引擎模型研究[J];计算机工程与应用;2005年31期
8 奚文,余坤华,张世永;基于内容的旁路式邮件阻断技术在网络病毒防治中的应用[J];计算机工程;2004年07期
9 顾益军,樊孝忠,于江德,李良富;受限领域中文文本主题标引系统研究[J];计算机应用;2004年01期
10 陈治纲,何丕廉,孙越恒,郑小慎;基于向量空间模型的文本分类方法的研究与实现[J];计算机应用;2004年S1期
中国博士学位论文全文数据库 前10条
1 陈定权;自动主题搜索的应用研究[D];中国科学院研究生院(文献情报中心);2003年
2 徐建锁;知识管理和文本挖掘的若干问题研究[D];天津大学;2004年
3 王明春;基于粗糙集的数据及文本挖掘方法研究[D];天津大学;2005年
4 孙越恒;基于统计的NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
5 陈伟;通信网内容安全集成系统研究[D];北京邮电大学;2006年
6 郝占刚;基于遗传算法等技术的数据与文本聚分类研究[D];天津大学;2006年
7 荣耀;海底隧道衬砌裂缝控制关键技术研究[D];同济大学;2007年
8 刘向威;NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
9 夏天;研究性学习支持系统[D];华东师范大学;2007年
10 刘炜;智能元搜索引擎中个性化模式库的研究[D];太原理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 高雷;网络智能过滤系统的设计与实现[D];广东工业大学;2003年
2 葛昕;数据挖掘在Web使用模式中的研究和应用[D];广西大学;2003年
3 王艳;数字图书馆个性化中文文本信息服务系统研究[D];西南师范大学;2003年
4 侯震宇;主题型搜索引擎的研究与实现[D];中国科学院研究生院(文献情报中心);2003年
5 向旭宇;邮件安全审计和过滤技术研究与实现[D];中国人民解放军国防科学技术大学;2003年
6 董建设;基于HTML标记分析及中文切词的网页索引研究与实现[D];兰州理工大学;2003年
7 王华;基于分类用户的邮件过滤系统的研究与开发[D];北方工业大学;2004年
8 段建勇;现代汉语词性细分类标注研究[D];山西大学;2004年
9 李东艳;互联网信息内容安全过滤方法研究[D];山西大学;2004年
10 徐爱华;面向文本分类的中文文本挖掘技术研究及实现[D];武汉理工大学;2004年
【相似文献】
中国硕士学位论文全文数据库 前2条
1 朱红灿;基于SOM的两阶段中文文本聚类算法的研究[D];湘潭大学;2005年
2 龚静;中文文本聚类中特征选择算法的研究[D];湘潭大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026