收藏本站
《计算机与数字工程》 2006年08期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于句子重要度的特征项权重计算方法

董小国  甘立国  
【摘要】:特征项权重的计算方法是文本分类的一个重要问题,计算方法的选择关系到分类的效果。使用句子的重要度对特征项权重进行计算,并与其他几种传统的权重计算方法进行了比较。该方法能够有效地提高分类的准确度。

【引证文献】
中国期刊全文数据库 前1条
1 冯扬;罗森林;潘丽敏;刘莉莉;陈开江;;基于概念簇的文本向量构建方法[J];通信学报;2010年S1期
中国博士学位论文全文数据库 前1条
1 曾传华;事故车辆技术状况智能鉴定系统研究[D];西南交通大学;2008年
中国硕士学位论文全文数据库 前7条
1 丁琼;基于向量空间模型的文本自动分类系统的研究与实现[D];同济大学;2007年
2 王海龙;汉语关键词识别与主题信息提取的研究及应用[D];北京交通大学;2007年
3 凌强;古代建筑文化遗产保护知识的分类研究[D];中国科学院研究生院;2008年
4 王军;基于文本分类的WEB信息检索技术的研究[D];大连交通大学;2008年
5 刘慧;基于KNN的中文文本分类算法研究[D];西南交通大学;2010年
6 赵丽娜;模糊遗传算法及其在网络信息过滤系统中的应用研究[D];山东师范大学;2010年
7 侯艳钗;基于词语权重的中文文本分类算法的研究[D];河北工业大学;2011年
【参考文献】
中国期刊全文数据库 前4条
1 陆玉昌,鲁明羽,李凡,周立柱;向量空间法中单词权重函数的分析和构造[J];计算机研究与发展;2002年10期
2 庞剑锋,卜东波,白硕;基于向量空间模型的文本自动分类系统的研究与实现[J];计算机应用研究;2001年09期
3 黄萱菁,吴立德,石崎洋之,徐国伟;独立于语种的文本分类方法[J];中文信息学报;2000年06期
4 刘明吉,王秀峰,饶一梅,黄亚楼;Web文本信息的特征获取算法[J];小型微型计算机系统;2002年06期
【共引文献】
中国期刊全文数据库 前10条
1 张杰,战学刚,冯金平,陈文亮;中文文本分类器的评价[J];鞍山科技大学学报;2005年Z1期
2 李用江,回雁雁;基于ADO.NET的海洋经济生物MIS系统[J];安阳师范学院学报;2004年05期
3 洪颖;;基于改进VSM算法的智能个性化信息检索系统研究[J];北京服装学院学报(自然科学版);2010年01期
4 蔡茂蓉;;基于VRML和Java的远程虚拟教学系统[J];兵工自动化;2005年06期
5 李文斌;刘椿年;陈嶷瑛;;基于特征信息增益权重的文本分类算法[J];北京工业大学学报;2006年05期
6 李玉鑑;操卫平;周兰珍;;结构化向量空间模型及其在Web信息检索中的应用[J];北京工业大学学报;2008年04期
7 张辉;吴辉;刘瑞;周刚;;科技资源信息检索关键技术[J];北京航空航天大学学报;2006年09期
8 顾益军,樊孝忠,王建华,汪涛,黄维金;中文停用词表的自动选取[J];北京理工大学学报;2005年04期
9 战守义,井新;加入时间因素的个性化信息过滤技术[J];北京理工大学学报;2005年09期
10 高影繁;马润波;刘玉树;;一种快速文本归类算法的设计与实现[J];北京理工大学学报;2006年12期
中国重要会议论文全文数据库 前10条
1 ;Research on the Frame Structure and Its Implement of a Special Field-based Content Information Mining System on Web[A];Proceedings of 6th International Symposium on Test and Measurement(Volume 8)[C];2005年
2 来旭;李国辉;徐蕊;;基于云图和雨量的关联规则挖掘[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
3 张娟;王慧锋;;文本分类技术在海量金融信息处理中的应用[A];第二十四届中国控制会议论文集(下册)[C];2005年
4 牛强;王志晓;陈岱;夏士雄;;基于支持向量机的Web文本分类方法[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
5 杜鲁燕;苗振江;;基于语言模型的中文文本分类系统[A];第十届全国人机语音通讯学术会议暨国际语音语言处理研讨会论文摘要集[C];2009年
6 陈庆轩;郑德权;郑博文;赵铁军;李生;;中文文本分类中基于文档频度分布的特征选择方法[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
7 王秀娟;郭军;郑康锋;;基于互信息可信度的特征选择方法[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
8 王丹;蔡红柳;王斌;;基于混沌序列的数字水印算法[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
9 石艳荣;孙丹宁;贺永强;;一种基于内容的邮件过滤模型的研究与性能分析[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
10 张璐;王景中;;基于HNC语境框架的文本相似度计算[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
中国博士学位论文全文数据库 前10条
1 常春;Ontology在农业信息管理中的构建和转化[D];中国农业科学院;2004年
2 徐建锁;知识管理和文本挖掘的若干问题研究[D];天津大学;2004年
3 刘华;基于关键短语的文本内容标引研究[D];北京语言大学;2005年
4 黄定轩;企业核心能力智能挖掘应用基础研究[D];西南交通大学;2005年
5 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
6 刘云峰;基于潜在语义分析的中文概念检索研究[D];华中科技大学;2005年
7 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
8 万国根;面向内容的网络安全监控模型及其关键技术研究[D];电子科技大学;2005年
9 柳伟;易错信道下基于内容的差错控制方法研究[D];国防科学技术大学;2005年
10 王秀娟;文本检索中若干问题研究[D];北京邮电大学;2006年
中国硕士学位论文全文数据库 前10条
1 郭明;基于文本分类技术的文本情感倾向性研究[D];郑州大学;2010年
2 左维松;规则和统计相结合的篇章情感倾向性分析研究[D];郑州大学;2010年
3 刘辉;基于KNN算法的中文Web文本分类技术研究[D];辽宁工程技术大学;2010年
4 刘伟丽;基于粒子群算法和支持向量机的中文文本分类研究[D];河南工业大学;2010年
5 于飞;基于搜索引擎的个性化推荐研究[D];哈尔滨理工大学;2010年
6 梁晔平;中文文本自动分类相关算法的研究与实现[D];华南理工大学;2010年
7 王阿婷;基于概念集合的网页内容过滤方法的研究[D];北京交通大学;2010年
8 张庐颖;基于粗糙集的K-means研究[D];北京交通大学;2011年
9 杨洋;企业内容管理系统的设计与实现[D];电子科技大学;2010年
10 吴惠雄;基于支持向量机与聚类算法的中文文本分类研究[D];中南林业科技大学;2009年
【同被引文献】
中国期刊全文数据库 前10条
1 王涛;樊孝忠;林培光;陈康;;基于复杂特征集的剽窃检测[J];北京理工大学学报;2008年02期
2 孙健,王伟,钟义信;基于K-最近距离的自动文本分类的研究[J];北京邮电大学学报;2001年01期
3 李巍;孙涛;陈建孝;罗梓恒;李雄飞;;基于加权余弦相似度的XML文档聚类研究[J];吉林大学学报(信息科学版);2010年01期
4 王伟;;面向未来的计算模式——普适计算[J];成都电子机械高等专科学校学报;2005年04期
5 尤天慧,樊治平;区间数多指标决策的一种TOPSIS方法[J];东北大学学报;2002年09期
6 李洪燕,樊治平;一种基于二元语义的多指标群决策方法[J];东北大学学报;2003年05期
7 宋之杰,高晓红;一种多指标综合评价中确定指标权重的方法[J];燕山大学学报;2002年01期
8 冯志伟;;特思尼耶尔的从属关系语法[J];国外语言学;1983年01期
9 耿兆丰;李蓓蓓;赵志宏;;Improved Genetic Algorithm Application in Textile Defect Detection[J];Journal of Donghua University(English Edition);2007年03期
10 左忠义,马社强,邵春福;我国交通事故现状及预防对策研究[J];大连铁道学院学报;2005年02期
中国博士学位论文全文数据库 前7条
1 肖明;WWW科技信息资源自动标引的理论与实践研究[D];中国科学院文献情报中心;2001年
2 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
3 许洪波;大规模信息过滤技术研究及其在Web问答系统中的应用[D];中国科学院研究生院(计算技术研究所);2003年
4 熊云波;文本信息处理的若干关键技术研究[D];复旦大学;2006年
5 尚文倩;文本分类及其相关技术研究[D];北京交通大学;2007年
6 郝秀兰;文本分类技术与应用研究[D];复旦大学;2008年
7 刘赫;文本分类中若干问题研究[D];吉林大学;2009年
中国硕士学位论文全文数据库 前10条
1 孙丽华;中文文本自动分类的研究[D];哈尔滨工程大学;2002年
2 苏伟峰;基于概念的文本自动分类研究[D];厦门大学;2002年
3 周威成;信息过滤方法的研究与应用[D];华北电力大学(北京);2003年
4 柳培林;基于向量空间模型的中文文本分类技术研究[D];大庆石油学院;2006年
5 许海华;交通事故车辆技术鉴定规范研究及其辅助软件开发[D];西华大学;2006年
6 刘玉国;基于遗传算法的网络信息过滤模型研究[D];山东师范大学;2006年
7 曲晓;受限条件下学生作业文本相似度的研究[D];内蒙古师范大学;2006年
8 王宇;基于TFIDF的文本分类算法研究[D];郑州大学;2006年
9 张旭;一个基于词典与统计的中文分词算法[D];电子科技大学;2007年
10 丁琼;基于向量空间模型的文本自动分类系统的研究与实现[D];同济大学;2007年
【二级引证文献】
中国期刊全文数据库 前6条
1 孙长宾;柴松;;军事信息主题搜索引擎研究[J];福建电脑;2011年03期
2 匡春临;夏清强;;基于SVM-KNN的文本分类算法及其分析[J];计算机时代;2010年08期
3 孟海东;刘小荣;;基于聚类分析的图模型文档分类[J];计算机应用与软件;2012年01期
4 田昕辉;李成基;;带有短语切分的中文文本分类方法(英文)[J];计算机技术与发展;2010年01期
5 张素智;孙培锋;;基于KSVM的网络评论情感分类研究[J];郑州轻工业学院学报(自然科学版);2011年03期
6 鲍蕾;黄曙光;李永亮;;基于商空间粒度合成的中文文本表示法[J];小型微型计算机系统;2011年12期
中国硕士学位论文全文数据库 前10条
1 梁晔平;中文文本自动分类相关算法的研究与实现[D];华南理工大学;2010年
2 张龙;基于粗糙集和神经网络的中文文本分类研究与实现[D];西北大学;2008年
3 曹茂诚;基于本体的语义检索技术研究[D];山东轻工业学院;2008年
4 孙丽丽;基于语义和信任的超节点P2P网络模型及其搜索算法[D];中南大学;2008年
5 李晗;面向石油的主题搜索引擎研究[D];中国石油大学;2008年
6 蔡建华;一个具有自组织能力的并发协商模型的设计与实现[D];暨南大学;2008年
7 刘晨曦;网页去噪音与分类算法研究[D];华侨大学;2008年
8 章洁;大词表自然语音关键词识别系统的研究与实现[D];北京交通大学;2009年
9 李书杰;基于语义扩展和匹配的信息检索在P2P中的研究与实现[D];北京交通大学;2009年
10 卢扬竹;基于内容的垃圾邮件过滤技术研究[D];西南交通大学;2009年
【二级参考文献】
中国期刊全文数据库 前9条
1 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
2 邹涛,王继成,朱华宇,金翔宇,张福炎;WWW上的信息挖掘技术及实现[J];计算机研究与发展;1999年08期
3 王实;高文;李锦涛;;Web数据挖掘[J];计算机科学;2000年04期
4 王伟强;高文;段立娟;;Internet上的文本数据挖掘[J];计算机科学;2000年04期
5 吴军,王作英,禹锋,王侠;汉语语料的自动分类[J];中文信息学报;1995年04期
6 邹涛,王继成,黄源,张福炎;中文文档自动分类系统的设计与实现[J];中文信息学报;1999年03期
7 李凡,鲁明羽,陆玉昌;关于文本特征抽取新方法的研究[J];清华大学学报(自然科学版);2001年07期
8 张晓辉,邵华,常桂然;WWW上的信息发现与搜索引擎技术[J];小型微型计算机系统;1998年06期
9 张月杰,姚天顺;基于特征相关性的汉语文本自动分类模型的研究[J];小型微型计算机系统;1998年08期
【相似文献】
中国期刊全文数据库 前10条
1 傅鹏,张德运;基于离散核支持向量机的文本自动分类[J];清华大学学报(自然科学版);2005年S1期
2 曹毅;贺卫红;;基于向量空间模型的信息安全过滤系统[J];计算机工程与设计;2006年02期
3 刘辉;邵良杉;;Web文本分类中特征项权重的研究[J];科技和产业;2010年02期
4 徐大伟;董渊;张素琴;;文本分类技术在海洋信息处理领域中的应用[J];计算机科学;2008年11期
5 甄志龙;韩立新;陆佃龙;;基于模糊关系的文本分类特征选择方法[J];情报学报;2008年06期
6 张业鹏;张道德;;贝叶斯算法在文本自动分类系统中的应用[J];计算机与现代化;2006年02期
7 刘茂旺;林世平;;BOOSTING算法在多类多标签文本分类中的应用[J];福建电脑;2006年03期
8 周瑛;刘政怡;;覆盖算法在文本分类中的应用[J];情报理论与实践;2006年01期
9 孟杰;耿正;严莉莉;张燕平;;覆盖算法在文本分类中的应用[J];计算机技术与发展;2007年07期
10 邹金凤,林鸿飞,杨志豪;文本分类中多分类器的综合机制[J];计算机工程与应用;2005年26期
中国重要会议论文全文数据库 前10条
1 陈克利;宗成庆;王霞;;基于大规模真实文本的平衡语料分析与文本分类方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 杜长海;吉根林;;模糊聚类的最大树法在文本分类中的应用研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
3 刘秉权;李博;孙林;王宝勋;刘远超;;标签特征和正文特征融合的SVM博客文本分类算法研究[A];第六届全国信息检索学术会议论文集[C];2010年
4 海丽且木·艾沙;维尼拉·木沙江;;Web文本分类及其维、哈、柯多文种信息检索中的应用研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
5 商炳章;白清源;;基于特征项权重改进的关联文本分类[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
6 胡俊;黄厚宽;;一种基于SVM的可视化文本分类的方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
7 朱慕华;陈文亮;朱靖波;;词聚类在文本分类中的应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年
8 王小华;陆蓓;张国煊;;文本自动分类的模糊方法[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
9 庞剑锋;程学旗;;反馈方法在文本分类系统中的应用[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
10 贾会强;刘晓丽;于洪志;;基于词性特征提取的藏文文本分类方法研究[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
中国重要报纸全文数据库 前10条
1 本报记者 艾林;信息处理[N];中国质量报;2000年
2 狄国斌徐春花;在信息处理的规律上建立岗责体系[N];江苏经济报;2007年
3 旷健 旷菲;我区民文信息处理技术开发应用硕果累累[N];新疆日报(汉);2006年
4 赵伟;专家热议财务信息处理新技术[N];中国税务报;2006年
5 记者 傅小冰;信息处理驶入快车道[N];中国质量报;2004年
6 本报记者 吴晓伟;缓解电子政务信息处理困境[N];计算机世界;2004年
7 冀邦杰;所校联合科技创新构筑海上钢铁长城[N];科技日报;2006年
8 陈文;号码百事通试水“云南模式”[N];通信产业报;2006年
9 记者 李文生朱良骏;劳务工诉求件件得到落实[N];深圳特区报;2007年
10 特约记者 曹学兵;信息处理智能化 训练环境仿真化[N];战士报;2004年
中国博士学位论文全文数据库 前10条
1 章舜仲;文本分类中词共现关系的研究及其应用[D];南京理工大学;2010年
2 孟佳娜;迁移学习在文本分类中的应用研究[D];大连理工大学;2011年
3 李智星;用于文本分类的简明语义分析技术研究[D];重庆大学;2011年
4 刘伍颖;面向垃圾信息过滤的主动多域学习文本分类方法研究[D];国防科学技术大学;2011年
5 王博;文本分类中特征选择技术的研究[D];国防科学技术大学;2009年
6 冯国忠;文本分类中的贝叶斯特征选择[D];东北师范大学;2011年
7 熊云波;文本信息处理的若干关键技术研究[D];复旦大学;2006年
8 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年
9 祝翠玲;基于类别结构的文本层次分类方法研究[D];山东大学;2011年
10 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
中国硕士学位论文全文数据库 前10条
1 张彪;文本分类中特征选择算法的分析与研究[D];中国科学技术大学;2010年
2 张保富;基于粗糙集的中文文本分类算法研究及应用[D];江苏大学;2010年
3 蒋健;文本分类中特征提取和特征加权方法研究[D];重庆大学;2010年
4 闫晨;KNN文本分类研究[D];燕山大学;2010年
5 苏小康;基于维基百科构建语义知识库及其在文本分类领域的应用研究[D];华中师范大学;2010年
6 李璇;基于坐标下降法的半监督学习算法及其在文本分类中的应用[D];华南理工大学;2010年
7 宋志理;基于LDA模型的文本分类研究[D];西安理工大学;2010年
8 郭志毅;基于EM算法的半监督文本分类方法研究[D];重庆邮电大学;2010年
9 郭明;基于文本分类技术的文本情感倾向性研究[D];郑州大学;2010年
10 段江丽;基于SVM的文本分类系统中特征选择与权重计算算法的研究[D];太原理工大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026