收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

面向短文本的动态组合分类算法

闫瑞  曹先彬  李凯  
【摘要】:短文本分类是网络内容安全的一种主要方法.然而,短文本固有的关键词特征稀疏和样本高度不均衡等特点,使得难以直接使用现有针对长文本的分类算法.本文提出了一种针对短文本的动态组合分类算法.首先构造出一种树状组合分类器结构,可有效缓解短文本特征稀疏和样本高度不均衡对分类性能的影响;进一步,提出了一种动态调整策略来训练组合分类器,可以根据样本的分布特点自适应地调整分类器的组合结构.测试实验表明,相对于传统的单一分类方法和集成分类方法,动态组合分类算法在短文本分类中可以获得更好的准确率和召回率.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 傅德胜,谢忠红,苏坚;基于组合分类器的自由手写体数字识别方法[J];计算机工程与设计;2004年10期
2 张国柱,周一宇,姜文利;基于贝叶斯理论的辐射源分类识别方法研究[J];信号处理;2004年04期
3 刘新华;旷海兰;眭仁武;;一种基于粗糙集理论的组合分类器构造方法(英文)[J];衡阳师范学院学报;2006年06期
4 殷镇良,韩学东,舒鑫,陈坚;一种特定条件下的人脸识别系统[J];哈尔滨工程大学学报;1999年02期
5 夏春;范明;;集成异种分类器用于入侵检测[J];微计算机信息;2008年33期
6 胡乃全;朱巧明;周国栋;;混合的汉语基本名词短语识别方法[J];计算机工程;2009年20期
7 付彬;王志海;王中锋;;Boosting算法中基分类器权重的动态赋值[J];广西师范大学学报(自然科学版);2009年03期
8 郭泗辉;樊兴华;;一种改进的贝叶斯网络短文本分类算法[J];广西师范大学学报(自然科学版);2010年03期
9 周红英;蔺启忠;吴昀昭;王钦军;;基于AdaBoost的组合分类器在遥感影像分类中的应用[J];计算机应用研究;2007年10期
10 石国强;牛常勇;范明;;使用PCA建立基于规则的组合分类器[J];计算机科学与探索;2010年05期
11 职为梅;范明;叶阳东;;样本大小对非平衡数据分类的影响[J];微型机与应用;2010年19期
12 殷天石;孙济庆;;基于树型结构的SVM多类组合分类器在文本分类中的应用[J];情报杂志;2006年02期
13 钟淑瑛;李陶深;;基于MATLAB的BP-LVQ神经网络组合分类模型[J];计算机技术与发展;2006年02期
14 康凯;张化祥;赵斌;;一种基于核函数分割数据集的分类器组合算法[J];计算机工程与应用;2008年24期
15 陈松峰;范明;;利用PCA和AdaBoost建立基于贝叶斯的组合分类器[J];计算机科学;2010年08期
16 王细薇;沈云琴;;中文短文本分类方法研究[J];现代计算机(专业版);2010年07期
17 郑忠;曾永年;刘慧敏;徐艳艳;于菲菲;;并联结构组合分类器的误差分析[J];遥感技术与应用;2011年03期
18 旷海兰;罗可;刘新华;徐雨明;王樱;;一种基于粗糙集理论的组合分类器构造方法[J];计算机工程与应用;2006年16期
19 李亚军;刘晓霞;陈平;;改进的AdaBoost算法与SVM的组合分类器[J];计算机工程与应用;2008年32期
20 黄永文;何中市;伍星;;用户评论的分类获取[J];计算机应用;2009年03期
中国重要会议论文全文数据库 前2条
1 徐昉;宗成庆;;汉语base NP识别:错误驱动的组合分类器方法[A];第三届学生计算语言学研讨会论文集[C];2006年
2 王占一;徐蔚然;刘东鑫;郭军;;一种基于两级分类器的垃圾短信过滤方法[A];第五届全国信息检索学术会议论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 杨水山;冷轧带钢表面缺陷机器视觉自动检测技术研究[D];哈尔滨工业大学;2009年
2 王勇;WEB数据挖掘研究[D];西北工业大学;2006年
3 黄永文;中文产品评论挖掘关键技术研究[D];重庆大学;2009年
4 许言午;面向行人检测的组合分类计算模型与应用研究[D];中国科学技术大学;2009年
5 杨哲海;高光谱影像分类若干关键技术的研究[D];解放军信息工程大学;2006年
6 张国柱;雷达辐射源识别技术研究[D];国防科学技术大学;2005年
7 毛勇;基于支持向量机的特征选择方法的研究与应用[D];浙江大学;2006年
8 董阔;慢速拒绝服务攻击防御方法研究[D];中国科学技术大学;2008年
9 贾富仓;生物医学图像组织统计分类研究[D];中国科学院研究生院(计算技术研究所);2004年
10 王君泽;基于大规模问答语料的问题检索系统[D];华中科技大学;2010年
中国硕士学位论文全文数据库 前10条
1 谢忠红;基于组合分类器的自由手写体数字识别方法[D];南京气象学院;2003年
2 肖伟;数据挖掘在网络故障诊断中的应用[D];南京理工大学;2004年
3 李国安;基于数据挖掘的垃圾邮件过滤技术研究[D];内蒙古大学;2008年
4 陈程;基于混合蚁群算法的车间作业调度问题求解[D];电子科技大学;2008年
5 任惠;基于Stacking框架的命名实体识别[D];大连理工大学;2008年
6 刘依璐;基于机器学习的中文文本分类方法研究[D];西安电子科技大学;2009年
7 闫瑞;博客数据特征提取与基于分类的垃圾博客过滤[D];中国科学技术大学;2009年
8 伍飞;基于CT影像的肺部肿瘤计算机自动检测方法研究[D];电子科技大学;2005年
9 庄玮;基于数据挖掘的信用卡欺诈行为识别模型的研究[D];南京航空航天大学;2008年
10 吴婷;数据挖掘在信用卡欺诈识别上的应用研究[D];东南大学;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978