收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于多示例学习框架的文本分类算法

徐建国  肖海峰  赵华  
【摘要】:针对有特殊结构的文本,传统的文本分类算法已经不能满足需求,为此提出一种基于多示例学习框架的文本分类算法。将每个文本当作一个示例包,文本中的标题和正文视为该包的两个示例;利用基于一类分类的多类分类支持向量机算法,将包映射到高维特征空间中;引入高斯核函数训练分类器,完成对无标记文本的分类预测。实验结果表明,该算法相较于传统的机器学习分类算法具有更高的分类精度,为具有特殊文本结构的文本挖掘领域研究提供了新的角度。

知网文化
【相似文献】
中国期刊全文数据库 前18条
1 吕淑宝;王明月;翟祥;陈宇;;一种深度学习的信息文本分类算法[J];哈尔滨理工大学学报;2017年02期
2 寇志亮;李静亚;;基于过滤垃圾短信的文本分类算法研究[J];信息化建设;2016年04期
3 柴玉梅;朱国重;昝红英;胡达明;冼家扬;;基于质心的文本分类算法[J];计算机工程;2009年20期
4 杨娟;王未央;;几种文本分类算法性能比较与分析[J];现代计算机(专业版);2016年25期
5 王珍珍;;粗糙集理论在文本分类算法中的应用[J];重庆科技学院学报(自然科学版);2009年04期
6 郭绪坤;范冰冰;;一种朴素贝叶斯文本分类算法的分布并行实现[J];计算机应用与软件;2016年11期
7 任剑锋;梁雪;李淑红;;基于非线性流形学习和支持向量机的文本分类算法[J];计算机科学;2012年01期
8 刘刊;刘中;;一种面向云计算环境的制造文本分类算法的研究[J];机械设计与制造工程;2013年01期
9 杨丽华;戴齐;郭艳军;;KNN文本分类算法研究[J];微计算机信息;2006年21期
10 杜选;;基于加权补集的朴素贝叶斯文本分类算法研究[J];计算机应用与软件;2014年09期
11 孙铁利;赵隽;杨凤芹;吴迪;;一种基于相对特征的文本分类算法[J];东北师大学报(自然科学版);2010年01期
12 王欣欣;赖惠成;;改进的SMO文本分类算法[J];信息安全与通信保密;2011年12期
13 罗超;郭斌;龙侃;;基于Cross-Validation模型的可扩展标记语言文本分类算法对比研究[J];井冈山大学学报(自然科学版);2010年03期
14 王亚民;刘洋;;含附件文本的分类算法研究[J];情报杂志;2012年08期
15 李龙昊;;基于朴素贝叶斯的文本分类算法研究[J];数字通信世界;2017年09期
16 曾洪波;杨天奇;邱韬奋;;一种基于模糊理论的KNN文本分类算法[J];微计算机应用;2011年02期
17 巩知乐;张德贤;胡明明;;一种改进的支持向量机的文本分类算法[J];计算机仿真;2009年07期
18 孙新;欧阳童;严西敏;尚煜茗;郭文浩;;基于训练集裁剪的加权K近邻文本分类算法[J];情报工程;2016年06期
中国重要会议论文全文数据库 前10条
1 郭庆军;赵燕平;;一种简单的基于奖励机制的文本分类算法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
2 律佳;;基于内容的文本分类算法综述[A];“决策论坛——企业党建与政工创新工作发展学术研讨会”论文集(下)[C];2016年
3 石志伟;吴功宜;;改善朴素贝叶斯在文本分类中的稳定性[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
4 张智军;沈昉;朱伟;;文本组织方式对介绍性文章搜索绩效的影响研究[A];中国人类工效学学会第六次学术交流会论文摘要汇编[C];2003年
5 周昭涛;卜东波;程学旗;;文本的图表示初探[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
6 何慧;陈博;郭军;;基于流形学习的半监督文本情感分类算法[A];第五届全国信息检索学术会议论文集[C];2009年
7 罗长升;段建国;许洪波;郭莉;;基于拉推策略的文本分类增量学习研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 许君;王朝坤;刘立超;王建民;刘璋;;云环境中的近似复制文本检测[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年
9 易绵竹;南振兴;李绍哲;薛恩奎;;文本生成与理解的语言学模拟——伊戈尔·梅里丘克《意思(?)文本》模型评介[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
10 王树西;白硕;姜吉发;;基于自由文本的模式推理[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 闫琰;基于深度学习的文本表示与分类方法研究[D];北京科技大学;2016年
2 刘晓佩;自然场景文本信息提取关键技术研究[D];西安电子科技大学;2014年
3 刘赫;文本分类中若干问题研究[D];吉林大学;2009年
4 宋胜利;文本语义表示及多层分类关键技术研究[D];西安电子科技大学;2012年
5 李自强;大规模文本分类的若干问题研究[D];电子科技大学;2013年
6 胡明涵;面向领域的文本分类与挖掘关键技术研究[D];东北大学 ;2009年
7 王中卿;基于文本信息的社会关系分析与研究[D];苏州大学;2016年
8 张博宇;基于局部特征的场景文本分析方法研究[D];哈尔滨工业大学;2015年
9 李岩;基于深度学习的短文本分析与计算方法研究[D];北京科技大学;2016年
10 李丽洁;视频中文本信息提取技术研究[D];哈尔滨工程大学;2012年
中国硕士学位论文全文数据库 前10条
1 徐易;基于短文本的分类算法研究[D];上海交通大学;2010年
2 赵隽;基于相对特征的文本分类算法研究[D];东北师范大学;2008年
3 杨涛;面向海量文本的分类算法研究[D];齐鲁工业大学;2016年
4 刘智祥;两种文本分类算法的研究与实现[D];吉林大学;2008年
5 曾洪波;基于类别裁剪和模糊理论的文本分类算法研究[D];暨南大学;2011年
6 王贤川;基于知网的文本分类算法研究及应用[D];江苏大学;2009年
7 蒋红;中文文本分类中文本表示及分类算法研究[D];浙江师范大学;2007年
8 李运龙;基于概念的文本分类算法研究[D];华南理工大学;2010年
9 刘文;基于聚类算法和支持向量机算法的文本分类算法研究[D];江苏科技大学;2012年
10 吴巧敏;基于支持向量机的文本分类算法研究[D];湖南大学;2007年
中国重要报纸全文数据库 前10条
1 刘向晨;Word中的虚拟文本[N];中国电脑教育报;2003年
2 飞鱼;巧用COPY命令加密文本文件[N];江苏经济报;2003年
3 飞鱼;巧用COPY命令加密文本文件[N];中国电脑教育报;2003年
4 ;BI和文本分析的强强联手[N];网络世界;2007年
5 浙江省绍兴县职业教育中心 何永胜;让文本发声[N];中国电脑教育报;2004年
6 福建 陈桂鑫;让文本文件更精彩[N];电脑报;2002年
7 朱宝贵;Authorware 插入文本的四种方法[N];中国电脑教育报;2004年
8 宋志明;文本也能转成MP3[N];中国电脑教育报;2004年
9 李永波;实现滚动文本一例[N];中国电脑教育报;2004年
10 广东 魔岩;做一个English文本朗读机[N];电脑报;2002年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978