收藏本站
《国防科技大学学报》 2007年06期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于自训练EM算法的半监督文本分类

张博锋  白冰  苏金树  
【摘要】:为了提高计算效率,提出基于自训练的改进EM算法STEM。在每步迭代的E-step中,将中间分类器最有把握对其类别进行预测的未标注样本转移至标注样本集,并应用到M-step中进行下一个中间分类器的训练,从而引入了利用中间结果的自训练机制。文本分类实验表明STEM算法在大部分情况下的分类准确性都高于EM,并通过减少迭代提高了分类器学习的计算效率。

【参考文献】
中国期刊全文数据库 前2条
1 黄萱菁,夏迎炬,吴立德;基于向量空间模型的文本过滤系统[J];软件学报;2003年03期
2 苏金树;张博锋;徐昕;;基于机器学习的文本分类技术研究进展[J];软件学报;2006年09期
【共引文献】
中国期刊全文数据库 前10条
1 战守义,井新;加入时间因素的个性化信息过滤技术[J];北京理工大学学报;2005年09期
2 贺卫红;曹毅;;基于向量空间模型文本过滤算法[J];系统工程;2005年10期
3 周志勇;袁方;刘海博;;用聚类-分类模式解决聚类问题[J];广西师范大学学报(自然科学版);2007年02期
4 索红光;杨涛;;基于互信息的Web文档聚类方法[J];广西师范大学学报(自然科学版);2007年02期
5 伊文敏,高岩,王颖;评估信息过滤系统的方法及衡量标准概述[J];河北建筑工程学院学报;2004年02期
6 丁月华,文贵华,郭炜强;基于核向量空间模型的专利分类[J];华南理工大学学报(自然科学版);2005年08期
7 王映,常毅,谭建龙,白硕;基于N元汉字串模型的文本表示和实时分类的研究与实现[J];计算机工程与应用;2005年05期
8 赵丰年;刘林;商建云;;基于概念的文本过滤模型[J];计算机工程与应用;2006年04期
9 张帆;杨炳儒;;基于文本过滤的数字图书馆个性化服务技术[J];计算机工程与应用;2006年31期
10 郭炜强;戴天;文贵华;;基于领域知识的专利自动分类[J];计算机工程;2005年23期
中国重要会议论文全文数据库 前7条
1 郑永煌;王磊;陈嘉鸿;;基于GMM与EM彩色图像分割算法的应用研究[A];2007中国控制与决策学术年会论文集[C];2007年
2 黄文良;李石坚;刘菊新;徐从富;;大规模垃圾短信实时过滤系统的设计与实现[A];中国通信学会第五届学术年会论文集[C];2008年
3 赵林;夏迎炬;黄萱菁;吴立德;;基于Winnow算法的文本过滤[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 李东林;迟呈英;战学刚;;一个改进的中文文本过滤系统的设计与实现[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
5 李文波;孙乐;黄瑞红;冯元勇;张大鲲;;基于Labeled-LDA模型的文本分类新算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
6 王辉;左万利;;利用质心向量构建增量式分类器(英文)[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 刘健;张维明;;基于文本概念序列的非线性分析方法初探[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年
2 代六玲;互联网内容监管系统关键技术的研究[D];南京理工大学;2005年
3 张雪英;基于粗糙集理论的文本自动分类研究[D];南京理工大学;2005年
4 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
5 谭建龙;串匹配算法及其在网络内容分析中的应用[D];中国科学院研究生院(计算技术研究所);2003年
6 姜韶华;科研项目管理中的文本挖掘方法研究及应用[D];大连理工大学;2006年
7 尹清波;基于机器学习的入侵检测方法研究[D];哈尔滨工程大学;2007年
8 杨传耀;中文信息检索索引模型及相关技术研究[D];复旦大学;2007年
9 王树梅;信息检索相关技术研究[D];南京理工大学;2007年
10 潘冠宇;基于粗糙集和群体智能的数据挖掘方法研究[D];吉林大学;2007年
中国硕士学位论文全文数据库 前10条
1 田萱;基于Internet的信息检索若干问题的研究[D];山东师范大学;2003年
2 方兰;基于局域网的信息推送系统[D];江西师范大学;2004年
3 谭利文;基于用户模型的个性化网络文献检索系统的研究与设计[D];吉林大学;2004年
4 孙岩国;基于Internet的中文文本过滤系统的研究与实践[D];兰州理工大学;2004年
5 吴娟;军用信息自动分类的研究与实现[D];南京理工大学;2004年
6 张敏;基于Web挖掘的个性化信息检索研究[D];山东科技大学;2004年
7 关真珍;基于半督导机器学习的分词算法的设计与实现[D];华中科技大学;2004年
8 迟学芝;基于自学习机制的信息过滤模型研究与实践[D];山东师范大学;2005年
9 马志柔;中文信息检索分类技术的研究[D];北京化工大学;2005年
10 曾义聪;基于概念树的主题爬取技术研究[D];湖南大学;2005年
【同被引文献】
中国期刊全文数据库 前10条
1 战守义,井新;加入时间因素的个性化信息过滤技术[J];北京理工大学学报;2005年09期
2 朱靖波,陈文亮;基于领域知识的文本分类[J];东北大学学报(自然科学版);2005年08期
3 金博,史彦军,滕弘飞;基于语义理解的文本相似度算法[J];大连理工大学学报;2005年02期
4 盛晓炜,江铭虎;基于Rough集约简算法的中文文本自动分类系统[J];电子与信息学报;2005年07期
5 祁亨年,杨建刚,方陆明;基于多类支持向量机的遥感图像分类及其半监督式改进策略[J];复旦学报(自然科学版);2004年05期
6 张士峰;混合正态分布参数极大似然估计的EM算法[J];飞行器测控学报;2004年04期
7 贺卫红;曹毅;;基于向量空间模型文本过滤算法[J];系统工程;2005年10期
8 索红光;杨涛;;基于互信息的Web文档聚类方法[J];广西师范大学学报(自然科学版);2007年02期
9 严红萍;俞兵;;主成分分析在遥感图像处理中的应用[J];资源环境与工程;2006年02期
10 伊文敏,高岩,王颖;评估信息过滤系统的方法及衡量标准概述[J];河北建筑工程学院学报;2004年02期
中国博士学位论文全文数据库 前4条
1 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年
2 刘华;基于关键短语的文本内容标引研究[D];北京语言大学;2005年
3 谭松波;高性能文本分类算法研究[D];中国科学院研究生院(计算技术研究所);2006年
4 尚文倩;文本分类及其相关技术研究[D];北京交通大学;2007年
中国硕士学位论文全文数据库 前9条
1 孙丽华;中文文本自动分类的研究[D];哈尔滨工程大学;2002年
2 汪传建;基于混合模型的文本分类的研究[D];东北大学;2005年
3 杨柳;中文文本分类技术研究[D];河北大学;2006年
4 闫蓉;基于语义的汉语词义消歧方法研究[D];西北大学;2006年
5 郭春燕;基于支持向量机的高光谱遥感图像分类[D];哈尔滨工程大学;2007年
6 杨柯;基于关联规则的中文文本自动分类算法研究[D];重庆大学;2007年
7 杨国鹏;基于核方法的高光谱影像分类与特征提取[D];解放军信息工程大学;2007年
8 段新成;基于BP人工神经网络的土地利用分类遥感研究[D];中国地质大学(北京);2008年
9 彭丽;数据挖掘中几种划分聚类算法的比较及改进[D];大连理工大学;2008年
【二级参考文献】
中国期刊全文数据库 前2条
1 李荣陆,王建会,陈晓云,陶晓鹏,胡运发;使用最大熵模型进行中文文本分类[J];计算机研究与发展;2005年01期
2 黄萱菁,吴立德,石崎洋之,徐国伟;独立于语种的文本分类方法[J];中文信息学报;2000年06期
【相似文献】
中国期刊全文数据库 前10条
1 王安娜;李云路;赵锋云;史成龙;;一种新的半监督直推式支持向量机分类算法[J];仪器仪表学报;2011年07期
2 张钢;印鉴;程良伦;钟钦灵;;半监督多示例核[J];计算机科学;2011年09期
3 刘利;韦佳;马千里;;边信息传播修正的半监督维数约减方法[J];小型微型计算机系统;2011年06期
4 韦佳;文贵华;王文丰;王家兵;;基于局部重构与全局保持的半监督维数约减算法[J];计算机科学;2011年08期
5 徐飞裕;徐荣聪;;基于密度敏感距离的协同训练算法[J];计算机应用与软件;2011年09期
6 郭剑毅;雷春雅;余正涛;苏磊;赵君;田维;;基于信息熵的半监督领域实体关系抽取研究[J];山东大学学报(工学版);2011年04期
7 叶伟龙;刘华平;孙富春;何克忠;;非结构化道路区域检测的协同学习方法[J];中国图象图形学报;2011年05期
8 计华;张化祥;孙晓燕;;基于最近邻原则的半监督聚类算法[J];计算机工程与设计;2011年07期
9 余国先;张国基;韦佳;任亚洲;;一种基于多图的集成直推分类方法[J];电子与信息学报;2011年08期
10 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 谷方明;刘大有;王新颖;;基于半监督学习的加权支持向量域数据描述方法[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
2 杨源;马云龙;林鸿飞;;基于权重标准化SimRank与半监督学习的产品属性归类[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 毕锦烟;李巍华;;基于半监督模糊核聚类的齿轮箱早期故障检测方法[A];第九届全国振动理论及应用学术会议论文摘要集[C];2007年
4 骆俊;马尽文;;高斯混合模型的遗传分基融合算法[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
5 王倩影;冯国灿;汤鑫;;δ-距离及其在半监督增强中的应用[A];第十五届全国图象图形学学术会议论文集[C];2010年
6 冯瑞;宋春林;;一种基于局部学习的复杂系统建模方法[A];2007中国控制与决策学术年会论文集[C];2007年
7 张艳红;孙超;;协同训练样本的动态元反射机制研究[A];第六届全国信息获取与处理学术会议论文集(3)[C];2008年
8 谢永芳;蒋有为;唐明珠;;一种基于数据剪辑的半监督最邻近分类算法[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年
9 柳斌;李之棠;涂浩;;基于半监督学习的应用流分类方法[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年
10 王彪;姜志国;赵丹培;;基于多特征提取的遥感图像机场目标自动检测[A];第八届全国信号与信息处理联合学术会议论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 孔怡青;半监督学习及其应用研究[D];江南大学;2009年
2 王娇;多视图的半监督学习研究[D];北京交通大学;2010年
3 兰远东;基于图的半监督学习理论、算法及应用研究[D];华南理工大学;2012年
4 徐雪;样本的几何信息在半监督学习中的应用研究[D];中国科学技术大学;2010年
5 桂杰;基于图的半监督学习和维数约简方法及其应用研究[D];中国科学技术大学;2010年
6 潘俊;基于图的半监督学习及其应用研究[D];浙江大学;2011年
7 任广波;基于半监督学习的遥感影像分类技术研究[D];中国海洋大学;2010年
8 薛贞霞;支持向量机及半监督学习中若干问题的研究[D];西安电子科技大学;2009年
9 谷方明;支持向量数据描述的若干问题及应用研究[D];吉林大学;2010年
10 刘天羽;基于特征选择技术的集成学习方法及其应用研究[D];上海大学;2007年
中国硕士学位论文全文数据库 前10条
1 林鸿;EM算法的改进及其在基因序列分析中的应用[D];福州大学;2006年
2 张智勇;基于GMDH的缺失数据插补方法研究[D];四川大学;2007年
3 陈新勇;基于核策略的半监督学习方法研究[D];河北大学;2010年
4 黄明明;半监督学习方法研究及在警用平台中的应用[D];大连理工大学;2010年
5 冯元佶;基于图的半监督学习的改进研究[D];湘潭大学;2010年
6 余养强;半监督学习若干问题的研究[D];福建师范大学;2010年
7 刘伟涛;半监督学习方法及应用研究[D];山东大学;2011年
8 杨伟;半监督学习方法研究[D];国防科学技术大学;2011年
9 杨伟;基于半监督学习的遥感影像分类[D];上海交通大学;2010年
10 蒋延生;基于图的适应性相似度估算的半监督学习[D];大连理工大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026