收藏本站
《计算机技术与发展》 2011年07期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于条件随机场的文本分类模型

张春元  
【摘要】:条件随机场(CRFs)是一种十分优秀的统计学习模型,文中尝试将其引入到文本分类之中,提出了一种基于CRFs的文本分类模型。首先通过特征选择将待分类文档和文档类别分别表示成为CRFs的观察序列和状态序列,然后使用文本分类相关领域知识定义特征函数来提取序列之间的关联特征,再采用前向或后向算法评估出给定观察序列条件下各状态序列的概率,据此实现待分类文档的分类。分析表明,这种新模型语义清晰,计算直观,易于融合各种文本分类领域知识,分类效率较高。
【作者单位】海南大学信息科学技术学院;
【基金】:国家自然科学基金资助项目(60863001)
【分类号】:TP391.1

【参考文献】
中国期刊全文数据库 前1条
1 李荣陆,王建会,陈晓云,陶晓鹏,胡运发;使用最大熵模型进行中文文本分类[J];计算机研究与发展;2005年01期
【共引文献】
中国期刊全文数据库 前10条
1 尚文倩;黄厚宽;刘玉玲;林永民;瞿有利;董红斌;;文本分类中基于基尼指数的特征选择算法研究[J];计算机研究与发展;2006年10期
2 贾宁;;使用概念基元特征进行自动文本分类[J];计算机工程与应用;2007年01期
3 赵建国;吴军;钱起霖;龚昌明;;文献信息分类的代数学方法研究[J];军事运筹与系统工程;2006年02期
4 黄名选;严小卫;张师超;;查询扩展技术进展与展望[J];计算机应用与软件;2007年11期
5 崔彩霞;王素格;;基于粗集的支持向量机文本分类方法研究[J];科技广场;2006年08期
6 孙景广;蔡东风;吕德新;董燕举;;基于知网的中文问题自动分类[J];中文信息学报;2007年01期
7 刘海峰;王元元;王倩;;基于分类的VSM模式下文本检索研究[J];情报科学;2006年11期
8 刘海峰;王元元;;基于向量模型的文本检索若干问题研究[J];情报杂志;2006年10期
9 苏金树;张博锋;徐昕;;基于机器学习的文本分类技术研究进展[J];软件学报;2006年09期
10 范春晓;张洪宇;于中强;;基于P2P技术的信息获取方案研究[J];铁路计算机应用;2006年09期
中国博士学位论文全文数据库 前7条
1 孟静;光学层析图像的重建技术研究[D];苏州大学;2006年
2 古平;基于贝叶斯模型的文档分类及相关技术研究[D];重庆大学;2006年
3 杨传耀;中文信息检索索引模型及相关技术研究[D];复旦大学;2007年
4 王树梅;信息检索相关技术研究[D];南京理工大学;2007年
5 颜端武;面向知识服务的智能推荐系统研究[D];南京理工大学;2007年
6 周顺先;文本信息抽取模型及算法研究[D];湖南大学;2007年
7 尚文倩;文本分类及其相关技术研究[D];北京交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 赵巍;基于聚类的网页相关性挖掘技术研究[D];东北师范大学;2005年
2 崔彩霞;基于支持向量机的文本分类方法研究[D];山西大学;2005年
3 马忠宝;基于支持向量机的中文文本分类系统研究[D];武汉理工大学;2006年
4 杨军玲;汉语动词词语搭配自动获取方法研究[D];山西大学;2006年
5 樊景超;基于SDD中文农业网页搜索系统的设计与实现[D];中国农业科学院;2006年
6 毛伟;基于统计语言模型的中文自动文本分类系统[D];北京邮电大学;2006年
7 叶浩;基于类信息的潜在语义多类文本分类模型研究[D];江西师范大学;2006年
8 司广涛;基于最大熵模型的垃圾邮件过滤系统研究[D];苏州大学;2006年
9 张晓卫;Web全文信息检索系统的研究与实现[D];苏州大学;2006年
10 修宇;方向性聚类技术及其应用[D];江南大学;2006年
【二级参考文献】
中国期刊全文数据库 前2条
1 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期
2 王雷;陈治平;李志成;;基于文本分块的多模板隐马尔可夫模型的文本信息抽取[J];山东大学学报(理学版);2006年03期
【相似文献】
中国期刊全文数据库 前10条
1 郑海,林鸿飞;基于段落匹配的文本分类机制[J];计算机工程与应用;2004年28期
2 王丁,运海红,张辉;文本自动分类系统的研究与实现[J];信息技术;2005年03期
3 杜志文;曾文华;;网格计算在文本分类中的应用[J];微电子学与计算机;2006年S1期
4 崔彩霞;王素格;;基于粗集的支持向量机文本分类方法研究[J];科技广场;2006年08期
5 祝晓鲁;白振兴;贾海燕;;自动文本分类技术研究[J];现代电子技术;2007年03期
6 张桂芸;刘洋;王元元;;基于模糊认知图的文本分类推理算法[J];计算机工程与应用;2007年12期
7 陈莲娜;姚伏天;;用于文本分类的多核SVM算法研究[J];计算机工程;2007年09期
8 王倩倩;段震;张燕平;;基于交叉覆盖算法的文本分类[J];计算机技术与发展;2007年06期
9 董梅;胡学钢;;基于多特征选择的中文文本分类[J];计算机技术与发展;2007年07期
10 巩知乐;张德贤;;文本挖掘理论概述[J];福建电脑;2008年09期
中国重要会议论文全文数据库 前10条
1 陈克利;宗成庆;王霞;;基于大规模真实文本的平衡语料分析与文本分类方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 杜长海;吉根林;;模糊聚类的最大树法在文本分类中的应用研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
3 海丽且木·艾沙;维尼拉·木沙江;;Web文本分类及其维、哈、柯多文种信息检索中的应用研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
4 胡俊;黄厚宽;;一种基于SVM的可视化文本分类的方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
5 朱慕华;陈文亮;朱靖波;;词聚类在文本分类中的应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 贾会强;刘晓丽;于洪志;;基于词性特征提取的藏文文本分类方法研究[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
7 房一飞;张冬茉;;基于boosting的文本分类在股市领域信息抽取系统中的应用[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
8 肖婷;唐雁;;文本分类中特征选择方法及应用[A];2008年计算机应用技术交流会论文集[C];2008年
9 赵修湘;石勇;刘莹;张玲玲;;文本分类在软件缺陷管理中的应用[A];第四届(2009)中国管理学年会——管理科学与工程分会场论文集[C];2009年
10 徐志明;丛帅;王宇颖;雷萌;;基于仿生模式识别文本分类算法[A];第五届全国信息检索学术会议论文集[C];2009年
中国重要报纸全文数据库 前2条
1 希安;微软试水信息检索[N];经济日报;2004年
2 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
中国博士学位论文全文数据库 前10条
1 章舜仲;文本分类中词共现关系的研究及其应用[D];南京理工大学;2010年
2 孟佳娜;迁移学习在文本分类中的应用研究[D];大连理工大学;2011年
3 李智星;用于文本分类的简明语义分析技术研究[D];重庆大学;2011年
4 刘伍颖;面向垃圾信息过滤的主动多域学习文本分类方法研究[D];国防科学技术大学;2011年
5 王博;文本分类中特征选择技术的研究[D];国防科学技术大学;2009年
6 冯国忠;文本分类中的贝叶斯特征选择[D];东北师范大学;2011年
7 平源;基于支持向量机的聚类及文本分类研究[D];北京邮电大学;2012年
8 祝翠玲;基于类别结构的文本层次分类方法研究[D];山东大学;2011年
9 王占一;Web文本挖掘中若干问题的研究[D];北京邮电大学;2012年
10 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
中国硕士学位论文全文数据库 前10条
1 张彪;文本分类中特征选择算法的分析与研究[D];中国科学技术大学;2010年
2 张保富;基于粗糙集的中文文本分类算法研究及应用[D];江苏大学;2010年
3 蒋健;文本分类中特征提取和特征加权方法研究[D];重庆大学;2010年
4 闫晨;KNN文本分类研究[D];燕山大学;2010年
5 苏小康;基于维基百科构建语义知识库及其在文本分类领域的应用研究[D];华中师范大学;2010年
6 李璇;基于坐标下降法的半监督学习算法及其在文本分类中的应用[D];华南理工大学;2010年
7 宋志理;基于LDA模型的文本分类研究[D];西安理工大学;2010年
8 郭志毅;基于EM算法的半监督文本分类方法研究[D];重庆邮电大学;2010年
9 郭明;基于文本分类技术的文本情感倾向性研究[D];郑州大学;2010年
10 段江丽;基于SVM的文本分类系统中特征选择与权重计算算法的研究[D];太原理工大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026