收藏本站
《福建电脑》 2006年09期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

文本分类关键技术

谷峰  吴扬扬  
【摘要】:本文介绍了文本分类的基本原理及关键技术,讨论目前的一些主要算法,对现有的文本分类算法进行分析和比较,并针对目前文本分类技术的不足之处,提出今后文本分类研究的方向和目标。
【作者单位】华侨大学计算机科学系 华侨大学计算机科学系
【基金】:福建省科技计划项目(2004I014)
【分类号】:TP391.1

【参考文献】
中国期刊全文数据库 前5条
1 程泽凯,陆小艺;文本分类中的特征选择方法[J];安徽工业大学学报(自然科学版);2004年03期
2 龚汉明,周长胜;汉语分词技术综述[J];北京机械工业学院学报;2004年03期
3 刘娇蛟,龚丽,李建华;基于本体实现对网页文本的自动主题分类[J];计算机工程;2003年11期
4 庞剑锋,卜东波,白硕;基于向量空间模型的文本自动分类系统的研究与实现[J];计算机应用研究;2001年09期
5 解冲锋,李 星;基于序列的文本自动分类算法[J];软件学报;2002年04期
【共引文献】
中国期刊全文数据库 前10条
1 张学工;关于统计学习理论与支持向量机[J];自动化学报;2000年01期
2 潘峰,程浩忠,杨镜非,张澄,潘震东;基于支持向量机的电力系统短期负荷预测[J];电网技术;2004年21期
3 李建平,徐伟宣,刘京礼,石勇;消费者信用评估中支持向量机方法研究[J];系统工程;2004年10期
4 陶秀凤,唐诗忠,周鸣争;基于支持向量机的软测量模型及应用[J];安徽工程科技学院学报(自然科学版);2004年02期
5 徐正光,王淑盛,刘冀伟,王志良,史立峰;基于主成分分析的核Fisher判别方法在油水识别中的应用[J];北京科技大学学报;2005年01期
6 战守义,井新;加入时间因素的个性化信息过滤技术[J];北京理工大学学报;2005年09期
7 代劲;胡峰;王国胤;;基于不完备信息系统的文本分类研究与应用[J];重庆邮电学院学报(自然科学版);2006年03期
8 吴德会;王晓红;;基于SVM的传感器动态模型辩识方法[J];传感技术学报;2006年03期
9 常玉清,王福利,王小刚,吕哲;基于支持向量机的生物发酵过程软测量建模[J];东北大学学报(自然科学版);2005年11期
10 吕干云;程浩忠;郑金菊;汪晓东;;基于S变换和多级SVM的电能质量扰动检测识别[J];电工技术学报;2006年01期
中国重要会议论文全文数据库 前10条
1 LI Yawei~a CHEN Shouyu~a XU Dawei~b a School of Civil and Hydraulic Engineering; b 21~(st) Century Development Research Center Dalian University of Technology,Dalian 116024,China;The Support Vector Machine Technique for Concrete Adherence Strength Prediction[A];Proceedings of 6th International Symposium on Test and Measurement(Volume 5)[C];2005年
2 Lin Jipeng Liu Junhua School of Electrical Engineering,Xi'an Jiaotong University,Xi'an 710049,China;A Wavelet Kernel for Support Vector Machine Based on Frame Theory[A];Proceedings of 6th International Symposium on Test and Measurement(Volume 5)[C];2005年
3 Lin Jipeng Liu Junhua School of Electrical Engineering,Xi'an Jiaotong University,Xi'an 710049,China;Support vector machines for multi-component gases classification with wavelet features extraction[A];Proceedings of 6th International Symposium on Test and Measurement(Volume 6)[C];2005年
4 Zhao Shuanzhu Chen Junjie Guo Xin College of Computer and Software Taiyuan University of Technology,Taiyuan,Shanxi,Chnia,030024;Research on the Frame Structure and Its Implement of a Special Field-based Content Information Mining System on Web[A];Proceedings of 6th International Symposium on Test and Measurement(Volume 8)[C];2005年
5 GUO Rong,WANG Wei,WANG Xiaojuan School of Optoelectronical Engineering,Xi'an Technological University,Xi'an,710032;On-line Estimation of Texaco Coal Gasification Quality Based on Support Vector Machine[A];第七届国际测试技术研讨会论文集[C];2007年
6 Hirotaka Nakayama;Yeboon Yun;;REGRESSION BY SUPPORT VECTOR MACHINES AND ITS APPLICATIONS TO ENGINEERING DESIGN[A];Proceedings of the Fourth China-Japan-Korea Joint symposium on Optimization of Structural and Mechanical Systems[C];2006年
7 Yeboon Yun;Hirotaka Nakayama;Min Yoon;;MULTI-OBJECTIVE OPTIMIZATION BASED ON ASPIRATION LEVELS AND APPROXIMATION OF PARETO FRONTIER[A];Proceedings of the Fourth China-Japan-Korea Joint symposium on Optimization of Structural and Mechanical Systems[C];2006年
8 郭锋;刘丽丽;吕凝;;基于LLE和SVM的人像识别方法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
9 张艳宁;郑江滨;赵荣椿;;一种有效的遥感图像识别方法[A];第九届中国体视学与图像分析学术会议论文集[C];2001年
10 石培培;刘红英;;具有单个等式和界约束二次规划的新算法[A];中国运筹学会第八届学术交流会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 马笑潇;智能故障诊断中的机器学习新理论及其应用研究[D];重庆大学;2002年
2 周伟达;核机器学习方法研究[D];西安电子科技大学;2003年
3 解应春;基于Kernel学习机的建模与分类的应用算法研究[D];浙江大学;2003年
4 翟永杰;基于支持向量机的故障智能诊断方法研究[D];华北电力大学(河北);2004年
5 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
6 张翔;支持向量机及其在医学图像分割中的应用[D];华中科技大学;2004年
7 李小平;智能信号分类方法研究[D];西安电子科技大学;2004年
8 宋杰;生物信息数据挖掘中的若干方法及其应用研究[D];大连理工大学;2005年
9 张英;基于支持向量机的过程工业数据挖掘技术研究[D];浙江大学;2005年
10 张国柱;雷达辐射源识别技术研究[D];国防科学技术大学;2005年
中国硕士学位论文全文数据库 前10条
1 梅彬;转炉提钒智能控制模型的研究与应用[D];重庆大学;2002年
2 秦鑫;一种蒙特卡罗贝叶斯分类的改进方法[D];华中师范大学;2004年
3 毛继珮;基于模式识别的汽轮发电机组故障诊断系统[D];华北电力大学(河北);2004年
4 杨传耀;数字图书馆及其分类技术的研究[D];福州大学;2004年
5 林红华;电子商务环境下企业信息的智能统计分析方法研究[D];重庆大学;2004年
6 杨宁;支持向量机在感官评估中的应用研究[D];中国海洋大学;2004年
7 陈荣胜;基于支撑矢量机的入侵检测[D];西安电子科技大学;2005年
8 彭培华;基于克隆选择和统计学习的视频检索[D];西安电子科技大学;2005年
9 陈振国;基于智能计算的入侵检测方法研究[D];西安电子科技大学;2005年
10 郑效来;癫痫脑电信号特征识别与提取的研究[D];大连理工大学;2005年
【同被引文献】
中国期刊全文数据库 前10条
1 殷建平;汉语自动分词方法[J];计算机工程与科学;1998年03期
2 王强 ,王继成 ,武港山 ,张福炎;Web文档清洗系统中HTML解析器的开发[J];计算机应用研究;2002年02期
3 李别;基于神经网络的数据挖掘算法[J];广东技术师范学院学报;2005年04期
4 刘莉,徐玉生,马志新;数据挖掘中数据预处理技术综述[J];甘肃科学学报;2003年01期
5 张玉芳;陈剑敏;熊忠阳;;一种改进的贝叶斯文本分类方法[J];广西师范大学学报(自然科学版);2007年02期
6 陈友,张国基,郭国雄;一种改进的SVM算法及其在证券领域中的应用[J];华南理工大学学报(自然科学版);2003年07期
7 王继成,萧嵘,孙正兴,张福炎;Web信息检索研究进展[J];计算机研究与发展;2001年02期
8 陆玉昌,鲁明羽,李凡,周立柱;向量空间法中单词权重函数的分析和构造[J];计算机研究与发展;2002年10期
9 刘志刚,李德仁,秦前清,史文中;支持向量机在多类分类问题中的推广[J];计算机工程与应用;2004年07期
10 宋玲;马军;连莉;张志军;;文档相似度综合计算研究[J];计算机工程与应用;2006年30期
中国博士学位论文全文数据库 前3条
1 陈定权;自动主题搜索的应用研究[D];中国科学院研究生院(文献情报中心);2003年
2 王秀娟;文本检索中若干问题研究[D];北京邮电大学;2006年
3 陈治平;智能搜索引擎理论与应用研究[D];湖南大学;2003年
中国硕士学位论文全文数据库 前10条
1 侯震宇;主题型搜索引擎的研究与实现[D];中国科学院研究生院(文献情报中心);2003年
2 于瑞萍;中文文本分类相关算法的研究与实现[D];西北大学;2007年
3 傅士光;基于主题的搜索引擎的研究与实现[D];北京交通大学;2007年
4 黄彦;基于高校人力资源的数据挖掘技术研究[D];天津大学;2004年
5 陈杰;主题搜索引擎中网络蜘蛛搜索策略研究[D];浙江大学;2006年
6 陈小颖;人力资源管理系统中数据挖掘技术的应用[D];武汉理工大学;2006年
7 沈斌;基于分词的中文文本相似度计算研究[D];天津财经大学;2006年
8 潘照明;智能中文搜索引擎若干关键技术的研究与实现[D];浙江大学;2006年
9 张会鹏;中文词法分析技术的研究与实现[D];哈尔滨工业大学;2006年
10 董祥千;搜索引擎设计分析与结果聚类改进[D];电子科技大学;2007年
【二级参考文献】
中国期刊全文数据库 前4条
1 范劲松,方廷健;特征选择和提取要素的分析及其评价[J];计算机工程与应用;2001年13期
2 秦进,陈笑蓉,汪维家,陆汝占;文本分类中的特征抽取[J];计算机应用;2003年02期
3 朱靖波,姚天顺;基于FIFA算法的文本分类[J];中文信息学报;2002年03期
4 王科,高常波,翟雪峰,罗万伯;汉语分词的主要技术及其应用展望[J];通信技术;2003年06期
【相似文献】
中国期刊全文数据库 前10条
1 奉国和;郑伟;;文本分类特征降维研究综述[J];图书情报工作;2011年09期
2 冯霞;刘志辉;田继存;;基于假设检验的文本分类特征选择[J];信息与控制;2011年03期
3 潘正高;侯传宇;谈成访;;基于命名实体的Web新闻文本分类方法[J];合肥工业大学学报(自然科学版);2011年08期
4 孟佳娜;林鸿飞;李彦鹏;;基于特征贡献度的特征选择方法在文本分类中应用[J];大连理工大学学报;2011年04期
5 沈友文;赵新建;徐俊;;一种改进的集中度和分散度文本特征选择算法[J];计算机应用与软件;2011年09期
6 周国强;崔荣一;;基于朴素贝叶斯分类器的朝鲜语文本分类的研究[J];中文信息学报;2011年04期
7 高金勇;徐朝军;冯奕竸;;基于迭代的TFIDF在短文本分类中的应用[J];情报理论与实践;2011年06期
8 刘新生;厉锟;;基于BP神经网络的旅游突发事件文本分类系统的设计与实现[J];计算机与现代化;2011年07期
9 张春元;;基于条件随机场的文本分类模型[J];计算机技术与发展;2011年07期
10 赖英旭;许昕;杨震;;基于尾项加权的自适应文本分类方法研究[J];中国科学技术大学学报;2011年07期
中国重要会议论文全文数据库 前10条
1 张永;陈思睿;杨志勇;;一种改进的文本分类方法的研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
2 徐燕;孙春明;王斌;李锦涛;;基于词条频率的特征选择算法研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
3 刘功申;李建华;李生红;;基于类信息的特征选择和加权方法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
4 伍建军;康耀红;;关于文本分类中特征降维方式的研究[A];第三届学生计算语言学研讨会论文集[C];2006年
5 王秀娟;郭军;郑康锋;;基于互信息可信度的特征选择方法[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
6 陈庆轩;郑德权;郑博文;赵铁军;李生;;中文文本分类中基于文档频度分布的特征选择方法[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
7 肖婷;唐雁;;文本分类中特征选择方法及应用[A];2008年计算机应用技术交流会论文集[C];2008年
8 陈克利;宗成庆;王霞;;基于大规模真实文本的平衡语料分析与文本分类方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 杜长海;吉根林;;模糊聚类的最大树法在文本分类中的应用研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
10 海丽且木·艾沙;维尼拉·木沙江;;Web文本分类及其维、哈、柯多文种信息检索中的应用研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
中国重要报纸全文数据库 前2条
1 希安;微软试水信息检索[N];经济日报;2004年
2 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
中国博士学位论文全文数据库 前10条
1 王博;文本分类中特征选择技术的研究[D];国防科学技术大学;2009年
2 冯国忠;文本分类中的贝叶斯特征选择[D];东北师范大学;2011年
3 章舜仲;文本分类中词共现关系的研究及其应用[D];南京理工大学;2010年
4 孟佳娜;迁移学习在文本分类中的应用研究[D];大连理工大学;2011年
5 韦娜;基于内容图像检索关键技术研究[D];西北大学;2006年
6 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
7 燕忠;基于蚁群优化算法的若干问题的研究[D];东南大学;2005年
8 陈晓云;文本挖掘若干关键技术研究[D];复旦大学;2005年
9 李勇明;尿沉渣图像自动识别算法的研究[D];重庆大学;2007年
10 杨水山;冷轧带钢表面缺陷机器视觉自动检测技术研究[D];哈尔滨工业大学;2009年
中国硕士学位论文全文数据库 前10条
1 黄启虎;基于仿生模式识别的文本分类技术研究[D];哈尔滨工业大学;2008年
2 董梅;文本内容的信息过滤技术研究[D];合肥工业大学;2006年
3 孟杰;基于构造性覆盖算法的中文文本分类[D];安徽大学;2007年
4 马宏伟;基于SVM的中文文本分类系统的建模与实现[D];大连理工大学;2006年
5 王小燕;文本分类相关技术与应用研究[D];西北大学;2007年
6 王新丽;中文文本分类系统的研究与实现[D];天津大学;2007年
7 陈超;基于支持向量机的中文文本分类的系统研究[D];武汉理工大学;2007年
8 张俊丽;文本分类中的关键技术研究[D];华中师范大学;2008年
9 王生新;基于支持向量机的文本分类研究[D];哈尔滨工程大学;2008年
10 吕小勇;多标签文本分类算法研究[D];山西财经大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026