收藏本站
《计算机应用研究》 2004年07期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

文本分类技术研究

高洁  吉根林  
【摘要】:对文本分类技术进行研究 ,介绍文本分类的基本过程 ,论述文本特征提取方法 ,讨论朴素贝叶斯、K 近邻、支持向量机、投票等常用的文本分类原理与方法 ,探讨中文文本分类技术

手机知网App
【引证文献】
中国博士学位论文全文数据库 前2条
1 石陆魁;非线性维数约减算法中若干关键问题的研究[D];天津大学;2005年
2 尹世群;Web文本分类关键技术研究[D];西南大学;2008年
中国硕士学位论文全文数据库 前10条
1 沈斌;基于分词的中文文本相似度计算研究[D];天津财经大学;2006年
2 柯慧燕;Web文本分类研究及应用[D];武汉理工大学;2006年
3 郭琛;数字图书馆的中文网页文本分类器研究[D];武汉理工大学;2005年
4 凌菁;基于数据挖掘的中文垃圾邮件过滤方法研究与实现[D];广东工业大学;2005年
5 任爽;基于XML和SVM的Web文本挖掘研究[D];大连理工大学;2006年
6 朱祥玉;基于向量空间模型的自适应文本过滤系统研究[D];山东师范大学;2006年
7 祁淑霞;基于IA的企业网站建设[D];山东师范大学;2005年
8 王宇;基于TFIDF的文本分类算法研究[D];郑州大学;2006年
9 肖雪;中文文本层次分类研究及其在唐诗分类中的应用[D];重庆大学;2006年
10 马志柔;中文信息检索分类技术的研究[D];北京化工大学;2005年
【参考文献】
中国期刊全文数据库 前4条
1 朱华宇,孙正兴,张福炎;一个基于向量空间模型的中文文本自动分类系统[J];计算机工程;2001年02期
2 贺海军,王建芬,周青,曹元大;基于决策支持向量机的中文网页分类器[J];计算机工程;2003年02期
3 苏伟峰,李绍滋,李堂秋;一个基于概念的中文文本分类模型[J];计算机工程与应用;2002年06期
4 解冲锋,李 星;基于序列的文本自动分类算法[J];软件学报;2002年04期
【共引文献】
中国期刊全文数据库 前10条
1 许云,樊孝忠,张锋;一种不需分词的中文文本分类方法[J];北京理工大学学报;2005年09期
2 张莉,康耀红,王曙光,张春元;中文网页自动分类现状的研究[J];福建电脑;2004年05期
3 谷峰;吴扬扬;;文本分类关键技术[J];福建电脑;2006年09期
4 索红光;杨涛;;基于互信息的Web文档聚类方法[J];广西师范大学学报(自然科学版);2007年02期
5 吴志峰,田学东;人名、机构名在基于概念的文本分类中的应用研究[J];河北大学学报(自然科学版);2004年06期
6 钟茂生;WEB页面的模糊聚类[J];华东交通大学学报;2004年05期
7 袁方,杨柳,张红霞;基于k-近邻方法的渐进式中文文本分类技术[J];华南理工大学学报(自然科学版);2004年S1期
8 李凡,林爱武,陈国社;一种基于VSM文本分类系统的设计与实现[J];华中科技大学学报(自然科学版);2005年03期
9 王梦云,王素格;一个基于字特征的文本分类模型[J];计算机工程与应用;2004年13期
10 王朝静,郑庆华;面向答疑文本的词类标注方法的研究与实现[J];计算机工程与应用;2004年16期
中国重要会议论文全文数据库 前1条
1 周雪忠;方青;吴朝晖;;中文文本分类特征表示及分类方法比较研究[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
中国博士学位论文全文数据库 前10条
1 朱征宇;Web资源组织与服务性能研究[D];重庆大学;2003年
2 徐建锁;知识管理和文本挖掘的若干问题研究[D];天津大学;2004年
3 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
4 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
5 张榕;术语定义抽取、聚类与术语识别研究[D];北京语言大学;2006年
6 柏宏权;适应性教学系统中个性化教学策略研究[D];南京师范大学;2006年
7 周瑛;神经网络作为分类器的算法研究及在信息检索中的应用[D];安徽大学;2006年
8 古平;基于贝叶斯模型的文档分类及相关技术研究[D];重庆大学;2006年
9 熊云波;文本信息处理的若干关键技术研究[D];复旦大学;2006年
10 王永恒;海量短语信息挖掘技术的研究与实现[D];国防科学技术大学;2006年
中国硕士学位论文全文数据库 前10条
1 苏伟峰;基于概念的文本自动分类研究[D];厦门大学;2002年
2 陈乐;基于智能文本分类技术的素材管理软件的设计与开发[D];南京师范大学;2003年
3 张海燕;基于分词的中文文本自动分类研究与实现[D];湖南大学;2002年
4 姚松源;文本自动分类系统的研究与实现[D];北京工业大学;2003年
5 胡蓉;中文Web文档倾向性自动分类研究[D];四川大学;2003年
6 刘钢;基于神经网络的文本分类系统NNTCS的设计和实现[D];中国科学院研究生院(软件研究所);2003年
7 黄海英;基于概念空间的文本分类的应用研究[D];广西师范大学;2002年
8 湛燕;K-近邻、K-均值及其在文本分类中的应用[D];河北大学;2003年
9 赵海雁;基于数据链路层数据捕获与信息过滤[D];华北工学院;2004年
10 马国俊;潜在语义索引在中文文本聚类中的应用研究[D];西安建筑科技大学;2004年
【同被引文献】
中国期刊全文数据库 前10条
1 盛晓炜,江铭虎;基于Rough集约简算法的中文文本自动分类系统[J];电子与信息学报;2005年07期
2 李道国,苗夺谦,张红云;粒度计算的理论、模型与方法[J];复旦学报(自然科学版);2004年05期
3 李道国;苗夺谦;张东星;张红云;;粒度计算研究综述[J];计算机科学;2005年09期
4 刘少辉,盛秋戬,吴斌,史忠植,胡斐;Rough集高效算法的研究[J];计算机学报;2003年05期
5 唐年亚;陈丽琛;邱幸凡;张六通;;从六淫邪气论毒邪[J];湖北中医学院学报;2006年03期
6 王小虎;关联规则挖掘综述[J];计算机工程与应用;2003年33期
7 高常青;黄克正;张勇;;TRIZ理论在产品创新设计中的应用[J];机械科学与技术;2006年04期
8 常富业,王永炎;中风病毒邪论[J];北京中医药大学学报;2004年01期
9 王永炎,常富业,杨宝琴;病络与络病对比研究[J];北京中医药大学学报;2005年03期
10 贾春华;王永炎;黄启福;鲁兆麟;王庆国;;从逻辑的观点看——“以象为素,以素为候,以候为证”[J];北京中医药大学学报;2006年01期
中国重要会议论文全文数据库 前1条
1 时达明;林鸿飞;;基于内容相关度和情感分析的Blogger声誉度研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 张雪英;基于粗糙集理论的文本自动分类研究[D];南京理工大学;2005年
2 王珏;粗糙集理论及其应用研究[D];西安电子科技大学;2005年
3 赵晖;支持向量机分类方法及其在文本分类中的应用研究[D];大连理工大学;2006年
4 王明春;基于粗糙集的数据及文本挖掘方法研究[D];天津大学;2005年
5 谭松波;高性能文本分类算法研究[D];中国科学院研究生院(计算技术研究所);2006年
6 刘少辉;知识发现中粗糙集理论的研究[D];中国科学院研究生院(计算技术研究所);2003年
7 杜卫锋;粗糙集理论在中文文本分类中的应用[D];西南交通大学;2006年
8 刘勇;基于粒度计算的知识发现研究及其应用[D];浙江大学;2006年
9 尚文倩;文本分类及其相关技术研究[D];北京交通大学;2007年
10 宋诚挚;中医学的思维模式[D];黑龙江中医药大学;2001年
中国硕士学位论文全文数据库 前10条
1 李军;粗糙集理论中的约简算法研究[D];吉林大学;2004年
2 张宝辉;模块化总体设计研究[D];国防科学技术大学;2004年
3 方明;基于系统工程视角的综合报警系统研究[D];西北工业大学;2007年
4 钱小军;Web文本挖掘技术研究及其实现[D];浙江大学;2002年
5 杨昂;文本分类算法研究[D];湖南大学;2002年
6 李勇;智能检索中基于本体的个性化用户建模技术及应用[D];国防科学技术大学;2002年
7 胡红霞;Web敏感页面发现技术研究[D];中国人民解放军信息工程大学;2002年
8 石霞军;邮件信息过滤算法研究与实现[D];湖南大学;2002年
9 苏伟峰;基于概念的文本自动分类研究[D];厦门大学;2002年
10 周威成;信息过滤方法的研究与应用[D];华北电力大学(北京);2003年
【二级引证文献】
中国硕士学位论文全文数据库 前10条
1 吕青普;科技文档的分类与查重[D];天津财经大学;2007年
2 刘毅;基于粗糙集的文本分类技术研究[D];西南交通大学;2007年
3 刘建涛;数字图书馆用户行为研究[D];武汉理工大学;2007年
4 赵军;基于音节统计语言模型蒙古文词汇分析校正器的设计与实现[D];内蒙古大学;2007年
5 王雪飞;词间相关性对文本分类的影响[D];南京理工大学;2007年
6 苏振魁;基于马尔科夫模型的文本相似度研究[D];大连理工大学;2007年
7 吕静;基于Rough集理论的信息过滤研究[D];南昌大学;2007年
8 方利伟;个性化在线答疑系统的研究与实现[D];浙江师范大学;2007年
9 郑奎;WEB点击流构建个性化信息服务[D];上海交通大学;2008年
10 曹勇;中文Web文本分类技术研究[D];厦门大学;2007年
【二级参考文献】
中国期刊全文数据库 前3条
1 李蕾,钟义信,郭祥昊;全信息理论在自动文摘系统中的应用[J];计算机工程与应用;2000年01期
2 李晓黎,刘继敏,史忠植;基于支持向量机与无监督聚类相结合的中文网页分类器[J];计算机学报;2001年01期
3 曹素丽,曾伏虎,曹焕光;基于汉字字频向量的中文文本自动分类系统[J];山西大学学报(自然科学版);1999年02期
【相似文献】
中国重要会议论文全文数据库 前10条
1 陈克利;宗成庆;王霞;;基于大规模真实文本的平衡语料分析与文本分类方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 杜长海;吉根林;;模糊聚类的最大树法在文本分类中的应用研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
3 海丽且木·艾沙;维尼拉·木沙江;;Web文本分类及其维、哈、柯多文种信息检索中的应用研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
4 胡俊;黄厚宽;;一种基于SVM的可视化文本分类的方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
5 朱慕华;陈文亮;朱靖波;;词聚类在文本分类中的应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 贾会强;刘晓丽;于洪志;;基于词性特征提取的藏文文本分类方法研究[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
7 房一飞;张冬茉;;基于boosting的文本分类在股市领域信息抽取系统中的应用[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
8 肖婷;唐雁;;文本分类中特征选择方法及应用[A];2008年计算机应用技术交流会论文集[C];2008年
9 赵修湘;石勇;刘莹;张玲玲;;文本分类在软件缺陷管理中的应用[A];第四届(2009)中国管理学年会——管理科学与工程分会场论文集[C];2009年
10 徐志明;丛帅;王宇颖;雷萌;;基于仿生模式识别文本分类算法[A];第五届全国信息检索学术会议论文集[C];2009年
中国重要报纸全文数据库 前2条
1 希安;微软试水信息检索[N];经济日报;2004年
2 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
中国博士学位论文全文数据库 前10条
1 章舜仲;文本分类中词共现关系的研究及其应用[D];南京理工大学;2010年
2 孟佳娜;迁移学习在文本分类中的应用研究[D];大连理工大学;2011年
3 李智星;用于文本分类的简明语义分析技术研究[D];重庆大学;2011年
4 刘伍颖;面向垃圾信息过滤的主动多域学习文本分类方法研究[D];国防科学技术大学;2011年
5 王博;文本分类中特征选择技术的研究[D];国防科学技术大学;2009年
6 冯国忠;文本分类中的贝叶斯特征选择[D];东北师范大学;2011年
7 平源;基于支持向量机的聚类及文本分类研究[D];北京邮电大学;2012年
8 祝翠玲;基于类别结构的文本层次分类方法研究[D];山东大学;2011年
9 王占一;Web文本挖掘中若干问题的研究[D];北京邮电大学;2012年
10 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
中国硕士学位论文全文数据库 前10条
1 张彪;文本分类中特征选择算法的分析与研究[D];中国科学技术大学;2010年
2 叶磊;电子公告系统环境中的数据挖掘技术设计与实现[D];华东交通大学;2009年
3 张保富;基于粗糙集的中文文本分类算法研究及应用[D];江苏大学;2010年
4 蒋健;文本分类中特征提取和特征加权方法研究[D];重庆大学;2010年
5 闫晨;KNN文本分类研究[D];燕山大学;2010年
6 苏小康;基于维基百科构建语义知识库及其在文本分类领域的应用研究[D];华中师范大学;2010年
7 李璇;基于坐标下降法的半监督学习算法及其在文本分类中的应用[D];华南理工大学;2010年
8 宋志理;基于LDA模型的文本分类研究[D];西安理工大学;2010年
9 郭志毅;基于EM算法的半监督文本分类方法研究[D];重庆邮电大学;2010年
10 吕小勇;多标签文本分类算法研究[D];山西财经大学;2010年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026