收藏本站
《软件学报》 2002年04期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于序列的文本自动分类算法

解冲锋  李 星  
【摘要】:提出了一种基于序列的文本自动分类算法.该算法利用了文本中两个层次的语义相关性:句子(子模式)之间的相关性和句子内代表特定含义的关键词(概念节点)之间的相关性,这样就实现了对关键词的动态加权.对于不含有关键词的子模式,采用Markov模型来对其信号幅度进行估计,从而生成一个待分类文本的特征序列.在中文文本分类实验中,可以达到83%的BEP值.此外,该算法在实际系统中容易实现.

【引证文献】
中国期刊全文数据库 前10条
1 薛松;张钟澍;殷知磊;;贝叶斯算法在反垃圾邮件应用中的改进方案[J];成都信息工程学院学报;2009年04期
2 陈华月;;结合用户长期兴趣和近期兴趣的个性化推荐模型[J];电脑知识与技术;2011年22期
3 谷峰;吴扬扬;;文本分类关键技术[J];福建电脑;2006年09期
4 丁文斌,李斌,罗浩;基于改进贝叶斯的垃圾邮件过滤系统设计与实现[J];计算机工程与应用;2005年18期
5 杜长海;吉根林;;模糊聚类在中文文本分类中的应用研究[J];计算机工程与应用;2006年08期
6 崔春生;吴祈宗;王莹;;用于推荐系统聚类分析的用户兴趣度研究[J];计算机工程与应用;2011年07期
7 朱征宇;张小林;熊茜;谢祈鸿;;基于用户兴趣子类的协作推荐算法[J];计算机科学;2005年10期
8 李学相;;改进的最大熵权值算法在文本分类中的应用[J];计算机科学;2012年06期
9 李国臣,段建勇;基于模糊集的名词细分类研究[J];计算机工程;2004年01期
10 陈华月,朱征宇;基于用户近期兴趣视图的个性化推荐[J];计算机工程;2005年20期
中国博士学位论文全文数据库 前10条
1 孟佳娜;迁移学习在文本分类中的应用研究[D];大连理工大学;2011年
2 朱征宇;Web资源组织与服务性能研究[D];重庆大学;2003年
3 徐建锁;知识管理和文本挖掘的若干问题研究[D];天津大学;2004年
4 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
5 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
6 柏宏权;适应性教学系统中个性化教学策略研究[D];南京师范大学;2006年
7 周瑛;神经网络作为分类器的算法研究及在信息检索中的应用[D];安徽大学;2006年
8 古平;基于贝叶斯模型的文档分类及相关技术研究[D];重庆大学;2006年
9 熊云波;文本信息处理的若干关键技术研究[D];复旦大学;2006年
10 张博锋;面向内容安全的文本分类研究[D];国防科学技术大学;2007年
中国硕士学位论文全文数据库 前10条
1 刘伟丽;基于粒子群算法和支持向量机的中文文本分类研究[D];河南工业大学;2010年
2 吴义国;支持向量机研究及其在文本分类中的应用[D];广东工业大学;2011年
3 赵德圣;基于关联技术的中文文本分类研究[D];南京理工大学;2011年
4 匡巧艳;面向G2C交互平台的Web文本挖掘模型和方法研究[D];湖南大学;2009年
5 刘小荣;基于聚类分析的图模型文本分类[D];内蒙古科技大学;2011年
6 郝建斌;基于模糊理论的Web用户聚类的研究[D];北京理工大学;2011年
7 马国俊;潜在语义索引在中文文本聚类中的应用研究[D];西安建筑科技大学;2004年
8 马建斌;基于SVM的中文电子邮件作者身份挖掘技术研究[D];河北农业大学;2004年
9 高洁;增量式中文文本分类算法研究与实现[D];南京师范大学;2004年
10 付关友;基于浏览行为分析的用户兴趣挖掘[D];重庆大学;2004年
【共引文献】
中国期刊全文数据库 前10条
1 杨日杰;吴芳;徐俊艳;高青伟;;基于马尔可夫过程的水下运动目标启发式搜索[J];兵工学报;2010年05期
2 邓兵;王旭;陶然;刘贤忠;;基于分数阶傅里叶变换的线性调频脉冲时延估计特性分析[J];兵工学报;2012年06期
3 白剑,杨亚飞,徐迎晖,杨榆,杨义先;基于恒虚警的信号检测迭代算法[J];北京邮电大学学报;2005年02期
4 杨福俊,云大真;干涉条纹相位检测数字信号处理系统研究[J];大连理工大学学报;2002年05期
5 吴芳;杨日杰;高青伟;;基于马尔可夫过程的水下运动目标启发式搜索[J];电子与信息学报;2010年05期
6 杨福俊,孙平,云大真;自适应统计滤波的单幅干涉条纹图相位解调研究[J];光学技术;2002年03期
7 王勇,廖延彪,田芊;波长扫描法布里-珀罗干涉仪的优化设计[J];光学学报;1999年10期
8 朱爱华,靳世久,曾周末;卡尔曼滤波在管道泄漏检测中的应用[J];化工自动化及仪表;2005年05期
9 吴文全,察豪;小样本采样数据的预处理[J];海军工程大学学报;2004年03期
10 钱玉莹;李淑华;叶灵伟;;雷达接收机灵敏度自动测试方案设计[J];科学技术与工程;2010年26期
中国重要会议论文全文数据库 前1条
1 金朝晖;钱惠生;刘顺兰;;Morlet小波在跳频信号检测和估计中的应用[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
中国博士学位论文全文数据库 前5条
1 杨福俊;光测条纹统计处理与卷积形貌检测方法和光弹性的应用研究[D];大连理工大学;2002年
2 陈永倩;计算智能方法在非合作信号参量估计中的应用研究[D];电子科技大学;2005年
3 王洪;宽带数字接收机关键技术研究及系统实现[D];电子科技大学;2007年
4 赵建宏;低空目标探测及宽带雷达信号检测研究[D];电子科技大学;2008年
5 何伟基;电子倍增CCD的倍增机制及其在光子计数成像的应用[D];南京理工大学;2009年
中国硕士学位论文全文数据库 前10条
1 陈胜春;城市重点污染源在线监控数据管理系统设计方案[D];电子科技大学;2010年
2 尧海昌;LTE系统信号检测技术研究[D];南京邮电大学;2011年
3 濮俊杰;非周期性扩频信号的检测与估计[D];杭州电子科技大学;2009年
4 吴继红;高压除鳞水泵机组在线监测诊断系统的研制[D];重庆大学;2002年
5 黄红星;合成孔径雷达(SAR)成像技术研究[D];武汉理工大学;2003年
6 包象阳;雷达中频数字接收机的研制[D];电子科技大学;2003年
7 梁峰;Robust检测技术及其在水声信号处理中的应用研究[D];西北工业大学;2002年
8 覃志宏;卷烟包装生产线风送除尘风机状态监测与故障诊断系统[D];重庆大学;2003年
9 刘春华;包装设备的管理与维修技术研究及应用[D];重庆大学;2003年
10 杨启成;卷烟成品柔性搬运系统高可靠性的研究及实现[D];重庆大学;2003年
【同被引文献】
中国期刊全文数据库 前10条
1 李文斌,刘椿年,黄佳进;基于数据挖掘的垃圾E-mail过滤方法[J];北京工业大学学报;2003年02期
2 龚汉明,周长胜;汉语分词技术综述[J];北京机械工业学院学报;2004年03期
3 梁南元;书面汉语的自动分词与一个自动分词系统—CDWS[J];北京航空学院学报;1984年04期
4 顾益军,樊孝忠,王建华,汪涛,黄维金;中文停用词表的自动选取[J];北京理工大学学报;2005年04期
5 许云,樊孝忠,张锋;一种不需分词的中文文本分类方法[J];北京理工大学学报;2005年09期
6 陈琦,张建伟;信息时代的整合性学习模型——信息技术整合于教学的生态观诠释[J];北京大学教育评论;2003年03期
7 孙健,王伟,钟义信;基于K-最近距离的自动文本分类的研究[J];北京邮电大学学报;2001年01期
8 肖丁;李琳;张雷;王柏;;以活动为中心的电信企业收入保障过程元模型[J];北京邮电大学学报;2006年S1期
9 李巍;孙涛;陈建孝;罗梓恒;李雄飞;;基于加权余弦相似度的XML文档聚类研究[J];吉林大学学报(信息科学版);2010年01期
10 王伟;;面向未来的计算模式——普适计算[J];成都电子机械高等专科学校学报;2005年04期
中国重要会议论文全文数据库 前2条
1 李正学;吴微;;引入技术指标的BP网络在沪市综合指数涨跌预测中的应用[A];Data Analysis, Econo-physics and Risk Management--Proceedings of CCAST (World Laboratory) Workshop[C];2001年
2 白硕;程学旗;郭莉;王斌;余智华;刘群;;大规模内容计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国博士学位论文全文数据库 前10条
1 肖明;WWW科技信息资源自动标引的理论与实践研究[D];中国科学院文献情报中心;2001年
2 吴涛;构造性知识发现方法研究[D];安徽大学;2003年
3 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年
4 杨旭华;神经网络及其在控制中的应用研究[D];浙江大学;2004年
5 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
6 薛德军;中文文本自动分类中的关键问题研究[D];清华大学;2004年
7 邵郅邛;连续感知器学习算法的有限收敛性及连续距离转换神经网络[D];大连理工大学;2005年
8 张雪英;基于粗糙集理论的文本自动分类研究[D];南京理工大学;2005年
9 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
10 陈晓云;文本挖掘若干关键技术研究[D];复旦大学;2005年
中国硕士学位论文全文数据库 前10条
1 都云琪;中文文本自动分类的研究与实现[D];西安电子科技大学;2002年
2 李勇;智能检索中基于本体的个性化用户建模技术及应用[D];国防科学技术大学;2002年
3 孙丽华;中文文本自动分类的研究[D];哈尔滨工程大学;2002年
4 苏伟峰;基于概念的文本自动分类研究[D];厦门大学;2002年
5 张海燕;基于分词的中文文本自动分类研究与实现[D];湖南大学;2002年
6 张玉红;基于概念格扩展模型的分类问题研究[D];合肥工业大学;2004年
7 蒋伟贞;基于类别的特征选择算法的文本分类系统[D];西南交通大学;2004年
8 付关友;基于浏览行为分析的用户兴趣挖掘[D];重庆大学;2004年
9 张清;高速网络的内容监控过滤技术的研究与实现[D];电子科技大学;2005年
10 钱宇华;基于粗糙集的粒度计算理论与方法研究[D];山西大学;2005年
【二级引证文献】
中国期刊全文数据库 前10条
1 陈基漓;牛秦洲;;WEB挖掘在农业信息网站个性化服务中的应用[J];安徽农业科学;2008年35期
2 陈键;胡学刚;;词分布均衡度评价特征词选取方法的文本分类[J];安徽科技学院学报;2009年02期
3 翟剑锋;;聚类支持下决策树模型的借阅数据分析[J];信息安全与技术;2012年03期
4 宋涛;施水才;房祥;吕学强;;基于改进的潜在语义分析的文本聚类[J];北京信息科技大学学报(自然科学版);2012年03期
5 李荣艳;金鑫;王春辉;郑宁;别荣芳;;一种新的中文文本分类算法[J];北京师范大学学报(自然科学版);2006年05期
6 陈风雷;;对信息时代职业学校计算机学科的思考[J];才智;2011年30期
7 冀胜利;李波;;基于SVM的中文文本分类算法[J];重庆工学院学报(自然科学版);2008年07期
8 樊雷;马文杰;孙健波;;基于MVC的适应性超媒体教学系统设计[J];长江大学学报(自然科学版);2011年10期
9 陈华月;裴仰军;蒲静;;基于用户访问模式的个性化远程教育系统研究[J];重庆科技学院学报(自然科学版);2011年04期
10 朱君;曲超;汤庸;;利用单词超团的二分图文本聚类算法[J];电子科技大学学报;2008年03期
中国重要会议论文全文数据库 前9条
1 肖婷;唐雁;;文本分类中特征选择方法及应用[A];2008年计算机应用技术交流会论文集[C];2008年
2 刘华;张普;;面向词典编纂的词汇聚类研究[A];2004年辞书与数字化研讨会论文集[C];2004年
3 罗云飞;李国臣;;采用优先选择策略的中文人称代词的指代消解[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 刘华;周凌燕;张普;;面向词典编撰的词汇聚类研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
5 郭庆军;赵燕平;;一种简单的基于奖励机制的文本分类算法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
6 海丽且木·艾沙;维尼拉·木沙江;;Web文本分类及其维、哈、柯多文种信息检索中的应用研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
7 李月伦;李湘;常宝宝;袁毓林;;一种基于认知情景框架的文本分类方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
8 钱铁云;冯小年;王元珍;;prefix-hash-tree的插入、查找和重构算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
9 刘勘;尹承明;陈凡;;图书借阅信息的分析与挖掘[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
中国博士学位论文全文数据库 前10条
1 祁瑞华;不完整数据分类知识发现算法研究[D];大连理工大学;2011年
2 孟佳娜;迁移学习在文本分类中的应用研究[D];大连理工大学;2011年
3 王晓娟;多目标柔性作业车间调度方法研究[D];华中科技大学;2011年
4 杨晓蓉;分布式农业科技信息共享关键技术研究与应用[D];中国农业科学院;2011年
5 刘玉国;基于内容的互联网舆情信息挖掘关键技术研究[D];山东大学;2011年
6 田俊华;基于本体知识库的教学资源自动采集技术研究[D];南京师范大学;2011年
7 代劲;云模型在文本挖掘应用中的关键问题研究[D];重庆大学;2011年
8 管春;电能质量综合检测与分析系统研究[D];重庆大学;2011年
9 罗芳;意见挖掘中若干关键问题研究[D];武汉理工大学;2011年
10 刘昕;区域水安全评价模型及应用研究[D];西北农林科技大学;2011年
中国硕士学位论文全文数据库 前10条
1 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
2 吕万里;中文文本分类技术研究[D];山东科技大学;2010年
3 范丹;Web检索中的查询扩展及结果聚类技术研究[D];辽宁师范大学;2010年
4 张军珲;基于统计的常用汉语副词用法自动识别研究[D];郑州大学;2010年
5 于洪霞;基于SVM的中文垃圾邮件过滤[D];哈尔滨工程大学;2009年
6 唐微;网络信息提取系统关键技术研究[D];大连理工大学;2009年
7 龚健;数据挖掘技术在农业信息服务中的应用研究[D];安徽农业大学;2010年
8 周登;基于N-Gram模型的藏文文本分类技术研究[D];西北民族大学;2010年
9 伍红亮;基于最小风险的贝叶斯邮件过滤算法研究[D];华南理工大学;2010年
10 梁晔平;中文文本自动分类相关算法的研究与实现[D];华南理工大学;2010年
【相似文献】
中国期刊全文数据库 前10条
1 杨义先;;线性复杂度可控的新型密钥流生成器[J];北京邮电大学学报;1989年03期
2 魏仕民,王宏,肖国镇;q元缩减发生器[J];西安电子科技大学学报;2001年02期
3 郑君刚 ,吴成东 ,马斌 ,靖新;基于混沌的无线跳频通信技术[J];电子产品世界;2005年16期
4 袁红娟;;基于链表的出栈序列生成算法[J];河北北方学院学报(自然科学版);2006年05期
5 周旭;;数据库中实现多表共用自增长序列的方法[J];现代计算机(专业版);2009年01期
6 李中年;张宁;董睿;;一种基于DHT的实数插值并行新算法[J];软件导刊;2009年07期
7 张九根;顺序图设计法中的扰动和复杂结构分析[J];南京建筑工程学院学报(自然科学版);1996年02期
8 魏仕民;确定周期序列k错线性复杂度的一个快速算法[J];电子学报;2004年05期
9 张晓蕾;伍新华;张俊;;Oracle同步复制时表没有主键的一种解决方法[J];软件导刊;2009年03期
10 金桂梅;李永冰;王萌;;伪随机序列的仿真与分析[J];现代电子技术;2009年14期
中国重要会议论文全文数据库 前10条
1 杨峰;雷连成;;胸膜肺炎放线杆菌血清3型与5型菌株基因组特征序列筛选与分析[A];中国畜牧兽医学会生物制品学分会中国微生物学会兽医微生物学专业委员会2010年学术年会(第三届中国兽药大会学术论坛)论文集[C];2010年
2 刘洁;陈智伟;张玉廉;陈吉龙;;应用果蝇yellow基因的分子模式分析基因转应作用[A];中国动物科学研究——中国动物学会第十四届会员代表大会及中国动物学会65周年年会论文集[C];1999年
3 彭瑞祥;;汉字结构的统计分析[A];中国心理学会第三次会员代表大会及建会60周年学术会议(全国第四届心理学学术会议)文摘选集(下)[C];1981年
4 李羽;韩勇;赵刚;青玲;杨水英;孙现超;;温州蜜柑萎缩病毒编码大外壳蛋白基因克隆分析[A];粮食安全与植保科技创新[C];2009年
5 姚燕来;闵航;;CODEHOP PCR扩增Rhodococcus sp.YYL中四氢呋喃单加氧酶基因部分同源序列[A];第十次全国环境微生物学术研讨会论文摘要集[C];2007年
6 范留彬;张利英;王艳丽;李连杰;刘国栋;;以化学键为加和单元研究三元共聚物的玻璃化温度[A];2009年全国高分子学术论文报告会论文摘要集(上册)[C];2009年
7 周学广;;两类混沌函数周期的证明[A];2000中国控制与决策学术年会论文集[C];2000年
8 党耀国;刘思峰;翟振杰;;区间数关联度的研究[A];管理科学与系统科学研究新进展——第8届全国青年管理科学与系统科学学术会议论文集[C];2005年
9 吴志明;闫若潜;刘光辉;盛敏;方先诊;张志凌;;猪附红细胞体PCR诊断方法的建立及应用[A];中国畜牧兽医学会2006学术年会论文集(下册)[C];2006年
10 亓海刚;李莉;张国范;;长牡蛎基因组微卫星和单核苷酸多态位点筛查与标记开发[A];中国动物学会、中国海洋湖沼学会贝类学会分会第十四次学会研讨会论文摘要汇编[C];2009年
中国重要报纸全文数据库 前10条
1 王俊霞 邓晓兰 徐谦;实行基本养老保险省级统筹制度运行模式初探[N];中国劳动保障报;2004年
2 张发松周珺;才子,中国男装的国粹典范[N];中国现代企业报;2007年
3 张益博;如何确定打死的就是拉登[N];国防时报;2011年
4 曹琰;机构编制和职级序列规范工作启动[N];华中电力报;2009年
5 新文;立白扩张路:先做市场后生产[N];消费日报;2005年
6 刘阳;软件的安全控制[N];财会信报;2007年
7 本报记者 王成 贾建新;“坊子模式”:城乡医疗一体化结硕果[N];新农村商报;2009年
8 蒙永宏本报记者 夏新;搬罾蔬菜能否复制川西坝子模式[N];南充日报;2008年
9 记者 郭春雨 王 钰;吉林全面实行书记员单独序列[N];人民法院报;2002年
10 赵卫忠;首批苏-30多功能歼击机加入印度作战序列[N];中国航空报;2002年
中国博士学位论文全文数据库 前10条
1 聂维琳;变点靠近序列端点的检测问题[D];武汉大学;2010年
2 兰欢;新基因PRR11在细胞增殖和细胞周期中功能的研究[D];重庆医科大学;2011年
3 张英英;中国新疆和重庆地区多物种博尔纳病病毒的检测及种系发生分析[D];重庆医科大学;2010年
4 郭晓贤;跨膜区突变对ABC转运蛋白Pdr5p功能的影响及其机制研究[D];浙江大学;2012年
5 柳广东;三种经济绒螯蟹的遗传学和形态学研究[D];中国海洋大学;2005年
6 刘勇;河豚鱼多药耐药基因组全长序列和邻座基因的分析[D];中国协和医科大学;1998年
7 童英;翻译调控序列的退化性突变及其对重复拷贝亚功能化的影响[D];浙江大学;2010年
8 尹春煜;中国HIV-1主要结构基因的序列变异性以及耐药相关性突变分析[D];复旦大学;2005年
9 展群岭;博尔纳病病毒分子流行病学研究[D];重庆医科大学;2010年
10 张小燕;胶原蛋白肽生物功能材料的研究与开发[D];西北工业大学;2006年
中国硕士学位论文全文数据库 前10条
1 侯晓慧;牛Meg8基因的克隆、组织表达及印记状态分析[D];河北农业大学;2011年
2 陈志华;茅盾小说的叙事结构分析[D];山东师范大学;2007年
3 欧阳景根;政治发展理论的序列观评析[D];中国人民大学;1999年
4 曹如姬;山西五台山寺庙建筑布局及空间组织[D];太原理工大学;2005年
5 吴海强;体育教育专业本科学生实践能力培养的路径研究[D];河南大学;2008年
6 杨春龙;连续映射的几种熵的研究[D];广西大学;2012年
7 宋灿磊;江门某医院儿童急性腹泻患者诺如病毒的检测与毒株型别分析[D];南方医科大学;2010年
8 Jyotsna Shakya;与HERV-K相关的一种未知功能的mRNA在头颈部肿瘤组织中表达增加[D];吉林大学;2012年
9 裴志花;牛O型口蹄疫病毒内蒙古疫苗株p1基因的克隆与序列分析[D];内蒙古农业大学;2005年
10 朱涛;嗜铁钩端螺旋菌Leptospirillum ferriphilum UBK03抗镍操纵子表达调控机理研究[D];中国农业科学院;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026