收藏本站
《东北大学学报(自然科学版)》 2005年08期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于领域知识的文本分类

朱靖波  陈文亮  
【摘要】:提出了一种基于知识的文本分类方法,其中引入领域知识,利用领域特征作为文本特征,增强文本表示能力,将文本分类过程看作集聚计算过程.文本索引过程采用了改进型特征选取和权重计算方法.提出了一种基于互信息的学习算法,从训练语料中自动学习领域特征集聚计算公式.实验结果显示基于领域知识的文本分类技术总体性能优于传统的贝叶斯分类模型,领域知识的应用能够有效改善对相似主题和相反主题的分类性能.

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前3条
1 王继明;网络新闻分类系统及个性化新闻网站的研究与应用[D];内蒙古工业大学;2007年
2 胡谢斐;基于多重关系领域知识的分类问题研究[D];合肥工业大学;2006年
3 叶志刚;SVM在文本分类中的应用[D];哈尔滨工程大学;2006年
【参考文献】
中国期刊全文数据库 前1条
1 朱靖波,姚天顺;文本内容主题的识别方法[J];东北大学学报(自然科学版);2002年05期
【共引文献】
中国期刊全文数据库 前10条
1 吴保民,杜祝平,张连海,王炳锡;Matlink英汉机器翻译试验系统中词典的存储结构及搜索算法[J];信息工程大学学报;2001年04期
2 林鸿飞,王剑峰;双语交叉分类模型的设计与实现[J];中文信息学报;2001年06期
3 刘军万,刘飞飞;基于潜在语义索引的文本结构分析方法的研究[J];情报杂志;2004年01期
4 林鸿飞,战学刚,姚天顺;基于概念的文本结构分析方法[J];计算机研究与发展;2000年03期
5 林鸿飞,战学刚,姚天顺;文本特征区域与文本过滤的匹配机制[J];计算机工程与应用;2000年07期
6 李业丽,林鸿飞,姚天顺;基于示例的用户信息需求模型的获取和表示[J];计算机工程与应用;2000年09期
7 顾益军,于江德,刘群,樊孝忠;受限领域中文文本内容主题概念识别研究[J];计算机工程与应用;2004年01期
8 党琰,张冬茉,李芳;角色反演算法在问答系统中的应用[J];计算机工程与应用;2004年36期
9 张殿勇;互联网内容识别和中文文本信息过滤——互联网监管系统设计实现[J];辽宁行政学院学报;2003年03期
10 麻志毅,林鸿飞,姚天顺,马佳琳;基于情境的文本中的时间信息分析[J];东北大学学报(自然科学版);1999年03期
中国重要会议论文全文数据库 前2条
1 靳光瑾;郭曙纶;肖航;章云帆;;语料库加工中的规范问题——谈《信息处理用现代汉语词类标记集规范》[A];语言文字应用研究论文集(Ⅱ)[C];2004年
2 陈文亮;朱靖波;姚天顺;;企业网络监管系统CNM的设计与实现[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
中国博士学位论文全文数据库 前6条
1 徐尔清;基于中心语驱动短语结构文法的句法和语义分析[D];上海外国语大学;2007年
2 陈定权;自动主题搜索的应用研究[D];中国科学院研究生院(文献情报中心);2003年
3 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
4 陈清才;基于粗集的汉语建模及其应用研究[D];哈尔滨工业大学;2003年
5 吴翔;产品4D信息模型的基础技术研究[D];武汉理工大学;2005年
6 张春霞;领域文本知识获取方法研究及其在考古领域中的应用[D];中国科学院研究生院(计算技术研究所);2005年
中国硕士学位论文全文数据库 前10条
1 王睿;数字科技馆中文信息检索系统的设计与实现[D];山东大学;2007年
2 赵云峰;面向需求的构件适用性评价模型的研究[D];大连海事大学;2007年
3 旺建华;中文文本分类技术研究[D];吉林大学;2007年
4 李俊杰;基于自然语言处理技术的消化科内窥镜检查报告的结构化[D];浙江大学;2007年
5 高雷;网络智能过滤系统的设计与实现[D];广东工业大学;2003年
6 张少平;基于结构化自然语言的算法规约研究[D];江西师范大学;2003年
7 张磊;基于Internet的智能信息挖掘系统建模及关键技术研究[D];西北工业大学;2003年
8 张隽;模糊同义词典在VSM文本信息检索方法中的应用[D];大连理工大学;2004年
9 张俊;基于神经网络的拼音汉字转换[D];南京理工大学;2004年
10 刘红星;分布式系统中的文本信息检索技术研究[D];清华大学;2004年
【同被引文献】
中国期刊全文数据库 前10条
1 曹倩,丁艳,王超,潘金贵;汉语自动分词研究及其在信息检索中的应用[J];计算机应用研究;2004年05期
2 李渝勤,孙丽华;基于规则的自动分类在文本分类中的应用[J];中文信息学报;2004年04期
3 张春霞,郝天永;汉语自动分词的研究现状与困难[J];系统仿真学报;2005年01期
4 张杰,战学刚,冯金平,陈文亮;中文文本分类器的评价[J];鞍山科技大学学报;2005年Z1期
5 李广原;一种特征词权重调整算法的研究[J];电脑与信息技术;2005年04期
6 胡俊华,杨波,李金屏;自然语言理解研究略述[J];济南大学学报(社会科学版);2001年05期
7 朱华宇,孙正兴,张福炎;一个基于向量空间模型的中文文本自动分类系统[J];计算机工程;2001年02期
8 刘明吉;基于协同演化的文本特征获取算法[J];计算机工程;2005年04期
9 许建潮,胡明;中文Web文本的特征获取与分类[J];计算机工程;2005年08期
10 周新栋,王挺;基于N元语言模型的文本分类方法[J];计算机应用;2005年01期
中国博士学位论文全文数据库 前1条
1 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
中国硕士学位论文全文数据库 前1条
1 张晶;基于领域知识和概念格模型的知识发现研究[D];合肥工业大学;2004年
【二级引证文献】
中国硕士学位论文全文数据库 前1条
1 牛琳;基于SVM的公安情报自动分类系统的设计与实现[D];解放军信息工程大学;2007年
【二级参考文献】
中国期刊全文数据库 前1条
1 林鸿飞,高天,姚天顺;中文文本的可视化表示[J];东北大学学报(自然科学版);2000年05期
【相似文献】
中国期刊全文数据库 前10条
1 管纪文;张爱冬;马志方;;元知识及其在专家系统中的运用[J];计算机科学;1987年01期
2 David Barstow;陈冀军;;软件工程需要人工智能[J];计算机科学;1987年06期
3 闵罗礼;张铨;;控制领域知识的分类和表达[J];自动化技术与应用;1988年04期
4 储军杰;在智能教学系统中引入与领域相关的教学知识[J];计算机学报;1989年08期
5 冯方方;;面向多领域多专家的专家系统开发工具-IMADES[J];计算机研究与发展;1989年04期
6 王永庆;杜长征;杨萍;刘晓东;;专家系统外壳TTY[J];计算机工程与应用;1989年07期
7 李小滨;;CUI:具有良好适应性的汉语理解工具[J];计算机工程与应用;1989年07期
8 田在勤;唐雪飞;;专家系统开发环境ESDEN中多级知识库的实现[J];计算机科学;1989年02期
9 章振辉 ,王治森;减速器设计专家系统中知识库的构造[J];合肥工业大学学报(自然科学版);1990年03期
10 程翼宇,胡上序;识别和解释质谱图知识库系统的研究[J];分析测试学报;1990年04期
中国重要会议论文全文数据库 前10条
1 刘朝阳;;领域知识和数据结合的神经网络学习方法和应用[A];复杂巨系统理论·方法·应用——中国系统工程学会第八届学术年会论文集[C];1994年
2 裴利芳;;领域知识与自我解释策略间关系的实验研究[A];第八届全国心理学学术会议文摘选集[C];1997年
3 杨武金;池毓焕;;中国产业结构管理系统的逻辑程序开发[A];1994年逻辑研究专辑[C];1994年
4 郑德玲;吉冰溪;吕焕云;;多个专家意见综合方法的研究[A];1996中国控制与决策学术年会论文集[C];1996年
5 马建军;陈文伟;;IDSS中知识获取的一种新方法[A];1996中国控制与决策学术年会论文集[C];1996年
6 钱冬生;强士中;郑凯锋;;铁路桥梁损伤等级评估及对策专家系统[A];中国土木工程学会桥梁及结构工程学会第九届年会论文集[C];1990年
7 吴纬强;万在龙;袁勇;;基坑支护体系选型的智能化原理与实现[A];中国土木工程学会计算机应用分会第七届年会土木工程计算机应用文集[C];1999年
8 朱岳清;俞旭东;;地震综合预报专家系统的研究与应用[A];计算机在地学中的应用国际讨论会论文摘要集[C];1991年
9 章宁;甘仞初;;信息系统总体设计的知识表示机制研究[A];2001年中国管理科学学术会议论文集[C];2001年
10 于楠;朱靖波;陈文亮;;领域知识库的构建机制[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国重要报纸全文数据库 前10条
1 张维明 邓苏 肖卫东 汤大权;应对信息爆炸的挑战[N];计算机世界;2001年
2 郑宁;独立董事既难 独立亦难懂事[N];中国财经报;2002年
3 武德锋 李国辉 林洪文 姚作梁;图像世界任我行[N];计算机世界;2002年
4 清华大学 徐剑军 李涓子 王克宏;新计算时代来临[N];计算机世界;2002年
5 本报记者 冯军军;医药界一个迫在眉睫的问题(视点)[N];人民日报海外版;2002年
6 柯文;共育高层次嵌入式系统软件人才[N];科技日报;2003年
7 龚菊芳;强化财务管理 提高农垦效益[N];农民日报;2003年
8 吴伯明 作者为全国政协委员、国家知识产权局副局长;国家知识产权战略与核心竞争力[N];文汇报;2003年
9 高林;《现代软件工程技术与CMM的融合》[N];中华读书报;2003年
10 学华;技术是手段 学习是重点[N];电子资讯时报;2004年
中国博士学位论文全文数据库 前10条
1 李桃;烧结过程智能实时操作指导系统的研究[D];中南大学;2000年
2 许兆新;基于元知识的数据挖掘系统研究[D];哈尔滨工程大学;2003年
3 徐振宁;基于本体的Web数据语义信息的表示与处理方法研究[D];中国人民解放军国防科学技术大学;2002年
4 王晓东;基于Ontology知识库系统建模与应用研究[D];华东师范大学;2003年
5 陈品德;基于Web的适应性学习支持系统研究[D];华南师范大学;2003年
6 姚卫新;智能数据分析中异常数据的集成化管理方法研究[D];复旦大学;2004年
7 戴若夷;面向大规模定制的广义需求建模方法与实现技术的研究及应用[D];浙江大学;2004年
8 金鑫;基于本体的领域信息交互语义化研究[D];东华大学;2005年
9 杨立;基于领域知识的知识发现研究[D];中国科学院研究生院(软件研究所);2005年
10 胡明;Web中文信息智能获取与分类研究[D];吉林大学;2005年
中国硕士学位论文全文数据库 前10条
1 余锡荣;紧迫局面情况下的船舶避碰决策[D];大连海事大学;2000年
2 刘震;基于知识的面向主题查询分析技术研究[D];国防科学技术大学;2002年
3 郝宁;Visual Basic编程专家的领域知识及其在编程过程中的作用[D];华东师范大学;2003年
4 杨文柱;基于领域知识和信息抽取的个性化Web查询系统[D];河北大学;2002年
5 杨涛;基于领域知识的电梯动态最佳群控方法[D];重庆大学;2003年
6 张晶;基于领域知识和概念格模型的知识发现研究[D];合肥工业大学;2004年
7 张焱;知识发现在金融反洗钱领域中的应用研究[D];合肥工业大学;2004年
8 邓廿庆;安徽省医药卫生领域知识产权保护与管理问题及对策研究[D];安徽医科大学;2003年
9 丁淑辉;并行产品开发过程与知识管理系统研究与实现[D];山东科技大学;2004年
10 冯兰萍;本体在智能信息检索系统中的应用研究[D];河海大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026