收藏本站
《模式识别与人工智能》 2001年04期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于主观Bayes方法的渐进式中文文档分类

汪保友  周益群  周水庚  胡运发  
【摘要】:本文介绍基于主观Bayes方法的渐进式中文文档分类。包括三个方面:一是应用主观Bayes方法,利用领域专家的经验,减少复杂的计算量,二是采用渐进式中文文档分类,先进行粗分类,把文档集映射到大的类别集中去,再对属于每一大类别中的文档子集进行细分类,映射到次级类别中去,直到划分到最后的基类,三是选择文档属性时,采用相邻字对提取方法,某种程度可摆脱对复杂切词处理程序和庞大词库的依赖。
【作者单位】复旦大学计算机科学系;
【基金】:国家863计划资助项目
【分类号】:TP391.1

【引证文献】
中国期刊全文数据库 前2条
1 王一蕾,林世平;Web文本挖掘三种技术的比较[J];福建电脑;2003年12期
2 宋枫溪,高林;文本分类器性能评估指标[J];计算机工程;2004年13期
中国硕士学位论文全文数据库 前1条
1 贝雨馨;基于意义信息增益的文本特征项权重计算方法[D];延边大学;2004年
【共引文献】
中国期刊全文数据库 前10条
1 彭宇,车文刚,杨健;CBR系统中实例库数据冗余的解决[J];大连民族学院学报;2005年01期
2 周毅灵;服装网络教学系统智能化技术支持研究[J];纺织导报;2004年02期
3 梁荣华,史济建;人工智能在财务决策支持系统中的应用[J];计算机工程与应用;2001年08期
4 徐如燕,郭齐胜;计算机生成兵力中的人工智能技术[J];计算机工程与应用;2002年01期
5 周兴斌,李平;基于优先数的智能生产调度系统[J];计算机工程与应用;2003年11期
6 智勇,曹梅,杜楚源;基于B/S结构的智能授导系统的设计与实现[J];计算机工程与应用;2004年11期
7 周云,傅泽田,张小栓;基于案例推理的鱼病诊断专家系统及其数据库设计[J];计算机工程与应用;2004年34期
8 纪丰伟,陈恳;专家系统在PDM任务流控制中的应用[J];计算机集成制造系统-CIMS;2004年05期
9 杨鹤标,陈华,徐向英;基于Agent的智能检索技术在类库管理系统中的应用研究[J];计算机工程与科学;2005年03期
10 冯艳红,王阿川;基于Web的森林防火专家系统知识库的构建[J];林业机械与木工设备;2005年01期
中国重要会议论文全文数据库 前1条
1 马力波;黄席樾;陈东义;;基于多智能体的远程机器人自主性变换控制机制研究[A];2003年中国智能自动化会议论文集(上册)[C];2003年
中国博士学位论文全文数据库 前10条
1 熊励;网络协同商务链的理论与方法研究[D];浙江大学;2002年
2 钟崴;锅炉智能CAD的技术、方法和模型研究[D];浙江大学;2002年
3 温继文;基于知识的鱼病诊断推理系统研究[D];中国农业大学;2003年
4 臧铁钢;先进维修技术资源信息支持系统的研究与开发[D];武汉理工大学;2003年
5 汤宝平;新一代虚拟仪器—智能控件化虚拟仪器系统的研究[D];重庆大学;2003年
6 刘君强;海量数据挖掘技术研究[D];浙江大学;2003年
7 郭庆;多Agent系统协商中若干关键技术的研究[D];浙江大学;2003年
8 马力波;网络远程机器人控制系统及关键技术研究[D];重庆大学;2003年
9 刘纪平;电子政务空间辅助决策研究[D];解放军信息工程大学;2004年
10 高飞;面向大批量定制的产品设计方法学研究[D];浙江大学;2004年
中国硕士学位论文全文数据库 前10条
1 范新华;基于信息融合的专家控制系统在工业生产中应用的研究[D];浙江工业大学;2001年
2 吴仁志;单神经元和多层前向人工神经网络的研究与应用[D];广西大学;2002年
3 王凡;考核系统的核心技术——评分的智能信息处理[D];河北工业大学;2002年
4 曹锐;基于语义网的网络化制造服务匹配研究[D];浙江大学;2003年
5 魏冬健;管控Agent社交行为的基础结构研究—Agent管控的透明化[D];浙江大学;2003年
6 杨焕军;基于工业PC的专家控制系统开发工具[D];广西大学;2003年
7 靳彦涛;电站锅炉吹灰优化计算机软件系统的研究[D];浙江大学;2003年
8 朱海波;机械传动原理方案智能系统及其评价研究[D];清华大学;2002年
9 向郑涛;基于CATV和IP网络集成的组播视频系统[D];浙江大学;2004年
10 屈韬;管控Agent社交行为的基础结构研究[D];浙江大学;2004年
【同被引文献】
中国期刊全文数据库 前10条
1 武旭,须德;基于向量空间模型的文本自动分类系统的研究与实现[J];北方交通大学学报;2003年02期
2 张晓辉,李莹,王华勇,赵宏;应用特征聚合进行中文文本分类的改进KNN算法[J];东北大学学报(自然科学版);2003年03期
3 湛燕,陈昊,袁方,王丽娟;文本挖掘研究进展[J];河北大学学报(自然科学版);2003年02期
4 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
5 周水庚,关佶红,胡运发,周傲英;一个无需词典支持和切词处理的中文文档分类系统[J];计算机研究与发展;2001年07期
6 林鸿飞;基于示例的文本标题分类机制[J];计算机研究与发展;2001年09期
7 陆玉昌,鲁明羽,李凡,周立柱;向量空间法中单词权重函数的分析和构造[J];计算机研究与发展;2002年10期
8 邹涛,王继成,朱华宇,金翔宇,张福炎;WWW上的信息挖掘技术及实现[J];计算机研究与发展;1999年08期
9 李蕾,钟义信,郭祥昊;全信息理论在自动文摘系统中的应用[J];计算机工程与应用;2000年01期
10 欧振猛,余顺争;中文分词算法在搜索引擎应用中的研究[J];计算机工程与应用;2000年08期
【二级引证文献】
中国期刊全文数据库 前2条
1 王一蕾,林世平;基于Web页面链接结构的挖掘算法[J];福州大学学报(自然科学版);2004年04期
2 秦锋;杨波;程泽凯;;分类器性能评价标准研究[J];计算机技术与发展;2006年10期
中国博士学位论文全文数据库 前1条
1 冯德军;弹道中段目标雷达识别与评估研究[D];国防科学技术大学;2006年
中国硕士学位论文全文数据库 前8条
1 张海龙;Web挖掘技术在东亚植物遗传资源管理系统中的应用研究[D];中国农业大学;2005年
2 任爽;基于XML和SVM的Web文本挖掘研究[D];大连理工大学;2006年
3 张娜;基于内容的视频分类算法研究[D];西安电子科技大学;2006年
4 陈伟萍;基于语义概念的中文文本分类研究[D];燕山大学;2006年
5 王琳;基于类别概念的中文文本分类研究[D];北京邮电大学;2006年
6 付渊;运用神经网络聚类方法推进构建本体的自动化[D];太原理工大学;2006年
7 江川;基于AUC的SVM多类分类算法的优化[D];武汉科技大学;2007年
8 王礼刚;基于XML的Web文本数据挖掘研究[D];西南大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 成奋华;吴家强;;数字图书馆中基于向量空间模型的文档分类系统[J];上海高校图书情报工作研究;2004年02期
2 黄萱菁;吴立德;;基于向量空间模型的文档分类系统[J];模式识别与人工智能;1998年02期
3 何丽;刘军;;CFV-NB:基于概念特征向量的NB文档分类模型[J];计算机工程;2006年20期
4 林海文;;文本挖掘技术研究[J];电脑知识与技术;2008年34期
5 范灵;;一种改进的基于VSM的文档快速分类方法[J];中国西部科技;2006年17期
6 古平;朱庆生;何希平;李云峰;;基于关联特征扩展的特征选择算法[J];计算机工程;2007年16期
7 周朴雄;;用于WEB文档分类的并行KNN算法[J];计算机工程与应用;2008年25期
8 张宝剑,杨尔弘;计算机引文索引数据库的构建与应用[J];河南职技师院学报;2001年02期
9 范灵;;信噪比优化算法文档分类及特征权重公式改进研究[J];微计算机信息;2006年21期
10 王伟,王惠荣,刘志强;自动分类模型及算法研究[J];微电子学与计算机;2004年05期
中国重要报纸全文数据库 前4条
1 刘畅;重庆移动建立企业文档管理系统[N];人民邮电;2008年
2 湖北 王金元;小小藏书架BookShelf[N];电脑报;2001年
3 杨洪林;ipresentation发布企业信息的新手段[N];计算机世界;2001年
4 泰山;柯达采集软件 增加输出模块降低成本[N];中国包装报;2010年
中国博士学位论文全文数据库 前9条
1 陈莉;KDD中的几个关键问题研究[D];西安电子科技大学;2003年
2 袁家政;可伸缩矢量图形(SVG)的数据表示研究[D];北京交通大学;2008年
3 阎红灿;面向Web的XML文档数据管理及分类检索技术研究[D];天津大学;2009年
4 熊云波;文本信息处理的若干关键技术研究[D];复旦大学;2006年
5 陈圣兵;基于商空间理论的海量信息检索模型的研究[D];安徽大学;2010年
6 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
7 蒲强;基于独立分量分析的语义聚类技术在信息检索中的应用研究[D];电子科技大学;2010年
8 高田;基于领域知识的旅游突发事件状态评估与演化研究[D];北京邮电大学;2011年
9 祝翠玲;基于类别结构的文本层次分类方法研究[D];山东大学;2011年
中国硕士学位论文全文数据库 前10条
1 徐生良;利用文档分类结构的信息检索技术[D];上海交通大学;2010年
2 成少梅;利用IRF模型丰富文档的语义代表[D];武汉理工大学;2010年
3 张炼;基于图模型的Web文档分类方法研究[D];内蒙古科技大学;2010年
4 陈波;中文WEB文档自动分类的研究与实现[D];武汉理工大学;2005年
5 高媛媛;多层次文档归类在挖掘及处理用户偏好中的应用[D];天津大学;2005年
6 郝晓丽;信息检索系统的算法库研究[D];天津大学;2006年
7 彭超逸;一个面向XML文档的扩展RBAC模型及其应用研究[D];华中科技大学;2006年
8 张亮;基于本体的个性化元搜索引擎[D];天津大学;2006年
9 姜冶;对网页目录的分析以及相关算法的设计[D];吉林大学;2009年
10 石芙芙;基于正负关联规则的Web文档分类研究[D];山东轻工业学院;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026