收藏本站
《小型微型计算机系统》 1998年08期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于特征相关性的汉语文本自动分类模型的研究

张月杰  姚天顺  
【摘要】:本文提出一种基于预定义类别与文本特征之间相关性的自动分类算法,并在文中详细阐述了汉语文本自动分类模型的设计与实现过程。为测试分类模型实现性能,建立具有12类别的分类体系,并构造包含近500篇汉语新闻语料的测试集。实验结果表明,评价自动分类算法的两个重要指标:查全率和查准率,都比较令人满意。
【作者单位】东北大学计算机系
【分类号】:TP387,

手机知网App
【引证文献】
中国期刊全文数据库 前10条
1 肖雪;1997年—2002年我国文献分类理论研究进展[J];高校图书馆工作;2003年06期
2 陈勤,张国煊,王小华;文本自动模糊分类方法的研究[J];杭州电子工业学院学报;1999年04期
3 王小华,张国煊,陆蓓;文本分类系统的评价因素探讨[J];杭州电子工业学院学报;2002年03期
4 陈勤,张国煊,王小华,陆蓓,赵葆华;基于模糊模式识别的文本自动分类法研究[J];浙江大学学报(理学版);2000年03期
5 李莼,罗振声,厉宇航;基于语义相关和概念相关的自动分类方法研究[J];计算机工程与应用;2003年12期
6 徐凤亚,罗振声;文本自动分类中特征权重算法的改进研究[J];计算机工程与应用;2005年01期
7 沈记全,唐菁,杨炳儒;Web文本挖掘系统及其分类算法的研究与实现[J];计算机工程;2003年17期
8 张宪海,吴玲达,谢毓香,老松杨;基于分类的个性化视频故事的自动生成与表现技术研究[J];计算机应用研究;2000年07期
9 刘红;利用扩展锚点文本来分类网页[J];计算机应用研究;2004年03期
10 王凯,周建国,夏德麟,晏蒲柳,董伟钛;基于支持向量机的中文文本自动分类研究[J];计算机应用研究;2005年11期
中国重要会议论文全文数据库 前1条
1 苏伟峰;李绍滋;李堂秋;尤文建;;可分义原向量空间中的跨语种文本过滤模型[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国博士学位论文全文数据库 前2条
1 刘少辉;[D];中国科学院研究生院(计算技术研究所);年
2 王树梅;[D];南京理工大学;年
中国硕士学位论文全文数据库 前10条
1 李保秀;[D];南昌大学;年
2 吴惠雄;[D];中南林业科技大学;年
3 李朝阳;[D];南京农业大学;年
4 王崑崙;[D];大连理工大学;年
5 皮鹏;[D];哈尔滨工程大学;年
6 张海燕;[D];湖南大学;年
7 马国俊;[D];西安建筑科技大学;年
8 檀林;[D];山西大学;年
9 吴娟;[D];南京理工大学;年
10 张红霞;[D];河北大学;年
【参考文献】
中国期刊全文数据库 前1条
1 吴军,王作英,禹锋,王侠;汉语语料的自动分类[J];中文信息学报;1995年04期
【共引文献】
中国期刊全文数据库 前10条
1 吴昌合;分类主题一体化:《中国分类主题词表》的特点[J];安徽大学学报;2000年06期
2 云晓燕;王春英;;基于最大树法的多文档文摘子主题划分[J];辽宁科技大学学报;2009年06期
3 高迎,王丽君,王锡钢;Simutem:一个中文信息检索系统[J];鞍山师范学院学报;2001年03期
4 王逢鑫;论象声词——英汉象声词语义比较[J];北京大学学报(英语语言文学专刊);1992年02期
5 王逢鑫;论感叹词——英汉感叹词语义比较[J];北京大学学报(外国语言文学专刊);1999年S1期
6 吴娜炯;;格语法在主观题自动阅卷中的应用[J];办公自动化;2010年08期
7 郭忠伟;桑殿伟;郑华利;李洪峰;;军用文书自动生成中表层实现的概率模型[J];兵工自动化;2010年11期
8 郭庆琳,樊孝忠;知识信息搜索和获取技术的研究[J];北京工业大学学报;2003年04期
9 侯汉清;建立以《中国分类主题词表》为核心的检索语言兼容体系[J];北京图书馆馆刊;1998年04期
10 冉去疾;国家图书馆书目数据若干分类问题简析[J];国家图书馆学刊;2002年02期
中国重要会议论文全文数据库 前10条
1 甘灿;孙星明;刘玉玲;向凌云;;一种改进的基于同义词替换的中文文本信息隐藏方法[A];第七届全国信息隐藏暨多媒体信息安全学术大会论文集[C];2007年
2 卢伟清;苏新春;;词义开放处理平台的研究和实现[A];第六届汉语词汇语义学研讨会论文集[C];2005年
3 王惠;苏新春;;XHK基于语法知识的汉语词义描述[A];第六届汉语词汇语义学研讨会论文集[C];2005年
4 靳光瑾;郭曙纶;肖航;章云帆;;语料库加工中的规范问题——谈《信息处理用现代汉语词类标记集规范》[A];语言文字应用研究论文集(Ⅱ)[C];2004年
5 王小华;陆蓓;张国煊;;文本自动分类的模糊方法[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
6 姚天昉;;一种用于汉语信息抽取的词汇本体[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
7 吕静;昝红英;;基于语义统计的中文自动文摘研究[A];第三届学生计算语言学研讨会论文集[C];2006年
8 刘鸣洋;由丽萍;;汉语感知词语的语义角色标注规则初探[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
9 许小星;亢世勇;;基于语料库的现代汉语句法成分和语义成分对应机制研究初探[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
10 程月;陈小荷;李斌;;基于义类信息的动宾搭配的考察与实验[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 肖明;[D];中国科学院文献情报中心;年
2 程军;[D];中国科学院研究生院(文献情报中心);年
3 于国庆;[D];华东师范大学;年
4 王建会;[D];复旦大学;年
5 崔世钢;[D];天津大学;年
6 陈清才;[D];哈尔滨工业大学;年
7 戴忠信;[D];北京师范大学;年
8 吴翔;[D];武汉理工大学;年
9 耿焕同;[D];中国科学技术大学;年
10 张磊;[D];中央民族大学;年
中国硕士学位论文全文数据库 前10条
1 付红艳;[D];哈尔滨工程大学;年
2 孔胜;[D];大连理工大学;年
3 柴艳丽;[D];广西民族大学;年
4 周登;[D];西北民族大学;年
5 刘金凤;[D];鲁东大学;年
6 吴惠雄;[D];中南林业科技大学;年
7 张振幸;[D];安徽工业大学;年
8 卢朝华;[D];河南科技大学;年
9 毛帆;[D];重庆大学;年
10 杨智蛟;[D];华中科技大学;年
【同被引文献】
中国期刊全文数据库 前10条
1 张红云,石阳,马垣;数据挖掘中聚类算法比较研究[J];鞍山钢铁学院学报;2001年05期
2 武旭,须德;基于向量空间模型的文本自动分类系统的研究与实现[J];北方交通大学学报;2003年02期
3 卜书庆;《中图法》第四版电子版简介[J];国家图书馆学刊;2001年02期
4 白国应;论图书分类法的总体设计[J];北京图书馆馆刊;1998年03期
5 孙健,王伟,钟义信;基于K-最近距离的自动文本分类的研究[J];北京邮电大学学报;2001年01期
6 张琪玉;中国情报语言20世纪回顾[J];图书与情报;1999年04期
7 吴年;主题分类一体化的可行性探讨[J];图书与情报;1997年01期
8 祁延莉;计算机辅助数据库标引技术的现状[J];图书与情报;1997年02期
9 王述亭,刘家瑾;模糊数学在煤层层位识别中的应用[J];测井技术;1985年02期
10 林鸿飞,高天,姚天顺;中文文本的可视化表示[J];东北大学学报;2000年05期
中国博士学位论文全文数据库 前10条
1 李广建;[D];中国科学院研究生院(文献情报中心);年
2 范昕炜;[D];浙江大学;年
3 程军;[D];中国科学院研究生院(文献情报中心);年
4 张俊林;[D];中国科学院研究生院(软件研究所);年
5 宋枫溪;[D];南京理工大学;年
6 王建会;[D];复旦大学;年
7 代六玲;[D];南京理工大学;年
8 薛德军;[D];清华大学;年
9 李荣陆;[D];复旦大学;年
10 王斌;[D];中国科学院研究生院(计算技术研究所);年
中国硕士学位论文全文数据库 前10条
1 都云琪;[D];西安电子科技大学;年
2 苏伟峰;[D];厦门大学;年
3 骆昌日;[D];华中师范大学;年
4 王术;[D];重庆大学;年
5 章兰;[D];苏州大学;年
6 靳小波;[D];西北工业大学;年
7 左家莉;[D];江西师范大学;年
8 张海龙;[D];中国农业大学;年
9 孙猛;[D];东北大学;年
10 陈治纲;[D];天津大学;年
【二级引证文献】
中国期刊全文数据库 前10条
1 许磊;网络环境下《中图法》的改造[J];图书与情报;2003年03期
2 马乐;翁智生;罗军;;一种基于SVM的网页层次分类算法[J];北京师范大学学报(自然科学版);2009年03期
3 白国应;;俞君立的文献分类思想[J];重庆图情研究;2010年03期
4 谭金波;;面向网络教育资源的文本自动分类系统的设计与实现[J];中国远程教育;2009年04期
5 郭玉滨;;Web文本挖掘技术及其应用的研究[J];电脑知识与技术;2006年08期
6 刘军;;基于向量空间模型的问答题智能化评分系统[J];电脑知识与技术;2008年01期
7 张青;熊前兴;;文本分类中词语权重计算的改进[J];电脑知识与技术;2011年01期
8 李宁;王子磊;郑涛;;基于本体论的个性化影片推荐技术研究[J];电子技术;2009年10期
9 邱云飞;邵良杉;那宝贵;;面向合作伙伴选择的中文Web信息获取系统研究[J];电子商务;2010年07期
10 张瑜;张德贤;;基于类别比例因子和类内均分度的χ~2统计改进[J];电子科技;2010年12期
中国重要会议论文全文数据库 前10条
1 陈伟萍;王琳;封化民;杨鼎才;方勇;;一种基于语义概念的中文文本分类方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
2 张永;陈思睿;杨志勇;;一种改进的文本分类方法的研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
3 张志斌;施水才;吕学强;;基于贝叶斯方法的中文垃圾邮件过滤技术综述[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
4 韩冰;林鸿飞;;基于支撑向量机的人物关系抽取[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
5 郭鸿志;陈清才;康永燕;王晓龙;;一种基于网站特征识别的搜索引擎排序算法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
6 海丽且木·艾沙;维尼拉·木沙江;;Web文本分类及其维、哈、柯多文种信息检索中的应用研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
7 王珍;维尼拉·木沙江;赵丽红;;维、哈、柯文搜索引擎中自动分类技术的应用研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
8 罗阳;季铎;张桂平;王莹莹;;面向单一网页的双语资源挖掘方法[A];第六届全国信息检索学术会议论文集[C];2010年
9 赵燕平;李超;;网络安全信息挖掘中的特征选择与专利分析研究[A];2004年中国管理科学学术会议论文集[C];2004年
10 丁政建;张路;;基于本体的语义检索研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
中国博士学位论文全文数据库 前10条
1 杜文斌;[D];辽宁中医学院;年
2 代六玲;[D];南京理工大学;年
3 徐建锁;[D];天津大学;年
4 刘华;[D];北京语言大学;年
5 孙越恒;[D];天津大学;年
6 王进;[D];中国科学技术大学;年
7 李冠军;[D];天津大学;年
8 杨为民;[D];安徽大学;年
9 王树梅;[D];南京理工大学;年
10 宗校军;[D];华中科技大学;年
中国硕士学位论文全文数据库 前10条
1 王丽敬;[D];山东科技大学;年
2 王洋;[D];哈尔滨工程大学;年
3 井志强;[D];哈尔滨工程大学;年
4 刘辉;[D];辽宁工程技术大学;年
5 刘伟丽;[D];河南工业大学;年
6 韩子明;[D];长春工业大学;年
7 陈雅芳;[D];浙江大学;年
8 冯学桥;[D];山东大学;年
9 吴惠雄;[D];中南林业科技大学;年
10 楼佳;[D];杭州电子科技大学;年
【相似文献】
中国期刊全文数据库 前10条
1 长江一号;;三招提升谷歌图片搜索效率[J];电脑迷;2011年14期
2 李育嫦;;传统知识组织系统的重构及其在网络环境下的应用[J];情报杂志;2011年07期
3 闫怀平;冯贺;;基于相关性和小波变换的纹理合成算法[J];电脑知识与技术;2011年17期
4 蔡志林;须文波;孙俊;;利用相关性的快速块拼贴纹理合成[J];计算机工程与应用;2011年21期
5 张翼飞;张俊;田志全;;海杂波背景下的非相干积累目标检测[J];中国雷达;2011年02期
6 张野;杨建林;;基于KNN和SVM的中文文本自动分类研究[J];情报科学;2011年09期
7 张唯希;周杰;;相关性对BLAST系统信道容量性能的影响[J];南京信息工程大学学报(自然科学版);2011年04期
8 郑彬彬;贾珈;蔡莲红;;基于多模态信息融合的语音意图理解方法[J];中国科技论文在线;2011年07期
9 刘晋胜;;采用熵相关性优化分离性的SVM说话人识别[J];计算机工程与设计;2011年08期
10 周靖;刘晋胜;;采用特征相关性差异优化距离的改进k近邻算法[J];计算机工程与设计;2011年09期
中国重要会议论文全文数据库 前10条
1 陈涛;胡学钢;陈秀美;;基于数据挖掘的教学质量评价体系分析[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
2 万寿义;刘正阳;;公司价值与企业社会责任成本研究——来自于沪深300指数上市公司的经验证据[A];中国会计学会2011学术年会论文集[C];2011年
3 沈宏;邹宛彤;陈星;;ZDCF在气候时间序列上的应用及MPT成因的一些探讨[A];第28届中国气象学会年会——S4应对气候变化,发展低碳经济[C];2011年
4 刘树军;李向林;何峰;万里强;陈玮玮;伊亚莉;;CH_4产量与奶牛业常用饲草营养参数的相关性研究[A];中国草学会饲料生产专业委员会第十六次学术研讨会论文集[C];2011年
5 李晓;杜彩霞;孔德信;;生物相关性、生物相关谱用于化合物成药性预测[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
6 魏歌;;无损压缩编码方法中的关联性研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
7 周亮;梅凡民;张莎;傅成诚;;西安市春季大气颗粒物污染特性研究[A];恶臭污染管理与防治技术进展[C];2009年
8 莫文;许金海;叶洁;万宏波;童正一;徐华;马俊明;;颈脊髓受压程度与椎间隙、颈椎曲度变化的相关性研究[A];全国第七次中国整脊学学术交流大会论文集·《脊柱常见病整脊诊疗指南》研究编写报告[C];2011年
9 黄建;赵海;朱剑;李学波;许雷;;基于光电容积法的人体血压检测系统设计[A];第八届沈阳科学学术年会论文集[C];2011年
10 李艳艳;李维琳;边银丙;;湖北省双孢蘑菇子实体中重金属铅镉含量及来源分析[A];海峡两岸第十届菌物学暨第三届食药用菌学术研讨会论文摘要集[C];2011年
中国重要报纸全文数据库 前10条
1 牛东波;IEC中GR原则的界定与把握[N];中国国门时报;2004年
2 韩咏霞;情景相关性晕厥类型知多少[N];中国中医药报;2004年
3 晓宁;一体化作战力量的相关性[N];解放军报;2005年
4 Brian Dolan 编译 长城伟业期货 文辉;货币和其他金融资产的相关性[N];期货日报;2010年
5 国开证券研究所 刘振聚;美元指数与A股相关性不可不察[N];中国证券报;2011年
6 记者 安明静;打破投连险与股市相关性的秘密[N];国际金融报;2005年
7 田煜;国内外油脂价格的相关性[N];粮油市场报;2001年
8 秦皇岛中医医院脾胃科副主任中医师 张丽娟;幽门螺杆菌相关性胃病的中医药研治[N];秦皇岛日报;2006年
9 本报记者 王雪敏;癌症相关性乏力,不可不治[N];医药经济报;2011年
10 贺辉红;期指行情随想:相关性或成关键[N];中国证券报;2007年
中国硕士学位论文全文数据库 前10条
1 李星华;中英文新闻网页关键词抽取技术研究[D];合肥工业大学;2009年
2 许霞;民营上市公司资本结构与经营绩效的关系研究[D];江苏大学;2009年
3 轩文烽;面向主题的博客资源挖掘关键技术研究[D];哈尔滨工业大学;2011年
4 胡安;开放进程中的中国证券市场外部因素影响初探[D];清华大学;2003年
5 王俊;预应力混凝土空心薄板、叠合板试验研究与计算分析[D];郑州大学;2005年
6 周玉华;通过阅读策略的有效使用来提高阅读水平[D];安徽大学;2005年
7 濮兴庭;活动星系核的光变研究[D];南京师范大学;2005年
8 段洪威;羊只舍饲和硒缺乏症发生相关性的研究[D];吉林大学;2005年
9 赵雁宁;中国高等教育的制度创新[D];山东大学;2005年
10 胡歆悦;中国股票市场发展与经济增长关系的实证研究[D];对外经济贸易大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026