收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于词语上下文的文本分类研究

杨金柱  刘金岭  
【摘要】:文本自动分类系统无法直接理解其语义并进行分类,需要对文本进行预处理,提取能表达文本主题内容的关键词,将这些关键词用结构化的形式保存起来,形成文本的表示。针对文本数据中存在大量词语共现的特点,提出了一种基于上下文的文本分类方法。该方法利用词语的上下文关系定义了词语相似度和词语权值,更科学地表达了词语在该类别中的语义表示,从而更能提高文本分类的质量。实验结果表明,该方法的分类效果比传统的简单向量距离分类法有明显的改善。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 刘金岭;严云洋;;基于上下文的短信文本分类方法[J];计算机工程;2011年10期
2 姜丽丽;赵德斌;;基于复合上下文的自适应熵编码器设计与实现[J];计算机应用与软件;2007年06期
3 易丽萍;李红霞;;HowNet在文本挖掘中的应用[J];电脑知识与技术;2009年12期
4 申丽平;;WordNet在查询扩展中的应用研究[J];科技信息;2009年14期
5 郭少友;;一种基于词语上下文关系的文本检索算法[J];情报理论与实践;2008年04期
6 田久乐;赵蔚;;基于同义词词林的词语相似度计算方法[J];吉林大学学报(信息科学版);2010年06期
7 秦春秀;赵捧未;刘怀亮;;词语相似度计算研究[J];情报理论与实践;2007年01期
8 杨喜权;国頔娜;胡加·托和塔森;曹雪亚;周建园;;基于领域本体的词语相似度计算[J];计算机应用;2009年S1期
9 D·奥斯汀;侯汉清;吴政;;怎样生成保留上下文索引[J];图书馆理论与实践;1987年04期
10 章志凌;虞立群;陈奕秋;罗海飞;邵晓敏;;基于Corpus库的词语相似度计算方法[J];计算机应用;2006年03期
11 费洪晓;戴宏伟;刘斌;;基于协议分析的入侵检测系统设计与实现[J];信息技术;2007年03期
12 林丽;薛方;任仲晟;;一种改进的基于《知网》的词语相似度计算方法[J];计算机应用;2009年01期
13 吴思颖;吴扬扬;;基于中文WordNet的中英文词语相似度计算[J];郑州大学学报(理学版);2010年02期
14 孙亚明;杨春玲;;JPEG2000编码算法中上下文关系的改进[J];计算机应用与软件;2005年12期
15 刘弢;;从《不能承受生命之轻》看电影剧本符号化改编[J];新闻大学;2007年02期
16 李卫疆;赵铁军;王宪刚;;基于上下文的查询扩展[J];计算机研究与发展;2010年02期
17 张振幸;李金厚;;一种基于义原重合度的词语相似度计算[J];信阳师范学院学报(自然科学版);2010年02期
18 张亮;尹存燕;陈家骏;;基于语义树的中文词语相似度计算与分析[J];中文信息学报;2010年06期
19 刘青磊;顾小丰;;基于《知网》的词语相似度算法研究[J];中文信息学报;2010年06期
20 王海云;刘金岭;;基于查询词扩展的文本检索算法研究[J];计算机与数字工程;2011年06期
中国重要会议论文全文数据库 前10条
1 乔林;黄维通;孟威;;一种改进的知网系统词语相似度计算方法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
2 章志凌;虞立群;罗海飞;邵晓敏;;基于改进Corpus库的词语相似度计算方法[A];第二十四届中国控制会议论文集(下册)[C];2005年
3 李斌;曲维光;陈小荷;;名词转喻的自动理解[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
4 白宇;于水;叶娜;蔡东风;任晓娜;;一种基于语境的词语相似度计算方法[A];第五届全国信息检索学术会议论文集[C];2009年
5 郭丽;蔡东风;季铎;白宇;;统计与语义相融合的词语相似度计算[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
6 张亮;尹存燕;陈家骏;;基于语义树的中文词语相似度计算与分析[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
7 熊德兰;鄢靖丰;陈静;;基于论坛主题的网页褒贬倾向性识别[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 张鹏远;刘赵杰;韩疆;颜永红;;一种改进的声学置信度计算方法[A];第八届全国人机语音通讯学术会议论文集[C];2005年
9 陇菲;;“二生三”之“三”[A];《国学论衡》(第四辑)[C];2007年
10 赵庆卫;王作英;陆大;;音节间相关的识别单元在连续语音识别中的应用[A];第五届全国人机语音通讯学术会议论文集[C];1998年
中国博士学位论文全文数据库 前2条
1 王莉;基于动态虚拟语义社区的知识通信[D];太原理工大学;2010年
2 程环环;基于贝叶斯网络的图像内容表述与分类[D];国防科学技术大学;2011年
中国硕士学位论文全文数据库 前10条
1 蔡瑞瑜;基于社会上下文约束和物品上下文约束的协同推荐[D];浙江大学;2012年
2 郭丽;基于上下文的词语相似度计算及其应用[D];沈阳航空工业学院;2009年
3 李佳;基于知网的中文本体映射研究[D];北京邮电大学;2007年
4 温安国;基于词语网络的关键词自动提取方法及在中文网页分类中的应用研究[D];复旦大学;2009年
5 王春喜;融合多元信息的句子相似度计算研究[D];河南大学;2009年
6 史燕;基于HNC的汉语句子相似度算法的研究[D];江苏大学;2009年
7 王文兴;基于语义分析的查询扩展及其关键技术研究[D];哈尔滨工程大学;2008年
8 李海军;基于语义的汉语短语结构歧义研究与实现[D];西北大学;2006年
9 朱雪刚;基于语义网络的教学资源搜索引擎研究[D];东北师范大学;2006年
10 李继;基于视频处理的混合交通事件检测方法研究[D];长安大学;2011年
中国重要报纸全文数据库 前10条
1 ;数据集成:让SOA稳着陆[N];网络世界;2006年
2 张效霞;也谈《脉要精微论》“精明”之含义[N];中国中医药报;2007年
3 本报记者 黄俊娴;“图像”如何继续?[N];美术报;2010年
4 ;科大讯飞:VUI设计制胜“下一代网”[N];通信产业报;2005年
5 常燕杰;商用搜索 须打智慧牌[N];中国计算机报;2006年
6 陆春涛;在水墨中得以自由[N];美术报;2003年
7 李庆刚;“马克思主义中国化”的提法有问题吗[N];北京日报;2006年
8 ;文化的脚步近了[N];深圳商报;2004年
9 ;风险发现引擎一瞥[N];网络世界;2006年
10 本报记者 薛海滨;麦克·林奇:“Google不是我的对手”[N];计算机世界;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978