收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于高维聚类技术的中文关键词提取算法

高学东  吴玲玉  
【摘要】:关键词提取是中文信息处理技术研究中的热点和难点,基于统计信息的方法是其中一个重要分支。本文针对基于统计信息关键词提取方法准确率低的问题,提出基于高维聚类技术的中文关键词提取算法。算法通过依据小词典的快速分词、二次分词、高维聚类和关键词甄选4个步骤实现关键词的提取。理论分析和实验显示,基于高维聚类技术的中文关键词提取方法具备更好的稳定性、更高的效率和更准确的结果。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 汪鹏,刘加,刘润生;基于离散HMM的非特定人关键词提取语音识别系统[J];吉林大学学报(理学版);2003年03期
2 陈康,奚伟鹏,蒋凯,武港山;Web智能信息服务系统的设计与实现[J];计算机应用研究;2004年06期
3 高媛,陈建斌,陈立潮;一种基于多层概图的高维聚类算法研究[J];计算机应用;2004年S1期
4 钟晓旭;;层次聚类方法在关键词提取上的研究应用[J];电脑知识与技术;2009年06期
5 程岚岚,何丕廉,孙越恒;基于朴素贝叶斯模型的中文关键词提取算法研究[J];计算机应用;2005年12期
6 刘希宋;喻登科;李玥;;基于客户知识的客户CABOSFV聚类[J];情报杂志;2008年02期
7 秦鹏;张华平;刘金刚;;基于新词发现技术的关键词提算法的研究[J];微计算机信息;2010年33期
8 殷佳;武森;王沙骋;;CABOSFV算法的改进方法[J];情报探索;2007年09期
9 刘佳佳;胡孔法;陈凌;;基于单维分割的高维数据聚类算法HDCA-SDP[J];扬州大学学报(自然科学版);2008年03期
10 沙芸;张国英;孟凡亮;;基于关键词提取的娱乐新闻文档去重算法[J];广西师范大学学报(自然科学版);2007年02期
11 管瑞霞;陆蓓;;TFLD:一种中文文本关键词自动提取方法[J];机电工程;2010年09期
12 方俊;郭雷;王晓东;;基于语义的关键词提取算法[J];计算机科学;2008年06期
13 王晓斌;温春;石昭祥;;基于贝叶斯信息准则的文本主题数估计[J];计算机工程;2009年07期
14 刘佳佳;胡孔法;陈崚;宋爱波;;一种有效的基于密度度量的相交网格划分聚类算法[J];高技术通讯;2009年12期
15 章成志;;基于集成学习的自动标引方法研究[J];情报学报;2010年01期
16 张颖颖;谢强;丁秋林;;基于同义词链的中文关键词提取算法[J];计算机工程;2010年19期
17 章成志;;基于集成学习的自动标引方法研究[J];中国索引;2009年02期
18 章成志,侯汉清;面向概念挖掘的文本层次模型研究[J];中国图书馆学报;2005年02期
19 罗杰;陈力;夏德麟;王凯;;基于新的关键词提取方法的快速文本分类系统[J];计算机应用研究;2006年04期
20 许晓昕;李安贵;;一种基于TFIDF的网络聊天关键词提取算法[J];计算机技术与发展;2006年03期
中国重要会议论文全文数据库 前10条
1 秦鹏;李恒训;张华平;刘金刚;;基于关键词提取的搜索结果聚类研究[A];第五届全国信息检索学术会议论文集[C];2009年
2 章成志;;基于集成学习的自动标引方法研究[A];中国索引学会第三次全国会员代表大会暨学术论坛论文集[C];2008年
3 罗准辰;刘伍颖;王挺;;关键词提取中的分离模型和特征设计[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
4 马亮;何婷婷;陈劲光;李芳;邵伟;;一种利用关键词提取的面向查询多文档文摘技术[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
5 薛征;廖闻剑;;基于位置权重和实体识别的关键词提取[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
6 沙芸;周俊武;张国英;;基于主题关键词的新闻去重算法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
7 庞宗强;封化民;邱鹍;宋国森;;基于Web的中文新闻视频内容分析[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年
8 翁伟;王厚峰;;基于LDA的关键词抽取方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
9 章成志;王惠临;;基于专业领域平行语料的双语核心术语抽取研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
10 刘宁宁;毕然;任水;叶祺;吴斌;;融合复杂网络理论的科技监测研究[A];2006全国复杂网络学术会议论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 蒋昌金;基于关键词提取的中文网页自动文摘方法研究[D];华南理工大学;2010年
2 孙越恒;基于统计的NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
3 王一川;基于内容的海量文本探索式查询导引中若干关键技术的研究[D];北京邮电大学;2011年
4 姜静清;最小二乘支持向量机算法及应用研究[D];吉林大学;2007年
5 余利华;分布式数据存储和处理的若干技术研究[D];浙江大学;2008年
6 金博;面向专利和零部件的设计知识检索方法[D];大连理工大学;2009年
7 缪嘉嘉;异构数据映射技术研究[D];国防科学技术大学;2008年
8 万源;基于语义统计分析的网络舆情挖掘技术研究[D];武汉理工大学;2012年
9 甄凤超;基于语料库的中国英语外语学习者口语交际能力研究:COLSEC中的预构成语块、图式、语用特征及策略[D];上海交通大学;2006年
10 徐悦竹;机会发现算法及其应用研究[D];哈尔滨工程大学;2010年
中国硕士学位论文全文数据库 前10条
1 梁伟明;中文关键词提取技术[D];上海交通大学;2010年
2 管瑞霞;基于基因表达式编程的中文文本关键词提取算法研究[D];杭州电子科技大学;2009年
3 谢凤宏;基于复杂网络理论的文本聚类和关键词提取方法研究[D];辽宁师范大学;2011年
4 谢晋;基于词跨度的中文文本关键词提取及在文本分类中的应用[D];浙江工业大学;2011年
5 薛征;基于改进TF-IDF的文本信息热点话题发现[D];武汉邮电科学研究院;2009年
6 刘治华;面向主题的文档摘要技术研究[D];北方工业大学;2011年
7 尹倩;基于聚类分析的中文新闻网页关键词提取方法研究[D];合肥工业大学;2009年
8 刘佳佳;高维数据聚类技术中的若干算法研究[D];扬州大学;2008年
9 郭运凯;关联规则基本技术研究[D];西安科技大学;2009年
10 何金艳;基于内容分析的Blog话题检测方法研究[D];哈尔滨工业大学;2010年
中国重要报纸全文数据库 前1条
1 钟赫;练好十大绝招做好企业微博营销[N];中国高新技术产业导报;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978