收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于特征权重量化的相似度计算方法

刘铭  吴冲  刘远超  孙承杰  
【摘要】:随着信息产业的迅猛发展,聚类的无监督特性使其成为一种极为有效的分析工具.而为获得良好的聚类结果,有效及准确的相似度计算方法是其必备的前提条件.事实上,在描述数据相似度时,不同的特征显然具有不同的作用,因此有必要借助一些先验知识,例如用户提供的限制数据,来衡量特征的重要性,并将其应用于相似度计算中以获取更加准确的计算结果.传统的特征权值量化方法均忽视了两点问题:(1)限制数据在特征空间中极有可能为非均匀分布;(2)限制数据可能包含不一致性.上述问题的存在使得传统的权值量化方法无法获得准确的结果甚至无法运行.基于此,文中提出了一种新颖的特征权值量化方法用以处理上述两点问题:(1)将限制数据划分为若干个等价类,进而通过计算参数"分布系数"来均匀化数据的分布;(2)将限制数据连接为无向图,进而通过计算参数"置信度"来衡量及弱化限制数据的不一致性.之后将这两个参数结合到特征权值量化函数中以获得准确的相似度计算结果.实验结果显示:该特征权值量化方法能够结合限制数据来获取不同特征对相似度计算的贡献能力,并能应用于任何聚类算法中以提高聚类的准确度.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 蔡东风;白宇;于水;叶娜;任晓娜;;一种基于语境的词语相似度计算方法[J];中文信息学报;2010年03期
2 丁政建;张路;;一种改进的本体相似度计算方法[J];计算机工程;2010年24期
3 朱珍元;郑诚;;一种改进的本体相似度计算方法[J];微型机与应用;2011年01期
4 崔韬世;麦范金;;词语相似度计算方法分析[J];网络安全技术与应用;2012年05期
5 王国春;郑山红;赵辉;董亚则;;基于阶段递进的综合本体相似度计算方法[J];吉林大学学报(信息科学版);2014年02期
6 张忠平;田淑霞;刘洪强;;一种新的本体相似度计算方法[J];计算机应用研究;2008年10期
7 赵欢;李仁发;王家琴;张在美;;综合多层信息的本体概念相似度计算方法的研究[J];通信学报;2009年06期
8 李改;李章凤;李磊;;一种新的社会化相似度计算方法[J];计算机应用研究;2013年09期
9 曾辉;徐海洲;钟茂生;;基于主题和焦点的问句相似度计算方法[J];科学技术与工程;2014年06期
10 张忠平;田淑霞;刘洪强;;一种综合的本体相似度计算方法[J];计算机科学;2008年12期
11 李迎凯;徐小良;;一种改进的基于知网的句子相似度计算方法[J];电子科技;2012年07期
12 吕刚;郑诚;;基于加权的本体相似度计算方法[J];计算机工程与设计;2010年05期
13 陆军;;一种综合概念相似度计算方法[J];甘肃科技;2010年03期
14 石静;吴云芳;邱立坤;吕学强;;基于大规模语料库的汉语词义相似度计算方法[J];中文信息学报;2013年01期
15 张敏;王振辉;王艳丽;;一种基于《知网》知识描述语言结构的词语相似度计算方法[J];计算机应用与软件;2013年07期
16 王东;熊世桓;;一种新颖的汉字字形相似度计算方法[J];计算机应用研究;2013年08期
17 杨思春,程节华,陈家骏,王启祥;一种基于模式的汉语句子相似度计算方法[J];微型机与应用;2001年08期
18 李苏梅;韩国强;;感兴趣区域的确定及相似度计算方法[J];湖南工业大学学报;2008年04期
19 吴全娥;熊海灵;;一种综合多特征的句子相似度计算方法[J];计算机系统应用;2010年11期
20 程传鹏;吴志刚;;一种基于知网的句子相似度计算方法[J];计算机工程与科学;2012年02期
中国重要会议论文全文数据库 前6条
1 白宇;于水;叶娜;蔡东风;任晓娜;;一种基于语境的词语相似度计算方法[A];第五届全国信息检索学术会议论文集[C];2009年
2 乔林;黄维通;孟威;;一种改进的知网系统词语相似度计算方法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
3 菅小艳;郑家恒;;一种改进的句子相似度计算方法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
4 卢延科;尹宝生;张桂平;苗雪雷;白宇;;基于伪LCS的中文专利句子相似度计算方法[A];第五届全国信息检索学术会议论文集[C];2009年
5 章志凌;虞立群;罗海飞;邵晓敏;;基于改进Corpus库的词语相似度计算方法[A];第二十四届中国控制会议论文集(下册)[C];2005年
6 章成志;李斌;;基于混合策略的查询串相似度计算方法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国博士学位论文全文数据库 前1条
1 吴小坤;轻量级服务推荐算法研究[D];北京邮电大学;2015年
中国硕士学位论文全文数据库 前10条
1 陈欣;一种基于多属性本体的概念相似度计算方法的研究[D];东北师范大学;2010年
2 唐中林;基于本体的概念相似度计算方法的研究[D];武汉理工大学;2013年
3 徐海洲;自动问答系统中问句相似度计算方法研究[D];华东交通大学;2014年
4 王莹莹;中文短语相似度计算方法研究及应用[D];长沙理工大学;2008年
5 俞云飞;多特征融合的电影相似度计算方法研究[D];华东师范大学;2012年
6 周舫;汉语句子相似度计算方法及其应用的研究[D];河南大学;2005年
7 江阿古丽·哈依达尔;哈萨克语句子相似度计算方法的研究[D];新疆大学;2012年
8 贾娜;基于本体的食品投诉文档文本分类研究[D];东北师范大学;2011年
9 牛庆鹏;博客潜在朋友推荐技术的研究[D];东北大学;2009年
10 朱文奇;推荐系统用户相似度计算方法研究[D];重庆大学;2014年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978