收藏本站
《计算机研究与发展》 2011年02期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一种基于统计语义聚类的查询语言模型估计

蒲强  何大庆  杨国纬  
【摘要】:如何有效生成文档聚类并使用聚类信息提高检索效果是信息检索中的重要研究课题.如果假设文档中存在若干隐含的独立主题,那么文档可以看成是由这些隐含的独立主题混合噪声相互作用的结果.基于这个假设提出了一种基于独立分量分析的语义聚类技术,试图借助于独立分量分析的良好主题区分能力,将一组文档按照实际隐含的主题在语义空间上聚类.在语言模型的框架下,语义主题聚类将由用户初始查询按照一定的度量方式激活.利用激活语义聚类的信息估计一个反馈语义主题模型,并与初始查询模型一起形成新的查询模型.在5个TREC数据集上的实验结果表明:基于统计语义聚类估计的查询模型相比传统的查询模型以及其他基于聚类的语言模型在检索性能上有显著性提高.其主要原因是应用了和用户查询最相似的语义聚类信息来估计查询模型.

手机知网App
【引证文献】
中国博士学位论文全文数据库 前1条
1 蒲强;基于独立分量分析的语义聚类技术在信息检索中的应用研究[D];电子科技大学;2010年
【参考文献】
中国期刊全文数据库 前1条
1 曲卫民,张俊林,孙乐;基于主题的汉语语言模型的研究[J];计算机研究与发展;2003年09期
【共引文献】
中国期刊全文数据库 前2条
1 任纪生;王作英;;一种新的基于主题的语言模型自适应方法[J];中文信息学报;2006年04期
2 许亚堃;刘功申;;利用依存关系优化拼音输入法[J];通信技术;2013年03期
中国博士学位论文全文数据库 前1条
1 肖镜辉;非时齐语言建模技术研究及实践[D];哈尔滨工业大学;2007年
中国硕士学位论文全文数据库 前2条
1 赵敏涯;基于主题的新闻搜索引擎的研究与实现[D];扬州大学;2006年
2 梁奇;语言模型自适应方法在嵌入式系统中应用的研究[D];清华大学;2006年
【同被引文献】
中国期刊全文数据库 前4条
1 崔宇红;基于手机短信平台的图书馆信息推送服务[J];大学图书馆学报;2004年04期
2 周源远,王继成,郑刚,张福炎;Web页面清洗技术的研究与实现[J];计算机工程;2002年09期
3 李效东,顾毓清;基于DOM的Web信息提取[J];计算机学报;2002年05期
4 封化民,刘飚,刘艳敏,方勇,宋国森;含有位置坐标树的Web页面分析和内容提取框架[J];清华大学学报(自然科学版);2005年S1期
【相似文献】
中国期刊全文数据库 前10条
1 楼炉群;牛军钰;;信息检索中语言模型的研究[J];计算机工程;2007年04期
2 张建平;语音识别与理解的语言统计模型和搜索算法[J];电子商务;1999年09期
3 陈刚;陈莘萌;;基于独立分量分析的语种识别方法[J];计算机工程;2006年24期
4 李卫疆;赵铁军;王宪刚;;基于统计机器翻译模型的查询扩展[J];电子与信息学报;2008年03期
5 杨红卫,段守敏,彭煊,王炳锡;一种改进的基于ICA的信号增强方法[J];电声技术;2003年07期
6 刘小东,楼顺天;盲信源分离中信源动态变化的识别[J];西安电子科技大学学报;2003年05期
7 刘琚,孙建德;基于图像独立特征分解的数字水印方法[J];电子与信息学报;2003年09期
8 黄翠萍;基于独立分量分析的盲源分离技术[J];医疗设备信息;2003年07期
9 李卫疆;赵铁军;王宪刚;;基于上下文的查询扩展[J];计算机研究与发展;2010年02期
10 刘琚,顾明亮,何振亚,梅良模;一种新的瞬时混迭信号盲分离的自适应方法[J];电路与系统学报;1998年04期
中国重要会议论文全文数据库 前10条
1 陈振标;徐波;;限定领域的语言模型[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
2 谢凡;滕云田;徐沁;;独立分量分析在地磁台站轨道交通干扰分析中的应用[A];中国地球物理2010——中国地球物理学会第二十六届年会、中国地震学会第十三次学术大会论文集[C];2010年
3 刘喜武;刘洪;李幼铭;;独立分量分析及其在地震信息处理中应用初探[A];中国科学院地质与地球物理研究所二○○三学术论文汇编·第四卷(油气资源)[C];2003年
4 韩宪军;王利;;分布形式及相关模型对可靠度计算结果的影响[A];第十一届全国土力学及岩土工程学术会议论文集[C];2011年
5 付晓寅;魏玮;徐波;;一种基于状态转移的N元语言模型快速查询方法[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
6 韩中元;李生;杨沐昀;齐浩亮;;面向信息检索的近邻语言模型[A];第六届全国信息检索学术会议论文集[C];2010年
7 秦先勇;沈功田;何仁洋;李寰;;基于独立分量分析的气体管道泄漏信号消噪方法研究[A];压力管道技术研究进展精选集——第四届全国管道技术学术会议[C];2010年
8 林建方;李生;郑德权;;基于词语搭配关系的查询扩展方法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
9 奚宁;赵迎功;汤光超;李斌;罗春勇;戴新宇;陈家骏;;统计机器翻译中多种语言模型的融合[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
10 努尔艾力·喀迪尔;彭良瑞;;基于SRILM的阿拉伯和维吾尔文语言模型建立方法[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
中国重要报纸全文数据库 前10条
1 清华大学 刘加;识别语音的几种依据[N];计算机世界;2006年
2 清华大学 刘加;语音识别应用促进技术发展[N];计算机世界;2006年
3 本报记者 刘洪宇;当机器听懂了我们的声音[N];辽宁日报;2008年
4 郝亭;软件是怎样“炼”成的[N];工人日报;2000年
5 何中军米海涛 刘群;统计机器翻译系统中的开源软件[N];计算机世界;2007年
6 中科院计算技术研究所 吕雅娟付雷 黄瑾 何中军 刘群;化繁为简的统计机器翻译技术[N];中国计算机报;2007年
7 王向东 栾焕博 林守勋 钱跃良;语音识别:抗噪音能力有待加强[N];计算机世界;2006年
8 蒋秀娟;土壤选择对食品安全影响有多大?[N];科技日报;2007年
9 石天强;“凡客体”中的资本欲望[N];中国教育报;2010年
10 北京清华大学电子工程系副教授 刘加 教授 刘润生;让机器听懂我的话[N];科技日报;2001年
中国博士学位论文全文数据库 前10条
1 蒲强;基于独立分量分析的语义聚类技术在信息检索中的应用研究[D];电子科技大学;2010年
2 周仲兴;复合下肢想象动作电位的特征识别新技术研究[D];天津大学;2009年
3 韩军;内燃机的非平稳信号分析方法及其噪声源小波识别技术的研究[D];天津大学;2004年
4 焦卫东;基于独立分量分析的旋转机械故障诊断方法研究[D];浙江大学;2003年
5 许宏吉;发射分集和波束形成优化设计及其盲接收技术研究[D];山东大学;2005年
6 林秋华;基于盲源分离的图像与语音加密新方法研究[D];大连理工大学;2006年
7 李小军;独立分量分析及其在阵列信号处理中的应用[D];西安电子科技大学;2004年
8 米建勋;带参考信号的独立分量分析理论及其应用研究[D];中国科学技术大学;2010年
9 张俊林;基于语言模型的信息检索系统研究[D];中国科学院研究生院(软件研究所);2004年
10 静行;基于独立分量分析的结构模态分析与损伤诊断[D];武汉理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 张润延;海量语言模型的研究及其在机器翻译中的应用[D];厦门大学;2009年
2 李新生;基于改进语言模型的相关反馈方法的检索系统设计[D];北京邮电大学;2011年
3 周成;基于独立分量分析的单通道语音降噪算法的研究[D];电子科技大学;2005年
4 何付志;独立分量分析在脑电信号分析中的应用[D];山东大学;2005年
5 张丽丹;基于监督独立分量分析的人脸识别[D];哈尔滨工程大学;2005年
6 王可;盲源分离技术在多通道信号处理中的应用[D];汕头大学;2004年
7 范建中;基于ICA和小波神经网络的人脸识别研究[D];华侨大学;2005年
8 朱瑾;基于肤色和独立分量分析的人脸检测技术研究[D];华侨大学;2005年
9 周旭欣;独立分量分析算法的计算机仿真及其在多导脑电信号处理中的应用[D];四川大学;2005年
10 吕鑫;独立分量分析在MIMO OFDM系统信道盲估计中应用的研究[D];兰州大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026