收藏本站
《计算机与信息技术》 2007年07期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于说话人聚类的说话人自适应

王坚  
【摘要】:本文提出一种改进的基于模型差别度量的说话人聚类(Speaker Clustering)方法,并将该说话人聚类算法结合最大似然线性回归算法(Maximum Likelihood Linear Regression,MLLR)构成整体的说话人自适应框架。将该方法应用于以音素为识别基元的汉语连续语音识别系统中,可能够提高系统的识别率,较好的满足快速性和渐进性。实验结果表明,该方法能够在仅有一句自适应数据的情况下,使系统字正识率由40.43%提高到50.86%.

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 李虎生,刘加,刘润生;语音识别说话人自适应研究现状及发展趋势[J];电子学报;2003年01期
【共引文献】
中国期刊全文数据库 前2条
1 李财莲,赵小阳,王丽娟,岳振军;说话人识别中关键技术的现状与发展[J];军事通信技术;2005年02期
2 徐向华;朱杰;郭强;;决策树结构对说话人自适应影响的研究[J];声学学报(中文版);2006年01期
中国博士学位论文全文数据库 前4条
1 沈海峰;语音识别中的环境补偿研究[D];北京邮电大学;2006年
2 徐望;连续语音识别的稳健性技术研究[D];解放军信息工程大学;2006年
3 雷建军;噪声鲁棒语音识别中若干问题的研究[D];北京邮电大学;2007年
4 王坚;语音识别中的说话人自适应研究[D];北京邮电大学;2007年
中国硕士学位论文全文数据库 前8条
1 周祖洋;基于VxWorks平台的人声识别技术的研究[D];哈尔滨工程大学;2005年
2 方鹤鹤;基于人耳听觉特性的语音特征提取研究[D];西北大学;2006年
3 曾海涛;说话人识别的研究与DSP实现[D];西南交通大学;2006年
4 李建宁;汉语孤立词语音识别的研究与实现[D];西北大学;2007年
5 刘大鹏;会话语音中说话人识别的研究[D];重庆大学;2007年
6 王琛;语音中身份与情感信息提取及其在普适计算中的应用[D];北京交通大学;2007年
7 纪现清;文本无关说话人确认及其应用研究[D];北京交通大学;2008年
8 余浩;说话人识别的自适应算法研究[D];武汉理工大学;2005年
【二级参考文献】
中国期刊全文数据库 前1条
1 李虎生,杨明杰,刘润生;汉语数码语音识别自适应算法[J];电路与系统学报;1999年02期
【相似文献】
中国重要会议论文全文数据库 前10条
1 徐琳;谢湘;匡镜明;;结合MLLR和MAP的说话人聚类自适应方法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
2 何磊;方棣棠;吴文虎;;说话人聚类与模型自适应结合的说话人自适应方法[A];第六届全国人机语音通讯学术会议论文集[C];2001年
3 王炜;吕萍;颜永红;;基于假设检验的的自动说话人聚类算法[A];第八届全国人机语音通讯学术会议论文集[C];2005年
4 吕萍;颜永红;;广播新闻语料自动识别系统[A];第八届全国人机语音通讯学术会议论文集[C];2005年
5 马龙;李成荣;徐波;李腾;;语音识别技术在智能语音机器人中的应用[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
6 白俊梅;张树武;徐波;;广播电视中的目标说话人跟踪技术[A];第八届全国人机语音通讯学术会议论文集[C];2005年
7 欧贵文;邓英;;基于说话人的对话语音分割[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
8 贾磊;徐波;;基于检测熵变化趋势的音频特征跳变点检测[A];第六届全国人机语音通讯学术会议论文集[C];2001年
9 王刚;邬晓钧;郑方;王琳琳;张陈昊;;基于参考说话人模型和双层结构的说话人辨认[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
10 王刚;邬晓钧;郑方;王琳琳;张陈昊;;基于参考说话人模型和双层结构的说话人辨认快速算法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
中国博士学位论文全文数据库 前2条
1 王坚;语音识别中的说话人自适应研究[D];北京邮电大学;2007年
2 屈丹;电话信道下语言辨识技术研究[D];中国人民解放军信息工程大学;2005年
中国硕士学位论文全文数据库 前6条
1 陈芬;无监督说话人聚类方法研究及实现[D];华南理工大学;2012年
2 张志华;说话人自适应技术研究及其在电话信道下的关键词检出系统应用[D];中国人民解放军信息工程大学;2005年
3 刘大鹏;会话语音中说话人识别的研究[D];重庆大学;2007年
4 余骁捷;新闻播报节目的内容自动标注系统[D];清华大学;2011年
5 余丽珍;智能环境下基于音频和视频特征融合的多说话人识别[D];兰州理工大学;2012年
6 凌锦雯;基于多特征的说话人分割与聚类的研究[D];中国科学技术大学;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026