收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于对抗不变性解散的说话人识别

黄多林  刘栋  郑智燊  
【摘要】:为提高说话人识别模型的性能,论文提出一种新颖的方法来提取具有鲁棒性的说话人可区分性特征。该方法将说话人映射到两个较低维度的嵌入空间,通过解散对抗和注意力机制,其中一个嵌入空间完成从语音信号的所有其他信息中解散出说话人相关信息,而另一个嵌入空间捕获所有其他无关的干扰因素。实验结果表明,在TIMIT数据集的两类实验设置中,论文方法分别比两个最先进方法提高2.74%和2.86%的识别准确率。并且通过实验分析测试集的损失和识别准确率,得出注意力机制和解散模块对本文方法的说话人识别性能确实有提升。

知网文化
【相似文献】
中国期刊全文数据库 前15条
1 张雄伟;张星昱;孙蒙;邹霞;;说话人验证系统攻击方法的研究现状及展望[J];数据采集与处理;2021年05期
2 赵艳;吕亮;赵力;;基于改进的深度神经网络的说话人辨认研究[J];电子器件;2017年05期
3 曹敏;王浩川;;说话人自动识别技术研究[J];中州大学学报;2007年02期
4 尚雯;王宏霞;;基于指纹的5G通信说话人身份追踪方案[J];信息网络安全;2021年03期
5 侯风雷,王炳锡;基于支持向量机的说话人辨认研究[J];通信学报;2002年06期
6 马勇;鲍长春;夏丙寅;;基于辨别性深度信念网络的说话人分割[J];清华大学学报(自然科学版);2013年06期
7 杨毅;宋辉;刘加;;基于NIST评测的说话人分类及定位技术研究[J];电子与信息学报;2011年05期
8 马勇;鲍长春;;说话人分割聚类研究进展[J];信号处理;2013年09期
9 殷启新,韩春光,杨鉴;基于掌上电脑录音的说话人辨认[J];云南民族学院学报(自然科学版);2003年04期
10 叶于林;杨波;莫建华;刘夏;;基于说话人辨识的自上而下听觉显著性注意模型[J];计算机系统应用;2017年07期
11 李秀怡;徐利敏;;基于汉语元音分类的多维特征说话人辨认研究[J];信息与电脑(理论版);2011年24期
12 刘明辉;黄中伟;熊继平;;用于说话人辨识的评分规整[J];计算机工程与应用;2010年12期
13 李稀敏;洪青阳;黄晓丹;;基于说话人的音频分割与聚类[J];心智与计算;2010年02期
14 袁哲菲;张连海;杨绪魁;刘爽;;基于改进自注意力机制的说话人分割聚类[J];信息工程大学学报;2020年05期
15 陈杰;叶瑶瑶;;基于孪生自动编码器的深度说话人嵌入向量[J];现代计算机;2021年10期
中国重要会议论文全文数据库 前20条
1 黄顺珍;蔡耿平;徐志鸿;蓝波;范国华;梁凡;;突出数据有效性及结合距离测度方法的说话人辨认系统[A];第六届全国人机语音通讯学术会议论文集[C];2001年
2 罗海风;龙长才;;多话者环境下说话人辨识听觉线索研究[A];中国声学学会2009年青年学术会议[CYCA’09]论文集[C];2009年
3 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
4 鲍福良;方志刚;徐洁;;说话人识别综述[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年
5 马勇;鲍长春;夏丙寅;;基于辨别性深度信念网络的说话人分割[A];第十二届全国人机语音通讯学术会议(NCMMSC2013)论文集[C];2013年
6 金乃高;侯刚;王学辉;李非墨;;基于主动感知的音视频联合说话人跟踪方法[A];2010年通信理论与信号处理学术年会论文集[C];2010年
7 谭良杰;刘亚丽;;噪声对跨语种说话人音色感知的影响[A];2019年全国声学大会论文集[C];2019年
8 王海燕;杨鸿武;甘振业;裴东;;基于说话人自适应训练的汉藏双语语音合成[A];第十二届全国人机语音通讯学术会议(NCMMSC2013)论文集[C];2013年
9 何磊;方棣棠;吴文虎;;说话人聚类与模型自适应结合的说话人自适应方法[A];第六届全国人机语音通讯学术会议论文集[C];2001年
10 索宏彬;刘晓星;;基于高斯混合模型的说话人跟踪系统[A];第八届全国人机语音通讯学术会议论文集[C];2005年
11 白俊梅;张树武;徐波;;广播电视中的目标说话人跟踪技术[A];第八届全国人机语音通讯学术会议论文集[C];2005年
12 张玲华;郑宝玉;杨震;;一种新的具有噪声鲁棒性的说话人语音特征及其应用[A];通信理论与信号处理新进展——2005年通信理论与信号处理年会论文集[C];2005年
13 张彬桥;;基于主分量分析的说话人特征提取[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
14 王刚;邬晓钧;郑方;王琳琳;张陈昊;;基于参考说话人模型和双层结构的说话人辨认[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
15 欧贵文;邓英;;基于说话人的对话语音分割[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
16 王琛;苗振江;王海龙;;面向普适计算下的说话人实时识别系统[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年
17 牛小川;徐波;;说话人自适应策略与方法的研究与实验[A];第五届全国人机语音通讯学术会议(NCMMSC1998)论文集[C];1998年
18 张世磊;姜洪臣;张树武;徐波;;广播语音的说话人切分聚类算法[A];第八届全国人机语音通讯学术会议论文集[C];2005年
19 郑燕琳;许星宇;陈伟庆;;说话人识别技术探讨[A];2011年全国电子信息技术与应用学术会议论文集[C];2011年
20 刘敬伟;;信道、噪声与说话人自适应技术研究[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
中国博士学位论文全文数据库 前20条
1 李蓝天;说话人识别中的特征学习方法研究[D];清华大学;2018年
2 玄成君;基于语音频率特性抑制音素影响的说话人特征提取[D];天津大学;2014年
3 陈凌辉;说话人转换建模方法研究[D];中国科学技术大学;2013年
4 郑建炜;基于核方法的说话人辨认模型研究[D];浙江工业大学;2010年
5 吕声;说话人转换方法的研究[D];华南理工大学;2004年
6 解奉龙;跨越说话人及语言差异的语音生成[D];哈尔滨工业大学;2019年
7 田野;麦克风网络中基于分布式卡尔曼滤波的说话人跟踪方法研究[D];大连理工大学;2018年
8 杨继臣;说话人信息分析及其在多媒体检索中的应用研究[D];华南理工大学;2010年
9 李燕萍;说话人辨认中的特征参数提取和鲁棒性技术研究[D];南京理工大学;2009年
10 王坚;语音识别中的说话人自适应研究[D];北京邮电大学;2007年
11 张巧灵;麦克风网络中基于分布式粒子滤波的说话人跟踪方法研究[D];大连理工大学;2016年
12 李威;多人会话语音中的说话人角色分析[D];华南理工大学;2015年
13 孙俊;基于激励源及其韵律特征的源—目标说话人声音转换研究[D];中国科学技术大学;2006年
14 酆勇;基于深度学习的说话人识别建模研究[D];重庆大学;2016年
15 金乃高;音视频联合说话人定位与跟踪方法研究[D];大连理工大学;2008年
16 徐利敏;说话人辨认中的特征变换和鲁棒性技术研究[D];南京理工大学;2008年
17 付中华;说话人识别系统鲁棒性研究[D];西北工业大学;2004年
18 侯代文;非线性滤波及其在说话人跟踪中的应用研究[D];大连理工大学;2008年
19 谢怡宁;基于稀疏编码的鲁棒说话人识别方法研究[D];哈尔滨理工大学;2016年
20 王军;复杂环境下说话人确认鲁棒性研究[D];清华大学;2015年
中国硕士学位论文全文数据库 前20条
1 朱杰;面向短波通信的文本无关说话人辨识研究[D];哈尔滨工程大学;2009年
2 张琪;复杂环境下特定说话人的语音识别研究[D];武汉纺织大学;2012年
3 李鹏;说话人特征参数建模研究及其在信息安全中的应用[D];西安电子科技大学;2008年
4 刘玲霜;基于语音信号处理的呼吸认证方法研究[D];电子科技大学;2017年
5 陈军;基于深度学习说话人的三维特征识别研究[D];贵州大学;2020年
6 代亚丽;防录音回放攻击的说话人认证算法及系统设计[D];武汉理工大学;2014年
7 宋文豪;基于深度学习的说话人识别技术应用[D];电子科技大学;2020年
8 赵春宇;鲁棒性的与文本无关的开集说话人辨识方法研究[D];哈尔滨工程大学;2006年
9 徐晨;基于支持向量机的说话人辨别研究[D];陕西师范大学;2013年
10 黄锋;基于说话人转换的语音识别方法[D];华南理工大学;2005年
11 杨旻;多层次说话人分割及相关算法研究[D];浙江大学;2006年
12 王欢;基于FPGA的说话人身份识别系统设计[D];齐齐哈尔大学;2015年
13 胡若华;改进的核函数算法及其在说话人辨认中的应用研究[D];北京交通大学;2008年
14 陈新磊;基于深度学习的特定说话人语音分离的研究[D];华中科技大学;2020年
15 李晨啟;基于域对抗训练和注意力机制的鲁棒说话人特征研究[D];哈尔滨工业大学;2021年
16 李锐;基于因子分析的说话人分离技术研究[D];中国科学技术大学;2016年
17 贺文锋;说话人性别识别与年龄估计的研究[D];华南理工大学;2014年
18 王俊丰;基于深度学习的多说话人语音分离技术研究与实现[D];中国电子科技集团公司电子科学研究院;2020年
19 颜祥;基于韵律联合短时谱的说话人变换[D];苏州大学;2007年
20 高娅;说话人转变检测的研究与实现[D];南京邮电大学;2013年
中国重要报纸全文数据库 前1条
1 本报记者 李祺瑶 刘冕;先声夺人[N];北京日报;2021年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978