收藏本站
《计算机工程与应用》 2019年17期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

改进卷积输入的端到端普通话语音识别

王彦哲  张立民  张兵强  李振宇  
【摘要】:主流神经网络训练的交叉熵准则是对声学数据的每个帧进行分类优化,而连续语音识别是以序列级转录准确性为性能度量。针对这个不同,构建基于序列级转录的端到端语音识别系统。针对低资源语料条件下系统性能不佳的问题,其中模型使用卷积神经网络对输入特征进行处理,选取最佳的网络结构,在时域和频域进行二维卷积,从而改善输入空间中因不同环境和说话人产生的小扰动影响。同时神经网络使用批量归一化技术来减少泛化误差,加速训练。基于大型的语言模型,优化解码过程中的超参数,提高模型建模效果。实验结果表明系统性能提升约24%,优于主流语音识别系统。

【参考文献】
中国期刊全文数据库 前1条
1 张晴晴;刘勇;潘接林;颜永红;;基于卷积神经网络的连续语音识别[J];工程科学学报;2015年09期
【相似文献】
中国期刊全文数据库 前10条
1 陈敏华;李杨;张武雄;;基于卷积神经网络的信道均衡算法[J];计算机应用与软件;2017年09期
2 王兆华;重叠并元卷积[J];信号处理;1994年01期
3 王振宇;准卷积与准相关[J];电工教学;1995年02期
4 刘潇;和应民;陈力伟;;基于神经网络的语音识别系统[J];应用科技;2006年06期
5 黎明;探讨卷积和的求解方法[J];北京工商大学学报(自然科学版);2005年02期
6 李伟林;文剑;马文凯;;基于深度神经网络的语音识别系统研究[J];计算机科学;2016年S2期
7 栗学丽;刘琚;;“数字信号处理”中分段卷积的教学探讨[J];电气电子教学学报;2011年02期
8 陈琛;陈赟;曾晓洋;;一种面积与功耗优化的卷积器设计[J];计算机工程;2010年22期
9 舒勤,张有正;再论X[k]有零点的卷积反演的DFT算法[J];电子学报;1992年12期
10 杨继业;李雨青;;计算二维数字卷积的重叠相加法研究[J];工程数学学报;2012年05期
中国重要会议论文全文数据库 前10条
1 迟边进;方棣棠;;粗识别在大字表语音识别系统中的应用[A];第一届全国人机语音通讯学术会议(NCMMSC1990)论文集[C];1990年
2 刘家松;刘承玺;李爱军;;对语音识别系统中一些环节的计算方法的选择[A];第一届全国人机语音通讯学术会议(NCMMSC1990)论文集[C];1990年
3 王仁华;倪晋富;;语音识别系统评估初探[A];第二届全国人机语音通讯学术会议(NCMMSC1992)论文集[C];1992年
4 秦勇;莫福源;李昌立;关定华;;汉语超大词汇语音识别系统的研究与实现[A];第四届全国人机语音通讯学术会议(NCMMSC1996)论文集[C];1996年
5 幸璐璐;谢莎莎;王侠;孙甲松;王作英;;利用废料模型改进受限域语音识别系统[A];第八届全国人机语音通讯学术会议论文集[C];2005年
6 王承发;肖毅壮;韩纪庆;;一种语音识别系统的端点检测算法[A];第二届全国人机语音通讯学术会议(NCMMSC1992)论文集[C];1992年
7 胡春静;吴善培;;不定人的语音识别系统[A];第三届全国人机语音通讯学术会议(NCMMSC1994)论文集[C];1994年
8 方敏;浦剑涛;李成荣;台宪青;;嵌入式语音识别系统的研究和实现[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
9 俸云;景新幸;;基于SOPC的语音识别系统的设计与实现[A];2008年声频工程学术交流年会论文集[C];2008年
10 孙甲松;肖熙;王作英;;利用有调拼音模型改进语音识别系统的稳健性[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
中国重要报纸全文数据库 前1条
1 平远;多语种交谈式语音识别系统[N];北京电子报;2000年
中国博士学位论文全文数据库 前10条
1 刘纪平;多重演化神经网络在语音识别中的应用[D];武汉大学;2011年
2 张仕良;基于深度神经网络的语音识别模型研究[D];中国科学技术大学;2017年
3 郭网媚;卷积网络编码及其应用[D];西安电子科技大学;2012年
4 项延德;基于卷积神经网络的心电信号检测和分类研究[D];浙江大学;2018年
5 仇悦;基于循环神经网络的胎儿心电提取方法研究[D];浙江大学;2018年
6 肖伟;神经网络技术在大气激光信道反演分析及信道编码译码中的应用研究[D];武汉大学;2018年
7 刘嘉威;视频监控中的行人再识别算法研究[D];中国科学技术大学;2019年
8 吴渤;基于深度神经网络的语音去混响方法研究[D];西安电子科技大学;2018年
9 苟飞;随机信号处理的新方法[D];华南理工大学;1995年
10 张素花;神经网络内电振荡活动特性的研究[D];河北工业大学;2006年
中国硕士学位论文全文数据库 前10条
1 黄文涛;基于神经网络的嵌入式语音识别系统研究[D];广东工业大学;2012年
2 马丽艳;卷积混合盲源分离[D];中国地质大学;2008年
3 张稳;基于神经网络的语音识别系统的实现[D];成都理工大学;2013年
4 鲁泽茹;连续语音识别系统的研究与实现[D];浙江工业大学;2016年
5 伍斯龙;群智感知中语音识别系统的研究与实现[D];华南理工大学;2013年
6 郭亚娜;基于深度神经网络的蒙古文语音识别系统[D];内蒙古大学;2016年
7 张德良;深度神经网络在中文语音识别系统中的实现[D];北京交通大学;2015年
8 肖吉;基于有限状态图的语音识别系统的构建[D];清华大学;2011年
9 黄志强;卷积神经网络研究及其在基音检测中的应用[D];内蒙古大学;2015年
10 陈仕伟;轨道交通下车载环境中的语音识别系统的研究[D];江苏科技大学;2019年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026