收藏本站
收藏 | 投稿 | 论文排版

基于ResNet-BLSTM的端到端语音识别

胡章芳  徐轩  付亚芹  夏志广  马苏东  
【摘要】:基于深度学习的端到端语音识别模型中,由于模型的输入采用固定长度的语音帧,造成时域信息和部分高频信息损失进而导致识别率不高、鲁棒性差等问题。针对上述问题,提出了一种基于残差网络与双向长短时记忆网络相结合的模型,该模型采用语谱图作为输入,同时在残差网络中设计并行卷积层,提取不同尺度的特征,然后进行特征融合,最后采用连接时序分类方法进行分类,实现一个端到端的语音识别模型。实验结果表明,该模型在Aishell-1语音集上字错误率相较于传统端到端模型的WER下降2.52%,且鲁棒性较好。

知网文化
【相似文献】
中国期刊全文数据库 前3条
1 林劲;;基于典型相关分析的水声特征融合方法研究[J];中国科技信息;2014年01期
2 白日欣;陈淑春;智刚毅;;基于多元特征融合技术的农村家居安防系统设计[J];河北农业大学学报;2017年03期
3 张善文,朱参世,刘进忙;雷达目标特征融合的一种方法[J];航空计算技术;2002年04期
中国硕士学位论文全文数据库 前10条
1 郭维;基于深度学习的心电信号分类研究与应用[D];深圳大学;2019年
2 曾俊仙;跨摄像机的行人再识别检索系统[D];合肥工业大学;2019年
3 魏献巍;基于脑电波信号的情绪识别算法研究与应用[D];南京邮电大学;2019年
4 霍雪芹;基于脑电和前额眼电融合的疲劳驾驶检测研究[D];上海交通大学;2017年
5 程飞;基于特征融合的开挖器械声音识别算法研究[D];杭州电子科技大学;2018年
6 臧瑾;阵列脉象信号融合分类方法研究[D];哈尔滨工业大学;2018年
7 殷和义;基于卷积神经网络和特征融合的高分辨率距离像识别[D];山东大学;2018年
8 刘楚琦;基于多模态生理信号的特征融合算法研究[D];天津师范大学;2018年
9 耿佳佳;基于人脸和语音深度特征融合的说话人识别与标注算法研究[D];华侨大学;2018年
10 侯弘慧;基于特征融合的不平衡ECG信号分析[D];天津大学;2018年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978